OlmOCR – 从 PDF 中提取文字的开源 AI 工具

OlmOCR – 从 PDF 中提取文字的开源 AI 工具 (https://olmocr.allenai.org/)

🐙 开源页面 (https://github.com/allenai/olmocr)

OlmOCR 基于 Qwen2-VL-7B-Instruct 模型,用 GPT-4o 标记了 25 万页 PDF 对其进行了微调。

完全开源,可以在本地 Nvidia GPU(4090以上) 上运行

#AI工具 #OCR #PDF
评论(0)
游客的头像
表情
全部评论
最新