OlmOCR – 从 PDF 中提取文字的开源 AI 工具 wpcoder 2025-3-10 11:48 · 浏览 5 OlmOCR – 从 PDF 中提取文字的开源 AI 工具 (https://olmocr.allenai.org/) 🐙 开源页面 (https://github.com/allenai/olmocr) OlmOCR 基于 Qwen2-VL-7B-Instruct 模型,用 GPT-4o 标记了 25 万页 PDF 对其进行了微调。 完全开源,可以在本地 Nvidia GPU(4090以上) 上运行 #AI工具 #OCR #PDF Github