SmolDocling:轻量级全能型文档 OCR 模型#
当前主流 OCR 系统通常都需要 1B + 参数的大模型计算,近期刚好在抱抱脸上发现一款仅 256M 参数的轻量级全能型文档 OCR 模型工具。
SmolDocling OCR 模型特点#
-
轻量级与高速
- 256M 小型参数,可在 CPU / 低配 GPU 上运行,无需高端计算资源。
- OCR 速度快,每页仅需 0.35 秒,适用于批量处理。
-
核心能力
- 全文档 OCR 解析
- 智能识别标题、正文、列表、表格、图表、代码、公式等内容。
- 适用于学术论文、商业文档、专利、报告、手写文档等多种文档类型。
- 多样化元素识别
- 布局识别、代码识别、公式识别、图表与表格、图形分类等。
- 灵活的输出格式
- 支持导出为 Markdown、HTML、JSON 等多种格式。
- 批量处理支持
- 可一次性处理多个文档,适合大规模数据转换。
- 全文档 OCR 解析
快速使用#
要想使用这个最新的 SmolDocling,有两种方法:
- 在线 Demo:官方在 HuggingFace 上部署了 SmolDocling-256M-preview 的 Demo,可直接体验其强大的功能。
SmolDocling 是一款轻量级、超快、可全文档解析的多模态 OCR 模型,比传统 OCR 更精准、更高效,适用于论文解析、合同分析、数据提取、知识库构建等任务。不仅支持完整文档 OCR,包括表格、代码、公式、图表,处理速度也超快,每页仅需 0.35 秒,还可导出多种格式,适合许多不同需求的人群。
如果你正在寻找一款快速、高效的 OCR 工具,SmolDocling 绝对值得一试!