banner
andrewji8

Being towards death

Heed not to the tree-rustling and leaf-lashing rain, Why not stroll along, whistle and sing under its rein. Lighter and better suited than horses are straw sandals and a bamboo staff, Who's afraid? A palm-leaf plaited cape provides enough to misty weather in life sustain. A thorny spring breeze sobers up the spirit, I feel a slight chill, The setting sun over the mountain offers greetings still. Looking back over the bleak passage survived, The return in time Shall not be affected by windswept rain or shine.
telegram
twitter
github

揭秘!256M参数多模态OCR神器助你瞬间获取文档信息

SmolDocling:轻量级全能型文档 OCR 模型#

当前主流 OCR 系统通常都需要 1B + 参数的大模型计算,近期刚好在抱抱脸上发现一款仅 256M 参数的轻量级全能型文档 OCR 模型工具。

image

SmolDocling OCR 模型特点#

  • 轻量级与高速

    • 256M 小型参数,可在 CPU / 低配 GPU 上运行,无需高端计算资源。
    • OCR 速度快,每页仅需 0.35 秒,适用于批量处理。
  • 核心能力

    1. 全文档 OCR 解析
      • 智能识别标题、正文、列表、表格、图表、代码、公式等内容。
      • 适用于学术论文、商业文档、专利、报告、手写文档等多种文档类型。
    2. 多样化元素识别
      • 布局识别、代码识别、公式识别、图表与表格、图形分类等。
    3. 灵活的输出格式
      • 支持导出为 Markdown、HTML、JSON 等多种格式。
    4. 批量处理支持
      • 可一次性处理多个文档,适合大规模数据转换。

快速使用#

要想使用这个最新的 SmolDocling,有两种方法:

  • 在线 Demo:官方在 HuggingFace 上部署了 SmolDocling-256M-preview 的 Demo,可直接体验其强大的功能。

SmolDocling 是一款轻量级、超快、可全文档解析的多模态 OCR 模型,比传统 OCR 更精准、更高效,适用于论文解析、合同分析、数据提取、知识库构建等任务。不仅支持完整文档 OCR,包括表格、代码、公式、图表,处理速度也超快,每页仅需 0.35 秒,还可导出多种格式,适合许多不同需求的人群。

如果你正在寻找一款快速、高效的 OCR 工具,SmolDocling 绝对值得一试!

載入中......
此文章數據所有權由區塊鏈加密技術和智能合約保障僅歸創作者所有。