一款超強 OCR 神器!它叫做 Surya,一款オープンソースの OCR ツール、性能炸裂、更新された 表格識別機能、行、列、単元格を識別できるだけでなく、回転した表や複雑なレイアウトも識別でき、90 以上の言語をサポートしており、まさに無敵です。Surya は先進的なアーキテクチャを通じて、特に表格識別の面で、現在の SoTA オープンソースモデル Table Transformer よりも性能が優れています。現在、GitHub 上でのコレクション数は 1 万人(10K)を超え、無料でオープンソースであり、商業シーンにも応用できます。
核心機能
1、表格識別 Surya の新しいバージョンは特に表格識別を強化し、表の行、列、単元格を明確に識別でき、具体的な文字内容も識別できます。この機能は大量の表データを処理する必要がある方にとって、間違いなく大きな福音です。
2、複雑なレイアウト識別それは表に限らず、文書内の複雑なレイアウト、例えばタイトル、画像、さらには回転した表も識別できます。これは、あなたの文書がどれほど複雑であっても、Surya が必要な情報を正確に抽出できることを意味します。
3、90 以上の言語をサポート世界の 90 以上の言語の OCR 識別をサポートしており、中国語、日本語、韓国語、アラビア語などが含まれます。この多言語サポートにより、国際ビジネスの文書処理やローカライズプロジェクトのコンテンツ変換など、さまざまな異なる言語の文書に簡単に対応できます。
4、高効率のテキスト識別と読み取り順序の確定表に加えて、Surya はテキストの行レベルの検出にも優れており、テキストの読み取り順序を正しく識別し、文書情報の混乱を避け、テキスト内容が正しい順序で出力されることを保証します。
5、ローカル実行と API サポート Surya のもう一つの特徴は、ローカルで実行できることで、開発者がオフラインで敏感な情報を処理したり、大規模に文書を処理したりするのに便利です。同時に、Surya は API インターフェースも提供しており、開発者はそれを自分のアプリに簡単に統合し、バッチ自動化処理を行うことができます。
GitHub アドレス:https://github.com/VikParuchuri/surya