YomiToku-Client¶
概要¶
YomiToku-Clientは、AWS SageMaker上で提供されるYomiToku-Pro APIの出力を扱うためのPythonクライアントライブラリです。OCR解析結果を構造化データへ変換し、CSV・JSON・Markdown・PDFなどの形式での保存や可視化を容易にします。YomiToku-Proの高精度OCRと、業務アプリケーションを結びつける「橋渡し」役を担います。
flowchart LR
subgraph Local["ユーザー環境"]
A["解析対象データ"]
B["YomiToku-Client<br/>(Pythonライブラリ / CLI)"]
end
subgraph AWS["AWS アカウント内"]
C["Amazon SageMaker Endpoint<br/>YomiToku-Pro Document Analyzer"]
end
A -->|"ドキュメント画像 / (PDF / JPG / PNG / TIFF)"| B
B -->|"推論リクエスト"| C
C -->|"解析結果<br/>(JSON)"| B
B -->|"構造化データ(CSV / JSON / Markdown / HTML / PDF)"| A
利用の手順¶
- YomiToku-Clientをインストール
- AWS MarketplaceよりYomiToku-Pro - Document Analyzerをサブスクライブ
- AWSの認証の設定する
- AWS SageMakerにYomiToku-Pro Document-AnalyzerのEndpointを作成する
- CLIかモジュールを実行し、エンドポイントを呼び出して、文書を解析する
YomiToku-Clientの機能¶
- AWS SageMakerで作成されたエンドポイントを簡単、安全かつ効率的に呼び出せます。
- 読み取り結果を多様な出力形式(CSV / JSON / Markdown / HTML / PDF)への変換をサポートします。
- 読み取り結果を可視化し、内容をすぐに確認できます。
- バッチ処理機能で大量の文書を効率的に処理できます。
YomiToku-Pro Document Analyzer とは¶
YomiToku-Pro Document Analyzer は、AWS Marketplace 上で提供される Amazon SageMaker 専用の高精度日本語ドキュメント解析エンジン です。
お客様の AWS アカウント上に専用エンドポイントとして構築され、外部サーバーへのデータ送信を一切行わずに、安全かつ高速、高精度な解析を実行します。
🔍 特長¶
-
高精度な日本語 OCR / レイアウト解析 日本語文書に特化して学習されており、7,000 文字を超える日本語文字を認識可能。手書き文字、縦書き、複雑な帳票レイアウトにも対応し、ページ向き補正 や 詳細レイアウト解析 機能を備えています。
-
高速推論(約 0.6〜1.2 秒 / ページ) 一般的な A4 片面文書を 平均 1 秒未満 で解析可能。 並列処理にも対応しており、大量ページのバッチ処理にも適しています。
-
高セキュリティ設計 解析はすべてお客様の AWS 環境内で完結します。 データは外部ネットワークや第三者サーバーに送信されず、安全にデータを解析可能です。
-
無制限のスケーラビリティ SageMaker の専用エンドポイントとして提供されるため、 レートリミットやクオーター制限がなく、起動中は無制限にリクエストを実行できます。
お問い合わせ¶
お問い合わせはYomiToku-ClientのGitHubリポジトリのIssueに投稿するか、もしくはsupport-aws-marketplace@mlism.comまでご連絡ください。