Skip to content

YomiToku-Client

概要

YomiToku-Clientは、AWS SageMaker上で提供されるYomiToku-Pro APIの出力を扱うためのPythonクライアントライブラリです。OCR解析結果を構造化データへ変換し、CSV・JSON・Markdown・PDFなどの形式での保存や可視化を容易にします。YomiToku-Proの高精度OCRと、業務アプリケーションを結びつける「橋渡し」役を担います。

flowchart LR
    subgraph Local["ユーザー環境"]
        A["解析対象データ"]
        B["YomiToku-Client<br/>(Pythonライブラリ / CLI)"]
    end

    subgraph AWS["AWS アカウント内"]
        C["Amazon SageMaker Endpoint<br/>YomiToku-Pro Document Analyzer"]
    end

    A -->|"ドキュメント画像 / (PDF / JPG / PNG / TIFF)"| B
    B -->|"推論リクエスト"| C
    C -->|"解析結果<br/>(JSON)"| B
    B -->|"構造化データ(CSV / JSON / Markdown / HTML / PDF)"| A

利用の手順

  1. YomiToku-Clientをインストール
  2. AWS MarketplaceよりYomiToku-Pro - Document Analyzerをサブスクライブ
  3. AWSの認証の設定する
  4. AWS SageMakerにYomiToku-Pro Document-AnalyzerのEndpointを作成する
  5. CLIかモジュールを実行し、エンドポイントを呼び出して、文書を解析する

YomiToku-Clientの機能

  • AWS SageMakerで作成されたエンドポイントを簡単、安全かつ効率的に呼び出せます。
  • 読み取り結果を多様な出力形式(CSV / JSON / Markdown / HTML / PDF)への変換をサポートします。
  • 読み取り結果を可視化し、内容をすぐに確認できます。
  • バッチ処理機能で大量の文書を効率的に処理できます。

YomiToku-Pro Document Analyzer とは

YomiToku-Pro Document Analyzer は、AWS Marketplace 上で提供される Amazon SageMaker 専用の高精度日本語ドキュメント解析エンジン です。

お客様の AWS アカウント上に専用エンドポイントとして構築され、外部サーバーへのデータ送信を一切行わずに、安全かつ高速、高精度な解析を実行します。

🔍 特長

  • 高精度な日本語 OCR / レイアウト解析 日本語文書に特化して学習されており、7,000 文字を超える日本語文字を認識可能。手書き文字、縦書き、複雑な帳票レイアウトにも対応し、ページ向き補正詳細レイアウト解析 機能を備えています。

  • 高速推論(約 0.6〜1.2 秒 / ページ) 一般的な A4 片面文書を 平均 1 秒未満 で解析可能。 並列処理にも対応しており、大量ページのバッチ処理にも適しています。

  • 高セキュリティ設計 解析はすべてお客様の AWS 環境内で完結します。 データは外部ネットワークや第三者サーバーに送信されず、安全にデータを解析可能です。

  • 無制限のスケーラビリティ SageMaker の専用エンドポイントとして提供されるため、 レートリミットやクオーター制限がなく、起動中は無制限にリクエストを実行できます。


お問い合わせ

お問い合わせはYomiToku-ClientのGitHubリポジトリのIssueに投稿するか、もしくはsupport-aws-marketplace@mlism.comまでご連絡ください。