開発エンジニアのTOSHIKI.Kです。
企業では、日々大量の請求書や契約書がやり取りされています。これらの文書を手作業で情報の抽出や処理を行うことは、時間とコストがかかるだけでなく、人為的なミスも発生する恐れがあります。Document AIでは、これらの業務を自動化し、大幅な効率化を実現できます。
本記事では、Document AIの基本的な機能やユースケース、そして具体的な使い方について解説します。
1. Document AIとは
Document AIは、文書のデジタル化、解析を行うためのGoogle Cloudのサービスです。手書きのテキストや印刷文書、PDFなどを読み取り、文字情報を抽出することが可能です。
基本的な利用の流れは以下の通りです。
-
要件に合うプロセッサの作成
プロセッサとは、テキストの抽出やドキュメントの分類、解析等を実行するための中核となるコンポーネントです。
プロセッサはいくつか種類があり、用途に応じてどれを使うかを選択します。
日本語に対応しているプロセッサとしては以下のようなものがあります。
プロセッサ名 概要 Document OCR 200を超える言語のドキュメントからテキストを抽出する。一般的なOCR。 Form Parser アンケートフォームや表などから、キーと値のペアを抽出する。 Layout Parser ドキュメントのコンテンツ要素 (テキスト、表、リスト) を抽出する。
例えば、論文や新聞、書籍などのレイアウトを検出して「ここは本文」「ここは図表」などを検出することが可能。
Expense Parser 領収書から日付、仕入先、金額などを抽出する。
※その他プロセッサの一覧はこちらをご確認ください。
※プロセッサには「カスタムプロセッサ」というものがあり、独自のプロセッサを構築することも可能です。
-
プロセッサへのファイル取込、解析
ファイルを取り込み、文字列の抽出、ラベル付けなどを行うことができます。
対応フォーマットは以下の通りです。
「PDF、GIF、TIFF、JPEG、PNG、BMP、WebP」 -
情報抽出の精度を上げるために、プロセッサのトレーニング
ノーコードでトレーニングを行うことができます。
2. どのようなことが出来る?
Document AIを使ったユースケースとしては以下のようなものがあります。
1. 文書のデジタル化
- アーカイブ・検索の効率化: 紙の文書をスキャンしてテキストデータに変換し、簡単に検索・編集可能なデジタルアーカイブを作成する。
2. 請求書・領収書の自動処理
- 会計業務の効率化: 請求書や領収書から金額、支払期日、取引先などの情報を自動的に抽出し、会計システムへの入力作業を自動化する。
- 人為的なミス削減: 手作業でのデータ入力による誤りを防ぎ、会計処理の精度を上げる。
3. 契約書・法的文書の解析
- リスク管理: 契約書から重要な条項を抽出・分析することで、契約内容の理解を深め、潜在的なリスクを早期に発見する。
- コンプライアンス強化: 法律や規制に準拠しているかどうかのチェックを自動化し、法務部門の負担を軽減する。
4. ID文書の検証
- 本人確認: パスポートや運転免許証などのID文書から個人情報を抽出し、本人確認プロセスを自動化する。
-
セキュリティ強化: 不正行為や改ざんを検知し偽造防止をする。
※参考:Document AI で身分証明書の処理を自動化
3. Document AIを使ったPDF解析
今回は、以下の領収書PDFから日付や金額などの抽出を行ってみたいと思います。
まずは、Document AIのAPIを使って、どのように抽出が行われるかを見てみます。
※参考:Pythonを使ったサンプルコード
実際の出力結果は以下となりました。
合計金額、取引先、日付など自動的にラベリングして、値を抽出してくれました。
Google Cloudの管理コンソールからも、プロセッサがどのようにラベリングして値を抽出しているかを確認することが出来ます。
例えば、「サンプル株式会社 御中」という文字列が抽出され、「supplier_name」でラベリングされています。
このままでも、十分高い精度でラベリングをしてくれましたが、Document AIでは、手動でラベリング、トレーニングを行うことで、特定の範囲に対して、任意のラベルを付与することも可能です。
以下は、指定範囲(サンプルプロジェクトという文字がある箇所)に対して、titleというラベルを付与しています。
4. ドキュメント抽出を行う際のアーキテクチャ例
例えば、以下のアーキテクチャでは、下記のようなことが可能となります。
1.Cloud Storageに対象のファイルが格納されたことを検知
2.Cloud Run関数にてDocument AIによる情報抽出
3.抽出した結果をBigQueryやCloud SQLに格納し、分析
まとめ
今回、Document AIを使って、領収書の解析を行ってみましたが、トレーニングをしていない状態でも、高い精度で解析が出来ました。
Document AIを利用することで、テキストデータを抽出し、検索性の向上などの業務改善に繋げることが可能になると考えております。
実際に各プロセッサによる解析結果がどうなるかを試してみたい場合は、
以下リンクにて、解析したいファイルをアップロードするだけで簡単に解析できるので、ぜひ試してみてください。
Document AIを試してみる -Document AI
気になったことがありましたら、ぜひお気軽にお問い合わせください。
上記の記事に関してご質問ございましたら、お問い合わせください。