帳票処理の最新ソリューション: AIが主導する文書分類とデータ抽出技術について学ぶ - ABBYYではじめる | ABBYYブログ
帳票処理の最新ソリューション: AIが主導する文書分類とデータ抽出技術について学ぶ - ABBYYではじめる | ABBYYブログ
帳票処理ソリューション – AI自動学習による文書仕分け・データ抽出
ABBYY Japan エンジニアリングチーム
11月11日, 2020
ABBYY FlexiCapture最大の特長としては「複雑なレイアウトを持つ帳票でもOCRし、データ抽出可能(第1回ブログ) 」が挙げられますが、一方で比較的シンプルな帳票については難しい設定無しに文書仕分け・データ抽出が可能です。これを実現可能にした技術が、AI自動学習機能であり、さらにそれを請求書について汎用化した製品が ABBYY FlexiCapture for Invoices となります。
「帳票処理ソリューション」シリーズ第3回は、ABBYY FlexiCaptureのAI自動学習機能について紹介いたします。
まず、AI自動学習機能を用いた文書仕分けについてご紹介いたします。
文書仕分けの設定・確認は次の4ステップのみで、非常に簡単に実行可能です。
1. 文書定義作成
仕分け結果の格納先となる文書定義名を作成します。
2. 仕分け用トレーニングバッチ作成、学習用画像読み込み
プロジェクト設定ステーションで、仕分け用トレーニングバッチを選択し、新規バッチを作成します。
作成したバッチに、学習用のサンプルイメージを読み込みます。
各サンプル画像に対し、仕分けしたいクラス(文書定義)を選択します。
サンプル画像ごとに「学習用」「テスト用」を選択します。
3. 仕分けトレーニング(仕分け学習)とトレーニング結果の設定
ステップ2で仕分けトレーニングの準備が整いましたので、学習ボタンをクリックし、トレーニングを実行、結果を確認します。
結果に問題なければ、トレーニング結果を認識処理時に適用する設定を実施します。
4. 作業バッチで結果を確認
作業バッチでテスト画像を読み込み、正しく仕分けが行われることを確認します。
では、次にAI自動学習によるデータ抽出についてご紹介いたします。
データ抽出設定・確認方法は、次の4ステップになります。
※文書仕分けについては既に設定済である事を前提とします。
1. フィールド追加
対象の文書定義にトレーニングしたいフィールドを追加します。
2. データ抽出用トレーニングバッチ作成、学習用画像読み込み
プロジェクト設定ステーションのフィールド抽出用トレーニングバッチで新規バッチを作成します。その際、「文書定義セクションの選択」で該当する文書定義 > セクションを選択します。
次に、作成したバッチにトレーニング用のサンプル画像ファイルを読み込み、認識を実行します。また、それぞれのサンプル画像に対し「学習用」「テスト用」を設定します。
3. フィールド抽出トレーニングの実施
「学習用」のサンプルドキュメントに対し、各フィールドの正しい位置をクリック、または囲い込みにより指定します。
※ここではフィールドの位置をエンジンに教えているだけですので、文字の修正をする必要はありません。
以上でトレーニングの準備が整いましたので、学習ボタンをクリックする事によりトレーニングを実行、トレーニングが完了次第認識処理を実施し、結果を確認します。
4. 作業バッチで結果を確認
作業バッチでテスト画像を読み込み、正しくフィールド抽出が行われていることを確認します。
いかがでしょうか?
簡単かつ直感的に文書仕分け・データ抽出の設定が可能であることがお分かりいただけたかと思います。
このように、ABBYY FlexiCaptureは、帳票レイアウトの複雑さや取得項目に応じて様々な設定のアプローチをとることが可能です。
ABBYY FlexiCaptureについての概要、デモの依頼、お問い合わせはこちら から承ります。
なお、「帳票処理シリーズ」第一回、第二回はこちらより、アクセス可能です。
また、チュートリアルビデオもこちらより、ご覧頂くことができます。
デジタルインテリジェンス AI OCR コンテンツの理解 AI(人工知能)
ABBYY Japan エンジニアリングチーム
いいね!、シェア、再投稿
シェア
ブログのアップデートを購読
名*
電子メール*
国*
国アフガニスタンオーランド諸島アルバニアアルジェリアアメリカ領サモアアンドラアンゴラアンギラ南極アンティグア・バーブーダアルゼンチンアルメニアアルバオーストラリアオーストリアアゼルバイジャンバハマバーレーンバングラデシュバルバドスベルギーベリーズベナンバミューダブータンボリビアカリブ海オランダボスニア・ヘルツェゴビナボツワナブーベ島ブラジルイギリス領インド洋地域イギリス領ヴァージン諸島ブルネイ・ダルサラームブルガリアブルキナファソブルンジカンボジアカメルーンカナダカーボベルデケイマン諸島中央アフリカ共和国チャドチリ中華人民共和国クリスマス島ココス(キーリング)諸島コロンビアコモロコンゴ共和国コンゴ民主共和国クック諸島コスタリカクロアチアキュラソーキプロスチェココートジボワールデンマークジブチドミニカ国ドミニカ共和国エクアドルエジプトエルサルバドル赤道ギニアエリトリアエストニアエチオピアフォークランド(マルビナス)諸島フェロー諸島フィジーフィンランドフランスフランス領ギアナフランス領ポリネシアフランス領南方・南極地域ガボンガンビアジョージアドイツガーナジブラルタルギリシャグリーンランドグレナダグアドループグアムグアテマラガーンジーギニアギニアビサウガイアナハイチハード島とマクドナルド諸島バチカンホンジュラス香港ハンガリーアイスランドインドインドネシアイラクアイルランドマン島イスラエルITジャマイカ日本ジャージーヨルダンカザフスタンケニアキリバス大韓民国クウェートKyrgyzstanラオスラトビアレバノンレソトリベリアリビアリヒテンシュタインリトアニアルクセンブルクマカオマケドニアマダガスカルマラウイマレーシアモルディブマリマルタマーシャル諸島マルティニークモーリタニアモーリシャスマヨットメキシコミクロネシアモルドバモナコモンゴルモンテネグロモントセラトモロッコモザンビークミャンマーナミビアナウルネパールオランダオランダ領アンティル諸島ニューカレドニアニュージーランドニカラグアニジェールナイジェリアニウエノーフォーク島北マリアナ諸島ノルウェーオマーンパキスタンパラオパレスチナパナマパプアニューギニアパラグアイペルーフィリピンピトケアンポーランドポルトガルプエルトリコカタールルーマニアルワンダレユニオンセントヘレナセントクリストファー・ネイビスセントルシアサンピエール島・ミクロン島セントビンセントおよびグレナディーン諸島サン・バルテルミーサン・マルタン(フランス領)サモアサンマリノサントメ・プリンシペサウジアラビアセネガルセルビアセーシェルシエラレオネシンガポールシント・マールテン(オランダ領)スロバキアスロベニアソロモン諸島南アフリカサウスジョージア・サウスサンドウィッチ諸島南スーダンスペインスリランカスリナムスヴァールバル諸島およびヤンマイエン島スワジランドスウェーデンスイス台湾タジキスタンタンザニアタイ東ティモールトーゴトケラウトンガトリニダード・トバゴチュニジアトルコタークス・カイコス諸島ツバルウガンダウクライナアラブ首長国連邦イギリスアメリカ合衆国ウルグアイ合衆国領有小離島ウズベキスタンバヌアツベネズエラベトナムアメリカ領ヴァージン諸島ウォリス・フツナ西サハラザンビアジンバブエ
プライバシーポリシー とクッキーポリシー を読み、同意します。
ABBYY Solutions Ltd.製品と技術に関連するニュース、イベントとウェビナーへのご案内、ABBYY Solutions Ltd.製品とサービスに関連するホワイトペーパーやコンテンツの情報など、ABBYY Solutions Ltd.からのメールを受け取ることに同意します。
私は、ABBYY Solutions Ltd.から送信されるEメールに記載された配信停止リンクをクリックするか、または ABBYYデータ主体アクセス権利フォームを 介していつでも同意を取り消すことができることを理解しています。
Referrer
姓
Query string
Product Interest Temp
UTM Campaign Name
UTM Medium
UTM Source
ITM Source
GA Client ID
UTM Content
GDPR Consent Note
Captcha Score
Page URL
Connect with us
Also read:
- [Updated] 2024 Approved Cringe-Worthy Tweets The Collection
- [Updated] In 2024, Essential Tactics for Adding Vimeo Clips to PowerPoint Slides
- 2024 Approved HotCapture FireFox Add-Ons
- How to Stop Google Chrome from Tracking Your Location On Vivo T2x 5G? | Dr.fone
- How to Stream Your DVD Collection From PC to Chromecast-Enabled Television
- Installing the Fluxus IPTV Plug-In for Kodi 19 Matrix - A Comprehensive Tutorial
- Is It Possible to Convert a Copy Protected DVD Into an ISO File Using ImgBurn Software?
- Latest Driver Enhancement for Improved GTX 970 Graphics
- Leading Vector Image Creators The Ultimate 10-Tool Guide
- Optimal Video Formats for Uploading and Watching on Google Drive
- PCで簡単にアフリカTVのストリーミング放送を録画する完全ガイド
- Simplify Audio Hardware Maintenance Now
- Title: 帳票処理の最新ソリューション: AIが主導する文書分類とデータ抽出技術について学ぶ - ABBYYではじめる | ABBYYブログ
- Author: Richard
- Created at : 2024-10-07 17:09:13
- Updated at : 2024-10-11 22:45:21
- Link: https://solve-news.techidaily.com/ai-abbyy-abbyy/
- License: This work is licensed under CC BY-NC-SA 4.0.