DAにて画像からテキストを抽出する際のOCR言語を変更する方法

フォローする

DAにて画像のテキストを認識する際のデフォルトのOCR言語としては、英語が設定されています。言語がテキストに対応していないなどの理由で他の言語へ変更したい場合、下記の手順を参照してください。

  

手順

1.必要な言語の .traineddata ファイルを下記のURLからダウンロードする。

[URL] https://github.com/tesseract-ocr/tessdata

※日本語ファイルは「jpn.traineddata」を利用ください。

 

2.手順1でダウンロードした trainedデータファイルをDASのインストールディレクトリのDeviceAutomationService\lib\tessdataに配置する。(※1)

 <例>デフォルトパス

C:\Program Files (x86)\Kapow DeviceAutomation{バージョン}\DeviceAutomationService\lib\tessdata

 

3.Windowsタスクバー通知領域のDASアイコンを右クリックする。

 4.「Configure」をクリックする。

mceclip0.png

 

5.「OCR」タブをクリックする。

6.「Default OCR language」項目にて手順1でダウンロードした言語を選択する。

7.「Save and Restart」 ボタンをクリックする。

mceclip1.png

 Dynamic OCRについては「Dynamic OCR(Nine-Grid Image Finder)での文字抽出」を参照してください。

ISAを使用した画面のオブジェクト認識と操作については「ISAの要素(各属性)の説明」を参照してください。

   

注意事項

(※1)古いファイルがある場合は削除をするか、あらかじめ拡張子の変更を行ってから新しいファイルを配置してください。

0人中0人がこの記事が役に立ったと言っています

コメント

0件のコメント

ログインしてコメントを残してください。