This page archives the FAQ page pertaining to Tesseract 2.0x, 3.0x and 4.00.00alpha as of May 1, 2018. |
このページは2018年5月1日現在のTesseract 2.0x、3.0xおよび4.00.00alphaに関するFAQページをアーカイブしています。 |
The main FAQ page will be updated to only contain information pertaining to Tesseract 4.0.0. |
メインのFAQページは、Tesseract 4.0.0に関連する情報のみを含むように更新されます。 |
*** |
*** |
# Frequently Asked Questions |
# よくある質問 |
A collection of frequently asked questions and the answers, or pointers to them. If you have a question, please post it to the forums. |
よく寄せられる質問とその回答、またはそれらへのポインタのコレクション。質問がある場合は、フォーラムに投稿してください。 |
* Rules and advice |
* ルールとアドバイス |
Table of Contents |
目次 |
================= |
================= |
* Can I increase speed of OCR? |
* OCRの速度を上げることはできますか? |
* Windows: tesseract closes automatically right after launching |
* Windows:起動後すぐにtesseractが自動的に閉じる |
* What output formats can Tesseract produce? |
* Tesseractが生成できる出力フォーマットは? |
* How to interpret hOCR baseline output? |
* hOCRベースライン出力の解釈方法 |
* libtesseract.so.3: cannot open shared object file |
* libtesseract.so.3:共有オブジェクトファイルを開けません |
* Tesseract does not work |
* Tesseractが動かない |
* How do I uninstall Tesseract |
* Tesseractをアンインストールする方法 |
* How do I run multiple versions of Tesseract on same machine |
* どのように私は同じマシン上でTesseractの複数のバージョンを実行するのですか |
* Error in pixReadStream: |
* pixReadStreamのエラー: |
* Can't open eng.unicharset? |
* eng.unicharsetを開けませんか? |
* leptonica library missing |
* leptonica library missing |
* Can't read compressed TIFF files |
* 圧縮されたTIFFファイルを読むことができません |
* No output with color images |
* カラー画像なしで出力しない |
* Does it support multi-page TIFF files? |
* マルチページTIFFファイルをサポートしますか? |
* Why doesn't viewer/svutil.cpp compile? |
* なぜviewer / svutil.cppがコンパイルされないのですか? |
* Where are the training tools for Ubuntu 14.04 ? |
* Ubuntu 14.04のトレーニングツールはどこにありますか? |
* How do I Edit Box files used in training? |
* トレーニングで使用されているBoxファイルを編集するにはどうすればよいですか? |
* Utf8 buffer too big, size=xx (Error during training) |
* Utf8バッファが大きすぎる、サイズ= xx(トレーニング中のエラー) |
* How do I recognize only digits? |
* 数字だけを認識させるにはどうすればよいですか? |
* Tesseract 3 |
* Tesseract 3 |
* Tesseract 2.03 |
* Tesseract 2.03 |
* How do I add just one character or one font to my favourite language, without having to retrain from scratch? |
* [最初からやり直さずに、お気に入りの言語に1文字または1フォントだけを追加するにはどうすればよいですか。](#how-do-i-1文字だけのフォントまたは1つのフォントの追加 - お気に入りの言語 - 最初からやり直すことができない) |
* How do I produce searchable PDF output? |
* どのようにして検索可能なPDF出力を作成しますか? |
* The produced searchable PDF seems to only contain spaces |
* 作成された検索可能なPDFにはスペースしか含まれていないようです |
* How to do streaming |
* ストリーミングのやり方 |
* Is there a Minimum Text Size? (It won't read screen text!) |
* [最小文字サイズはありますか? (それはスクリーンテキストを読みません!)](#は最小のテキストサイズではありません - スクリーンテキストは読みません) |
* Why is the output empty or of poor quality? |
* なぜ出力が空なのか、それとも品質が悪いのですか。 |
* How do I generate the language data files? |
* どのようにして言語データファイルを生成しますか? |
* How do I unpack or alter existing language data files? |
* 既存の言語データファイルをアンパックまたは変更するにはどうすればよいですか? |
* How do I provide my own dictionary? |
* 自分の辞書を提供するにはどうすればいいですか? |
* Tesseract 3 |
* Tesseract 3 |
* Tesseract 2 |
* Tesseract 2 |
* wordlist2dawg doesn't work! |
* wordlist2dawgは動作しません! |
* How to increase the trust in/strength of the dictionary? |
* 辞書の信頼性/強度を高めるにはどうすればいいですか? |
* What are configs and how can I have more? |
* 設定とは何ですか、またどのように設定できますか? |
* There are inconsistent results from tesseract when the same TessBaseAPI object is used for decoding multiple images |
* 複数の画像をデコードするために同じTessBaseAPIオブジェクトを使用した場合、tesseractからの結果が矛盾する |
* Diacritics above and below the glyph are ignored/cause garbage output |
* グリフの上と下の発音区別符号は無視されます/ガベージアウトプットが発生します |
* Where is the documentation? |
* ドキュメントはどこにありますか |
* How can I try the next version? |
* 次のバージョンを試すにはどうすればよいですか? |
* actual_tessdata_numentries<= TESSDATA_NUMENTRIES:Error:Assert failed:in file ..\ccutil\tessdatamanager.cpp, line 55 |
* actual_tessdata_numentries&lt; = TESSDATA_NUMENTRIES:エラー:アサートに失敗しました:ファイル.. \ ccutil \ tessdatamanager.cpp、行55 |
* last_char == '\n':Error:Assert failed:in file ..\ccutil\tessdatamanager.cpp, line 95 |
* [last_char == '\ n':エラー:アサートに失敗しました:ファイル.. \ ccutil \ tessdatamanager.cppの95行目](#last_char - ネロアサート - 失敗 - ファイル - ccutiltessdatamanagercpp - 95行目) |
* Error: Illegal min or max specification |
* エラー:不正な最小値または最大値の指定 |
* Error: X classes in inttemp while unicharset contains Y unichars. |
* エラー:unicharsetがinticpにY個のunicharsが含まれているときにinttempにX個のクラスが含まれています。 |
* Error: Size of unicharset is greater than MAX_NUM_CLASSES |
* エラー:ユニキャストのサイズがMAX_NUM_CLASSESを超えています |
* How can I make the error messages go to tesseract.log instead of stderr? |
* どのようにしてエラーメッセージを標準エラー出力の代わりにtesseract.logに送ることができますか? |
* How can I suppress tesseract info line? |
* どのようにしてtesseract情報行を抑制できますか? |
* How can I get the coordinates and confidence of each word? |
* 各単語の座標と信頼度を取得するにはどうすればよいですか? |
* How is confidence calculated? |
* 信頼度はどのように計算されますか? |
* Can I use Tesseract for handwriting recognition? |
* 手書き文字認識にTesseractを使用できますか? |
* Can I use tesseract for barcode recognition? |
* バーコード認識にtesseractを使用できますか? |
* Issues with older versions of tesseract |
* 旧バージョンのtesseractに関する問題 |
* How to port Tesseract engine into vb6 project? |
* Tesseractエンジンをvb6プロジェクトに移植するにはどうすればいいですか? |
* Delphi wrapper for tessdll.dll |
* tessdll.dllのDelphiラッパー |
* Incomplete OCR result |
* 不完全なOCR結果 |
* error LNK2001: unresolved external symbol "public: static char cdecl TessBaseAPI::TesseractRect(unsigned char const,int,int,int,int,int,int)" |
* [エラーLNK2001:未解決の外部シンボル "public:static char cdecl TessBaseAPI :: TesseractRect(unsigned char const、int、int、int、int、int、int)"](#error-lnk2001-unresolved-external-symbol-public -static-char-cdecl-tessbaseapitesseractrectunsigned-char-constintintintintintint-tesseractrecttessbaseapisapadpbehhhhhhz) |
* box overlaps no blobs or blobs in multiple rows error when training |
* ボックスがトレーニング時にblobと重ならない、またはblobが複数行エラーになる |
[Training failed with error message "mf.cpp:78: FEATURE_SET_STRUCT\ ExtractMicros..."](#training-failed--with-error-message-mfcpp78-feature_set_struct-extractmicros) |
[トレーニングはエラーメッセージ "mf.cpp:78:FEATURE_SET_STRUCT \ ExtractMicros ..."で失敗しました](#training-failed - with-error-message-mfcpp78-feature_set_struct-extractmicros) |
* error message: Font id = -1/0, class id = 1/105 on sample 0 |
* [エラーメッセージ:サンプル0のフォントID = -1 / 0、クラスID = 1/105](#エラーメッセージのフォントID --- 10のクラスID - 1105のサンプル0) |
* My question isn't in here! |
* 私の質問はここにはありません! |
## Rules and advice |
##規則とアドバイス |
If you think you found a bug in Tesseract, please create an issue. Questions should be asked in the users mailing-list. |
Tesseractにバグが見つかったと思われる場合は、問題を作成してください。質問はusers mailing-listでお願いします。 |
You must read the CONTRIBUTING guide before you report an issue in GitHub or ask a question in the forum. |
GitHubで問題を報告したりフォーラムで質問をする前に、CONTRIBUTINGガイドを読む必要があります。 |
## Can I increase speed of OCR? |
## OCRのスピードを上げることはできますか? |
If you are processing several images, you can run tesseract in parallel with GNU Parallel. |
複数の画像を処理している場合は、GNU Parallelと並列にtesseractを実行できます。 |
E.g. instead of: |
例えば。の代わりに: |
` | ` |
find . -maxdepth 1 -name "*.tif" -print0 |
while IFS= read -r -d '' n; do |
見つけます。 -maxdepth 1 -name "* .tif" -print0 |
IFS = read -r -d '' nの間。行う |
tesseract "$n" "$n" -l eng hocr |
tesseract "$ n" "$ n" -l eng hocr |
hocr2pdf -i "$n" -n -o "$n.pdf" < "$n.html" |
hocr2pdf -i "$ n" -n -o "$ n.pdf" |