original (2019/05/14 付) Google 翻訳 (2019/05/21 付)
# A list of useful control parameters and config files. #便利な制御パラメータと設定ファイルのリスト。
# Introduction # 前書き
Tesseract is extremely flexible, if you know how to control it. There is a large number of control parameters to modify its behaviour. While these change from time to time, most of them are fairly stable. List of all parameters with default value and short description can be retrieved with: あなたがそれを制御する方法を知っていれば、Tesseractは非常に柔軟です。その動作を変更するための多数の制御パラメータがあります。これらは時々変化しますが、それらのほとんどはかなり安定しています。デフォルト値と簡単な説明を含むすべてのパラメータのリストは、次のコマンドで取得できます。
` | `
tesseract --print-parameters tesseract --print-parameters
` | `
There are 3 different types: 3種類あります。
### Init only ###初期化のみ
Characterized by INIT in its initialization macro. 初期設定マクロの INIT によって特徴付けられます。
These parameters can only be set at the TessBaseAPI::Init function that takes a list of config files. これらのパラメータは設定ファイルのリストを取る TessBaseAPI :: Init関数で設定することができます。
NOTE: You can't change init only parameter with tesseract executable option -c. 注意:tesseract実行可能オプション -cを指定してinit onlyパラメータを変更することはできません。
The rest can be set through TessBaseAPI::SetVariable and make 2 further groups: 残りは TessBaseAPI :: SetVariableを通して設定でき、さらに2つのグループを作ります:
### General parameters ###一般的なパラメータ
Control many different aspects of Tesseract's functionality. Tesseractの機能のさまざまな側面を制御します。
### Debug parameters ###デバッグパラメータ
Contain debug in their name, control huge amounts of optional debug text and graphical output as Tesseract works. Tesseractの機能として、名前にdebugを含め、膨大な量のオプションのデバッグテキストとグラフィカル出力を制御します。
# Useful parameters #便利なパラメータ
Note that the default value may change; check the source code if you need to be sure of it. デフォルト値は変わる可能性があることに注意してください。確実にする必要がある場合は、ソースコードを確認してください。
Name Type Default value Init only Description 名前 タイプ デフォルト値 初期化のみ 説明
:--------- :--------- :------------------ :-------------- :---------------- :--------- :--------- :------------------ :------ -------- :----------------
load_system_dawg boolean (0/1) 1 Yes Controls whether or not to load the main dictionary for the selected language. load_system_dawg ブール値(0/1) 1 はい 選択した言語のメイン辞書を読み込むかどうかを制御します。
user_words_suffix string "" Yes The extension of the users-words word list file. If non-empty, it will attempt to load the relevant list of words to add to the dictionary for the selected language. Eg if set to user-words Tesseract will attempt to load eng.user-words from the tessdata directory at initialization time. user_words_suffix 文字列"" はい ユーザーワードリストファイルの拡張子。空でなければ、それは選択された言語の辞書に追加するために単語の関連リストをロードしようとします。例えば ​​user-wordsに設定すると、Tesseractは初期化時にtessdataディレクトリから eng.user-wordsをロードしようとします。
language_model_penalty_non_dict_word double (0-1) 0.15 No The penalty to apply to words not in the word_dawg / user_words wordlists. language_model_penalty_non_dict_word ダブル(0-1) 0.15 いいえ 単語\ _dawg / user \ _wordsに含まれていない単語に適用するペナルティ。
language_model_penalty_non_freq_dict_word double (0-1) 0.1 No The penalty to apply to words not in the freq_dawg wordlist. language_model_penalty_non_freq_dict_word ダブル(0-1) 0.1 いいえ freq \ _dawgの単語リストにない単語に適用する場合のペナルティ。
### Useful parameters for Japanese and Chinese ###日本語と中国語に便利なパラメータ
Some Japanese tesseract user found these parameters helpful for increasing tesseract-ocr (3.02) accuracy for Japanese : 一部の日本語tesseractユーザーは、日本語のtesseract-ocr(3.02)の精度を高めるのに便利です。
Name Suggested value Description 名前 推奨値 説明
:--------- :-------------------- :---------------- :--------- :-------------------- :--------------- -
chop_enable T Chop enable. チョップT チョップ有効
use_new_state_cost F Use new state cost heuristics for segmentation state evaluation \ _new \ _state \ _costを使用してください。 F セグメンテーション状態評価に新しい状態コストヒューリスティックを使用します。
segment_segcost_rating F Incorporate segmentation cost in word rating? セグメント\ _segcost \ _rating F 単語評価にセグメンテーションコストを組み込みますか?
enable_new_segsearch 0 Enable new segmentation search path. It could solve the problem of dividing one character to two characters \ _new \ _segsearchを有効にします。 0 新しいセグメンテーション検索パスを有効にします。 1文字を2文字に分割する問題を解決できます。
language_model_ngram_on 0 Turn on/off the use of character ngram model. 言語\ _モデル\ _ngram \ _on 0 文字ngramモデルの使用をオン/オフにします。
textord_force_make_prop_words F Force proportional word segmentation on all rows. textord \ _force \ _make \ _prop \ _words F すべての行に比例単語分割を強制します。
edges_max_children_per_outline 40 Max number of children inside a character outline. Increase this value if some of KANJI characters are not recognized (rejected). edges \ _max \ _children \ _per \ _outline 40 文字アウトライン内の最大子供数。 [一部の漢字が認識されない(拒否される)]場合は、この値を大きくしてください(*/ ?id = 1022)。