frame_decoration

「[対訳] コントロールパラメータ」の編集履歴(バックアップ)一覧はこちら

[対訳] コントロールパラメータ」(2019/06/17 (月) 20:39:56) の最新版変更点

追加された行は緑色になります。

削除された行は赤色になります。

original (2019/05/14 付) | Google 翻訳 (2019/05/21 付) ---------- | ------------ # A list of useful control parameters and config files. | #便利な制御パラメータと設定ファイルのリスト。 | # Introduction | # 前書き | Tesseract is extremely flexible, if you know how to control it. There is a large number of control parameters to modify its behaviour. While these change from time to time, most of them are fairly stable. List of all parameters with default value and short description can be retrieved with: | あなたがそれを制御する方法を知っていれば、Tesseractは非常に柔軟です。その動作を変更するための多数の制御パラメータがあります。これらは時々変化しますが、それらのほとんどはかなり安定しています。デフォルト値と簡単な説明を含むすべてのパラメータのリストは、次のコマンドで取得できます。 ``` | `` ` tesseract --print-parameters | tesseract --print-parameters ``` | `` ` | There are 3 different types: | 3種類あります。 | ### Init only | ###初期化のみ Characterized by **INIT** in its initialization macro. | 初期設定マクロの **INIT** によって特徴付けられます。 These parameters can **only** be set at the ` TessBaseAPI::Init ` function that takes a list of config files. | これらのパラメータは設定ファイルのリストを取る `TessBaseAPI :: Init`関数で設定することができます。 | *NOTE*: You can't change init only parameter with tesseract executable option `-c`. | *注意*:tesseract実行可能オプション `-c`を指定してinit onlyパラメータを変更することはできません。 | | The rest can be set through ` TessBaseAPI::SetVariable ` and make 2 further groups: | 残りは `TessBaseAPI :: SetVariable`を通して設定でき、さらに2つのグループを作ります: | ### General parameters | ###一般的なパラメータ Control many different aspects of Tesseract's functionality. | Tesseractの機能のさまざまな側面を制御します。 | ### Debug parameters | ###デバッグパラメータ Contain debug in their name, control huge amounts of optional debug text and graphical output as Tesseract works. | Tesseractの機能として、名前にdebugを含め、膨大な量のオプションのデバッグテキストとグラフィカル出力を制御します。 | | # Useful parameters | #便利なパラメータ | Note that the default value may change; check the source code if you need to be sure of it. | デフォルト値は変わる可能性があることに注意してください。確実にする必要がある場合は、ソースコードを確認してください。 | | **Name** | **Type** | **Default value** | **Init only** | **Description** | | | **名前** | **タイプ** | **デフォルト値** | **初期化のみ** **説明** | |:---------|:---------|:------------------|:--------------|:----------------| | |:--------- |:--------- |:------------------ |:------ -------- |:---------------- | | ` load_system_dawg ` | boolean (0/1) | 1 | Yes | Controls whether or not to load the main dictionary for the selected language. | | | `load_system_dawg` |ブール値(0/1) 1 |はい|選択した言語のメイン辞書を読み込むかどうかを制御します。 | | ` user_words_suffix ` | string | "" | Yes | The extension of the users-words word list file. If non-empty, it will attempt to load the relevant list of words to add to the dictionary for the selected language. Eg if set to ` user-words ` Tesseract will attempt to load ` eng.user-words ` from the tessdata directory at initialization time. | | | `user_words_suffix` |文字列"" |はい|ユーザーワードリストファイルの拡張子。空でなければ、それは選択された言語の辞書に追加するために単語の関連リストをロードしようとします。例えば ​​`user-words`に設定すると、Tesseractは初期化時にtessdataディレクトリから `eng.user-words`をロードしようとします。 | | ` language_model_penalty_non_dict_word ` | double (0-1) | 0.15 | No | The penalty to apply to words not in the word\_dawg / user\_words wordlists. | | | `language_model_penalty_non_dict_word` |ダブル(0-1) 0.15 |いいえ|単語\ _dawg / user \ _wordsに含まれていない単語に適用するペナルティ。 | | ` language_model_penalty_non_freq_dict_word ` | double (0-1) | 0.1 | No | The penalty to apply to words not in the freq\_dawg wordlist. | | | `language_model_penalty_non_freq_dict_word` |ダブル(0-1) 0.1 |いいえ| freq \ _dawgの単語リストにない単語に適用する場合のペナルティ。 | | ### Useful parameters for Japanese and Chinese | ###日本語と中国語に便利なパラメータ | [Some Japanese tesseract user](https://groups.google.com/d/msg/tesseract-ocr/A4IQlslY7hc/d4xK1PoihfMJ) found these parameters helpful for increasing tesseract-ocr (3.02) accuracy for Japanese : | [一部の日本語tesseractユーザー](https://groups.google.com/d/msg/tesseract-ocr/A4IQlslY7hc/d4xK1PoihfMJ)は、日本語のtesseract-ocr(3.02)の精度を高めるのに便利です。 | | **Name** | **Suggested value** | **Description** | | | **名前** | **推奨値** | **説明** | |:---------|:--------------------|:----------------| | |:--------- |:-------------------- |:--------------- - | | chop\_enable | T | Chop enable. | | |チョップT |チョップ有効| | use\_new\_state\_cost | F | Use new state cost heuristics for segmentation state evaluation | | | \ _new \ _state \ _costを使用してください。 F |セグメンテーション状態評価に新しい状態コストヒューリスティックを使用します。 | segment\_segcost\_rating | F | Incorporate segmentation cost in word rating? | | |セグメント\ _segcost \ _rating | F |単語評価にセグメンテーションコストを組み込みますか? | | enable\_new\_segsearch | 0 | Enable new segmentation search path. It could solve the problem of dividing one character to two characters | | | \ _new \ _segsearchを有効にします。 0 |新しいセグメンテーション検索パスを有効にします。 1文字を2文字に分割する問題を解決できます。 | language\_model\_ngram\_on | 0 | Turn on/off the use of character ngram model. | | |言語\ _モデル\ _ngram \ _on | 0 |文字ngramモデルの使用をオン/オフにします。 | | textord\_force\_make\_prop\_words | F | Force proportional word segmentation on all rows. | | | textord \ _force \ _make \ _prop \ _words | F |すべての行に比例単語分割を強制します。 | | edges\_max\_children\_per\_outline | 40 | Max number of children inside a character outline. Increase this value if [some of KANJI characters are not recognized (rejected)](https://web.archive.org/web/*/https://code.google.com/p/tesseract-ocr/issues/detail?id=1022). | | | edges \ _max \ _children \ _per \ _outline | 40 |文字アウトライン内の最大子供数。 [一部の漢字が認識されない(拒否される)]場合は、この値を大きくしてください(https://web.archive.org/web/*/https://code.google.com/p/tesseract-ocr/issues/detail ?id = 1022)。 |

表示オプション

横に並べて表示:
変化行の前後のみ表示: