frame_decoration
original (2019/05/14 付) Google 翻訳 (2019/05/18 付)
## The Hallucination Effect ##幻覚効果
Is the sensitive dependence on the initial conditions in which a small change in one state in the system can result in large differences in a later state. It's some-how connected to "The Butterfly Effect" & "The Domino Effect". システム内の1つの状態の小さな変化が後の状態に大きな違いをもたらす可能性がある初期条件への敏感な依存関係です。それは「バタフライ効果」と「ドミノ効果」に何らかの関係があります。
## Observing this phenomenon in Tesseract 4.x ## Tesseract 4.xでこの現象を観察する
If your training text frequently includes a certain element in a certain form. トレーニングテキストに頻繁に特定の形式の特定の要素が含まれている場合。
- Example 1: A word is frequently in the Capital form Word, then when you use that trained model to recognize word, it's going to hallucinate and see it as Word. - 例1:単語はしばしば大文字の形をしていますWordそれであなたがwordを認識するためにその訓練されたモデルを使うとき、それは幻覚を起こしてそれをWordとして見るつもりです
- Example 2: Your training text frequently includes a Space at the beginning of your sentences or at the end. Might result in slow training, non-convergence & even model corruption. - 例2:あなたのトレーニングテキストは、あなたの文の始めまたは終わりにしばしば Spaceを含みます。トレーニングが遅くなり、収束しなくなり、モデルが破損する可能性があります。
## Conclusion ##まとめ
Mostly, The Hallucination Effect is a product of the text that have been used to create the traineddata model. ほとんどの場合、幻覚効果は traineddataモデルを作成するために使用されてきたテキストの産物です。
* To combat such effect, one should refrain from excessive use of a single element/form/character/ etc... *そのような効果に対抗するために、1つの要素/フォーム/文字などの過剰な使用を控えるべきです。
Also, one should use a vast and diverse text input for training, while cleaning and removing the parts that you deem unnecessary, because Neural Networks also learn patterns & language behavior. また、「ニューラルネットワーク」はパターンや言語の振る舞いも学習するため、不要であると思われる部分をクリーニングして削除しながら、トレーニングには多種多様なテキスト入力を使用する必要があります。
最終更新:2019年06月15日 21:10