For GUI interface to Tesseract and other 3rd Party projects, please see User Projects - 3rd Party |
Tesseractおよび他のサードパーティープロジェクトへのGUIインターフェースについては、ユーザープロジェクト - サードパーティーを参照してください。 |
# External tools, wrappers and training projects for Tesseract |
#Tesseract用の外部ツール、ラッパー、トレーニングプロジェクト |
## Tesseract box editors and training tools |
## Tesseractボックスエディタとトレーニングツール |
Platform support depends on used language and experience of user. |
プラットフォームサポートは、使用言語とユーザーの経験によって異なります。 |
### For Tesseract-OCR 3.0x |
### Tesseract-OCR 3.0xの場合 |
#### Box file editors |
####ボックスファイルエディタ |
Name |
Last update |
Language |
Multipage support |
|
|
名前 |
最終更新日 |
言語 |
複数ページのサポート |
:--------- |
:---------------- |
:------------- |
:------------------ |
|
|
:--------- |
:---------------- |
:------------- |
:---- -------------- |
jTessBoxEditor |
2018 |
Java |
yes |
|
|
jTessBoxEditor |
2018年 |
Java |
はい |
QT Box Editor |
2018 |
C++, Qt4/Qt5 |
yes |
|
|
QTボックスエディタ |
2018年 |
C ++、Qt4 / Qt5 |
はい |
tesseract-box-editor |
2013 |
.NET 4 |
yes |
|
|
tesseract-box-editor |
2013年 |
.NET 4 |
はい |
Tesseract-OCR boxfile AJAX editor |
2012 |
online tool |
|
|
Tesseract-OCR boxfile AJAXエディタ |
2012年 |
オンラインツール |
cowboxer |
2012 |
C++, Qt4 |
no |
|
|
cowboxer |
2012年 |
C ++、Qt4 |
いいえ |
moshPyTT |
2011 |
Python, GTK2 |
no |
|
|
moshPyTT |
2011年 |
Python、GTK2 |
いいえ |
pytesseracttrainer |
2011 |
Python, GTK2 |
no |
|
|
pytesseracttrainer |
2011年 |
Python、GTK2 |
いいえ |
### For Tesseract-OCR 2.0x |
### Tesseract-OCR 2.0の場合 |
#### Box file editors |
####ボックスファイルエディタ |
Name |
Last update |
Language |
|
|
名前 |
最終更新日 |
言語 |
:--------- |
:---------------- |
:------------- |
|
|
:--------- |
:---------------- |
:------------- |
Tesseract-OCR boxfile AJAX editor |
2012 |
online tool |
|
|
Tesseract-OCR boxfile AJAXエディタ |
2012年 |
オンラインツール |
owlboxer |
2010 |
C++, Qt4 |
|
|
owlboxer |
2010年 |
C ++、Qt4 |
Tessboxer |
2009 |
.NET |
|
|
テスボクサー |
2009年 |
.NET |
boxfilereader.php |
2009 |
php |
|
|
boxfilereader.php |
2009年 |
php |
tessboxes |
2008 |
C |
|
|
tessboxes |
2008年 |
C |
JTesseract |
2008 |
C# |
|
|
JTesseract |
2008年 |
C# |
wx-tetra |
2008 |
perl, wx |
|
|
wx-tetra |
2008年 |
perl、wx |
bbtesseract |
2008 |
VB.NET 2008 |
|
|
bbtesseract |
2008年 |
VB.NET 2008 |
## Other Training Tools |
##その他のトレーニングツール |
|
* jTessBoxEditor |
Box Editor and Training Tool |
* jTessBoxEditor |
ボックスエディタとトレーニングツール |
* MzTesseract - MS Windows program that can train new language from top to bottom |
* MzTesseract - 新しい言語を上から下に訓練できるMS Windowsプログラム |
* FrankenPlus - tool for creating font training for Tesseract OCR engine from page images. More information about Franken+ is at at IT'S ALIVE! and Franken+ homepage. |
* FrankenPlus - ページ画像からTesseract OCRエンジンのフォントトレーニングを作成するためのツール。 Franken +の詳細については、[IT'S ALIVE!](http://emop.tamu.edu/node/54Franken+ :)およびFranken +ホームページを参照してください。 |
* python-tesseract-3.02-training - script to automate the generation of Tesseract 3.02 training files |
* python-tesseract-3.02-training - Tesseract 3.02トレーニングファイルの生成を自動化するためのスクリプト |
* tesseract-box-file - autoit script to make editing the box file easier |
* tesseract-box-file - ボックスファイルの編集を簡単にするautoitスクリプト |
* Serak Tesseract Trainer for Tesseract 3.02 - a front end GUI for training tesseract 3.02 |
* Tesseract 3.02用Serak Tesseract Trainer - tesseract 3.02をトレーニングするためのフロントエンドGUI |
* BoxMaker is online tool for generating image&box pair. Offline version is available in download section of PersianOCR project |
* BoxMakerは、画像とボックスのペアを生成するためのオンラインツールです。オフライン版はPersianOCRプロジェクトのダウンロードセクションにあります。 |
* boxFactory is a tool for quickly creating box files to train the Tesseract OCR engine. You can identify characters in the image by simply drawing boxes around them. |
* boxFactoryは、Tesseract OCRエンジンをトレーニングするためのボックスファイルを素早く作成するためのツールです。あなたは単にそれらの周りにボックスを描くことによって画像内の文字を識別することができます。 |
* https://github.com/BaltoRouberol/TesseractTrainer - TesseractTrainer is a simple Python API, taking over the tedious process of manually training Tesseract3 |
* https://github.com/BaltoRouberol/TesseractTrainer - TesseractTrainerは、Tesseract3を手動でトレーニングするという面倒なプロセスを引き継ぐ、シンプルなPython APIです。 |
* tess_school - a set of handy scripts to make the tesseract training process a bit easier |
* tess\ _school - テッセラートのトレーニングプロセスをもう少し簡単にするための便利なスクリプトのセット |
* txt2img: Qt GUI application that generate image and box file based on text imput |
* txt2img:テキスト入力に基づいて画像とボックスファイルを生成するQt GUIアプリケーション |
* DangAmbigs Generator: Creates a DangAmbigs file automatically given a set of OCR text output and correct text. Requirements: Python |
* DangAmbigs Generator:一連のOCRテキスト出力と正しいテキストが与えられたDangAmbigsファイルを自動的に作成します。 要件: Python |
* train.ps1: Windows powershell script for Automate Tesseract 3.01 language data pack generation process. |
* train.ps1:自動化Tesseract 3.01言語データパック生成プロセス用のWindows PowerShellスクリプト。 |
* Update unicharambigs.exe: A small (windows) C# program for editing "lang.unicharambigs" file |
* Update unicharambigs.exe: "lang.unicharambigs"ファイルを編集するための小さな(Windows)C#プログラム |
* train_tess.pl: perl script to facilitate training |
* train \ _tess.pl:トレーニングを容易にするperlスクリプト |
* boxedit A web-based editor for Tesseract box files |
* boxeditTesseractボックスファイル用のWebベースのエディタ |
* TrainYourTesseract |
Free online "no-hassle" TTF file to trainedata converter |
* TrainYourTesseract |
訓練されたデータのコンバーターへの無料のオンライン "手間のかからない" TTFファイル |
## Community training projects |
##コミュニティトレーニングプロジェクト |
* Tesseract-MICR-OCR: https://github.com/BigPino67/Tesseract-MICR-OCR |
* Tesseract-MICR-OCR: https://github.com/BigPino67/Tesseract-MICR-OCR |
* MRZ: https://groups.google.com/group/tesseract-ocr/attach/10d7c711c9cc80/mrz.traineddata |
* MRZ: https://groups.google.com/group/tesseract-ocr/attach/10d7c711c9cc80/mrz.traineddata |
* Latin: https://github.com/ryanfb/latinocr-lattraining |
* ラテン語: https://github.com/ryanfb/latinocr-lattraining |
* tesseract-georgian: https://github.com/ddohler/tesseract-georgian |
* tesseract-georgian: https://github.com/ddohler/tesseract-georgian |
* Polish Fraktur: training as result of the IMPACT project, trained dataset |
* ポーランドのFraktur : IMPACTプロジェクトの結果としてのトレーニング、トレーニング済みデータセット .pl / download / tesseract_traineddata.zip) |
* Ancient Greek: http://ancientgreekocr.org |
* 古代ギリシャ語: http://ancientgreekocr.org |
* Indic: http://code.google.com/p/tesseractindic/, https://github.com/debayan/Tesseract-Indic-OCR/, http://code.google.com/p/parichit/ (All are Obsolete) |
* インド: http://code.google.com/p/tesseractindic/、https://github.com/debayan/Tesseract-Indic-OCR/、http://code.google.com/p / parichit /(すべて旧式) |
* Indic-OCR http://indic-ocr.github.io/tessdata/ |
* Indic-OCR http://indic-ocr.github.io/tessdata/ |
* Irish uncial: https://github.com/jimregan/tesseract-gle-uncial |
* アイルランド語必須: https://github.com/jimregan/tesseract-gle-uncial |
* Polish: http://code.google.com/p/tesseract-polish/ |
* ポーランド語: http://code.google.com/p/tesseract-polish/ |
* Fraktur (dan, deu, swe): https://github.com/paalberti/tesseract-dan-fraktur |
* Fraktur(dan、deu、swe):https://github.com/paalberti/tesseract-dan-fraktur |
* Myanmar: http://code.google.com/p/myaocr/ |
* ミャンマー: http://code.google.com/p/myaocr/ |
* Persian (Farsi): https://github.com/reza1615/PersianOcr |
* ペルシャ語(ペルシア語): https://github.com/reza1615/PersianOcr |
* 7 segments font: https://github.com/arturaugusto/display_ocr/tree/master/letsgodigital |
* 7セグメントのフォント: https://github.com/arturaugusto/display_ocr/tree/master/letsgodigital |
## Ports |
##ポート |
* Project Naptha |
* プロジェクトナフサ |
* tesseract.js-core - Emscripten port of Tesseract C++ API |
* tesseract.js-core - Tesseract C ++ APIのEmscriptenポート |
* tesseract.js - Pure Javascript OCR |
* tesseract.js - Pure Javascript OCR |
## Tesseract wrappers |
## Tesseractラッパー |
### Tesseract 4.0x |
### Tesseract 4.0倍 |
Java |
Java |
* bytedeco - Java configuration and interface classes for Tesseract based on 'JavaCPP-Presets' library from https://bytedeco.org - https://github.com/bytedeco/javacpp-presets |
* bytedeco - https://bytedeco.orgからの 'JavaCPP-Presets'ライブラリーに基づくTesseract用のJava構成およびインターフェース・クラス - https://github.com/bytedeco/javacpp-presets |
### Tesseract 3.0x |
### Tesseract 3.0x |
C |
C |
* Tesseract versions 3.02 and up include C API |
* Tesseractバージョン3.02以降には[C API]が含まれています(https://github.com/tesseract-ocr/tesseract/blob/e95ff1159e652d9b8ae6bc4aafdb196981942e6a/src/api/capi.h) |
.Net |
。ネット |
* charlesw/tesseract - project offers also tesseract-ocr 64bit Windows library |
* charlesw / tesseract - プロジェクトには[tesseract-ocr 64ビットWindowsライブラリー]もあります(https://github.com/charlesw/tesseract/tree/master/src/lib/TesseractOcr /x64) |
* http://code.google.com/p/tesseractdotnet/ |
* http://code.google.com/p/tesseractdotnet/ |
Python |
Python |
* tesserocr - A Python wrapper around Tesseract's C++ API |
* tesserocr - TesseractのC ++ APIのPythonラッパー |
* pyocr - A Python wrapper for Tesseract (and Cuneiform) |
* pyocr - Tesseract(およびCuneiform)用のPythonラッパー |
* tesserwrap - Python bindings to the Tesseract API |
* tesserwrap - Tesseract APIへのPythonバインディング |
* tesseract-sip - A python SIP wrapper for libtesseract (Apache license) |
* tesseract-sip - libtesseract用のpython SIPラッパー(Apacheライセンス) |
* pytesseract - a wrapper class for Tesseract OCR |
* pytesseract - Tesseract OCRのラッパークラス |
* python-tesseract (Alternative link) - A wrapper class for Tesseract OCR that allows any conventional image files (SWIG based) |
* python-tesseract(代替リンク) - のラッパークラス任意の従来の画像ファイルを許可するTesseract OCR(SWIGベース) |
* http://code.google.com/p/pytess/ - A simple SWIG-based interface to Tesseract |
* http://code.google.com/p/pytess/ - Tesseractへの簡単なSWIGベースのインターフェース |
R |
R |
* tesseract Bindings to the C++ API for the R programming language |
* tesseractRプログラミング言語用のC ++ APIへのバインディング |
Ruby |
ルビー |
* ruby-tesseract-ocr - wrapper for tesseract 3.0x using the C++ API |
* ruby-tesseract-ocr - C ++ APIを使用したtesseract 3.0xのラッパー |
* rtesseract |
* rtesseract |
Java |
Java |
* bytedeco - Java configuration and interface classes for Tesseract based on 'JavaCPP-Presets' library from https://bytedeco.org - https://github.com/bytedeco/javacpp-presets |
* bytedeco - https://bytedeco.orgからの 'JavaCPP-Presets'ライブラリに基づくTesseract用のJava構成およびインターフェースクラスhttps://github.com/bytedeco/javacpp-presets |
* tess4j - JNA wrapper. Docs and discussions - http://tess4j.sourceforge.net/ |
* tess4j - JNAラッパー。ドキュメントとディスカッション - http://tess4j.sourceforge.net/ |
Node.js |
Node.js |
* penteract - The native node.js bindings to the Tesseract OCR project. |
* penteract - Tesseract OCRプロジェクトへのネイティブnode.jsバインディング。 |
PHP |
PHP |
* tesseract-ocr-for-php |
* tesseract-ocr-for-php |
* https://code.google.com/p/php-tesseract/ |
* https://code.google.com/p/php-tesseract/ |
Objective-C |
Objective-C |
* Tesseract-macOS |
* Tesseract-macOS |
* Tesseract-OCR-iOS |
* Tesseract-OCR-iOS |
* tesseract-ios |
* tesseract-ios |
Go |
行く |
* gosseract |
* gosseract |
Clojure |
クロージュ |
* clj-tesseract |
* clj-tesseract |
### Tesseract 2.0x |
### Tesseract 2.0x |
Python |
Python |
* https://github.com/hoffstaetter/python-tesseract/wiki |
* https://github.com/hoffstaetter/python-tesseract/wiki |
* http://code.google.com/p/pytesser/ |
* http://code.google.com/p/pytesser/ |
* http://code.google.com/p/tesseract-python (pytesser clone) |
* http://code.google.com/p/tesseract-python(pytesser clone) |
* https://github.com/hoffstaetter/python-tesseract/wiki |
* https://github.com/hoffstaetter/python-tesseract/wiki |
* http://pokerai.org/pf3/viewtopic.php?f=3&t=2677&start=0&st=0&sk=t&sd=a |
* http://pokerai.org/pf3/viewtopic.php?f=3&t=2677&start=0&st=0&sk=t&sd=a |
* patches of SWIG wrapper for python |
* SWIGラッパーのパッチpython |
.NET |
。ネット |
* http://www.pixel-technology.com/freeware/tessnet2/ |
* http://www.pixel-technology.com/freeware/tessnet2/ |
Java |
Java |
* tess4j (0.4) - JNA wrapper. Docs and discussions - http://tess4j.sourceforge.net/ |
* tess4j(0.4) - JNAラッパー。ドキュメントとディスカッション - http://tess4j.sourceforge.net/ |