frame_decoration
original (2019/05/14 付) Google 翻訳 (2019/05/23 付)
# GUIs and Other Projects using Tesseract OCR #Tesseract OCRを使ったGUIとその他のプロジェクト
## GUI ## GUI
Name Linux Mac Windows License Description 名前 Linux Mac Windows ライセンス 説明
:--------- :---------- :-------- :------------ :------------ :---------------- :--------- :---------- :-------- :------------ : - ----------- :----------------
gImageReader X X GPL v3 A graphical GTK frontend to tesseract-ocr gImageReader X X GPL v3 tesseract-ocrへのグラフィカルなGTKフロントエンド
TesseractStudio.Net X Proprietary A graphical interface to tesseract 4.0 TesseractStudio.Net X プロプライエタリtesseract 4.0へのグラフィカルインターフェース
VietOCR X X X Apache 2.0 A GUI frontend for Tesseract OCR engine. Supports optical character recognition for Vietnamese and other languages supported by Tesseract VietOCR X X X Apache 2.0 Tesseract OCRエンジン用のGUIフロントエンド。 Tesseractがサポートするベトナム語およびその他の言語の光学式文字認識をサポートします。
NeOCR X Freeware A GUI frontend for Tesseract 4.0 OCR engine. NeOCR X フリーウェアTesseract 4.0 OCRエンジン用のGUIフロントエンド。
Free-Ocr-Windows-Desktop X GNU AGPL v3 Free OCR application for the Windows Desktop - Essentially a graphical user interface (GUI) for the Tesseract OCR engine. The application also includes support for reading and scanned PDF files Free-Ocr-Windows-Desktop X GNU AGPL v3 Windowsデスクトップ用の無料OCRアプリケーション - 基本的にはTesseract OCRエンジン用のグラフィカルユーザーインターフェース(GUI)です。アプリケーションはまた、PDFファイルの読み取りとスキャンをサポートしています。
YAGF X GPL v3 A graphical front-end for cuneiform and tesseract GPL v3 楔状骨組とテッセラットのためのグラフィカルなフロントエンド
OCRFeeder X GPL v3 OCRFeeder is a document layout analysis and optical character recognition system [OCRFeeder](https://wiki.gnome.org/action / show / App / OCRFeeder) X GPL v3 OCRFeederは、文書レイアウト分析および光学式文字認識システムです。
Lector X X GPL v2 A graphical ocr solution for GNU/Linux based on Python, Qt4 and tessaract OCR 講師 X X GPL v2 Python、Qt4およびtessaract OCRに基づくGNU / Linux用のグラフィカルocrソリューション。
Tesseract-OCR QT4 gui X Apache 2.0 Tesseract-OCR QT4 gui is a simple GUI for tesseract Tesseract-OCR QT4 gui X Apache 2.0 Tesseract-OCR QT4 guiはtesseract用のシンプルなGUIです。
Lime OCR X GPL v3 A simple, free OCR software for Windows using tesseract-ocr engine ライムOCR X GPL v3 tesseract-ocrエンジンを使用したWindows用のシンプルで無料のOCRソフトウェア。
Ocrivist X GPL v3 Ocrivist is a utility which makes it possible to scan and OCR books and other printed documents to PDF or Djvu format Ocrivist X GPL v3 Ocrivistは、書籍やその他の印刷文書をスキャンしてPDFまたはDjvu形式に変換することを可能にするユーティリティです。
Tesseract-GUI X GPL v2 Tessract-GUI is not a front-end for tesseract-ocr, it is just a graphical way to use it with simple image manipulation through ImageMagick Tesseract-GUI X GPL v2 Tessract-GUIはtesseract-ocrのフロントエンドではありません。ImageMagickを使った簡単な画像操作でそれを使用するためのグラフィカルな方法です。
QTesseract X LGPL v3 QT GUI for the Tesseract OCR QTesseract X LGPL v3 Tesseract OCRのためのQT GUI
dpScreenOCR X zlib Program to recognize text on screen dpScreenOCR X zlib 画面上のテキストを認識するプログラム
pmOCR X BSD Batch OCR tool, also file monitor event OCR with tesseract pmOCR X BSD バッチOCRツール、tesseractでファイル監視イベントOCRも
tesseract4java X X X GPLv3 A cross-platform GUI for training and running Tesseract with advanced features like batch recognition and accuracy evaluation tesseract4java X X X GPLv3 バッチ認識や精度評価などの高度な機能を備えたTesseractをトレーニングおよび実行するためのクロスプラットフォームGUI
Linux-Intelligent-OCR-Solution(lios) X GPLv3 A GUI for scanning, running and training Tesseract with total accessibility for visually impaired and advanced features like Scanner Brightness optimizer, Text-Cleaner, etc Linux - インテリジェント - OCR - ソリューション(lios) X GPLv3 スキャニング、ランニング、トレーニング用のGUIスキャナーの明るさオプティマイザー、テキストクリーナーなどの視覚障害のある高度な機能のための完全なアクセシビリティを備えたTesseract。
SunnyPage OCR X Proprietary A GUI frontend for Tesseract OCR engine with automatic adjustment of image brightness, image processing and PDF support. SunnyPage OCR X プロプライエタリ画像の明るさの自動調整、画像処理およびPDFサポートを備えたTesseract OCRエンジン用のGUIフロントエンド。
PDF OCR X X X Proprietary PDF OCR is a simple drag-and-drop utility for Mac OS X and Windows, that converts your PDFs and images into text documents or searchable PDF files PDF OCR X X X プロプライエタリPDF OCRは、Mac OS XおよびWindows用のシンプルなドラッグアンドドロップユーティリティで、PDFや画像をテキスト文書または検索可能なPDFファイルに変換します。
TaxWorkFlow X Proprietary TaxWorkFlow is an accounting practice management application that includes GUI frontend for Tesseract OCR engine. The app supports AVX and allows to create OCR'ed PDF files of selected resolution and compression from PDF files and 100+ image file formats. TaxWorkFlow X プロプライエタリTaxWorkFlowは、Tesseract OCRエンジン用のGUIフロントエンドを含む会計実務管理アプリケーションです。アプリはAVXをサポートし、PDFファイルと100以上の画像ファイル形式から選択した解像度と圧縮のOCR'ed PDFファイルを作成することができます。
## Online OCR services ##オンラインOCRサービス
* OCR.net: Powered by PDF OCR X in back-end. Converts PDFs and Images to Text or searchable PDF. * OCR.net:バックエンドにPDF OCR Xを搭載。 PDFと画像をテキストまたは検索可能なPDFに変換します。
* WeOCR: is a platform for Web-enabled OCR (Optical Character Reader/Recognition) systems that enables people to use character recognition over networks * WeOCR:人々がネットワーク上で文字認識を使用できるようにするWeb対応OCR(光学式文字読取装置/認識)システムのためのプラットフォームです。
* CustomOCR * CustomOCR
* Free OCR * 無料OCR
* i2OCR * i2OCR
* Indic-OCR OCR Service An online OCR service for Indian languages * インドOCR OCRサービスインド語のオンラインOCRサービス
### Mobile ###携帯
* Android: * アンドロイド:
* tess-two - A fork of Tesseract Tools for Android tesseract-android-tools that adds some additional functions. * tess-two - Android用Tesseractツールのフォークtesseract-android-toolsいくつかの追加機能を追加する-android-tools /)。
* textfairy Android OCR App with source code at github.com * textfairy[github.com]のソースコードを含むAndroid OCRアプリ(https://github.com/ renard314 / textfairy)
* Character Recognition Android OCR App with source code at gitorious.org * 文字認識Android OCRアプリの[gitorious.org] ://gitorious.org/character-recognition/)
* tesseract-android-tools: set of Android APIs * tesseract-android-tools:Android APIのセット
* Mobile OCR: The goal of Mobile OCR is to create an application for the Android platform that will recognize text from an image taken by the phone's camera. The application will be fully accessible to low vision and blind users * Mobile OCR:Mobile OCRの目的は、携帯電話のカメラで撮影した画像からテキストを認識する、Androidプラットフォーム用のアプリケーションを作成することです。アプリケーションは、弱視や盲目のユーザーに完全にアクセス可能になります
* Across India: An app which lets users take pictures of sign boards in Indian Languages or English and transliterate it to the language that they can read. * Across India:ユーザーがインドの言語または英語で看板の写真を撮って読むことができる言語に変換することを可能にするアプリ。
* iOS: * iOS:
* Tesseract-OCR-iOS - Tesseract OCR iOS is a Framework for iOS7+, compiled also for armv7s and arm64. * Tesseract-OCR-iOS - Tesseract OCR iOSは、arm7およびarm64用にもコンパイルされたiOS 7用のFrameworkです。
* OCR-iOS-Example - a simple example of how to do optical character recognition (OCR) on iOS. * OCR-iOS-Example - iOSで光学式文字認識(OCR)を実行する方法の簡単な例。
* Tesseract-iPhone-Demo - example based on tesseract 2.04. * Tesseract-iPhone-Demo - tesseract 2.04に基づく例。
* More OS: * もっとOS:
* ScanBizCards: Mobile solution for business card scanning. Requirements: iPhone 4/iPhone 3/Android 2.0 * ScanBizCards:名刺スキャン用のモバイルソリューション。 要件: iPhone 4 / iPhone 3 / Android 2.0
## Others ##その他
* ocr-fileformat - Validate and transform between OCR file formats (hOCR, ALTO, PAGE, FineReader) * ocr-fileformat - OCRファイルフォーマット(hOCR、ALTO、PAGE、FineReader)間の検証と変換
* Tess4J - A Java JNA wrapper for Tesseract OCR API. * Tess4J - Tesseract OCR API用のJava JNAラッパー。
* Traineddata inspector - to inspect some of the internals of traineddata files * トレーニングデータインスペクター - トレーニングデータファイルの内部のいくつかを検査します
* TopOCR - high Quality OCR for Cameras with tesseract-ocr support (paid product) * TopOCR - tesseract-ocrをサポートしたカメラ用の高品質OCR(有料製品)
* Simple OCR Web Server using python, flask, tesseract-ocr, and leptonica * Simple OCR Web Server、python、flask、tesseract-ocr、およびleptonicaを使用
* Display OCR is OpenCV-Python + python-tesseract real-time image preprocess and OCR of 7 segments font. * Display OCRは、OpenCV-Python + python-tesseractのリアルタイム画像前処理および7セグメントフォントのOCRです。
* OpenOCR makes it simple to host your own OCR REST API. * OpenOCRを使用すると、独自のOCR REST APIを簡単にホストできます。
* https://github.com/guitarmind/tesseract-web-service is An implementation of RESTful web service for tesseract-OCR using tornado * https://github.com/guitarmind/tesseract-web-serviceは、トルネードを使用したtesseract-OCR用のRESTful Webサービスの実装です。
* RasterEdge .NET Image SDK - OCR Recognition is robust, high-performance recognition application of royalty-free distribution for desktop or server applications. * RasterEdge .NET Image SDK - OCR認識は、デスクトップまたはサーバー向けの無償配布の堅牢で高性能な認識アプリケーションです。アプリケーション
* DevScope OCR SDK is an Optical Character Recognition toolkit engine based on Tesseract OCR v3 that allows to develop applications using Microsoft .NET framework * DevScope OCR SDKは、Microsoft .NET Frameworkを使用したアプリケーションの開発を可能にするTesseract OCR v3に基づく光学式文字認識ツールキットエンジンです。
* Paperwork - using OCR to grep dead trees the easy way (requires pyocr) * 事務処理 - 枯れ木を簡単に掴むためのOCRの使用(pyocrが必要)
* Aletheia - An Advanced Document Layout and Text Ground-Truthing System for Production Environments * Aletheia - プロダクション環境向けの高度なドキュメントレイアウトおよびテキスト基礎学習システム
* gscan2pdf a GUI to produce PDFs or DjVus from scanned documents * gscan2pdfスキャンした文書からPDFまたはDjVusを生成するためのGUI
* Audiveris is an open-source Optical Music Recognition software which processes the image of a music sheet to automatically provide symbolic music information in MusicXML standard. * Audiverisは、楽譜の画像を処理してMusicXML規格のシンボリック音楽情報を自動的に提供する、オープンソースのOptical Music Recognitionソフトウェアです。
* Ocrivist is a utility which makes it possible to scan and OCR books and other printed documents to PDF or Djvu format. * Ocrivistは、書籍やその他の印刷物をPDFまたはDjvu形式にスキャンしてOCRすることを可能にするユーティリティです。
* thu-ipv6-login a python script for IPv6 authentication in Tsinghua University with support for OCR of authcode * thu-ipv6-login認証コードのOCRをサポートする清華大学のIPv6認証用のpythonスクリプト
* Wolfram Mathematica 9.0 use tesseract for recognizing text * Wolfram Mathematica 9.0は[テキストの認識]にtesseractを使う(https://groups.google.com/d/msg/tesseract-ocr/NmxFclHcsAE/-KaiT5oJ8oQJ )
* node-dv is a node.js library for processing and understanding scanned documents   * node-dvは、スキャンした文書を処理し理解するためのnode.jsライブラリです。
* hocr-tools - python tools for manipulating and evaluating the hOCR format for representing multi-lingual OCR results by embedding them into HTML. They include hocr-pdf tool for creating searchable pdf.   * hocr-tools - 多言語のOCR結果をHTMLに埋め込むことで表現するためのhOCR形式を操作および評価するためのpythonツール。それらは検索可能なpdfを作成するためのhocr-pdfツールを含みます。
* PyPDFOCR - Tesseract-OCR based PDF filing   * PyPDFOCR - Tesseract-OCRベースのPDFファイリング
* OCRmyPDF - Adds OCR text layer to scanned PDF files and images, allowing them to be searched. Processes pages in parallel on multi-core CPUs. Keeps exact resolution of original embedded images without recompressing JPEGs, when possible. Includes image several preprocessing options, detailed documentation, and support for many exotic PDFs.   * OCRmyPDF - スキャンしたPDFファイルと画像にOCRテキストレイヤーを追加し、それらを検索できるようにします。マルチコアCPU上でページを並列に処理します。可能であれば、JPEGを再圧縮せずに元の埋め込み画像の正確な解像度を維持します。画像、いくつかの前処理オプション、詳細なドキュメント、そして多くのエキゾチックなPDFのサポートを含みます。
* ChronoScan is a complete suite for document Scanning & Data Entry   * ChronoScanは、文書のスキャンとデータ入力のための完全なスイートです。
* speedy-ocr utility to simplify scanning and OCR focus to help blind and visually impaired community. It is part of Vinux project.   * speedy-ocrユーティリティ。スキャンとOCRフォーカスを簡素化し、視覚障害のあるコミュニティを支援します。これはVinuxプロジェクトの一部です。
* Project VIRAL Varico Invoice Recognition with Assisted Learning   * Project VIRALアシストラーニングによるVaricoの請求書認識
* Bindery: A simple GUI for binding post processed scanned pages into digital documents   * Bindery:後処理したスキャン済みページをデジタル文書にバインドするためのシンプルなGUI
* Clarify: Clarify helps you OCR 'image-only' PDFs. Your input is a PDF that you normally cannot extract text from. The output is text. Clarify is a python module that wraps up tesseract-ocr, xpdf and netpbm. Requirements: python, tesseract-ocr, xpdf, netpbm   * 明確化:明確化は、OCRの「画像のみの」PDFを手助けします。あなたの入力は通常あなたがテキストを抽出することができないPDFです。出力はテキストです。 Clarifyはtesseract-ocr、xpdf、netpbmをまとめたpythonモジュールです。 要件: python、tesseract-ocr、xpdf、netpbm
* hOcr2Pdf.NET: hOcr2Pdf.NET is a library that programmers can use to create highly compressed, searchable pdf's for applications. Requirements: .NET 2.0 or higher, Tesseract 3.0, JBig2.exe   * hOcr2Pdf.NET:hOcr2Pdf.NETは、プログラマーがアプリケーション用の高度に圧縮された検索可能なpdfを作成するために使用できるライブラリです。 要件: .NET 2.0以上、Tesseract 3.0、JBig2.exe
* PDFBeads: convert scanned images to a single searchable PDF file based on hOCR files. Requirements: ruby, RMagick, hpricot   * PDFBeads:hOCRファイルに基づいて、スキャンした画像を単一の検索可能なPDFファイルに変換します。 _要件:_ルビー、RMagick、hpricot
* ExactImage/hocr2pdf: creates a Searchable PDF from hOCR input. Requirements: libagg   * ExactImage / hocr2pdf:hOCR入力から検索可能なPDFを作成します。 要件: libagg
* HocrConverter: creates PDFs and plain text from hOCR documents. Requirements: python, reportlab   * HocrConverter:hOCR文書からPDFとプレーンテキストを作成します。 要件: python、reportlab
* HocrToPdf.java: java source for very basic hOCR to PDF converter. Compiled version can be found at project modi2hocr. Requirements: java, jericho, iText2   * HocrToPdf.java:PDFコンバータへの非常に基本的なhOCRのためのJavaソース。コンパイル版はプロジェクトmodi2hocrにあります。 要件: java、jericho、iText2
* hOcr2Pdf.NET: is a .NET library to convert .hocr html produced by Tesseract or Cuneiform into searchable pdfs using HtmlAgilityPack and iTextSharp. Requirements: C#. * hOcr2Pdf.NET:HtmlAgilityPackとiTextSharpを使用してTesseractまたはCuneiformによって作成された.hocr htmlを検索可能なpdfに変換するための.NETライブラリです。 要件: C#。
* Tally-Ho: Tally-Ho is a screen reader intended for sites like google books   * Tally-Ho:Tally-Hoは、Googleブックのようなサイトを対象としたスクリーンリーダーです。
* Mayan EDMS: Document management system with tesseract as it's base   * Mayan EDMS:tesseractを基本とした文書管理システム
* Olena: a generic and efficient image processing platform (tesseract is used in its part called scribo)   * Olena:一般的で効率的な画像処理プラットフォーム(tesseractは[scribo]と呼ばれる部分で使用されています(http: //git.lrde.epita.fr/?p=olena.git;a=tree))
* ocrodjvu is a wrapper for OCR systems, that allows you to perform OCR on DjVu files   * ocrodjvuは、DjVuファイルに対してOCRを実行できるようにするOCRシステム用のラッパーです。
* PaRADIIT (Pattern Redundancy Analysis for Document Image Indexation & Transcription) is a project initiated and sponsored by 2 successive Google DH awards. It aims to turn ancient books, especially from the Renaissance, into accessible digital libraries.   * PaRADIIT(文書画像の索引付けと転記のためのパターン冗長性分析)は、2つの連続したGoogle DHアワードによって開始および後援されるプロジェクトです。特にルネサンスからの古書をアクセス可能なデジタル図書館に変えることを目指しています。
* The ISRI Analytic Tools consist of 17 tools for measuring the performance of and experimenting with OCR output.   * ISRI分析ツールは、OCR出力のパフォーマンスを測定して実験するための17のツールで構成されています。
* pdf2pdfocr is a tool to OCR a PDF (or supported images) and add a text layer in the original file making it a searchable PDF. It is a python script that uses tesseract and other open source tools. Linux, macOS and Windows supported.   * pdf2pdfocrは、PDF(またはサポートされている画像)をOCRし、元のファイルにテキストレイヤーを追加して検索可能なPDFにするツールです。それはtesseractと他のオープンソースツールを使用するpythonスクリプトです。 Linux、macOS、およびWindowsがサポートされています。
* Indic Messenger A Facebook chat bot which can OCR images containing Indian/English text and transliterate it to other Indian scripts.   * インドのメッセンジャーインド/英語のテキストを含む画像をOCRして他のインドの文字に翻字することができるFacebookのチャットボット。
* LibreOCR A LibreOffice extension which can convert an image to OCT and open in the Writer application.   * LibreOCRイメージをOCTに変換してWriterアプリケーションで開くことができるLibreOffice拡張機能。
### IMPACT related ###インパクト関連
* IMPACT project * IMPACTプロジェクト
* IMPACT Centre - a not-for-profit organisation founded to sustain IMPACT outcomes and foster community building * IMPACT Center - IMPACTの成果を持続させ、コミュニティの構築を促進するために設立された非営利団体
* IMPACT data * インパクトデータ
* IMPACT tools * インパクトツール
* Results of the IMPACT project by PSNC Digital Libraries Team * IMPACTプロジェクトの結果PSNCデジタル図書館チーム
* Virtual Transcription Laboratory by PSNC * PSNCによるVirtual Transcription Laboratory
* IMPACT Interoperability Framework - interoperability layer supporting the loose coupling of software components developed during the IMPACT project. * IMPACT相互運用性フレームワーク - IMPACTプロジェクト中に開発されたソフトウェアコンポーネントの疎結合をサポートする相互運用層。
* Inventory-Extraction-Tool Prototype is a prototype with graphical user interface (GUI) that allows for the extraction of a complete list of characters from a document, without reference to a specific language dictionary or a library of fonts. * Inventory-Extraction-Toolプロトタイプは、ドキュメントから文字の完全なリストを抽出することを可能にするグラフィカルユーザーインターフェイス(GUI)を備えたプロトタイプです。特定の言語辞書またはフォントのライブラリへの参照。
* Post Correction Tool is interactive post-correction of OCRed documents. Using the information obtained by the Text and Error Profiler the whole correction process is adaptive to the document being processed. In this way, usually huge numbers of systematic errors can be corrected with just a few keystrokes.. * Post Correction Toolは、OCR文書の対話型の後補正です。 Text and Error Profilerによって取得された情報を使用して、修正プロセス全体が処理中の文書に適応します。このようにして、通常、膨大な数の系統的エラーを数回のキーストロークで修正できます。
* OCR evaluation tool. * OCR評価ツール
* BlackLab is a corpus retrieval engine built on top of Apache Lucene. It allows fast, complex searches with accurate hit highlighting on large, tagged and annotated, bodies of text. It was developed at the Institute of Dutch Lexicology (INL) to provide a fast and feature-rich search interface on our historical and contemporary text corpora. * BlackLabは、Apache Lucene上に構築されたコーパス検索エンジンです。これにより、タグ付きおよび注釈付きの大きなテキスト本文を正確にヒットハイライト表示して、高速で複雑な検索が可能になります。これはオランダ語彙学研究所(INL)で開発され、私たちの歴史的および現代的なテキストコーパス上で高速で機能豊富な検索インターフェースを提供します。
For more information about IMPACT project see discussion in tesseract forum. IMPACTプロジェクトの詳細については、tesseractフォーラムでの議論を参照してください。 tesseract-ocr / A1Qq_vfKyRs)
最終更新:2019年08月18日 20:44