In computer software, Tesseract is a free optical character recognition engine. It was originally developed as proprietary software at Hewlett-Packard between 1985 until 1995. After ten years without any development taking place, Hewlett Packard and UNLV released it as open source in 2005. Tesseract is currently developed by Google and released under the Apache License, Version 2.0. Tesseract is considered one of the most accurate free software OCR engines currently available.
| Property | Value |
| dbpedia-owl:Software/developer
| |
| dbpedia-owl:Software/license
| |
| dbpedia-owl:Software/status
| |
| dbpedia-owl:Work/author
| |
| dbpedia-owl:Work/genre
| |
| dbpedia-owl:author
| |
| dbpedia-owl:developer
| |
| dbpedia-owl:genre
| |
| dbpedia-owl:license
| |
| dbpedia-owl:status
| |
| dbpedia-owl:thumbnail
| |
| dbpprop:abstract
|
- In computer software, Tesseract is a free optical character recognition engine. It was originally developed as proprietary software at Hewlett-Packard between 1985 until 1995. After ten years without any development taking place, Hewlett Packard and UNLV released it as open source in 2005. Tesseract is currently developed by Google and released under the Apache License, Version 2.0. Tesseract is considered one of the most accurate free software OCR engines currently available.
- Tesseract ist ein freies Texterkennungsprogramm. Es ist ein reines Zeichenerkennungsprogramm ohne Analyse von Seitengestaltung oder die Verwendung statistischer Sprachmodelle sowie ohne grafische Benutzeroberfläche, das jedoch auf Zeichenebene sehr gute Ergebnisse bietet. Seit 2006 wird das Programm weiterentwickelt als Grundlage von Google Books. Es dient als Texterkennungsmodul in OCROpus, das zusätzlich noch Analyse der Dokumentgliederung und statistische Sprachmodelle bietet. Für die Sprachen Englisch, Französisch, Italienisch, Deutsch, Spanisch und Niederländisch sind bereits Texterkennungsdaten vorhanden. Teilweise ist auch die Texterkennung von Fraktur-Texten möglich.
- Es el programa de Tecnología OCR creada por Hewlett Packard Laboratories entre 1985 y 1995. En 1995 obtuvo el lugar 3 entre los de mejor comportamiento en la contienda preparada por la UNLV(University of Nevada in Las Vegas). La utiliza google para buscar texto en los libros que ya no tienen CopyRight y así brindarle solución a los usuarios. Liberado en 2005 bajo la Apache License.
- Tesseract est un logiciel de reconnaissance optique de caractères sous licence Apache. Conçu par les ingénieurs de Hewlett Packard de 1985 à 1995, son développement est abandonné pendant les dix années suivantes; en 2006, les sources du logiciel sont libérées sous licence Apache et le logiciel est actuellement développé par Google.
- Tesseract é um software de reconhecimento ótico de caracteres gratuito, originalmente desenvolvido pela Hewlett-Packard e atualmente mantido pelo Google. Se aplica a imagens em formato tiff com texto puro em uma única coluna, convertendo a saída em um arquivo txt. Não possui mecanismos para reconhecimento de layout, desta forma não é recomendável para textos que possuam imagens, fórmulas ou mais de uma coluna.
- Tesseract — свободная программа для распознавания текстов, разрабатывавшаяся Hewlett-Packard с середины 1980-х по середину 1990-х, а затем 10 лет «пролежавшая на полке». Не так давно (в августе 2006 г) Google купил её и открыл исходные тексты под лицензией Apache 2.0 для продолжения разработки. В настоящий момент программа уже работает с UTF-8, но знает только английский, немецкий, французский, испанский, итальянский и голландский языки.
- Tesseract — вільна програма для розпізнавання текстів, розроблялася Hewlett -Packard з середини 1980-их по середину 1990-их, а потім 10 років «пролежала на полиці». Не так давно Google купив її та відкрив джерельні тексти під ліцензією Apache 2.0 для продовження розробки. На даний момент програма вже працює з UTF-8, але знає лише англійську, німецьку, французьку, іспанську, італійську та голландську мови.
|
| dbpprop:author
| |
| dbpprop:caption
|
- Tesseract 2.03 running on Gnome Terminal 2.26. "scanneddoc.tif" is the input document which will be rendered as "outputfile.txt" by Tesseract.
|
| dbpprop:collapsible
| |
| dbpprop:developer
| |
| dbpprop:genre
| |
| dbpprop:hasPhotoCollection
| |
| dbpprop:latestPreviewDate
| |
| dbpprop:latestPreviewVersion
|
- 3.00 alpha - Revision 312
|
| dbpprop:latestReleaseDate
| |
| dbpprop:latestReleaseVersion
| |
| dbpprop:license
| |
| dbpprop:name
| |
| dbpprop:operatingSystem
| |
| dbpprop:programmingLanguage
| |
| dbpprop:reference
| |
| dbpprop:screenshot
| |
| dbpprop:status
| |
| dbpprop:website
| |
| dbpprop:wikiPageUsesTemplate
| |
| dbpprop:wordnet_type
| |
| rdf:type
| |
| rdfs:comment
|
- In computer software, Tesseract is a free optical character recognition engine. It was originally developed as proprietary software at Hewlett-Packard between 1985 until 1995. After ten years without any development taking place, Hewlett Packard and UNLV released it as open source in 2005. Tesseract is currently developed by Google and released under the Apache License, Version 2.0. Tesseract is considered one of the most accurate free software OCR engines currently available.
- Tesseract ist ein freies Texterkennungsprogramm. Es ist ein reines Zeichenerkennungsprogramm ohne Analyse von Seitengestaltung oder die Verwendung statistischer Sprachmodelle sowie ohne grafische Benutzeroberfläche, das jedoch auf Zeichenebene sehr gute Ergebnisse bietet. Seit 2006 wird das Programm weiterentwickelt als Grundlage von Google Books. Es dient als Texterkennungsmodul in OCROpus, das zusätzlich noch Analyse der Dokumentgliederung und statistische Sprachmodelle bietet.
- Es el programa de Tecnología OCR creada por Hewlett Packard Laboratories entre 1985 y 1995. En 1995 obtuvo el lugar 3 entre los de mejor comportamiento en la contienda preparada por la UNLV(University of Nevada in Las Vegas). La utiliza google para buscar texto en los libros que ya no tienen CopyRight y así brindarle solución a los usuarios. Liberado en 2005 bajo la Apache License.
- Tesseract est un logiciel de reconnaissance optique de caractères sous licence Apache. Conçu par les ingénieurs de Hewlett Packard de 1985 à 1995, son développement est abandonné pendant les dix années suivantes; en 2006, les sources du logiciel sont libérées sous licence Apache et le logiciel est actuellement développé par Google.
- Tesseract é um software de reconhecimento ótico de caracteres gratuito, originalmente desenvolvido pela Hewlett-Packard e atualmente mantido pelo Google. Se aplica a imagens em formato tiff com texto puro em uma única coluna, convertendo a saída em um arquivo txt. Não possui mecanismos para reconhecimento de layout, desta forma não é recomendável para textos que possuam imagens, fórmulas ou mais de uma coluna.
- Tesseract — свободная программа для распознавания текстов, разрабатывавшаяся Hewlett-Packard с середины 1980-х по середину 1990-х, а затем 10 лет «пролежавшая на полке». Не так давно (в августе 2006 г) Google купил её и открыл исходные тексты под лицензией Apache 2.0 для продолжения разработки.
- Tesseract — вільна програма для розпізнавання текстів, розроблялася Hewlett -Packard з середини 1980-их по середину 1990-их, а потім 10 років «пролежала на полиці». Не так давно Google купив її та відкрив джерельні тексти під ліцензією Apache 2.0 для продовження розробки.
|
| rdfs:label
|
- Tesseract (software)
- Tesseract
- Tesseract OCR
- Tesseract (logiciel)
- Tesseract (software)
- Tesseract
- Tesseract
|
| owl:sameAs
| |
| skos:subject
| |
| foaf:depiction
| |
| foaf:homepage
| |
| foaf:name
| |
| foaf:page
| |
| is dbpprop:disambiguates
of | |
| is dbpprop:redirect
of | |