Tesseract is a free software optical character recognition engine for various operating systems. Originally developed as proprietary software at Hewlett-Packard between 1985 and 1995, it had very little work done on it in the following decade. It was then released as open source in 2005 by Hewlett Packard and UNLV. Tesseract development has been sponsored by Google since 2006. It is released under the Apache License, Version 2.0.

PropertyValue
dbpedia-owl:abstract
  • Tesseract é um software de reconhecimento ótico de caracteres gratuito, originalmente desenvolvido pela Hewlett-Packard e atualmente mantido pelo Google. Se aplica a imagens em formato tiff com texto puro em uma única coluna, convertendo a saída em um arquivo txt. Não possui mecanismos para reconhecimento de layout, desta forma não é recomendável para textos que possuam imagens, fórmulas ou mais de uma coluna.
  • Tesseract es un motor OCR libre. Fue desarrollado originalmente por Hewlett Packard como software propietario entre 1985 y 1995. Tras diez años sin ningún desarrollo, fue liberado como código abierto en el año 2005 por Hewlett Packard y la Universidad de Nevada, Las Vegas. Tesseract es desarrollado actualmente por Google y distribuido bajo la licencia Apache, versión 2.0. Tesseract está considerado como uno de los motores OCR libres con mayor precisión disponibles actualmente.
  • Tesseract is a free software optical character recognition engine for various operating systems. Originally developed as proprietary software at Hewlett-Packard between 1985 and 1995, it had very little work done on it in the following decade. It was then released as open source in 2005 by Hewlett Packard and UNLV. Tesseract development has been sponsored by Google since 2006. It is released under the Apache License, Version 2.0. Tesseract is considered one of the most accurate free software OCR engines currently available.
  • Tesseract is een vrij computerprogramma voor optical character recognition. Het werd oorspronkelijk ontwikkeld tussen 1985 en 1995 in licentie door Hewlett-Packard. Na tien jaren zonder dat er enige ontwikkeling was, hebben Hewlett Packard en de University of Nevada (Las Vegas) het in 2005 vrijgegeven als open source. Tesseract wordt tegenwoordig ontwikkeld door Google en uitgegeven onder de Apache-licentie 2.0. Tesseract wordt beschouwd als een van de meest nauwkeurige vrije OCR-softwaremachines die tegenwoordig beschikbaar zijn.
  • Tesseract è un software libero per il riconoscimento ottico dei caratteri (OCR) . Sviluppato originariamente come software proprietario dalla Hewlett-Packard tra il 1985 e il 1995, non venne più aggiornato nel decennio successivo. Fu poi rilasciato come open source nel 2005 da Hewlett Packard e dall'Università del Nevada, Las Vegas, e rilasciato con la licenza Apache, versione 2.0. Lo sviluppo di Tesseract è attualmente sponsorizzato da Google. Come tutti i programmi OCR, anche Tesseract serve a convertire il testo contenuto in un'immagine, ottenuta di solito per mezzo di uno scanner, in caratteri comprensibili ad un elaboratore di testi. I risultati sono molto buoni per quanto riguarda il riconoscimento dei caratteri; manca invece la capacità di mantenere il layout delle pagine, per esempio le tabelle o le colonne. Inizialmente limitato ai soli caratteri ASCII, nell'ottobre 2011 Tesseract supporta i caratteri UTF-8 e riconosce 33 lingue. Un'altra limitazione di Tesseract è quella di accettare solo immagini Tagged Image File Format, con l'estensione «. tif». Il software inoltre è attualmente utilizzabile da riga di comando digitando, in una finestra di terminale, il seguente comando: tesseract <percorso del file TIFF> <nome del file di output> Sarà generato automaticamente un file di testo con estensione «. txt».
  • Tesseract ist eine freie Software zur Texterkennung. Es ist ein reines Zeichenerkennungsprogramm ohne die Verwendung statistischer Sprachmodelle sowie ohne grafische Benutzeroberfläche, das jedoch auf Zeichenebene sehr gute Ergebnisse bietet. Es wird in der Programmiersprache C++ entwickelt. Für eine Vielzahl von Sprachen sind bereits Texterkennungsdaten in Zusatzmodulen vorhanden. Mit einem entsprechenden Modul ist teilweise auch die Erkennung deutscher Fraktur-Schrift möglich.
  • Tesseract est un logiciel de reconnaissance optique de caractères sous licence Apache. Conçu par les ingénieurs de Hewlett Packard de 1985 à 1995, son développement est abandonné pendant les dix années suivantes ; en 2005, les sources du logiciel sont libérées sous licence Apache et le logiciel est actuellement développé par Google. Initialement limité aux caractère ASCII, il supporte parfaitement les caractères UTF-8 et reconnait maintenant 33 langues.
  • Tesseract  — свободная компьютерная программа для распознавания текстов, разрабатывавшаяся Hewlett-Packard с середины 1980-х по середину 1990-х, а затем 10 лет «пролежавшая на полке». В августе 2006 г. Google купил её и открыл исходные тексты под лицензией Apache 2.0 для продолжения разработки. В настоящий момент программа уже работает с UTF-8, поддержка языков (включая русский с версии 3.0) осуществляется с помощью дополнительных модулей.
dbpedia-owl:author
dbpedia-owl:developer
dbpedia-owl:genre
dbpedia-owl:language
dbpedia-owl:latestReleaseVersion
  • 3.02
dbpedia-owl:license
dbpedia-owl:operatingSystem
dbpedia-owl:programmingLanguage
dbpedia-owl:status
  • Active
dbpedia-owl:thumbnail
dbpedia-owl:wikiPageExternalLink
dbpedia-owl:wikiPageID
  • 6882267 (xsd:integer)
dbpedia-owl:wikiPageInLinkCount
  • 14 (xsd:integer)
dbpedia-owl:wikiPageOutLinkCount
  • 91 (xsd:integer)
dbpedia-owl:wikiPageRevisionID
  • 544532304 (xsd:integer)
dbpprop:author
  • Ray Smith, Hewlett-Packard
dbpprop:caption
  • Tesseract 2.03 running on Gnome Terminal 2.26. "scanneddoc.tif" is the input document which will be rendered as "outputfile.txt" by Tesseract.
dbpprop:developer
dbpprop:genre
dbpprop:hasPhotoCollection
dbpprop:language
  • Recognition: Arabic, Bulgarian, Catalan, Czech, Danish, Dutch, English, Finnish, French, German, Greek, Hindi Hungarian, Indonesian, Italian, Latvian, Lithuanian, Norwegian, Polish, Portuguese, Romanian, Russian, Serbian, Slovak, Slovenian, Spanish, Swedish, Tagalog, Thai, Turkish, Ukrainian & Vietnamese
  • Interface: English
dbpprop:latestReleaseVersion
  • 3.020000 (xsd:double)
dbpprop:license
  • Apache License v2.0
dbpprop:logo
  • 250 (xsd:integer)
dbpprop:name
  • Tesseract
dbpprop:operatingSystem
  • Linux , Windows , and, unofficially, Mac OS X
dbpprop:programmingLanguage
  • C and C++
dbpprop:screenshot
  • 250 (xsd:integer)
dbpprop:status
  • Active
dbpprop:wordnet_type
dcterms:subject
rdf:type
rdfs:comment
  • Tesseract is een vrij computerprogramma voor optical character recognition. Het werd oorspronkelijk ontwikkeld tussen 1985 en 1995 in licentie door Hewlett-Packard. Na tien jaren zonder dat er enige ontwikkeling was, hebben Hewlett Packard en de University of Nevada (Las Vegas) het in 2005 vrijgegeven als open source. Tesseract wordt tegenwoordig ontwikkeld door Google en uitgegeven onder de Apache-licentie 2.0.
  • Tesseract is a free software optical character recognition engine for various operating systems. Originally developed as proprietary software at Hewlett-Packard between 1985 and 1995, it had very little work done on it in the following decade. It was then released as open source in 2005 by Hewlett Packard and UNLV. Tesseract development has been sponsored by Google since 2006. It is released under the Apache License, Version 2.0.
  • Tesseract è un software libero per il riconoscimento ottico dei caratteri (OCR) . Sviluppato originariamente come software proprietario dalla Hewlett-Packard tra il 1985 e il 1995, non venne più aggiornato nel decennio successivo. Fu poi rilasciato come open source nel 2005 da Hewlett Packard e dall'Università del Nevada, Las Vegas, e rilasciato con la licenza Apache, versione 2.0. Lo sviluppo di Tesseract è attualmente sponsorizzato da Google.
  • Tesseract é um software de reconhecimento ótico de caracteres gratuito, originalmente desenvolvido pela Hewlett-Packard e atualmente mantido pelo Google. Se aplica a imagens em formato tiff com texto puro em uma única coluna, convertendo a saída em um arquivo txt. Não possui mecanismos para reconhecimento de layout, desta forma não é recomendável para textos que possuam imagens, fórmulas ou mais de uma coluna.
  • Tesseract es un motor OCR libre. Fue desarrollado originalmente por Hewlett Packard como software propietario entre 1985 y 1995. Tras diez años sin ningún desarrollo, fue liberado como código abierto en el año 2005 por Hewlett Packard y la Universidad de Nevada, Las Vegas. Tesseract es desarrollado actualmente por Google y distribuido bajo la licencia Apache, versión 2.0. Tesseract está considerado como uno de los motores OCR libres con mayor precisión disponibles actualmente.
  • Tesseract ist eine freie Software zur Texterkennung. Es ist ein reines Zeichenerkennungsprogramm ohne die Verwendung statistischer Sprachmodelle sowie ohne grafische Benutzeroberfläche, das jedoch auf Zeichenebene sehr gute Ergebnisse bietet. Es wird in der Programmiersprache C++ entwickelt. Für eine Vielzahl von Sprachen sind bereits Texterkennungsdaten in Zusatzmodulen vorhanden. Mit einem entsprechenden Modul ist teilweise auch die Erkennung deutscher Fraktur-Schrift möglich.
  • Tesseract est un logiciel de reconnaissance optique de caractères sous licence Apache. Conçu par les ingénieurs de Hewlett Packard de 1985 à 1995, son développement est abandonné pendant les dix années suivantes ; en 2005, les sources du logiciel sont libérées sous licence Apache et le logiciel est actuellement développé par Google. Initialement limité aux caractère ASCII, il supporte parfaitement les caractères UTF-8 et reconnait maintenant 33 langues.
  • Tesseract  — свободная компьютерная программа для распознавания текстов, разрабатывавшаяся Hewlett-Packard с середины 1980-х по середину 1990-х, а затем 10 лет «пролежавшая на полке». В августе 2006 г. Google купил её и открыл исходные тексты под лицензией Apache 2.0 для продолжения разработки. В настоящий момент программа уже работает с UTF-8, поддержка языков (включая русский с версии 3.0) осуществляется с помощью дополнительных модулей.
rdfs:label
  • Tesseract (Software)
  • Tesseract (software)
  • Tesseract OCR
  • Tesseract (logiciel)
  • Tesseract (software)
  • Tesseract (software)
  • Tesseract (software)
  • Tesseract
owl:sameAs
http://www.w3.org/ns/prov#wasDerivedFrom
foaf:depiction
foaf:homepage
foaf:isPrimaryTopicOf
foaf:name
  • Tesseract
is dbpedia-owl:wikiPageDisambiguates of
is dbpedia-owl:wikiPageRedirects of
is owl:sameAs of
is foaf:primaryTopic of