About: ALTO (XML)     Goto   Sponge   NotDistinct   Permalink

An Entity of Type : yago:WikicatDocuments, within Data Space : dbpedia.org associated with source document(s)
QRcode icon
http://dbpedia.org/describe/?url=http%3A%2F%2Fdbpedia.org%2Fresource%2FALTO_%28XML%29

ALTO (Analyzed Layout and Text Object) is an open XML Schema developed by the EU-funded project called METAe. The standard was initially developed for the description of text OCR and layout information of pages for digitized material. The goal was to describe the layout and text in a form to be able to reconstruct the original appearance based on the digitized information - similar to the approach of a lossless image saving operation. The standard is hosted by the Library of Congress since 2010 and maintained by the Editorial Board initialized at the same time.

AttributesValues
rdf:type
rdfs:label
  • Analyzed Layout and Text Object (de)
  • ALTO (XML) (en)
  • ALTO (XML) (es)
  • ALTO (XML) (fr)
rdfs:comment
  • ALTO (Analyzed Layout and Text Object) is an open XML Schema developed by the EU-funded project called METAe. The standard was initially developed for the description of text OCR and layout information of pages for digitized material. The goal was to describe the layout and text in a form to be able to reconstruct the original appearance based on the digitized information - similar to the approach of a lossless image saving operation. The standard is hosted by the Library of Congress since 2010 and maintained by the Editorial Board initialized at the same time. (en)
  • ALTO (Analized Layout and Text Object) es un esquema XML (usado para almacenar información en forma electrónica) que detalla los metadatos técnicos para describir el diseño gráfico y el texto de las imágenes digitales -ej. páginas de un libro o periódico-, obtenido por medio de un reconocimiento óptico de caracteres. Se inició en un proyecto europeo denominado METAe.​ (es)
  • ALTO (Analyzed Layout and Text Object) ist ein offenes XML Schema zur Beschreibung von Layoutinformationen digitalisierter Objekte. Der Standard wurde ursprünglich für die Beschreibung von OCR-Erkennungsergebnissen Text und Layout auf Seitenebene von digitalisierten Materialien entwickelt. Ziel war es, den Text und das Layout so zu beschreiben, dass eine Rekonstruktion auf Basis digitalisierten Materials möglich wäre. ALTO wurde in dem von der EU geförderten Projekt METAe entwickelt. Seit 2010 wird der Standard durch die Library of Congress und ein Herausgeber-Team gepflegt. (de)
  • ALTO (Analysed Layout and Text Object) est un standard XML permettant de rendre compte de la mise en page physique et de la structure logique d'un texte transcrit par reconnaissance optique de caractères (OCR). Le format est issu du projet européen METAe. * les coordonnées, * le taux de confiance de reconnaissance * des éléments de forme (police par ex.). Le format s'adapte tout particulièrement aux politiques de numérisation actuelles, il permet la superposition de l’image et du texte (en PDF par ex.). (fr)
dcterms:subject
Wikipage page ID
Wikipage revision ID
Link from a Wikipage to another Wikipage
Link from a Wikipage to an external page
sameAs
dbp:wikiPageUsesTemplate
date
url
has abstract
  • ALTO (Analyzed Layout and Text Object) is an open XML Schema developed by the EU-funded project called METAe. The standard was initially developed for the description of text OCR and layout information of pages for digitized material. The goal was to describe the layout and text in a form to be able to reconstruct the original appearance based on the digitized information - similar to the approach of a lossless image saving operation. ALTO is often used in combination with Metadata Encoding and Transmission Standard (METS) for the description of the whole digitized object and creation of references across the ALTO files, e.g. reading sequence description. The standard is hosted by the Library of Congress since 2010 and maintained by the Editorial Board initialized at the same time. In the time from the final version of the ALTO standard in June 2004 (version 1.0) ALTO was maintained by CCS CCS Content Conversion Specialists GmbH, Hamburg up to version 1.4. (en)
  • ALTO (Analyzed Layout and Text Object) ist ein offenes XML Schema zur Beschreibung von Layoutinformationen digitalisierter Objekte. Der Standard wurde ursprünglich für die Beschreibung von OCR-Erkennungsergebnissen Text und Layout auf Seitenebene von digitalisierten Materialien entwickelt. Ziel war es, den Text und das Layout so zu beschreiben, dass eine Rekonstruktion auf Basis digitalisierten Materials möglich wäre. ALTO wird oft in Kombination mit Metadata Encoding and Transmission Standard (METS) für die Beschreibung des gesamten digitalisierten Objektes und die Erzeugung von Referenzen innerhalb der ALTO-Datei verwendet, z. B. um die Lese-Abfolge festzulegen. ALTO wurde in dem von der EU geförderten Projekt METAe entwickelt. Seit 2010 wird der Standard durch die Library of Congress und ein Herausgeber-Team gepflegt. Durch die Empfehlung in einer DFG-Richtlinie ist ALTO ein de facto-Standard für Text-Digitalisierungsprojekte in Deutschland und wird beispielsweise vom DFG-Viewer unterstützt. (de)
  • ALTO (Analized Layout and Text Object) es un esquema XML (usado para almacenar información en forma electrónica) que detalla los metadatos técnicos para describir el diseño gráfico y el texto de las imágenes digitales -ej. páginas de un libro o periódico-, obtenido por medio de un reconocimiento óptico de caracteres. Se inició en un proyecto europeo denominado METAe.​ Su finalidad es describir el texto y su disposición en la página de una forma que haga posible reconstruir la apariencia original basándose en la información de la página digitalizada; un enfoque similar al de una operación de guardar la imagen sin pérdida de información por compresión. Comúnmente se utiliza como un esquema de extensión dentro la sección de metadatos administrativos del esquema METS (Metadata Encoding and Transmission Standard) que sirven para la descripción de la totalidad del objeto digitalizado y la creación de referencias a través de los distintos archivos que lo componen. Su uso es más que conveniente para la conservación y búsqueda de la información textual a largo plazo, como resultado de un proceso de digitalización, por ser un estándar abierto XML frente al PDF/A, que también permite la superposición de la imagen y texto. (es)
  • ALTO (Analysed Layout and Text Object) est un standard XML permettant de rendre compte de la mise en page physique et de la structure logique d'un texte transcrit par reconnaissance optique de caractères (OCR). Le format est issu du projet européen METAe. Ce schéma maintenu par la Bibliothèque du Congrès et la Bibliothèque nationale de France, est très utilisé pour la conversion en mode texte (OCR) en France et à l’étranger.Il est très adapté à la conservation à long terme des données issues de la conversion ; il permet une réutilisation ultérieure du mode texte, dans la mesure où il contient pour chaque boîte de texte : * les coordonnées, * le taux de confiance de reconnaissance * des éléments de forme (police par ex.). Le format s'adapte tout particulièrement aux politiques de numérisation actuelles, il permet la superposition de l’image et du texte (en PDF par ex.). La Bibliothèque nationale de Finlande a développé un éditeur en ligne permettant aux utilisateurs de corriger le texte reconnu de façon logiciel et d'ainsi améliorer le résultat de façon collaborative. (fr)
gold:hypernym
prov:wasDerivedFrom
page length (characters) of wiki page
foaf:isPrimaryTopicOf
is Link from a Wikipage to another Wikipage of
is Wikipage disambiguates of
is foaf:primaryTopic of
Faceted Search & Find service v1.17_git139 as of Feb 29 2024


Alternative Linked Data Documents: ODE     Content Formats:   [cxml] [csv]     RDF   [text] [turtle] [ld+json] [rdf+json] [rdf+xml]     ODATA   [atom+xml] [odata+json]     Microdata   [microdata+json] [html]    About   
This material is Open Knowledge   W3C Semantic Web Technology [RDF Data] Valid XHTML + RDFa
OpenLink Virtuoso version 08.03.3330 as of Mar 19 2024, on Linux (x86_64-generic-linux-glibc212), Single-Server Edition (61 GB total memory, 49 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software