Optical character recognition, usually abbreviated to OCR, is the mechanical or electronic translation of images of handwritten, typewritten or printed text (usually captured by a scanner) into machine-editable text. OCR is a field of research in pattern recognition, artificial intelligence and computer vision. Though academic research in the field continues, the focus on OCR has shifted to implementation of proven techniques.

PropertyValue
dbpprop:abstract
  • Optical character recognition, usually abbreviated to OCR, is the mechanical or electronic translation of images of handwritten, typewritten or printed text (usually captured by a scanner) into machine-editable text. OCR is a field of research in pattern recognition, artificial intelligence and computer vision. Though academic research in the field continues, the focus on OCR has shifted to implementation of proven techniques. Optical character recognition (using optical techniques such as mirrors and lenses) and digital character recognition (using scanners and computer algorithms) were originally considered separate fields. Because very few applications survive that use true optical techniques, the OCR term has now been broadened to include digital image processing as well. Early systems required training (the provision of known samples of each character) to read a specific font. "Intelligent" systems with a high degree of recognition accuracy for most fonts are now common. Some systems are even capable of reproducing formatted output that closely approximates the original scanned page including images, columns and other non-textual components.
  • Texterkennung oder auch Optische Zeichenerkennung ist ein Begriff aus dem IT-Bereich und beschreibt die automatische Texterkennung von einer gedruckten Vorlage.
  • El programari de reconeixement òptic de caràcters, abreviat habitualment com OCR (Optical character recognition), extrau d'una imatge els caràcters que componen un text per a emmagatzemar-los en un format amb el qual puguen interactuar programes d'edició de text. Mentres que en una imatge els caràcters es descriuen indicant cada un dels píxels que els formen, al convertir-los a un format de text (per exemple ASCII o unicode), passen a estar descrits per un sol número, pel que es produïx una reducció significativa de l'espai en memòria que ocupen. A partir d'ací el text és reconegut com a text, de manera que es poden buscar en ell cadenes de caràcters, exportar el text a un editor de textos, o a altres aplicacions, etc. Actualment, junt amb el text, es registra també el format amb què ha sigut escrit. Una variant és l'OMR (optical Mark recognition) que s'utilitza per a reconeixement de marques. Un exemple seria la correcció automàtica d'exàmens de tipus test, en els que la resposta correcta es rodeja amb un cercle.
  • OCR neboli optické rozpoznávání znaků (z anglického Optical Character Recognition) je metoda, která pomocí scanneru umožňuje digitalizaci tištěných textů, s nimiž pak lze pracovat jako s normálním počítačovým textem. Počítačový program převádí obraz buď automaticky nebo se musí naučit rozpoznávat znaky. Převedený text je téměř vždy v závislosti na kvalitě předlohy třeba podrobit důkladné korektuře, protože OCR program nerozezná všechna písmena správně. OCR – zpracování textu z tištěné do elektronické podoby je použitelné pro všechny tištěné výstupy z laserových, inkoustových, termosublimačních a jehličkových tiskáren a samozřejmě pro předlohy vytištěné knihtiskem. U nevhodných předloh např. slabě vytištěných jehličkových tiskáren nebo dohromady slitých písmen se z časového hlediska vyplatí spíše přepis textu.
  • El software de reconocimiento óptico de caracteres, abreviado habitualmente como OCR (Optical character recognition), extrae de una imagen los caracteres que componen un texto para almacenarlos en un formato con el cual puedan interactuar programas de edición de texto. Mientras que en una imagen los caracteres se describen indicando cada uno de los píxeles que los forman, al convertirlos a un formato de texto, pasan a estar descritos por un solo número, por lo que se produce una reducción significativa del espacio en memoria que ocupan. A partir de ahí el texto es reconocido como texto, de modo que se pueden buscar en él cadenas de caracteres, exportar el texto a un editor de textos, o a otras aplicaciones, etc. Actualmente, junto con el texto, se registra también el formato con el que ha sido escrito. Una variante es el Reconocimiento óptico de marcas (optical mark recognition) que se utiliza para reconocimiento de marcas. Un ejemplo sería la corrección automática de exámenes de tipo test, en los que la respuesta correcta se rodea con un círculo.
  • Tekstintunnistus (engl. Optical character recognition, OCR) on tapa muuntaa esimerkiksi kuvanlukijalla skannatuista kuvista tekstit takaisin muokattavaksi tekstiksi jonkin tähän tarkoitukseen suunnitellun ohjelman avulla. Monissa kuvanlukijoissa on myös OCR-toiminto, jonka avulla tekstin voi skannata suoraan muokattavaksi tekstiksi eikä sitä näin ollen tarvitse skannata kuvana. OCR-toimintoja on myös boteissa jotka kiertelevät keskustelupalstoilla ja lähettelevät roskapostia. OCR-toiminto antaa botille mahdollisuuden läpäistä kuvavarmennustesti.
  • La reconnaissance optique de caractères (ROC), ou encore appelé vidéocodage (traitement postal, chèque bancaire) désigne les procédés informatiques pour la traduction d'images de textes imprimés ou dactylographiés en fichiers de texte. Elle réalise beaucoup moins que l'être humain qui, lui, exécute, en plus de la reconnaissance, la compréhension du message, sa mémorisation, voire son analyse critique dans un seul temps. Un ordinateur réclame pour l'exécution de cette tâche un logiciel de reconnaissance optique de caractères, ROC ou OCR (abréviation du terme anglais optical character recognition), Celui-ci permet de récupérer le texte dans l'image d'un texte imprimé et de le sauvegarder dans un fichier pouvant être exploité dans un traitement de texte pour enrichissement, et stocké dans une base de données ou du moins, sur un support sûr et exploitable par un système informatique.
  • Az optikai karakterfelismerés (rövidítve OCR az angol optical character recognition szavakból) a számítástechnikában azon eljárások módszere, melyek lehetővé teszik a fizikai hordozón szereplő analóg írás, szöveg digitális formába történő alakítását. Az átalakított szöveg ezután könnyen használható, feldolgozható számítógépes környezetben. A felismerési folyamat részei: az írás képének beolvasása (scanning); a képen szereplő szövegblokkok, szövegsorok vizsgálata; a blokkokban, sorokban szereplő betűk vagy betűpárok felismerése; és a felismert szöveg ellenőrzése (például helyesírás- vagy nyelvtani ellenőrzés). Ezen részek nem mindegyike kell, hogy szerepeljen egy OCR-programban, azonban mellőzésük rontja a felismerés hatékonyságát.
  • I sistemi di Optical Character Recognition (riconoscimento ottico dei caratteri detti anche OCR) sono programmi dedicati alla conversione di un'immagine contenente testo, solitamente acquisite tramite scanner, in testo digitale modificabile con un normale editor. Il testo può essere convertito in formato ASCII semplice, Unicode o, nel caso dei sistemi più avanzati, in un formato contenente anche l'impaginazione del documento. L'OCR è un campo di ricerca dell'intelligenza artificiale, della visione artificiale e del pattern recognition, legati al riconoscimento delle immagini.
  • 光学文字認識(こうがくもじにんしき、Optical Character Recognition)は、活字の文書の画像(通常イメージスキャナーで取り込まれる)をコンピュータが編集できる形式(文字コードの列)に変換するソフトウェアである。一般にOCRと略記される。OCRは、人工知能やマシンビジョンの研究分野として始まった。研究は続けられているが、OCRの中心はその実装と応用に移っている。 (鏡やレンズといった光学技術を使った)光学文字認識と(スキャナーとアルゴリズムによる)デジタル文字認識は本来別の領域と考えられていた。光学技術として生き残った部分が非常に少ないため、光学文字認識という言葉は現在ではデジタル文字認識を含むものとみなされている。 初期のシステムは特定の書体を読むための「トレーニング」が必要であった(事前にその書体のサンプルを読ませることを意味する)。現在では、ほとんどの書体を高い識字率で変換することが可能である。いくつかのシステムでは読み込まれた画像からそれとほぼ同じになるようフォーマットされた出力(例えばワードプロセッサのファイルのようなもの)を生成することが可能であり、中には画像などの文書以外の部分が含まれていても正しく認識するものもある。
  • Optical character recognition (OCR), of in het Nederlands: optische tekenherkenning is een transformatie waarbij uit een afbeelding van een tekst door middel van patroonherkenning alle tekens uit de afbeelding als zodanig worden herkend en apart opgeslagen door een computer(programma). Een voorbeeld hiervan is Automatische kentekenplaatherkenning. Meestal wordt een scanner gebruikt om een afbeelding van het papier te maken en naar de computer te sturen. De afbeelding wordt meestal aangemaakt met een resolutie van 150-300 dpi en opgeslagen in het TIFF formaat. Om goed te kunnen worden geïnterpreteerd door een OCR computerprogramma dient het bestand in zwart-wit opgeslagen te worden met het compressieformaat CCITT G4. Wanneer alle tekens herkend zijn kan de OCR software verschillende bewerkingen uitvoeren. De meest bekende bewerking is het opslaan van de tekens in een verder bewerkbaar bestandsformaat, waarbij dikwijls zowel de taal van het origineel, als de fonts en de opmaak worden gereproduceerd. In dit geval wordt het een "full text" OCR genoemd. Door OCR'en neemt een A4-pagina met tekst nog maar een paar kilobyte aan geheugenopslag in en is dan weer bewerkbaar in een tekstverwerker.
  • OCR (ang. Optical Character Recognition) - zestaw technik lub oprogramowanie służące do rozpoznawania znaków i całych tekstów w pliku graficznym o postaci rastrowej. Zadaniem OCR jest zwykle rozpoznanie tekstu w zeskanowanym dokumencie (np. papierowym formularzu lub stronie książki). Niegdyś termin oznaczał samo rozpoznawanie ciągów znaków, głównie drukowanych, które są łatwiejsze do rozpoznania, dziś również pisma odręcznego oraz cech formatowania, jak krój pisma, stopień pisma, interlinia (techniki służące do tego typu zaawansowanego rozpoznawania nazywane są terminem ICR), a nawet układów tabelarycznych, np. formularzy. Techniki OCR są wykorzystywane m. in. przy digitalizacji zasobów bibliotek, a także jako ułatwienie przy odczytywaniu danych z formularzy wypełnianych pismem odręcznym. W obu przypadkach oprogramowanie OCR nie jest tak skuteczne jak człowiek, zatem w przypadkach wątpliwych (trudności z odczytaniem fragmentu) oraz w celu uniknięcia błędów nieodzowna jest weryfikacja wyniku OCR przez człowieka. Nowoczesną metodą współpracy oprogramowania OCR z ludźmi jest technika reCAPTCHA. Nie wymaga ona zatrudniania osób specjalnie do weryfikacji OCR, lecz wykorzystuje rozproszoną aktywność milionów użytkowników Internetu, którzy wchodząc na strony internetowe zabezpieczone przez CAPTCHA rozpoznają fragmenty tekstu wymagające weryfikacji.
  • OCR é um acrónimo para o inglês Optical Character Recognition, uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem, ou mapa de bits. Através do OCR é possível digitalizar uma folha de texto impresso e obter um arquivo de texto editável.
  • Оптическое распознавание символов (англ. Optical Character Recognition, OCR) — механическая или электронная конвертация изображений символов и букв в текст, редактируемый на компьютере. Перевод осуществляется программным путём, после получения изображения со сканера или фото. Текст, преобразованный из графической формы в символьную (текстовую), можно далее обрабатывать любыми текстовыми редакторами.
  • Optical Character Recognition, OCR, optisk teckenigenkänning, (maskinell) texttolkning, maskinell läsning och tydning av tecken och texter med automatiska bildanalysmetoder. Ibland kan det vara svårt att tolka olika teckensnitt och skrivstilar. De flesta program för OCR är därför utrustade med en inlärningsfunktion, vilket medför att programmet blir bättre och bättre på att tolka vad det är för tecken som lästs in.
  • Optik Karakter Tanıma (Optical Character Recognition), bilgisayar ortamında bulumayan yazılı dokümanların özel tarayıcılar arayıcılığıyla veya normal olarak taranmış resimlerinin FineReader, OmniPage gibi bazı özel programlar yardımıyla bilgisayar ortamına düzenlenebilecek sayısal halde ("Word", "txt") aktarılmasıdır. Bir uygulaması da "plaka tanıma" projesidir. Yoldan geçen araçların plaka fotoğrafları çekilir ve anında OKT (OCR) uygulamasından geçirilerek sisteme girilir.
  • 光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
dbpprop:date
  • May 2009
dbpprop:hasPhotoCollection
dbpprop:reference
dbpprop:wikiPageUsesTemplate
rdf:type
rdfs:comment
  • Optical character recognition, usually abbreviated to OCR, is the mechanical or electronic translation of images of handwritten, typewritten or printed text (usually captured by a scanner) into machine-editable text. OCR is a field of research in pattern recognition, artificial intelligence and computer vision. Though academic research in the field continues, the focus on OCR has shifted to implementation of proven techniques.
  • Texterkennung oder auch Optische Zeichenerkennung ist ein Begriff aus dem IT-Bereich und beschreibt die automatische Texterkennung von einer gedruckten Vorlage.
  • El programari de reconeixement òptic de caràcters, abreviat habitualment com OCR (Optical character recognition), extrau d'una imatge els caràcters que componen un text per a emmagatzemar-los en un format amb el qual puguen interactuar programes d'edició de text.
  • OCR neboli optické rozpoznávání znaků (z anglického Optical Character Recognition) je metoda, která pomocí scanneru umožňuje digitalizaci tištěných textů, s nimiž pak lze pracovat jako s normálním počítačovým textem. Počítačový program převádí obraz buď automaticky nebo se musí naučit rozpoznávat znaky.
  • El software de reconocimiento óptico de caracteres, abreviado habitualmente como OCR (Optical character recognition), extrae de una imagen los caracteres que componen un texto para almacenarlos en un formato con el cual puedan interactuar programas de edición de texto.
  • Tekstintunnistus (engl. Optical character recognition, OCR) on tapa muuntaa esimerkiksi kuvanlukijalla skannatuista kuvista tekstit takaisin muokattavaksi tekstiksi jonkin tähän tarkoitukseen suunnitellun ohjelman avulla. Monissa kuvanlukijoissa on myös OCR-toiminto, jonka avulla tekstin voi skannata suoraan muokattavaksi tekstiksi eikä sitä näin ollen tarvitse skannata kuvana. OCR-toimintoja on myös boteissa jotka kiertelevät keskustelupalstoilla ja lähettelevät roskapostia.
  • La reconnaissance optique de caractères (ROC), ou encore appelé vidéocodage (traitement postal, chèque bancaire) désigne les procédés informatiques pour la traduction d'images de textes imprimés ou dactylographiés en fichiers de texte. Elle réalise beaucoup moins que l'être humain qui, lui, exécute, en plus de la reconnaissance, la compréhension du message, sa mémorisation, voire son analyse critique dans un seul temps.
  • Az optikai karakterfelismerés (rövidítve OCR az angol optical character recognition szavakból) a számítástechnikában azon eljárások módszere, melyek lehetővé teszik a fizikai hordozón szereplő analóg írás, szöveg digitális formába történő alakítását. Az átalakított szöveg ezután könnyen használható, feldolgozható számítógépes környezetben.
  • I sistemi di Optical Character Recognition (riconoscimento ottico dei caratteri detti anche OCR) sono programmi dedicati alla conversione di un'immagine contenente testo, solitamente acquisite tramite scanner, in testo digitale modificabile con un normale editor. Il testo può essere convertito in formato ASCII semplice, Unicode o, nel caso dei sistemi più avanzati, in un formato contenente anche l'impaginazione del documento.
  • Optical character recognition (OCR), of in het Nederlands: optische tekenherkenning is een transformatie waarbij uit een afbeelding van een tekst door middel van patroonherkenning alle tekens uit de afbeelding als zodanig worden herkend en apart opgeslagen door een computer(programma). Een voorbeeld hiervan is Automatische kentekenplaatherkenning. Meestal wordt een scanner gebruikt om een afbeelding van het papier te maken en naar de computer te sturen.
  • OCR (ang. Optical Character Recognition) - zestaw technik lub oprogramowanie służące do rozpoznawania znaków i całych tekstów w pliku graficznym o postaci rastrowej. Zadaniem OCR jest zwykle rozpoznanie tekstu w zeskanowanym dokumencie (np. papierowym formularzu lub stronie książki).
  • OCR é um acrónimo para o inglês Optical Character Recognition, uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem, ou mapa de bits. Através do OCR é possível digitalizar uma folha de texto impresso e obter um arquivo de texto editável.
  • Оптическое распознавание символов (англ. Optical Character Recognition, OCR) — механическая или электронная конвертация изображений символов и букв в текст, редактируемый на компьютере. Перевод осуществляется программным путём, после получения изображения со сканера или фото.
  • Optical Character Recognition, OCR, optisk teckenigenkänning, (maskinell) texttolkning, maskinell läsning och tydning av tecken och texter med automatiska bildanalysmetoder. Ibland kan det vara svårt att tolka olika teckensnitt och skrivstilar. De flesta program för OCR är därför utrustade med en inlärningsfunktion, vilket medför att programmet blir bättre och bättre på att tolka vad det är för tecken som lästs in.
  • Optik Karakter Tanıma (Optical Character Recognition), bilgisayar ortamında bulumayan yazılı dokümanların özel tarayıcılar arayıcılığıyla veya normal olarak taranmış resimlerinin FineReader, OmniPage gibi bazı özel programlar yardımıyla bilgisayar ortamına düzenlenebilecek sayısal halde ("Word", "txt") aktarılmasıdır. Bir uygulaması da "plaka tanıma" projesidir.
  • 光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
rdfs:label
  • Optical character recognition
  • Texterkennung
  • Reconeixement òptic de caràcters
  • OCR
  • Reconocimiento óptico de caracteres
  • Tekstintunnistus
  • Reconnaissance optique de caractères
  • Optikai karakterfelismerés
  • Optical Character Recognition
  • 光学文字認識
  • Optical character recognition
  • OCR
  • Reconhecimento ótico de caracteres
  • Оптическое распознавание символов
  • Optical character recognition
  • Optik Karakter Tanıma
  • 光学字符识别
owl:sameAs
skos:subject
foaf:page
is dbpedia-owl:Company/product of
is dbpedia-owl:Work/genre of
is dbpedia-owl:genre of
is dbpedia-owl:product of
is dbpprop:columnsListProperty of
is dbpprop:disambiguates of
is dbpprop:genre of
is dbpprop:products of
is dbpprop:redirect of
is owl:sameAs of