Optical character recognition or optical character reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo) or from subtitle text superimposed on an image (for example: from a television broadcast).

Property Value
dbo:abstract
  • التعرف الضوئي على المحارف (بالإنجليزية: Optical character recognition) أو اختصارا OCR هي نوع من البرمجيات الحاسوبية لتحويل صور النصوص المكتوبة باليد أو بآلة (يحصل عليها عادة باستخدام الماسحة) إلى نصوص يستطيع الحاسوب معالجتها.التعرف الضوئي على الحروف '، يختصر عادة إلى التعرف الضوئي على الحروف ، هو أو تحويل الصورة الممسوحة الالكترونية من صيغة مكتوبة بخط اليد،أو مطبوعة على الآلة الكاتبة أو نص مطبوع إلى نص مرمز تفهمه الآلة وتدعى . ويستخدم على نطاق واسع باعتباره شكلا من أشكال إدخال البيانات من نوع ما من ورقة البيانات المصدر الأصلي ، سواء وثائق، أوايصالات مبيعات، والبريد، أو أي عدد من السجلات المطبوعة.لإنه من الأهمية بمكان أن حوسبة النصوص المطبوعة تكون مطلبا حتى يمكن أن يكون البحث عنها أوتخزينها إلكترونيا بحيث تصبح قابلة للإنضغاط أكثر ليتيسر عرضها على الإنترنت ، وتستخدم في عمليات آلية مثل الترجمة الآلية ، تحويل و . التعرف الضوئي على الحروف هو مجال البحث في ، الذكاء الاصطناعي و . هناك حاجة لإصدارات في وقت مبكر حتى يتسنى أن تبرمج الصور تبعا لكل حرف ، وتعمل على خط واحد في وقت واحد. النظام "الذكي" مع وجود درجة عالية من دقة التعرف على معظم الخطوط أصبحت شائعة الآن. بعض الأنظمة الآن قادرة على إنتاج حروف تمت تهيئتها formatted output و هى تقترب كثيرا من الشكل الأصلي بما في ذلك الصور الممسوحة ضوئيا، والأعمدة وغيرها من العناصر غير النصية. (ar)
  • Optické rozpoznávání znaků či OCR (z anglického Optical Character Recognition) je metoda, která pomocí scanneru umožňuje digitalizaci tištěných textů, s nimiž pak lze pracovat jako s normálním počítačovým textem. Počítačový program převádí obraz buď automaticky, nebo se musí naučit rozpoznávat znaky. Převedený text je téměř vždy v závislosti na kvalitě předlohy třeba podrobit důkladné korektuře, protože OCR program nemusí rozeznat všechna písmena správně. OCR – zpracování textu z tištěné do elektronické podoby je použitelné pro všechny tištěné výstupy z laserových, inkoustových, termosublimačních a jehličkových tiskáren a samozřejmě pro předlohy vytištěné knihtiskem. U nevhodných předloh, např. slabě vytištěných jehličkových výtisků nebo dohromady slitých písmen, se z časového hlediska vyplatí spíše přepis textu. Pro snadné rozpoznávání znaků byly vyvinuty strojově čitelné fonty, např. , nebo dnes používanější OCR-B. (cs)
  • El Reconeixement Òptic de Caràcters (OCR) és una aplicació de la intel·ligència artificial que consisteix a identificar automàticament símbols o caràcters, que pertanyen a un determinat alfabet, a partir d'una imatge per emmagatzemar-ho en forma de dades amb les quals podrem interaccionar amb un programa d'edició de text o similars. Hi ha dos tipus d'OCR: l'OCR-A, dirigit a textos, i l'OCR-B, dirigit a . En els últims anys la digitalització de la informació (textos, imatges, so, etc.) s'ha convertit en un punt d'interès per la societat. En el cas concret dels textos, existeixen i es generen contínuament grans quantitats d'informació escrita, tipogràfica o manuscrita en tota mena de suport. Amb aquest context, poder automatitzar la introducció de caràcters evitant l'entrada per teclat, implica un important estalvi de recursos humans i un augment de la productivitat al mateix temps que es manté o fins i tot es millora la qualitat de molts serveis. El Reconeixement Òptic de Caràcters (OCR), així com el reconeixement de text, en general són aplicacions dirigides a la digitalització de textos. (ca)
  • Η Οπτική Αναγνώριση Χαρακτήρων (Αγγλ. Optical Character Recognition) ή αλλιώς Αυτόματη Αναγνώριση Χαρακτήρων Κειμένου ονομάζεται η διαδικασία μετατροπής σαρωμένων εικόνων χειρογράφων ή έντυπων κειμένων σε κείμενο αναγνώσιμο από ηλεκτρονικό υπολογιστή. Η Οπτική Αναγνώριση Χαρακτήρων καθιστά εφικτή την εκ νέου επεξεργασία του κειμένου, αποφεύγοντας την δακτυλογράφηση του από την αρχή. Τα συστήματα Οπτικής Αναγνώρισης Χαρακτήρων απαιτούν βαθμονόμηση για να διαβάσουν μια συγκεκριμένη γραμματοσειρά. Οι πρώτες εκδόσεις ήταν προγραμματισμένες με εικόνες για κάθε χαρακτήρα και δούλευαν μια γραμματοσειρά την φορά. Τα ευφυή συστήματα με υψηλό δείκτη αναγνώρισης είναι πλέον κοινά. Μερικά συστήματα είναι ικανά να αναπαράγουν ακόμη και τις πληροφορίες που δεν είναι κείμενο σε ένα έγγραφο, όπως εικόνες, στήλες, γραμμές, γωνίες κτλ. (el)
  • Optika signorekono (OSR) aŭ tekstorekono aŭ optika karaktra rekono (angla, internacia mallongigo OCR laŭ Optical Character Recognition) estas nocio el la IT-areo, kiu priskribas la aŭtomatan tekstorekonon de (plej ofte presita) dokumento. Originale ĝi estis evoluigita al aŭtomata tekstorekono de diversaj skribotipoj, kiuj estis uzataj en ĉekoj. Tiuj skribotipoj estis tiel formitaj, ke la rekoniloj povis ilin – sen grava kalkula bezono – deĉifri, dividi inter ili. Tiel la skribotipo OCR-A estas uzata por tre diversaj signoj, OCR-B por pli similaj signotipoj, kaj OCR-H por manskriboj. La kreskantaj povumoj de la moderna komputilo kaj la pliboniĝantaj algoritmoj ebligas ankaŭ la rekonon de "normalaj" presitaj signoj ĝis la manskriboj (tiu lasta gravas ekz. ĉe leterodistribuo en la poŝto). La moderna tekstorekono entenas la rekonon de la diversaj litertipoj kaj -grandoj kaj tiel certigas la preskaŭ plej originalfidelan reaperigon. (eo)
  • Optical character recognition or optical character reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo) or from subtitle text superimposed on an image (for example: from a television broadcast). Widely used as a form of data entry from printed paper data records – whether passport documents, invoices, bank statements, computerized receipts, business cards, mail, printouts of static-data, or any suitable documentation – it is a common method of digitizing printed texts so that they can be electronically edited, searched, stored more compactly, displayed on-line, and used in machine processes such as cognitive computing, machine translation, (extracted) text-to-speech, key data and text mining. OCR is a field of research in pattern recognition, artificial intelligence and computer vision. Early versions needed to be trained with images of each character, and worked on one font at a time. Advanced systems capable of producing a high degree of recognition accuracy for most fonts are now common, and with support for a variety of digital image file format inputs. Some systems are capable of reproducing formatted output that closely approximates the original page including images, columns, and other non-textual components. (en)
  • Texterkennung oder auch optische Zeichenerkennung (englisch optical character recognition, Abk. OCR) ist ein Begriff aus der Informationstechnik und bezeichnet die automatisierte Texterkennung innerhalb von Bildern. (de)
  • El reconocimiento óptico de caracteres (ROC), generalmente conocido como reconocimiento de caracteres y expresado con frecuencia con la sigla OCR (del inglés Optical Character Recognition), es un proceso dirigido a la digitalización de textos, los cuales identifican automáticamente a partir de una imagen símbolos o caracteres que pertenecen a un determinado alfabeto, para luego almacenarlos en forma de datos. Así podremos interactuar con estos mediante un programa de edición de texto o similar. En los últimos años la digitalización de la información (textos, imágenes, sonido, etcétera) ha devenido un punto de interés para la sociedad. En el caso concreto de los textos, existen y se generan continuamente grandes cantidades de información escrita, tipográfica o manuscrita en todo tipo de soportes. En este contexto, poder automatizar la introducción de caracteres evitando la entrada por teclado implica un importante ahorro de recursos humanos y un aumento de la productividad, al mismo tiempo que se mantiene, o hasta se mejora, la calidad de muchos servicios. (es)
  • Karaktereen ezagutze optikoa (ingelesetik, Optical Character Recognition edo OCR), idazmakinaz edo eskuz idatzita, edo paperean inprimatuta, dauden testuak, makina-kode gisa gordetako testu bihurtzea da. Horrela, hauekin lan egitea posible izango litzateke testu-editore baten bitartez. Azken urteotan, informazioaren digitalizazioa (testuak, irudiak, soinua, eta abar) gero eta interesgarriago bihurtu da gizartean. Testuen kasuan, informazio mota idatzien edo tipografikoen kopuru handiak etengabe sortzen jarraitu da. Testuinguru honetan, karaktereak sartzeko garaian, teklatuaren sarrera saihesteak, giza baliabideen aurrezpen garrantzitsua eta produktibitatea areagotzea dakar eta gainera, zerbitzuen kalitatea mantendu edo hobetu. (eu)
  • La reconnaissance optique de caractères (ROC), en anglais optical character recognition (OCR), ou océrisation, désigne les procédés informatiques pour la traduction d'images de textes imprimés ou dactylographiés en fichiers de texte. Un ordinateur réclame pour l'exécution de cette tâche un logiciel d'OCR. Celui-ci permet de récupérer le texte dans l'image d'un texte imprimé et de le sauvegarder dans un fichier pouvant être exploité dans un traitement de texte pour enrichissement, et stocké dans une base de données ou sur un autre support exploitable par un système informatique. (fr)
  • Meaisín atá in ann téacsanna caighdeánacha a léamh isteach i ríomhaire le cabhair teicníochtaí optúla is ríomhaireachta. (ga)
  • Pengenalan Karakter Optik (bahasa Inggris: Optical Character Recognition, yang biasa disingkat OCR) adalah sebuah perangkat lunak yang mengubah teks dalam format berkas citra atau gambar ke dalam format teks yang bisa dibaca dan disunting oleh aplikasi komputer . Berkas teks berformat citra tersebut didapatkan dengan cara memindai atau memfoto sebuah buku, manuskrip, tulisan di papan pengumuman, ataupun materi kuliah di papan tulis dsb. Sedangkan alat yang diunakan untuk memindai adalah pemindai (scanner dalam bahasa Inggrisnya) atau kamera baik kamera DSLR ataupun kamera di ponsel pintar. Sebagai perangkat lunak yang kompleks, OCR diterapkan di berbagai bidang seperti untuk membaca data secara otomatis dan langsung memasukkannya ke dalam basis data -- contohnya seperti dalam pemindaian passport, nota transfer bank, kertas berharga – untuk pengenalan pelat kendaraan bermotor dari video atau gambar yang tertangkap kamera, dan yang paling marak adalah untuk preservasi konten buku-buku sumber referensi utama dan manuskrip bersejarah. Dalam beberapa kasus, OCR berkontribusi sangat besar dalam proses pembangunan perpustakaan digital. (in)
  • 光学文字認識(こうがくもじにんしき、Optical character recognition)は、活字の文書の画像(通常イメージスキャナーで取り込まれる)を文字コードの列に変換するソフトウェアである。一般にOCRと略記される。OCRは、人工知能やマシンビジョンの研究分野として始まった。研究は続けられているが、OCRの中心はその実装と応用に移っている。紙に印刷された文書をデジタイズし、よりコンパクトな形で記録するのに必要とされる。さらに、文字コードに変換することで機械翻訳や音声合成の入力にも使えるようになり、テキストマイニングも可能となる。研究分野としては、パターン認識、人工知能、コンピュータビジョンが対応する。 (鏡やレンズといった光学技術を使った)光学文字認識と(スキャナーとアルゴリズムによる)デジタル文字認識は本来別の領域と考えられていた。光学技術として生き残った部分が非常に少ないため、光学文字認識という言葉は現在ではデジタル文字認識を含むものとみなされている。 初期のシステムは特定の書体を読むための「トレーニング」が必要であった(事前にその書体のサンプルを読ませることを意味する)。現在では、ほとんどの書体を高い識字率で変換することが可能である。いくつかのシステムでは読み込まれた画像からそれとほぼ同じになるようフォーマットされた出力(例えばワードプロセッサのファイルのようなもの)を生成することが可能であり、中には画像などの文書以外の部分が含まれていても正しく認識するものもある。 (ja)
  • I sistemi di riconoscimento ottico dei caratteri, detti anche OCR (dall'inglese optical character recognition), sono programmi dedicati al rilevamento dei caratteri contenuti in un documento e al loro trasferimento in testo digitale leggibile da una macchina. La conversione viene effettuata solitamente tramite uno scanner. Il testo può essere convertito in formato ASCII semplice, Unicode o, nel caso dei sistemi più avanzati, in un formato contenente anche l'impaginazione del documento stesso. L'utente può modificare il risultato ottenuto con un normale editor di testo. L'OCR è un campo di ricerca dell'intelligenza artificiale, della visione artificiale e del pattern recognition, legati al riconoscimento delle immagini. (it)
  • 광학 문자 인식(Optical character recognition; OCR)은 사람이 쓰거나 기계로 인쇄한 문자의 영상을 이미지 스캐너로 획득하여 기계가 읽을 수 있는 문자로 변환하는 것이다. 이미지 스캔으로 얻을 수 있는 문서의 활자 영상을 컴퓨터가 편집 가능한 문자코드 등의 형식으로 변환하는 소프트웨어로써 일반적으로 OCR이라고 하며, OCR은 인공지능이나 기계 시각(machine vision)의 연구분야로 시작되었다. 거울이나 렌즈 등의 광학 기술을 이용한 광학 문자 인식과 스캐너 및 알고리즘에 의한 디지털 문자 인식은 다른 영역으로 생각되었으나 이제는 광학 문자 인식이라는 말이 디지털 문자 인식을 포함하는 것으로 간주되었다. 초기 시스템은 특정한 서체를 읽기 위해 미리 해당 서체의 샘플을 읽는 것을 뜻하는 "트레이닝"이 필요했지만, 지금은 대부분의 서체를 높은 확률로 변환이 가능하다. 몇몇 시스템에서는 읽어들인 이미지에서 그것과 거의 일치하는 워드 프로세서 파일과 같은 문서 포맷으로 된 출력 파일을 생성할 수 있으며, 그 중에는 이미지처럼 문서 이외의 부분이 포함되어있어도 제대로 인식하는 것도 있다. (ko)
  • Optical character recognition (OCR), of in het Nederlands: optische tekenherkenning is een transformatie waarbij uit een afbeelding van een tekst door middel van patroonherkenning alle tekens uit de afbeelding als zodanig worden herkend en apart opgeslagen door een computer(programma). Oftewel, de tekst uit een afbeelding wordt omgezet in bewerkbare tekst. Een voorbeeld hiervan is automatische kentekenplaatherkenning. Meestal wordt een scanner gebruikt om een afbeelding van het papier te maken en naar de computer te sturen. De afbeelding wordt meestal aangemaakt met een resolutie van 150-300 dpi en opgeslagen in het TIFF-formaat. Wanneer alle tekens herkend zijn kan de OCR-software verschillende bewerkingen uitvoeren. De bekendste bewerking is het opslaan van de tekens in een verder bewerkbaar bestandsformaat, waarbij dikwijls zowel de taal van het origineel, als de fonts en de opmaak worden gereproduceerd. In dit geval wordt het een "full text OCR" genoemd. Door OCRn neemt een pagina met tekst nog maar een paar kilobyte aan geheugenopslag in. Bovendien is hij daarna weer bewerkbaar in een tekstverwerker. Belangrijk is ook dat de tekst nu doorzoekbaar kan worden gemaakt, bijvoorbeeld in een digitale bibliotheek of in een zoekmachine. (nl)
  • Optyczne rozpoznawanie znaków, OCR (od ang. optical character recognition) – zestaw technik lub oprogramowanie służące do rozpoznawania znaków i całych tekstów w pliku graficznym o postaci rastrowej. Zadaniem OCR jest zwykle rozpoznanie tekstu w zeskanowanym dokumencie (na przykład papierowym formularzu lub stronie książki). Niegdyś termin oznaczał samo rozpoznawanie ciągów znaków, głównie drukowanych, które są łatwiejsze do rozpoznania, dziś również pisma odręcznego oraz cech formatowania, jak krój pisma, stopień pisma, interlinia (techniki służące do tego typu zaawansowanego rozpoznawania nazywane są terminem ICR), a nawet układów tabelarycznych. Techniki optycznego rozpoznawania znaków stosowane są, między innymi, przy digitalizacji zasobów bibliotek, a także jako ułatwienie przy odczytywaniu danych z formularzy wypełnianych pismem odręcznym. W obu przypadkach oprogramowanie OCR nie jest tak skuteczne jak człowiek, zatem w przypadkach wątpliwych (trudności z odczytaniem fragmentu) oraz w celu uniknięcia błędów nieodzowna jest weryfikacja wyniku OCR przez człowieka. Nowoczesną metodą współpracy oprogramowania OCR z ludźmi jest technika reCAPTCHA. Nie wymaga ona zatrudniania osób specjalnie do weryfikacji OCR, lecz wykorzystuje rozproszoną aktywność milionów użytkowników Internetu, którzy wchodząc na strony internetowe zabezpieczone przez CAPTCHA rozpoznają fragmenty tekstu wymagające weryfikacji. Postęp w optycznym rozpoznawaniu znaków jest bardzo widoczny – drogie komercyjne oprogramowanie z lat 90. XX wieku wymagało dobrego skanu, najlepiej w językach zachodnioeuropejskich. W 2013 możliwe było rozpoznawanie mało dokładnych skanów, wykonanych telefonami komórkowymi z szumami na obrazkach, z tekstem napisanym pod nienaturalnymi kątami, w 120–186 językach (w zależności od programu). (pl)
  • OCR é um acrónimo para o inglês Optical Character Recognition, é uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem ou mapa de bits sejam eles escaneados, escritos a mão, datilografados ou impressos. Dessa forma, através do OCR é possível obter um arquivo de texto editável por um computador. Combinado com outras tecnologias, como a inteligência artificial, empresas de diversos segmentos têm aplicado o OCR para automatizar processos de cadastro, onboarding e formalização, extraindo informações de documentos de identificação pessoal, contratos e comprovantes de residência. (pt)
  • Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в текстовые данные, использующиеся для представления символов в компьютере (например, в текстовом редакторе). Распознавание широко применяется для преобразования книг и документов в электронный вид, для автоматизации систем учёта в бизнесе или для публикации текста на веб-странице. Оптическое распознавание символов позволяет редактировать текст, осуществлять поиск слов или фраз, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тексту электронный перевод, форматирование или преобразование в речь. Оптическое распознавание текста является исследуемой проблемой в областях распознавания образов, искусственного интеллекта и компьютерного зрения. Системы оптического распознавания текста требуют калибровки для работы с конкретным шрифтом; в ранних версиях для программирования было необходимо изображение каждого символа, программа одновременно могла работать только с одним шрифтом. В настоящее время больше всего распространены так называемые «интеллектуальные» системы, с высокой степенью точности распознающие большинство шрифтов. Некоторые системы оптического распознавания текста способны восстанавливать исходное форматирование текста, включая изображения, колонки и другие нетекстовые компоненты. (ru)
  • Maskinläsningeller optisk teckenläsning (ofta förkortat OCR efter engelskans Optical Character Recognition) kallas datortekniken att med hjälp av bildanalys förvandla digitala bilder av tryckt text till bokstäver och siffror som andra datorprogram, till exempel ordbehandlare, kan använda. Den varierande kvaliteten på tryckt text kan göra denna texttydning svår ibland, så därför har många program för maskinläsning en inlärningsfunktion, där användaren kan hjälpa programmet att förstå hur vissa tecken ska tydas. (sv)
  • Оптичне розпізнавання тексту (англ. optical character recognition, OCR) — це механічне або електронне переведення зображень рукописного, машинописного або друкованого тексту в послідовність кодів, що використовуються для представлення в текстовому редакторі. Розпізнавання широко використовується для конвертації книг і документів в електронний вигляд, для автоматизації систем обліку в бізнесі або для публікації тексту на веб-сторінці. Оптичне розпізнавання тексту дозволяє редагувати текст, здійснювати пошук слова або фрази, зберігати його в компактнішій формі, демонструвати або роздруковувати матеріал, не втрачаючи якості, аналізувати інформацію, а також застосовувати до тексту електронний переклад, форматування або перетворення в мовлення. Оптичне розпізнавання тексту є досліджуваною проблемою в галузях розпізнавання образів, штучного інтелекту і комп'ютерного зору. Системи оптичного розпізнавання тексту вимагають калібрування для роботи з конкретним шрифтом; у ранніх версіях, для програмування було необхідно зображення кожного символу, програма одночасно могла працювати тільки з одним шрифтом. Зараз найпоширеніші так звані «інтелектуальні» системи, що розпізнають більшість шрифтів із високим ступенем точності. Деякі системи оптичного розпізнавання тексту здатні відновлювати вихідне форматування тексту, включаючи зображення, колонки й інші нетекстові компоненти. (uk)
  • 光学字符识别(英語:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。 (zh)
dbo:wikiPageExternalLink
dbo:wikiPageID
  • 49091 (xsd:integer)
dbo:wikiPageLength
  • 35327 (xsd:integer)
dbo:wikiPageRevisionID
  • 985979039 (xsd:integer)
dbo:wikiPageWikiLink
dbp:wikiPageUsesTemplate
dct:subject
rdf:type
rdfs:comment
  • Texterkennung oder auch optische Zeichenerkennung (englisch optical character recognition, Abk. OCR) ist ein Begriff aus der Informationstechnik und bezeichnet die automatisierte Texterkennung innerhalb von Bildern. (de)
  • La reconnaissance optique de caractères (ROC), en anglais optical character recognition (OCR), ou océrisation, désigne les procédés informatiques pour la traduction d'images de textes imprimés ou dactylographiés en fichiers de texte. Un ordinateur réclame pour l'exécution de cette tâche un logiciel d'OCR. Celui-ci permet de récupérer le texte dans l'image d'un texte imprimé et de le sauvegarder dans un fichier pouvant être exploité dans un traitement de texte pour enrichissement, et stocké dans une base de données ou sur un autre support exploitable par un système informatique. (fr)
  • Meaisín atá in ann téacsanna caighdeánacha a léamh isteach i ríomhaire le cabhair teicníochtaí optúla is ríomhaireachta. (ga)
  • 광학 문자 인식(Optical character recognition; OCR)은 사람이 쓰거나 기계로 인쇄한 문자의 영상을 이미지 스캐너로 획득하여 기계가 읽을 수 있는 문자로 변환하는 것이다. 이미지 스캔으로 얻을 수 있는 문서의 활자 영상을 컴퓨터가 편집 가능한 문자코드 등의 형식으로 변환하는 소프트웨어로써 일반적으로 OCR이라고 하며, OCR은 인공지능이나 기계 시각(machine vision)의 연구분야로 시작되었다. 거울이나 렌즈 등의 광학 기술을 이용한 광학 문자 인식과 스캐너 및 알고리즘에 의한 디지털 문자 인식은 다른 영역으로 생각되었으나 이제는 광학 문자 인식이라는 말이 디지털 문자 인식을 포함하는 것으로 간주되었다. 초기 시스템은 특정한 서체를 읽기 위해 미리 해당 서체의 샘플을 읽는 것을 뜻하는 "트레이닝"이 필요했지만, 지금은 대부분의 서체를 높은 확률로 변환이 가능하다. 몇몇 시스템에서는 읽어들인 이미지에서 그것과 거의 일치하는 워드 프로세서 파일과 같은 문서 포맷으로 된 출력 파일을 생성할 수 있으며, 그 중에는 이미지처럼 문서 이외의 부분이 포함되어있어도 제대로 인식하는 것도 있다. (ko)
  • Maskinläsningeller optisk teckenläsning (ofta förkortat OCR efter engelskans Optical Character Recognition) kallas datortekniken att med hjälp av bildanalys förvandla digitala bilder av tryckt text till bokstäver och siffror som andra datorprogram, till exempel ordbehandlare, kan använda. Den varierande kvaliteten på tryckt text kan göra denna texttydning svår ibland, så därför har många program för maskinläsning en inlärningsfunktion, där användaren kan hjälpa programmet att förstå hur vissa tecken ska tydas. (sv)
  • 光学字符识别(英語:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。 (zh)
  • التعرف الضوئي على المحارف (بالإنجليزية: Optical character recognition) أو اختصارا OCR هي نوع من البرمجيات الحاسوبية لتحويل صور النصوص المكتوبة باليد أو بآلة (يحصل عليها عادة باستخدام الماسحة) إلى نصوص يستطيع الحاسوب معالجتها.التعرف الضوئي على الحروف '، يختصر عادة إلى التعرف الضوئي على الحروف ، هو أو تحويل الصورة الممسوحة الالكترونية من صيغة مكتوبة بخط اليد،أو مطبوعة على الآلة الكاتبة أو نص مطبوع إلى نص مرمز تفهمه الآلة وتدعى . ويستخدم على نطاق واسع باعتباره شكلا من أشكال إدخال البيانات من نوع ما من ورقة البيانات المصدر الأصلي ، سواء وثائق، أوايصالات مبيعات، والبريد، أو أي عدد من السجلات المطبوعة.لإنه من الأهمية بمكان أن حوسبة النصوص المطبوعة تكون مطلبا حتى يمكن أن يكون البحث عنها أوتخزينها إلكترونيا بحيث تصبح قابلة للإنضغاط أكثر ليتيسر عرضها على الإنترنت ، وتستخدم في عمليات آلية مثل التر (ar)
  • El Reconeixement Òptic de Caràcters (OCR) és una aplicació de la intel·ligència artificial que consisteix a identificar automàticament símbols o caràcters, que pertanyen a un determinat alfabet, a partir d'una imatge per emmagatzemar-ho en forma de dades amb les quals podrem interaccionar amb un programa d'edició de text o similars. Hi ha dos tipus d'OCR: l'OCR-A, dirigit a textos, i l'OCR-B, dirigit a . En els últims anys la digitalització de la informació (textos, imatges, so, etc.) s'ha convertit en un punt d'interès per la societat. (ca)
  • Optické rozpoznávání znaků či OCR (z anglického Optical Character Recognition) je metoda, která pomocí scanneru umožňuje digitalizaci tištěných textů, s nimiž pak lze pracovat jako s normálním počítačovým textem. Počítačový program převádí obraz buď automaticky, nebo se musí naučit rozpoznávat znaky. Převedený text je téměř vždy v závislosti na kvalitě předlohy třeba podrobit důkladné korektuře, protože OCR program nemusí rozeznat všechna písmena správně. OCR – zpracování textu z tištěné do elektronické podoby je použitelné pro všechny tištěné výstupy z laserových, inkoustových, termosublimačních a jehličkových tiskáren a samozřejmě pro předlohy vytištěné knihtiskem. U nevhodných předloh, např. slabě vytištěných jehličkových výtisků nebo dohromady slitých písmen, se z časového hlediska vyp (cs)
  • Η Οπτική Αναγνώριση Χαρακτήρων (Αγγλ. Optical Character Recognition) ή αλλιώς Αυτόματη Αναγνώριση Χαρακτήρων Κειμένου ονομάζεται η διαδικασία μετατροπής σαρωμένων εικόνων χειρογράφων ή έντυπων κειμένων σε κείμενο αναγνώσιμο από ηλεκτρονικό υπολογιστή. Η Οπτική Αναγνώριση Χαρακτήρων καθιστά εφικτή την εκ νέου επεξεργασία του κειμένου, αποφεύγοντας την δακτυλογράφηση του από την αρχή. (el)
  • Optical character recognition or optical character reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo) or from subtitle text superimposed on an image (for example: from a television broadcast). (en)
  • Optika signorekono (OSR) aŭ tekstorekono aŭ optika karaktra rekono (angla, internacia mallongigo OCR laŭ Optical Character Recognition) estas nocio el la IT-areo, kiu priskribas la aŭtomatan tekstorekonon de (plej ofte presita) dokumento. Originale ĝi estis evoluigita al aŭtomata tekstorekono de diversaj skribotipoj, kiuj estis uzataj en ĉekoj. Tiuj skribotipoj estis tiel formitaj, ke la rekoniloj povis ilin – sen grava kalkula bezono – deĉifri, dividi inter ili. Tiel la skribotipo OCR-A estas uzata por tre diversaj signoj, OCR-B por pli similaj signotipoj, kaj OCR-H por manskriboj. (eo)
  • Karaktereen ezagutze optikoa (ingelesetik, Optical Character Recognition edo OCR), idazmakinaz edo eskuz idatzita, edo paperean inprimatuta, dauden testuak, makina-kode gisa gordetako testu bihurtzea da. Horrela, hauekin lan egitea posible izango litzateke testu-editore baten bitartez. (eu)
  • El reconocimiento óptico de caracteres (ROC), generalmente conocido como reconocimiento de caracteres y expresado con frecuencia con la sigla OCR (del inglés Optical Character Recognition), es un proceso dirigido a la digitalización de textos, los cuales identifican automáticamente a partir de una imagen símbolos o caracteres que pertenecen a un determinado alfabeto, para luego almacenarlos en forma de datos. Así podremos interactuar con estos mediante un programa de edición de texto o similar. (es)
  • Pengenalan Karakter Optik (bahasa Inggris: Optical Character Recognition, yang biasa disingkat OCR) adalah sebuah perangkat lunak yang mengubah teks dalam format berkas citra atau gambar ke dalam format teks yang bisa dibaca dan disunting oleh aplikasi komputer . Berkas teks berformat citra tersebut didapatkan dengan cara memindai atau memfoto sebuah buku, manuskrip, tulisan di papan pengumuman, ataupun materi kuliah di papan tulis dsb. Sedangkan alat yang diunakan untuk memindai adalah pemindai (scanner dalam bahasa Inggrisnya) atau kamera baik kamera DSLR ataupun kamera di ponsel pintar. (in)
  • I sistemi di riconoscimento ottico dei caratteri, detti anche OCR (dall'inglese optical character recognition), sono programmi dedicati al rilevamento dei caratteri contenuti in un documento e al loro trasferimento in testo digitale leggibile da una macchina. La conversione viene effettuata solitamente tramite uno scanner. Il testo può essere convertito in formato ASCII semplice, Unicode o, nel caso dei sistemi più avanzati, in un formato contenente anche l'impaginazione del documento stesso. L'utente può modificare il risultato ottenuto con un normale editor di testo. (it)
  • 光学文字認識(こうがくもじにんしき、Optical character recognition)は、活字の文書の画像(通常イメージスキャナーで取り込まれる)を文字コードの列に変換するソフトウェアである。一般にOCRと略記される。OCRは、人工知能やマシンビジョンの研究分野として始まった。研究は続けられているが、OCRの中心はその実装と応用に移っている。紙に印刷された文書をデジタイズし、よりコンパクトな形で記録するのに必要とされる。さらに、文字コードに変換することで機械翻訳や音声合成の入力にも使えるようになり、テキストマイニングも可能となる。研究分野としては、パターン認識、人工知能、コンピュータビジョンが対応する。 (鏡やレンズといった光学技術を使った)光学文字認識と(スキャナーとアルゴリズムによる)デジタル文字認識は本来別の領域と考えられていた。光学技術として生き残った部分が非常に少ないため、光学文字認識という言葉は現在ではデジタル文字認識を含むものとみなされている。 (ja)
  • Optical character recognition (OCR), of in het Nederlands: optische tekenherkenning is een transformatie waarbij uit een afbeelding van een tekst door middel van patroonherkenning alle tekens uit de afbeelding als zodanig worden herkend en apart opgeslagen door een computer(programma). Oftewel, de tekst uit een afbeelding wordt omgezet in bewerkbare tekst. Een voorbeeld hiervan is automatische kentekenplaatherkenning. (nl)
  • Optyczne rozpoznawanie znaków, OCR (od ang. optical character recognition) – zestaw technik lub oprogramowanie służące do rozpoznawania znaków i całych tekstów w pliku graficznym o postaci rastrowej. Zadaniem OCR jest zwykle rozpoznanie tekstu w zeskanowanym dokumencie (na przykład papierowym formularzu lub stronie książki). (pl)
  • OCR é um acrónimo para o inglês Optical Character Recognition, é uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem ou mapa de bits sejam eles escaneados, escritos a mão, datilografados ou impressos. Dessa forma, através do OCR é possível obter um arquivo de texto editável por um computador. (pt)
  • Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в текстовые данные, использующиеся для представления символов в компьютере (например, в текстовом редакторе). Распознавание широко применяется для преобразования книг и документов в электронный вид, для автоматизации систем учёта в бизнесе или для публикации текста на веб-странице. Оптическое распознавание символов позволяет редактировать текст, осуществлять поиск слов или фраз, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тексту электронный перевод, форматирование или преобразование в речь. Оптическое распознавание (ru)
  • Оптичне розпізнавання тексту (англ. optical character recognition, OCR) — це механічне або електронне переведення зображень рукописного, машинописного або друкованого тексту в послідовність кодів, що використовуються для представлення в текстовому редакторі. Розпізнавання широко використовується для конвертації книг і документів в електронний вигляд, для автоматизації систем обліку в бізнесі або для публікації тексту на веб-сторінці. Оптичне розпізнавання тексту дозволяє редагувати текст, здійснювати пошук слова або фрази, зберігати його в компактнішій формі, демонструвати або роздруковувати матеріал, не втрачаючи якості, аналізувати інформацію, а також застосовувати до тексту електронний переклад, форматування або перетворення в мовлення. Оптичне розпізнавання тексту є досліджуваною пробл (uk)
rdfs:label
  • Optical character recognition (en)
  • تعرف ضوئي على الرموز (ar)
  • Reconeixement òptic de caràcters (ca)
  • Optické rozpoznávání znaků (cs)
  • Texterkennung (de)
  • Οπτική Αναγνώριση Χαρακτήρων (el)
  • Optika signorekono (eo)
  • Reconocimiento óptico de caracteres (es)
  • Karaktereen ezagutze optiko (eu)
  • Reconnaissance optique de caractères (fr)
  • Léitheoir optúil carachtar (ga)
  • Pengenalan karakter optis (in)
  • Riconoscimento ottico dei caratteri (it)
  • 光学文字認識 (ja)
  • 광학 문자 인식 (ko)
  • Optyczne rozpoznawanie znaków (pl)
  • Optical character recognition (nl)
  • Reconhecimento ótico de caracteres (pt)
  • Оптическое распознавание символов (ru)
  • Maskinläsning (sv)
  • Оптичне розпізнавання символів (uk)
  • 光学字符识别 (zh)
rdfs:seeAlso
owl:sameAs
prov:wasDerivedFrom
foaf:isPrimaryTopicOf
is dbo:genre of
is dbo:knownFor of
is dbo:product of
is dbo:wikiPageDisambiguates of
is dbo:wikiPageRedirects of
is dbo:wikiPageWikiLink of
is dbp:genre of
is dbp:knownFor of
is dbp:products of
is dbp:services of
is owl:differentFrom of
is foaf:primaryTopic of