dbo:abstract
|
- In computer vision or natural language processing, document layout analysis is the process of identifying and categorizing the regions of interest in the scanned image of a text document. A reading system requires the segmentation of text zones from non-textual ones and the arrangement in their correct reading order. Detection and labeling of the different zones (or blocks) as text body, illustrations, math symbols, and tables embedded in a document is called geometric layout analysis. But text zones play different logical roles inside the document (titles, captions, footnotes, etc.) and this kind of semantic labeling is the scope of the logical layout analysis. Document layout analysis is the union of geometric and logical labeling. It is typically performed before a document image is sent to an OCR engine, but it can be used also to detect duplicate copies of the same document in large archives, or to index documents by their structure or pictorial content. Document layout is formally defined in the international standard ISO 8613-1:1989. (en)
- 文書レイアウト解析 (英:Document layout analysis) は、コンピュータビジョンまたは自然言語処理では、テキスト文書のスキャン画像内の関心領域を識別および分類するプロセスである。読み取りシステムでは、テキスト領域を非テキスト領域からセグメント化し、正しい読み取り順序で配置する必要がある。文書に埋め込まれたテキスト本文、イラスト、数学記号、および表としてのさまざまな領域(またはブロック)の検出とラベル付けは、幾何学的レイアウト解析と呼ばれる。 ただし、テキストゾーンは、文書内でさまざまな論理的役割(タイトル、キャプション、脚注など)を果たし、この種のセマンティックラベリングが論理レイアウト解析の範囲です。 文書レイアウト解析は、幾何学的および論理的なラベル付けの組み合わせである。これは通常、文書画像がOCRエンジンに送信される前に実行されるが、大規模なアーカイブ内の同じ文書の重複コピーを検出したり、構造や画像コンテンツによって文書にインデックスを付けたりするためにも使用できる。 文書のレイアウトは、国際規格ISO 8613-1:1989で正式に定義されている。 (ja)
|
dbo:wikiPageExternalLink
| |
dbo:wikiPageID
| |
dbo:wikiPageLength
|
- 9768 (xsd:nonNegativeInteger)
|
dbo:wikiPageRevisionID
| |
dbo:wikiPageWikiLink
| |
dbp:wikiPageUsesTemplate
| |
dcterms:subject
| |
gold:hypernym
| |
rdf:type
| |
rdfs:comment
|
- 文書レイアウト解析 (英:Document layout analysis) は、コンピュータビジョンまたは自然言語処理では、テキスト文書のスキャン画像内の関心領域を識別および分類するプロセスである。読み取りシステムでは、テキスト領域を非テキスト領域からセグメント化し、正しい読み取り順序で配置する必要がある。文書に埋め込まれたテキスト本文、イラスト、数学記号、および表としてのさまざまな領域(またはブロック)の検出とラベル付けは、幾何学的レイアウト解析と呼ばれる。 ただし、テキストゾーンは、文書内でさまざまな論理的役割(タイトル、キャプション、脚注など)を果たし、この種のセマンティックラベリングが論理レイアウト解析の範囲です。 文書レイアウト解析は、幾何学的および論理的なラベル付けの組み合わせである。これは通常、文書画像がOCRエンジンに送信される前に実行されるが、大規模なアーカイブ内の同じ文書の重複コピーを検出したり、構造や画像コンテンツによって文書にインデックスを付けたりするためにも使用できる。 文書のレイアウトは、国際規格ISO 8613-1:1989で正式に定義されている。 (ja)
- In computer vision or natural language processing, document layout analysis is the process of identifying and categorizing the regions of interest in the scanned image of a text document. A reading system requires the segmentation of text zones from non-textual ones and the arrangement in their correct reading order. Detection and labeling of the different zones (or blocks) as text body, illustrations, math symbols, and tables embedded in a document is called geometric layout analysis. But text zones play different logical roles inside the document (titles, captions, footnotes, etc.) and this kind of semantic labeling is the scope of the logical layout analysis. (en)
|
rdfs:label
|
- Document layout analysis (en)
- 文書レイアウト解析 (ja)
|
owl:sameAs
| |
prov:wasDerivedFrom
| |
foaf:isPrimaryTopicOf
| |
is dbo:wikiPageRedirects
of | |
is dbo:wikiPageWikiLink
of | |
is foaf:primaryTopic
of | |