dbo:abstract
|
- The Hamshahri Corpus (Persian: پیکره همشهری) is a sizable Persian corpus based on the Iranian newspaper Hamshahri, one of the first online Persian-language newspapers in Iran. It was initially collected and compiled by Ehsan Darrudi at DBRG Group of University of Tehran. Later, a team headed by Ale Ahmad built on this corpus and created the first Persian text collection suitable for information retrieval evaluation tasks. This corpus was created by crawling the online news articles from the Hamshahri's website and processing the HTML pages to create a standard text corpus for modern information retrieval experiments. (en)
- Корпус Хамшахри (перс. پیکره همشهری) — корпус текстов на персидском языке, основанный на контенте иранской газеты , одного из первых онлайн-изданий на персидском языке. Первоначально собран и составлен Эхсаном Дарруди из DBRG Group, базирующейся в Тегеранском университете. Позднее группа под руководством Али Ахмада, на основе этого корпуса создала первую базу персидских текстов, пригодную для задач информационного поиска. Корпус Хамшахри был создан путем сканирования новостных статей с веб-сайта газеты «Хамшахри» и последующей обработки HTML-страниц для создания стандартного текстового корпуса, пригодного для стандартного поиска информации. (ru)
|
dbo:thumbnail
| |
dbo:wikiPageExternalLink
| |
dbo:wikiPageID
| |
dbo:wikiPageLength
|
- 2763 (xsd:nonNegativeInteger)
|
dbo:wikiPageRevisionID
| |
dbo:wikiPageWikiLink
| |
dbp:wikiPageUsesTemplate
| |
dcterms:subject
| |
gold:hypernym
| |
rdf:type
| |
rdfs:comment
|
- The Hamshahri Corpus (Persian: پیکره همشهری) is a sizable Persian corpus based on the Iranian newspaper Hamshahri, one of the first online Persian-language newspapers in Iran. It was initially collected and compiled by Ehsan Darrudi at DBRG Group of University of Tehran. Later, a team headed by Ale Ahmad built on this corpus and created the first Persian text collection suitable for information retrieval evaluation tasks. (en)
- Корпус Хамшахри (перс. پیکره همشهری) — корпус текстов на персидском языке, основанный на контенте иранской газеты , одного из первых онлайн-изданий на персидском языке. Первоначально собран и составлен Эхсаном Дарруди из DBRG Group, базирующейся в Тегеранском университете. Позднее группа под руководством Али Ахмада, на основе этого корпуса создала первую базу персидских текстов, пригодную для задач информационного поиска. (ru)
|
rdfs:label
|
- Hamshahri Corpus (en)
- Корпус Хамшахри (ru)
|
owl:sameAs
| |
prov:wasDerivedFrom
| |
foaf:depiction
| |
foaf:isPrimaryTopicOf
| |
is dbo:wikiPageDisambiguates
of | |
is dbo:wikiPageRedirects
of | |
is dbo:wikiPageWikiLink
of | |
is foaf:primaryTopic
of | |