| dbpprop:abstract
|
- Text mining, sometimes alternately referred to as text data mining, roughly equivalent to text analytics, refers generally to the process of deriving high-quality information from text. High-quality information is typically derived through the divining of patterns and trends through means such as statistical pattern learning. Text mining usually involves the process of structuring the input text (usually parsing, along with the addition of some derived linguistic features and the removal of others, and subsequent insertion into a database), deriving patterns within the structured data, and finally evaluation and interpretation of the output. 'High quality' in text mining usually refers to some combination of relevance, novelty, and interestingness. Typical text mining tasks include text categorization, text clustering, concept/entity extraction, production of granular taxonomies, sentiment analysis, document summarization, and entity relation modeling (i.e. , learning relations between named entities).
- La minería de textos se refiere al proceso de derivar información nueva de textos.
- La fouille de textes ou l'extraction de connaissances dans les textes est une spécialisation de la fouille de données et fait partie du domaine de l'intelligence artificielle. Cette technique est souvent désignée sous l'anglicisme text mining. C'est un ensemble de traitements informatiques consistant à extraire des connaissances selon un critère de nouveauté ou de similarité dans des textes produits par des humains pour des humains. Dans la pratique, cela revient à mettre en algorithmes un modèle simplifié des théories linguistiques dans des systèmes informatiques d'apprentissage et de statistiques. Les disciplines impliquées sont donc la linguistique calculatoire, l'ingénierie du langage, l'apprentissage artificiel, les statistiques et bien sûr l'informatique.
- A szövegbányászat a strukturálatlan vagy kis mértékben strukturált szöveges állományokból történő ismeret kinyerésének tudománya; olyan különböző dokumentumforrásokból származó szöveges ismeretek és információk gépi intelligenciával történő kigyűjtése és reprezentációja, amely a feldolgozás előtt rejtve és feltáratlanul maradt az elemző előtt. Az egyszerű keresésnél jóval többet hivatott nyújtani a szövegbányászat. Míg szöveges keresés esetében meglévő információkra kívánunk kis időbefektetéssel rátalálni (nagy relevanciájú találati eredmények által), addig a szövegbányászat során olyan tudásra, ismeretekre is szert kívánunk tenni, ami explicite nem volt benne a rendelkezésre álló dokumentumállományban (korpuszban), csak indirekt módon, rejtve, látensen. Bár a teljes szövegű keresés is a szövegbányászat része, a szövegbányászat a keresésnél jóval többet jelent, hasonlóan, ahogy az adatbányászat is jóval többet jelent az egyszerű adatkeresésnél. A szövegbányászat nagy mértékben épít az adatbányászat eredményeire, ahol elsősorban számszerű adatok feldolgozása történik intelligens gépi módszerekkel. Az adatbányászat azon eredményeit, amelyek minták felismerésére, adatreprezentációra, előrejelzésre, statisztikai összefüggések kimutatására vonatkoznak, a szövegbányászat is nagymértékben hasznosítja. A különbség abban mutatkozik, hogy míg adatbányászat esetében jól strukturált számszerű adatokkal dolgozunk, addig a szövegbányászatban strukturálatlan szöveges állományok képezik a kiindulási alapot.
- テキストマイニング(text mining)は、テキストを利用したマイニングのことである。IT業界では、数値情報は比較的に入手しやすかったため、数値を使ったデータマイニングは、比較的昔から存在していた。 ところが、テキスト情報というものは、アンケートなどに書くことが多く、分析するためには、その膨大なテキスト情報を まずはコンピュータに入力しなければならないため、普及してこなかった。テキストを専門に入力する会社は存在するが コストパフォーマンスがわからないからだった。 しかし、2002年ごろから、Web上に掲示板が多く作られるようになると、Webを通して、ユーザ自らがテキストを コンピュータに入力してくれるようになり、飛躍的にテキストマイニングが増加してきた。
- Text mining is een interdisciplinair vakgebied dat tot doel heeft technieken en methoden te ontwikkelen om kennis uit vrije tekst te extraheren. De disciplines die zich in text mining verenigen zijn onder meer enkele vakgebieden uit de informatica/kunstmatige intelligentie zoals information retrieval en machine learning, maar ook disciplines als statistiek en computationele taalkunde. Sinds februari 2009 is Johannes Scholtes aangesteld als bijzonder hoogleraar in de text mining aan de Universiteit van Maastricht.
- Text mining – ogólna nazwa metod eksploracji danych służących do wydobywania danych statystycznych z tekstu i ich późniejszej obróbki. Metody text mining stosowane są np. do statystycznego przetwarzania: artykułów prasowych wiadomości poczty elektronicznej otwartych odpowiedzi na pytania ankietowe opisów dolegliwości, podawanych przez pacjentów komentarzy do sesji giełdowych i zdarzeń dotyczące spółek życiorysów zawodowych i listów motywacyjnych Text mining polega na znalezieniu kluczowych fraz, zdań, które zostają następnie zakodowane pod postacią zmiennych numerycznych. Później stosuje się metody statystyki i eksploracji danych w celu odkrycia zależności pomiędzy zmiennymi. Ze względu na to, że powstające zmienne są zwykle nominalne, szczególnie użyteczna jest analiza koszykowa.
- Prospecção de texto ou mineração de texto (também conhecida pelo termo inglês text mining), refere-se ao processo de obtenção de informação de qualidade a partir de texto em línguas naturais. É inspirado na mineração de dados, que consiste em extrair informação de bancos de dados estruturados; a mineração de texto extrai informação de dados não estruturados ou semi-estruturados. Ganhou importância com o crescimento da Internet e dos mecanismos de busca. Com mineração de texto pode-se extrair informação relevante de uma grande base de textos, sem precisar lê-los previamente. Outra utilização seria o auxílio na navegação para encontrar o que se deseja. Seguindo a mesma tendência da área de mineração de dados, classificação automática de textos e agrupamento por semelhança são outras funcionalidades comumente utilizadas. Apresentação sobre os passos da mineração de texto Um processo inteiro de mineração de texto consiste em um mecanismo de coleta, uma etapa de pré-processamento, um mecanismo de indexação, aplicação do algorítmo e finalmente a análise dos resultados.
- Анализ текста — процесс получения высококачественной информации из текста на естественном языке. Как правило, для этого применяется статистическое обучение на основе шаблонов: входной текст разделяется с помощью шаблонов, затем производится обработка полученных данных.
- Text mining är processen att upptäcka meningsfulla mönster och samband från ostrukturerad information/data, det vill säga texter. Text mining är inte en sökmotor, informationssökare eller tolkare.
- 文字探勘,也被稱為文本挖掘、文字採礦、智慧型文字分析、文字資料探勘或文字知識發現,一般而言,指的是從非結構化的文字中,萃取出有用的重要資訊或知識。文字探勘是一個剛起步的學科領域,它是透過資訊擷取、資料探勘、機械學習、統計學、電腦語言學來達成。大部分的資訊(超過80%)都是以文字儲存,因此,文字探勘被認為是有高度的潛在商業價值。
- 文本挖掘有时也被称为文字探勘、文本数据挖掘等,大致相当于文字分析,一般指文本处理过程中产生高质量的信息。高质量的信息通常通过分类和预测来产生,如模式识别。文本挖掘通常涉及输入文本的处理过程(通常进行分析,同时加上一些衍生语言特征以及消除杂音,随后插入到数据库中) ,产生结构化数据,并最终评价和解释输出。'高品质'的文本挖掘通常是指某种组合的相关性,新颖性和趣味性。典型的文本挖掘方法包括文本分类,文本聚类,概念/实体挖掘,生产精确分类,观点分析,文档摘要和实体关系模型(即,学习已命名实体之间的关系) 。
|
| rdfs:comment
|
- Text mining, sometimes alternately referred to as text data mining, roughly equivalent to text analytics, refers generally to the process of deriving high-quality information from text. High-quality information is typically derived through the divining of patterns and trends through means such as statistical pattern learning.
- La minería de textos se refiere al proceso de derivar información nueva de textos.
- La fouille de textes ou l'extraction de connaissances dans les textes est une spécialisation de la fouille de données et fait partie du domaine de l'intelligence artificielle. Cette technique est souvent désignée sous l'anglicisme text mining. C'est un ensemble de traitements informatiques consistant à extraire des connaissances selon un critère de nouveauté ou de similarité dans des textes produits par des humains pour des humains.
- A szövegbányászat a strukturálatlan vagy kis mértékben strukturált szöveges állományokból történő ismeret kinyerésének tudománya; olyan különböző dokumentumforrásokból származó szöveges ismeretek és információk gépi intelligenciával történő kigyűjtése és reprezentációja, amely a feldolgozás előtt rejtve és feltáratlanul maradt az elemző előtt. Az egyszerű keresésnél jóval többet hivatott nyújtani a szövegbányászat.
- Text mining is een interdisciplinair vakgebied dat tot doel heeft technieken en methoden te ontwikkelen om kennis uit vrije tekst te extraheren. De disciplines die zich in text mining verenigen zijn onder meer enkele vakgebieden uit de informatica/kunstmatige intelligentie zoals information retrieval en machine learning, maar ook disciplines als statistiek en computationele taalkunde.
- Text mining – ogólna nazwa metod eksploracji danych służących do wydobywania danych statystycznych z tekstu i ich późniejszej obróbki. Metody text mining stosowane są np.
- Prospecção de texto ou mineração de texto (também conhecida pelo termo inglês text mining), refere-se ao processo de obtenção de informação de qualidade a partir de texto em línguas naturais. É inspirado na mineração de dados, que consiste em extrair informação de bancos de dados estruturados; a mineração de texto extrai informação de dados não estruturados ou semi-estruturados. Ganhou importância com o crescimento da Internet e dos mecanismos de busca.
- Анализ текста — процесс получения высококачественной информации из текста на естественном языке.
- Text mining är processen att upptäcka meningsfulla mönster och samband från ostrukturerad information/data, det vill säga texter. Text mining är inte en sökmotor, informationssökare eller tolkare.
- 文字探勘,也被稱為文本挖掘、文字採礦、智慧型文字分析、文字資料探勘或文字知識發現,一般而言,指的是從非結構化的文字中,萃取出有用的重要資訊或知識。文字探勘是一個剛起步的學科領域,它是透過資訊擷取、資料探勘、機械學習、統計學、電腦語言學來達成。大部分的資訊(超過80%)都是以文字儲存,因此,文字探勘被認為是有高度的潛在商業價值。
|