About: Text mining

Facets (new session)
Description
Metadata
Settings
- Rule:
- Inverse Functional Properties:
- "Same As":

About: Text mining Goto Sponge NotDistinct Permalink

An Entity of Type : yago:Software106566077, within Data Space : dbpedia.org associated with source document(s)
QRcode icon

http://dbpedia.org/describe/?url=http%3A%2F%2Fdbpedia.org%2Fresource%2FText_mining

Text mining, also referred to as text data mining, similar to text analytics, is the process of deriving high-quality information from text. It involves "the discovery by computer of new, previously unknown information, by automatically extracting information from different written resources." Written resources may include websites, books, emails, reviews, and articles. High-quality information is typically obtained by devising patterns and trends by means such as statistical pattern learning. According to Hotho et al. (2005) we can distinguish between three different perspectives of text mining: information extraction, data mining, and a KDD (Knowledge Discovery in Databases) process. Text mining usually involves the process of structuring the input text (usually parsing, along with the a

Attributes	Values
rdf:type	Thing yago:WikicatArtificialIntelligenceApplications yago:Abstraction100002137 yago:Application106570110 yago:Code106355894 yago:CodingSystem106353757 yago:Communication100033020 yago:Program106568978 yago:Writing106359877 yago:WrittenCommunication106349220 music genre yago:Software106566077
rdfs:label	Text mining (en) تنقيب في النصوص (ar) Dolování z textu (cs) Text Mining (de) Εξόρυξη κειμένου (el) Minería de textos (es) Testu-meatzaritza (eu) Fouille de textes (fr) Penambangan teks (in) Text mining (it) テキストマイニング (ja) Textmining (nl) Text mining (pl) Mineração de texto (pt) Интеллектуальный анализ текста (ru) Text mining (sv) Інтелектуальний аналіз тексту (uk) 文本挖掘 (zh)
rdfs:comment	التنقيب في النصوص، وأحيانا يشار إليه باسم التنقيب في البيانات النصية، أي ما يعني تقريبا ، هو عملية استخلاص معلومات عالية الجودة من النص. واستخلاص المعلومات عالية الجودة يكون من خلال التقسيم للأنماط والاتجاهات من خلال وسائل مثل . وعادة ما يتطلب التنقيب في النصوص عملية هيكلة للنص المدخل (عادة التحليل، جنبا إلى جنب مع إضافة بعض المميزات اللغوية المشتقة وإزالة أخرى، ومن ثم الإدراج في قاعدة بيانات)، واستخلاص الأنماط في صورة بيانات مهيكلة، وأخيرا تقييم وتفسير للناتج. ويشير المصطلح 'ذات جودة عالية' في مجال التنقيب في النصوص إلى مزيج من ، ، الأهمية. (ar) Dolování z textu (anglicky text mining) je vědecká disciplína na pomezí dolování z dat, strojového učení a počítačové lingvistiky. Vyvíjí se především s potřebou automatického zpracování ohromného množství informací dostupných v podobě volného textu. Klasické metody dolování z dat totiž pracují pouze se strukturovanými daty (obsahujícími metadata důležitá pro zpracování) a většina informací jim tak zůstává nepřístupná. (cs) Text Mining, seltener auch Textmining, Text Data Mining oder Textual Data Mining, ist ein Bündel von Algorithmus-basierten Analyseverfahren zur Entdeckung von Bedeutungsstrukturen aus un- oder schwachstrukturierten Textdaten. Mit statistischen und linguistischen Mitteln erschließt Text-Mining-Software aus Texten Strukturen, die die Benutzer in die Lage versetzen sollen, Kerninformationen der verarbeiteten Texte schnell zu erkennen. Im Optimalfall liefern Text-Mining-Systeme Informationen, von denen die Benutzer zuvor nicht wissen, ob und dass sie in den verarbeiteten Texten enthalten sind. Bei zielgerichteter Anwendung sind Werkzeuge des Text Mining außerdem in der Lage, Hypothesen zu generieren, diese zu überprüfen und schrittweise zu verfeinern. (de) Penambangan teks (bahasa Inggris: text mining) adalah proses ekstraksi pola berupa informasi dan pengetahuan yang berguna dari sejumlah besar sumber data teks, seperti dokumen Word, PDF, kutipan teks, dll. Jenis untuk penambangan teks ini disebut data tak terstruktur dan merupakan pembeda utama dengan penambangan data yang menggunakan data terstruktur atau basis data sebagai masukan. Penambangan teks dapat dianggap sebagai proses dua tahap yang diawali dengan penerapan struktur terhadap sumber data teks dan dilanjutkan dengan dan pengetahuan yang relevan dari data teks terstruktur ini dengan menggunakan teknik dan alat yang sama dengan penambangan data. Proses yang umum dilakukan oleh penambangan teks di antaranya adalah , , , deteksi plagiarisme, dll. (Turban, et.al., 2011) (in) テキストマイニング（英: text mining）は、文字列を対象としたデータマイニングのことである。通常の文章からなるデータを単語や文節で区切り、それらの出現の頻度や共出現の相関、出現傾向、時系列などを解析することで有用な情報を取り出す、テキストデータの分析方法である。テキストデータの多くは形式が定まっておらず、また日本語は英語などと比べて単語の境界判別の必要性（→わかち書き）や文法ゆらぎが大きい点において形態素解析が困難であったが、自然言語処理の発展により実用的な水準の分析が可能となった。テキストマイニングの対象としては、顧客からのアンケートの回答やコールセンターに寄せられる質問や意見、電子掲示板やメーリングリストに蓄積されたテキストデータなどがある。 (ja) Text mining eller text data mining är processen att upptäcka meningsfulla mönster och samband i ostrukturerad information/ostrukturerade data, det vill säga texter. Text mining är inte en sökmotor, informationssökare eller tolkare. Denna artikel om språk eller lingvistik saknar väsentlig information. Du kan hjälpa till genom att lägga till den. (sv) Интеллектуальный анализ текстов (ИАТ, англ. text mining) — направление в искусственном интеллекте, целью которого является получение информации из , основываясь на применении эффективных в практическом плане методов машинного обучения и обработки естественного языка. Название «интеллектуальный анализ текстов» перекликается с понятием «интеллектуальный анализ данных» (ИАД, англ. data mining), что выражает схожесть их целей, подходов к переработке информации и сфер применения; разница проявляется лишь в конечных методах, а также в том, что ИАД имеет дело с хранилищами и базами данных, а не электронными библиотеками и корпусами текстов. (ru) Інтелектуальний аналіз тексту (ІАТ, англ. text mining) — напрям інтелектуального аналізу даних (англ. Data Mining) та штучного інтелекту, метою якого є отримання інформації з колекцій текстових документів, ґрунтуючись на застосуванні ефективних, у практичному плані, методів машинного навчання та обробки природної мови. Інтелектуальний аналіз тексту використовує всі ті ж підходи до перероблювання інформації, що й інтелектуальний аналіз даних, однак різниця між цими напрямками проявляється лише в кінцевих методах, а також у тому, що інтелектуальний аналіз даних має справу зі сховищами та базами даних, а не електронними бібліотеками та корпусами текстів. (uk) 文本挖掘（Text mining）有时也被称为文字探勘、文本数据挖掘等，大致相当于文字分析，一般指文本处理过程中产生高质量的信息。高质量的信息通常通过分类和预测来产生，如模式识别。文本挖掘通常涉及输入文本的处理过程（通常进行分析，同时加上一些衍生语言特征以及消除杂音，随后插入到数据库中），产生结构化数据，并最终评价和解释输出。'高品质'的文本挖掘通常是指某种组合的相关性，新颖性和趣味性。典型的文本挖掘方法包括，，概念/实体挖掘，生产精确分类，，和实体关系模型（即，学习之间的关系）。文本分析包括了信息检索与词典分析来研究词语的频数分布、模式识别、标签\注释、信息抽取，数据挖掘技术包括链接和关联分析、可视化和预测分析。本质上，首要的任务是，通过自然语言处理（NLP）和分析方法，将文本转化为数据进行分析。 (zh) Η εξόρυξη κειμένου (αγγλικά: text mining) είναι η διαδικασία με την οποία υψηλής ποιότητας πληροφορίες εξάγονται από κείμενα με τη χρήση πληροφοριακών συστημάτων. Πιο συγκεκριμένα, αφορά στον εντοπισμό και την αυτόματη εξαγωγή νέων, άγνωστων μέχρι πρότινος πληροφοριών από διάφορους γραπτούς πόρους, όπως ιστότοπους, βιβλία, μηνύματα ηλεκτρονικού ταχυδρομείου, κριτικές και άρθρα. Μέθοδοι και λογισμικό εξόρυξης κειμένου ερευνάται και αναπτύσσεται από μεγάλες εταιρείες, συμπεριλαμβανομένων των IBM και της Microsoft, για την περαιτέρω αυτοματοποίηση των διαδικασιών εξόρυξης και ανάλυσης. (el) La minería de textos es una rama específica de la minería de datos que se refiere al proceso de analizar y derivar información nueva de textos. Por medio de la identificación de patrones o correlaciones entre los términos se logra encontrar información que no está explícita dentro del texto. Los textos que se usan como recursos pueden ser páginas web, libros, correos electrónicos, reseñas de clientes, artículos, entre otros. (es) Testu-meatzaritza, testutik kalitate handiko informazioa lortzeko prozesua da. Kalitate handiko informazioa, oro har, patroiak eta joerak egitean lortzen da, esate baterako, eredu estatistikoko ikasketen bidez. Testu-meatzaritzak, oro har, idazketa-testua egituratzeko prozesua dakar (normalean azterketa, ezaugarri linguistiko eratorri batzuk gehituta eta besteen ezabapena eta ondorengo datu-base batean sartzea), eta, azkenik, irteeraren ebaluazioa eta interpretazioa. Testu-meatzaritzan "kalitate handia" garrantziaren, berrikuntzaren eta interesaren konbinazioari dagokio. Testu-meatzaritzako eginkizun tipikoen artean, testuen sailkapena, testu-taldekatzea, kontzeptu/entitate erauzketa, taxonomia granularrak, sentimenduen analisia, dokumentuaren laburpena eta entitate-ereduen modelizazioa. (eu) Text mining, also referred to as text data mining, similar to text analytics, is the process of deriving high-quality information from text. It involves "the discovery by computer of new, previously unknown information, by automatically extracting information from different written resources." Written resources may include websites, books, emails, reviews, and articles. High-quality information is typically obtained by devising patterns and trends by means such as statistical pattern learning. According to Hotho et al. (2005) we can distinguish between three different perspectives of text mining: information extraction, data mining, and a KDD (Knowledge Discovery in Databases) process. Text mining usually involves the process of structuring the input text (usually parsing, along with the a (en) Il text mining è una tecnica che utilizza l'elaborazione del linguaggio naturale per trasformare il testo libero, non strutturato, di documenti/database in dati strutturati e normalizzati. Lo scopo è quello di estrarre significato, classificare gli argomenti e assegnare agli stessi una polarità, che può essere positiva, negativa o neutra (ovvero, si parla di un determinato argomento in che modo?). Tanti gli strumenti di analisi utilizzabili, da quelli full AI (completamente automatizzati) a quelli ibridi, dove la componente umana aiuta nei procedimenti di interpretazione del big data testuale. (it) La fouille de textes ou « l'extraction de connaissances » dans les textes est une spécialisation de la fouille de données et fait partie du domaine de l'intelligence artificielle. Cette technique est souvent désignée sous l'anglicisme text mining. Les disciplines impliquées sont donc la linguistique calculatoire, l'ingénierie des langues, l'apprentissage artificiel, les statistiques et l'informatique. (fr) Textmining of tekstmining verwijst naar het proces om met allerhande ICT-technieken waardevolle informatie te halen uit grote hoeveelheden tekstmateriaal. Met deze technieken wordt gepoogd patronen en tendensen te ontwaren. Concreet gaat men teksten softwarematig structureren en ontleden, transformeren, vervolgens inbrengen in databanken, en ten slotte evalueren en interpreteren. Textmining is verwant aan tekstanalyse; de termen worden vaak door elkaar gebruikt. (nl) Text mining (eksploracja tekstu) – ogólna nazwa metod eksploracji danych służących do wydobywaniadanych z tekstu i ich późniejszej obróbki. Metody text mining stosowane są np. do statystycznego przetwarzania: * artykułów prasowych * wiadomości poczty elektronicznej * otwartych odpowiedzi na * opisów dolegliwości, podawanych przez pacjentów * komentarzy do sesji giełdowych i zdarzeń dotyczące spółek * życiorysów zawodowych i listów motywacyjnych * tekstów reklamacji konsumenckich (pl) Mineração de texto, conhecida também como mineração de dados textuais e semelhante à , refere-se ao processo de obtenção de informações importantes de um texto. Informações importantes são obtidas normalmente pela elaboração de padrões e tendências através de meios como o padrão estatístico de aprendizagem. Geralmente a mineração de texto envolve o processo de estruturação do texto de entrada (frequentemente análise, junto com a adição de algumas características linguísticas derivadas e com a retirada de outras, e com a subsequente inserção em um banco de dados), de derivação de padrões dentro da estrutura de dados e, por fim, de avaliação e interpretação do resultado. Geralmente, “importante” em mineração de texto refere-se a algumas combinações de relevância, originalidade e interesse. T (pt)
foaf:depiction
dcterms:subject	Applications of artificial intelligence Text Statistical natural language processing Computational linguistics Natural language processing Applied data mining Text mining
Wikipage page ID	318439 (xsd:integer)
Wikipage revision ID	1119160070 (xsd:integer)
Link from a Wikipage to another Wikipage	Protein interactions Encryption Named entity recognition Natural language processing Noun phrase Ontology learning Parsing Index (database) Intelligence analyst Biology Biomedical Decryption Algorithm Customer attrition Customer relationship management University of Alberta University of California, Berkeley University of Manchester University of Tokyo Information Awareness Office Information extraction Information retrieval Information visualization Lexical analysis Limitations and exceptions to copyright PubGene Gender bias Applications of artificial intelligence Commercial software Competitive intelligence Name resolution (semantics and text extraction) National security Nature (journal) Novelty (patent) Open source Gensim Concept mining Content analysis Context (language use) Copyright law of Japan Copyright law of the European Union

Faceted Search & Find service v1.17_git139 as of Feb 29 2024

Alternative Linked Data Documents: ODE Content Formats:

RDF

ODATA

Microdata

About

OpenLink Virtuoso version 08.03.3330 as of Mar 19 2024, on Linux (x86_64-generic-linux-glibc212), Single-Server Edition (62 GB total memory, 54 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software