| dbpprop:abstract
| - Data mining is the process of extracting hidden patterns from data. As more data is gathered, with the amount of data doubling every three years, data mining is becoming an increasingly important tool to transform this data into information. It is commonly used in a wide range of profiling practices, such as marketing, surveillance, fraud detection and scientific discovery. While data mining can be used to uncover patterns in data samples, it is important to be aware that the use of non-representative samples of data may produce results that are not indicative of the domain. Similarly, data mining will not find patterns that may be present in the domain, if those patterns are not present in the sample being "mined". There is a tendency for insufficiently knowledgeable "consumers" of the results to attribute "magical abilities" to data mining, treating the technique as a sort of all-seeing crystal ball. Like any other tool, it only functions in conjunction with the appropriate raw material: in this case, indicative and representative data that the user must first collect. Further, the discovery of a particular pattern in a particular set of data does not necessarily mean that pattern is representative of the whole population from which that data was drawn. Hence, an important part of the process is the verification and validation of patterns on other samples of data. The term data mining has also been used in a related but negative sense, to mean the deliberate searching for apparent but not necessarily representative patterns in large amounts of data. To avoid confusion with the other sense, the terms data dredging and data snooping are often used. Note, however, that dredging and snooping can be (and sometimes are) used as exploratory tools when developing and clarifying hypotheses. (en)
- Data mining er et engelsk låneord, som betegner søgning efter mønstre og strukturer i større datamængder. Begrebet er blevet aktuelt, efter at størrelsen på databaser i stadigt stigende omfang begrænser mulighederne for komplette statistiske analyser. Dette gør sig fx gældende inden for områder som biologi og finans. Gennem eksempelvis algoritmer eller direkte observation forsøger man at finde relationer mellem datapunkterne for således bedre at kunne visualisere og på sigt udnytte de komplekse informationer. Engelsk Wikipedia skriver Den engelske Wikipedia skriver: Data mining er princippet om at finde relevant information gennem sortering af store datamængder. Datamining bruges normalt af store virksomheders efterretningsorganisationer, finansanalytikere, men bruges også i videnskaberne til at udtrække præcis information fra de enorme datasæt, som dannes ved brug af moderne eksperimentelle og observationsorienterede metoder. D.M. er blevet beskrevet som "ikke-trivielt udtræk fra impælicit, førhen ukendt og potentielt nyttig information af data og "videnskaben om at udtrække nyttig information fra store datasæt eller store databaser. Hvor man med traditionel statistisk metode søger at slutte fra enkeltobservationer til udsagn om hele populationen, bruges data mining til gennem sammenstilling af egenskaber om det enkelte individ eller det enkelte objekt. Data mining og eavesdropping Data mining vinder i stigende grad indpas som middel til at vride ny viden frem om enkelte individer, efterhånden som data om individerne indsamles gennem overvågning af telefoni, datastrømme, internettrafik, mail, videoovervågning, betalingstransaktioner og lignende. Denne metode anvendes dels til præcisering af personorienteret markedsføring, dels til politisk efterretningsvirksomhed. (da)
- La minería de datos (DM, Data Mining) consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información era previamente desconocida y podrá resultar útil para algún proceso. En otras palabras, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos. Bajo el nombre de minería de datos se engloba todo un conjunto de técnicas encaminadas a la extracción de conocimiento procesable, implícito en las bases de datos. Está fuertemente ligado con la supervisión de procesos industriales ya que resulta muy útil para aprovechar los datos almacenados en las bases de datos. Las bases de la minería de datos se encuentran en la inteligencia artificial y en el análisis estadístico. Mediante los modelos extraídos utilizando técnicas de minería de datos se aborda la solución a problemas de predicción, clasificación y segmentación. (es)
- Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch-mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das Durchsuchen sehr großer Datenbestände, weswegen vor allem solche Methoden betrachtet werden, die eine hervorragende asymptotische Laufzeit haben. Bei Verzicht auf Modellannahmen über den Datenentstehungsprozess ergeben sich auch bei kleinen oder mittleren Datenbeständen sinnvolle Anwendungsmöglichkeiten. In der Praxis, vor allem im deutschen Sprachgebrauch, etablierte sich der angelsächsische Begriff "Data Mining" für den gesamten Prozess der so genannten "Knowledge Discovery in Databases". (de)
- L’exploration de données, aussi connue sous les noms fouille de données, data mining (forage de données) ou encore Extraction de Connaissances à partir de Données (ECD en français, KDD en Anglais), a pour objet l’extraction d'un savoir ou d'une connaissance à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques, et l'utilisation industrielle ou opérationnelle de ce savoir. Elle est utilisée dans le monde professionnel pour résoudre des problématiques très diverses, allant de la gestion de relation client à la maintenance préventive, en passant par la détection de fraudes ou encore l'optimisation de sites web. (fr)
- Il data mining ha per oggetto l'estrazione di un sapere o di una conoscenza a partire da grandi quantità di dati (attraverso metodi automatici o semi-automatici) e l'utilizzazione industriale o operativa di questo sapere. (it)
- データマイニング(Data mining)とは、統計学、パターン認識、人工知能等のデータ解析の技法を大量のデータに網羅的に適用することで知識を取り出す技術。DMと略して呼ばれる事もある。通常のデータの扱い方からは想像が及びにくい、発見的(heuristic)な知識獲得が可能であるという期待を含意していることが多い。英語ではknowledge-discovery in databases(データベースからの知識発見)の頭文字をとってKDDとも呼ばれる。 (ja)
- Datamining is het op een geautomatiseerde manier patronen en relaties ontdekken in grote hoeveelheden gegevens. De naam komt voort aan de overeenkomsten tussen het zoeken naar waardevolle bedrijfsinformatie en het graven (mining) naar iets waardevols in een grote berg. Datamining is gebaseerd op statistiek, machine learning, patroonherkenning, database management en geavanceerde computerberekeningen. Het wordt vaak toegepast op een datawarehouse. Het kan nieuwe informatie opleveren, die zonder de techniek niet gevonden zou zijn. Het geautomatiseerd verwerken van grote hoeveelheden persoonsgegevens kan echter stuiten op barrières met betrekking tot privacy, legaliteit en ethiek. Data mining maakt een onderdeel uit van een meer omvattend proces dat doorgaans wordt aangeduid als business intelligence. Data mining wordt vaak toegepast op grote hoeveelheden biologische, chemische en medische data. Deze techniek wordt dan met name toegepast op microarraydata of proteïnenmicroarraydata. Dit zijn onderzoeksgebieden binnen de de bio-informatica. Data miners kunnen gebruik maken van de volgende technieken: Case Based Redeneren : deze benadering gebruikt cases uit het verleden om er bepaalde patronen in te herkennen. Neuraal Computing: deze benadering onderzoekt historische data voor het herkennen van bepaalde patronen. Intelligente Agenten: hierbij wordt informatie van het internet gehaald en van databases die op intranet gebaseerd zijn. Samengaan Analyses: hierbij wordt gebruikt gemakt van gespecialiseerde algoritmen die grote hoeveelheden data uitzoeken en statistische regels voor bepaalde onderdelen uiten. Een bekend algoritme voor data mining is het a priori algoritme van Rakesh Agrawal et al. Een andere methode is ComPair. Verschillende Applicaties van DataMining: Bij de Detailhandel wordt het gebruikt voor het voorspellen van verkopen, bepalen van correcte voorraadniveaus en distributieschema's voor winkels. Bij Bankieren wordt het gebruikt voor het voorspellen van het niveau van slechte leningen en bedrieglijke creditcardhouders en welke klanten het beste reageren op nieuwe lening aanbiedingen. Bij Productie wordt het gebruikt voor het voorspellen van machinedefecten en het vinden van factoren die de optimalisatie van productiecapaciteit beheersen. Bij Verzekering wordt het gebruikt voor het voorspellen van de kosten van claims en het voorspellen welke klanten welke verzekeringspolis kopen. Bij Politie wordt het gebruikt voor het volgen van patronen, locaties en gedrag in de criminaliteit en het identificeren van attributen die kunnen assisteren bij het oplossen van criminaliteitszaken (nl)
- Data mining (norsk datagraving) er et fag innen informatikk, der man studerer leting etter struktur og ofte mening, i ofte store mengder med ustrukturerte data. Sentrale teknikker som brukes er mønstergjenkjenning, statistisk modellering og maskinlæring. Søk i ustrukturerte data har vært et eget fag i informatikken lenge, men begrepet data mining kom spesielt etter at man kunne fylle såkalte datavarehus med data av alle slag. En kunne da mot en pengesum, få tilgang til de innsamlede data, for så å iverksette søking og graving etter noe som for klienten var av interesse. (no)
- Prospecção de dados ou mineração de dados é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados. Esse é um tópico recente em ciência da computação mas utiliza várias técnicas da estatística, recuperação de informação, inteligência artificial e reconhecimento de padrões. (pt)
- Интеллектуальный анализ данных (англ. Data Mining) — выявление скрытых закономерностей или взаимосвязей между переменными в больших массивах необработанных данных. Подразделяется на задачи классификации, моделирования и прогнозирования и другие. Термин «Data Mining» введен Григорием Пятецким-Шапиро в 1989 году. Английский термин «Data Mining» не имеет однозначного перевода на русский язык поэтому в большинстве случаев используется в оригинале. Наиболее удачным непрямым переводом считается термин «интеллектуальный анализ данных» . ИАД включает методы и модели статистического анализа и машинного обучения, дистанцируясь от них в сторону автоматического анализа данных. Инструменты ИАД позволяют проводить анализ данных предметными специалистами (аналитиками), не владеющими соответствующими математическими знаниями. (ru)
- Informationsutvinning, även kallat Data mining betecknar sökandet efter mönster i stora datamängder. Begreppet har vuxit fram sedan växande databasers storlek har begränsat möjligheterna till kompletta statistiska analyser inom områden som biologi och finansiella kalkyler. Genom exempelvis algoritmer eller manuell observation försöker man finna relationer mellan datapunkterna, för att bättre kunna visualisera eller utnyttja den komplexa informationen. Informationsutvinning kan använda sig av olika tekniker, bl.a. mönsterigenkänning och subjektbaserad igenkänning. (sv)
- 数据挖掘,(英語:Data mining),又譯為資料採礦、資料探勘。也被稱為資料庫知識發現(英語:Knowledge-Discovery in Databases,簡稱:KDD),習慣上指從大量的資料中自動搜索隱藏於其中之特殊關聯性(屬於Association rule learning)的過程。資料挖掘是 KDD 的步驟之一,通常與電腦科學有關,並透過統計、在线分析处理、情報檢索、機器學習、專家系統(倚靠過去的經驗法則)和模式識別等諸多方法論來實現上述目標。 (zh)
|
| rdfs:comment
| - Data mining is the process of extracting hidden patterns from data. As more data is gathered, with the amount of data doubling every three years, data mining is becoming an increasingly important tool to transform this data into information. (en)
- Data mining er et engelsk låneord, som betegner søgning efter mønstre og strukturer i større datamængder. Begrebet er blevet aktuelt, efter at størrelsen på databaser i stadigt stigende omfang begrænser mulighederne for komplette statistiske analyser. (da)
- La minería de datos (DM, Data Mining) consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información era previamente desconocida y podrá resultar útil para algún proceso. (es)
- Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch-mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. (de)
- L’exploration de données, aussi connue sous les noms fouille de données, data mining (forage de données) ou encore Extraction de Connaissances � partir de Données (ECD en français, KDD en Anglais), a pour objet l’extraction d'un savoir ou d'une connaissance � partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques, et l'utilisation industrielle ou opérationnelle de ce savoir. (fr)
- Il data mining ha per oggetto l'estrazione di un sapere o di una conoscenza a partire da grandi quantit� di dati (attraverso metodi automatici o semi-automatici) e l'utilizzazione industriale o operativa di questo sapere. (it)
- データマイニング(Data mining)とは、統計学、パターン認識、人工知能等のデータ解析の技法を大量のデータに網羅的に適用することで知識を取り出す技術。DMと略して呼ばれる事もある。通常のデータの扱い方からは想像が及びにくい、発見的(heuristic)な知識獲得が可能であるという期待を含意していることが多い。英語ではknowledge-discovery in databases(データベースからの知識発見)の� �文字をとってKDDとも呼ばれる。 (ja)
- Datamining is het op een geautomatiseerde manier patronen en relaties ontdekken in grote hoeveelheden gegevens. De naam komt voort aan de overeenkomsten tussen het zoeken naar waardevolle bedrijfsinformatie en het graven (mining) naar iets waardevols in een grote berg. (nl)
- Data mining (norsk datagraving) er et fag innen informatikk, der man studerer leting etter struktur og ofte mening, i ofte store mengder med ustrukturerte data. (no)
- Prospecção de dados ou mineração de dados é o processo de explorar grandes quantidades de dados � procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados. (pt)
- Интеллектуальный анализ данных (англ. Data Mining) — выявление скрытых закономерностей или взаимосвязей между переменными в больших массивах необработанных данных. (ru)
- Informationsutvinning, även kallat Data mining betecknar sökandet efter mönster i stora datamängder. Begreppet har vuxit fram sedan växande databasers storlek har begränsat möjligheterna till kompletta statistiska analyser inom områden som biologi och finansiella kalkyler. (sv)
- 数据挖掘,(英語:Data mining),又譯為資料採礦、資料探勘。也被稱為資料庫知識發現(英語:Knowledge-Discovery in Databases,簡稱:KDD),習慣上指從大量的資料中自動搜索隱藏於其中之特殊關聯性(屬於Association rule learning)的過程。資料挖掘是 KDD 的步驟之一,通常與電腦科學有關,並透過統計、在线分析处理、情� �檢索、機器學習、專家系統(倚� 過去的經驗法則)和模式識別等諸多方法論來實現上述目標。 (zh)
|