| dbpprop:abstract
|
- Data mining is the process of extracting patterns from data. As more data are gathered, with the amount of data doubling every three years, data mining is becoming an increasingly important tool to transform these data into information. It is commonly used in a wide range of profiling practices, such as marketing, surveillance, fraud detection and scientific discovery. While data mining can be used to uncover patterns in data samples, it is important to be aware that the use of non-representative samples of data may produce results that are not indicative of the domain. Similarly, data mining will not find patterns that may be present in the domain, if those patterns are not present in the sample being "mined". There is a tendency for insufficiently knowledgeable "consumers" of the results to attribute "magical abilities" to data mining, treating the technique as a sort of all-seeing crystal ball. Like any other tool, it only functions in conjunction with the appropriate raw material: in this case, indicative and representative data that the user must first collect. Further, the discovery of a particular pattern in a particular set of data does not necessarily mean that pattern is representative of the whole population from which that data was drawn. Hence, an important part of the process is the verification and validation of patterns on other samples of data. The term data mining has also been used in a related but negative sense, to mean the deliberate searching for apparent but not necessarily representative patterns in large numbers of data. To avoid confusion with the other sense, the terms data dredging and data snooping are often used. Note, however, that dredging and snooping can be (and sometimes are) used as exploratory tools when developing and clarifying hypotheses.
- Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch-mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das Durchsuchen sehr großer Datenbestände, weswegen vor allem solche Methoden betrachtet werden, die eine hervorragende asymptotische Laufzeit haben. Bei Verzicht auf Modellannahmen über den Datenentstehungsprozess ergeben sich auch bei kleinen oder mittleren Datenbeständen sinnvolle Anwendungsmöglichkeiten. In der Praxis, vor allem im deutschen Sprachgebrauch, etablierte sich der angelsächsische Begriff "Data Mining" für den gesamten Prozess der so genannten "Knowledge Discovery in Databases".
- La mineria de dades (Data Mining) és un procés no trivial d'identificació vàlida, nova, potencialment útil i entendible de patrons comprensibles que es troben ocults en les dades (Fayyad i altres, 1996). Les bases de la mineria de dades es troben en la intel·ligència artificial i en l'anàlisi estadística. Mitjançant els models extrets utilitzant tècniques de mineria de dades s'aborda la solució a problemes de predicció, classificació i segmentació.
- Data mining (angl. dolování z dat či vytěžování dat) je analytická metodologie získávání netriviálních skrytých a potenciálně užitečných informací z dat. Někdy se chápe jako analytická součást dobývání znalostí z databází (Knowledge Discovery in Databases, KDD), tak například Berka (2003), jindy se tato dvě označení chápou jako souznačná. Data mining se používá v komerční sféře (například v marketingu při rozhodování, které klienty oslovit dopisem s nabídkou produktu), ve vědeckém výzkumu (například při analýze genetické informace) i v jiných oblastech (například při monitorování aktivit na internetu s cílem odhalit činnost potenciálních škůdců a teroristů).
- La minería de datos (DM, Data Mining) consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información era previamente desconocida y podrá resultar útil para algún proceso. En otras palabras, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos. Bajo el nombre de minería de datos se engloba todo un conjunto de técnicas encaminadas a la extracción de conocimiento procesable, implícito en las bases de datos. Está fuertemente ligado con la supervisión de procesos industriales ya que resulta muy útil para aprovechar los datos almacenados en las bases de datos. Las bases de la minería de datos se encuentran en la inteligencia artificial y en el análisis estadístico. Mediante los modelos extraídos utilizando técnicas de minería de datos se aborda la solución a problemas de predicción, clasificación y segmentación.
- Tiedonlouhinta tarkoittaa joukkoa menetelmiä, joilla pyritään oleellisen löytämiseen suurista tietomassoista.
- L’exploration de données, aussi connue sous les noms fouille de données, data mining (forage de données) ou encore Extraction de Connaissances à partir de Données (ECD en français, KDD en Anglais), a pour objet l’extraction d'un savoir ou d'une connaissance à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques, et l'utilisation industrielle ou opérationnelle de ce savoir. Elle est utilisée dans le monde professionnel pour résoudre des problématiques très diverses, allant de la gestion de relation client à la maintenance préventive, en passant par la détection de fraudes ou encore l'optimisation de sites web.
- Az adatbányászat a nagymennyiségű adatokban rejlő információk fél-automatikus feltárása mesterséges intelligencia algoritmusok alkalmazásával (például neurális hálók, szabálygenerálók, asszociációs modellek). A köznyelv és különböző informatikai cégek sok mindent neveznek adatbányászásának, de a szigorúbb szakmai terminológia szerint nem tekinthető adatbányászatnak az adatokból lekérdezésekkel, aggregálásokkal, illetve alap-statisztikai vizsgálatokkal történő információ nyerés.
- Il data mining ha per oggetto l'estrazione di un sapere o di una conoscenza a partire da grandi quantità di dati (attraverso metodi automatici o semi-automatici) e l'utilizzazione industriale o operativa di questo sapere.
- データマイニング(Data mining)とは、統計学、パターン認識、人工知能等のデータ解析の技法を大量のデータに網羅的に適用することで知識を取り出す技術。DMと略して呼ばれる事もある。通常のデータの扱い方からは想像が及びにくい、発見的(heuristic)な知識獲得が可能であるという期待を含意していることが多い。英語ではknowledge-discovery in databases(データベースからの知識発見)の頭文字をとってKDDとも呼ばれる。
- Datamining is het op een geautomatiseerde manier patronen en relaties ontdekken in grote hoeveelheden gegevens. De naam komt voort aan de overeenkomsten tussen het zoeken naar waardevolle bedrijfsinformatie en het graven (mining) naar iets waardevols in een grote berg. Datamining is gebaseerd op statistiek, machine learning, patroonherkenning, database management en geavanceerde computerberekeningen. Het wordt vaak toegepast op een datawarehouse. Het kan nieuwe informatie opleveren, die zonder de techniek niet gevonden zou zijn. Het geautomatiseerd verwerken van grote hoeveelheden persoonsgegevens kan echter stuiten op barrières met betrekking tot privacy, legaliteit en ethiek. Data mining maakt een onderdeel uit van een meer omvattend proces dat doorgaans wordt aangeduid als business intelligence. Data mining wordt vaak toegepast op grote hoeveelheden biologische, chemische en medische data. Deze techniek wordt dan met name toegepast op microarraydata of proteïnenmicroarraydata. Dit zijn onderzoeksgebieden binnen de de bio-informatica. Data miners kunnen gebruik maken van de volgende technieken: Case Based Redeneren : deze benadering gebruikt cases uit het verleden om er bepaalde patronen in te herkennen. Neuraal Computing: deze benadering onderzoekt historische data voor het herkennen van bepaalde patronen. Intelligente Agenten: hierbij wordt informatie van het internet gehaald en van databases die op intranet gebaseerd zijn. Samengaan Analyses: hierbij wordt gebruikt gemakt van gespecialiseerde algoritmen die grote hoeveelheden data uitzoeken en statistische regels voor bepaalde onderdelen uiten. Een bekend algoritme voor data mining is het a priori algoritme van Rakesh Agrawal et al. Een andere methode is ComPair. Verschillende Applicaties van DataMining: Bij de Detailhandel wordt het gebruikt voor het voorspellen van verkopen, bepalen van correcte voorraadniveaus en distributieschema's voor winkels. Bij Bankieren wordt het gebruikt voor het voorspellen van het niveau van slechte leningen en bedrieglijke creditcardhouders en welke klanten het beste reageren op nieuwe lening aanbiedingen. Bij Productie wordt het gebruikt voor het voorspellen van machinedefecten en het vinden van factoren die de optimalisatie van productiecapaciteit beheersen. Bij Verzekering wordt het gebruikt voor het voorspellen van de kosten van claims en het voorspellen welke klanten welke verzekeringspolis kopen. Bij Politie wordt het gebruikt voor het volgen van patronen, locaties en gedrag in de criminaliteit en het identificeren van attributen die kunnen assisteren bij het oplossen van criminaliteitszaken
- Data mining (norsk datagraving, dataminering, datautvinning) er et fag innen informatikk, der man studerer leting etter struktur og ofte mening, i ofte store mengder med ustrukturerte data. Sentrale teknikker som brukes er mønstergjenkjenning, statistisk modellering og maskinlæring. Søk i ustrukturerte data har vært et eget fag i informatikken lenge, men begrepet data mining kom spesielt etter at man kunne fylle såkalte datavarehus med data av alle slag. En kunne da mot en pengesum, få tilgang til de innsamlede data, for så å iverksette søking og graving etter noe som for klienten var av interesse.
- Eksploracja danych (spotyka się również określenie drążenie danych, pozyskiwanie wiedzy, wydobywanie danych, ekstrakcja danych) to jeden z etapów procesu odkrywania wiedzy z baz danych (ang. Knowledge Discovery in Databases, KDD). Istnieje wiele technik eksploracji danych, które wywodzą się z ugruntowanych dziedzin nauki takich jak statystyka (statystyczna analiza wielowymiarowa) i uczenie maszynowe. Idea eksploracji danych polega na wykorzystaniu szybkości komputera do znajdowania ukrytych dla człowieka (właśnie z uwagi na ograniczone możliwości czasowe) prawidłowości w danych zgromadzonych w hurtowniach danych.
- Prospecção de dados ou mineração de dados (também conhecida pelo termo inglês data mining) é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados. Esse é um tópico recente em ciência da computação mas utiliza várias técnicas da estatística, recuperação de informação, inteligência artificial e reconhecimento de padrões.
- Exploatarea datelor (adesea definită prin termenul englez Data mining) este un proces de sortare a unor cantităţi mari de date şi de extragere a informaţiilor relevante din acestea. Termenul este utilizat de obicei de organizaţiile ce se ocupă cu prelucrarea informaţiilor companiilor, şi de analiştii financiari, dar este folosit din ce în ce mai mult şi în domeniul ştiinţific cu referire la extragerea informaţiilor din volumuri mari de date generate de metode experimentale moderne. Data mining a fost descris ca "extragerea netrivială a informaţiilor implicite, anterior necunoscută şi potenţial utilă din date" şi ca "ştiinţa extragerii informaţiilor utile din volume de date mari sau din baze de date. " Data mining, în relaţie cu planificarea resurselor economice, este analiza statistică şi logică a unor mari volume de date despre tranzacţii, în căutarea unor şabloane care pot ajuta procesul de luare a deciziilor.
- Интеллектуальный анализ данных — выявление скрытых закономерностей или взаимосвязей между переменными в больших массивах необработанных данных. Подразделяется на задачи классификации, моделирования и прогнозирования и другие. Термин «Data Mining» введен Григорием Пятецким-Шапиро в 1989 году. Английский термин «Data Mining» не имеет однозначного перевода на русский язык (добыча данных, вскрытие данных, информационная проходка, извлечение данных/информации) поэтому в большинстве случаев используется в оригинале. Наиболее удачным непрямым переводом считается термин «интеллектуальный анализ данных» (ИАД). ИАД включает методы и модели статистического анализа и машинного обучения, дистанцируясь от них в сторону автоматического анализа данных. Инструменты ИАД позволяют проводить анализ данных предметными специалистами (аналитиками), не владеющими соответствующими математическими знаниями.
- Informationsutvinning, även kallat Data mining betecknar sökandet efter mönster i stora datamängder. Begreppet har vuxit fram sedan växande databasers storlek har begränsat möjligheterna till kompletta statistiska analyser inom områden som biologi och finansiella kalkyler. Genom exempelvis algoritmer eller manuell observation försöker man finna relationer mellan datapunkterna, för att bättre kunna visualisera eller utnyttja den komplexa informationen. Informationsutvinning kan använda sig av olika tekniker, bl.a. mönsterigenkänning och subjektbaserad igenkänning.
- Basit bir tanım yapmak gerekirse veri madenciliği, büyük ölçekli veriler arasından bilgiye ulaşma, bilgiyi madenleme işidir. Ya da bir anlamda büyük veri yığınları içerisinden gelecekle ilgili tahminde bulunabilmemizi sağlayabilecek bağıntıların bilgisayar programı kullanarak aranmasıdır. Veri madenciliği deyimi yanlış kullanılan bir deyim olabileceğinden buna eş değer başka kullanımlar da literatüre geçmiştir. Veritabanlarında bilgi madenciliği (İng. knowledge mining from databases), bilgi çıkarımı, veri ve örüntü analizi, veri arkeolojisi gibi. Bunların arasındaki en yaygın kullanım Veritabanlarında Bilgi Keşfi (İng. VBK - Knowledge Discovery From Databases - KDD)'dir. Alternatif olarak veri madenciliği aslında bilgi keşfi sürecinin bir parçası şeklinde kabul görmektedir. Bu adımlar: Veri temizleme (gürültülü ve tutarsız verileri çıkarmak) Veri bütünleştirme (birçok veri kaynağını birleştirebilmek) Veri seçme (yapılacak olan analizle ilgili olan verileri belirlemek) Veri dönüşümü (verinin veri madenciliği tekniğinden kullanılabilecek hale dönüşümünü gerçekleştirmek) Veri madenciliği (veri örüntülerini yakalayabilmek için akıllı metotları uygulamak) Örüntü değerlendirme (bâzı ölçümlere göre elde edilmiş bilgiyi temsil eden ilginç örüntüleri tanımlamak) Bilgi sunumu (mâdenciliği yapılmış olan elde edilmiş bilginin kullanıcıya sunumunu gerçekleştirmek). Veri madenciliği adımı, kullanıcı ve bilgi tabanıyla etkileşim halindedir. İlginç örüntüler kullanıcıya gösterilir, ve bunun ötesinde istenirse bilgi tabnına da kaydedilebilir. Buna göre, veri madenciliği işlemi, gizli kalmış örüntüler bulunana kadar devam eder. Bir veri madenciliği sistemi, aşağıdaki temel bileşenlere sahiptir: Veritabanı, veri ambarı ve diğer depolama teknikleri Veritabanı ya da Veri Ambarı Sunucusu Bilgi Tabanı Veri Madenciliği Motoru Örüntü Değerlendirme Kullanıcı Arayüzü Veri madenciliği, eldeki verilerden üstü kapalı, çok net olmayan, önceden bilinmeyen ancak potansiyel olarak kullanışlı bilginin çıkarılmasıdır. Bu da; kümeleme, veri özetleme, değişikliklerin analizi, sapmaların tespiti gibi belirli sayıda teknik yaklaşımları içerir. Başka bir deyişle, veri madenciliği, verilerin içerisindeki desenlerin, ilişkilerin, değişimlerin, düzensizliklerin, kuralların ve istatistiksel olarak önemli olan yapıların yarı otomatik olarak keşfedilmesidir. Temel olarak veri madenciliği, veri setleri arasındaki desenlerin ya da düzenin, verinin analizi ve yazılım tekniklerinin kullanılmasıyla ilgilidir. Veriler arasındaki ilişkiyi, kuralları ve özellikleri belirlemekten bilgisayar sorumludur. Amaç, daha önceden fark edilmemiş veri desenlerini tespit edebilmektir. Veri madenciliğini istatistiksel bir yöntemler serisi olarak görmek mümkün olabilir. Ancak veri madenciliği, geleneksel istatistikten birkaç yönde farklılık gösterir. Veri madenciliğinde amaç, kolaylıkla mantıksal kurallara ya da görsel sunumlara çevrilebilecek nitel modellerin çıkarılmasıdır. Bu bağlamda, veri madenciliği insan merkezlidir ve bazen insan – bilgisayar arayüzü birleştirilir. Veri madenciliği sahası, istatistik, makine bilgisi, veritabanları ve yüksek performanslı işlem gibi temelleri de içerir. Veri madenciliği konusunda bahsi geçen geniş verideki geniş kelimesi, tek bir iş istasyonunun belleğine sığamayacak kadar büyük veri kümelerini ifade etmektedir. Yüksek hacimli veri ise, tek bir iş istasyonundaki ya da bir grup iş istasyonundaki disklere sığamayacak kadar fazla veri anlamındadır. Dağıtık veri ise, farklı coğrafi konumlarda bulunan verileri anlatır.
- Добува́ння да́них — виявлення прихованих закономірностей або взаємозв'язків між змінними у великих масивах необроблених даних. Як правило поділяється на задачі класифікації, моделювання та прогнозування. На сучасних підприємствах, в дослідницьких проектах або в інтернеті утворюються великі обсяги даних. Добування даних дає можливість автоматичного аналізу цих даних шляхом застосування методів математичної статистики, штучних нейронних мереж, теорії нечітких множин або генетичних алгоритмів. Метою аналізу є виявлення правил та закономірностей, наприклад, статистичних подій. Так, наприклад, можуть виявлятись зміни у поведінці клієнтів або груп клієнтів для покращення політики підприємства.
- 数据挖掘(英語:Data mining),又譯為資料採礦、資料探勘。它是資料庫知識發現(英語:Knowledge-Discovery in Databases,簡稱:KDD)中的一個步驟。数据挖掘一般是指從大量的資料中自動搜索隱藏於其中的有着特殊關聯性(屬於Association rule learning)的信息的過程。資料挖掘通常與電腦科學有關,並通過統計、在线分析处理、情報檢索、機器學習、專家系統(依靠過去的經驗法則)和模式識別等諸多方法來實現上述目標。
|
| rdfs:comment
|
- Data mining is the process of extracting patterns from data. As more data are gathered, with the amount of data doubling every three years, data mining is becoming an increasingly important tool to transform these data into information. It is commonly used in a wide range of profiling practices, such as marketing, surveillance, fraud detection and scientific discovery.
- Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch-mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das Durchsuchen sehr großer Datenbestände, weswegen vor allem solche Methoden betrachtet werden, die eine hervorragende asymptotische Laufzeit haben.
- La mineria de dades (Data Mining) és un procés no trivial d'identificació vàlida, nova, potencialment útil i entendible de patrons comprensibles que es troben ocults en les dades (Fayyad i altres, 1996). Les bases de la mineria de dades es troben en la intel·ligència artificial i en l'anàlisi estadística. Mitjançant els models extrets utilitzant tècniques de mineria de dades s'aborda la solució a problemes de predicció, classificació i segmentació.
- Data mining (angl. dolování z dat či vytěžování dat) je analytická metodologie získávání netriviálních skrytých a potenciálně užitečných informací z dat. Někdy se chápe jako analytická součást dobývání znalostí z databází (Knowledge Discovery in Databases, KDD), tak například Berka (2003), jindy se tato dvě označení chápou jako souznačná.
- La minería de datos (DM, Data Mining) consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información era previamente desconocida y podrá resultar útil para algún proceso. En otras palabras, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos.
- Tiedonlouhinta tarkoittaa joukkoa menetelmiä, joilla pyritään oleellisen löytämiseen suurista tietomassoista.
- L’exploration de données, aussi connue sous les noms fouille de données, data mining (forage de données) ou encore Extraction de Connaissances à partir de Données (ECD en français, KDD en Anglais), a pour objet l’extraction d'un savoir ou d'une connaissance à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques, et l'utilisation industrielle ou opérationnelle de ce savoir.
- Az adatbányászat a nagymennyiségű adatokban rejlő információk fél-automatikus feltárása mesterséges intelligencia algoritmusok alkalmazásával (például neurális hálók, szabálygenerálók, asszociációs modellek).
- Il data mining ha per oggetto l'estrazione di un sapere o di una conoscenza a partire da grandi quantità di dati (attraverso metodi automatici o semi-automatici) e l'utilizzazione industriale o operativa di questo sapere.
- Datamining is het op een geautomatiseerde manier patronen en relaties ontdekken in grote hoeveelheden gegevens. De naam komt voort aan de overeenkomsten tussen het zoeken naar waardevolle bedrijfsinformatie en het graven (mining) naar iets waardevols in een grote berg. Datamining is gebaseerd op statistiek, machine learning, patroonherkenning, database management en geavanceerde computerberekeningen. Het wordt vaak toegepast op een datawarehouse.
- Data mining (norsk datagraving, dataminering, datautvinning) er et fag innen informatikk, der man studerer leting etter struktur og ofte mening, i ofte store mengder med ustrukturerte data. Sentrale teknikker som brukes er mønstergjenkjenning, statistisk modellering og maskinlæring. Søk i ustrukturerte data har vært et eget fag i informatikken lenge, men begrepet data mining kom spesielt etter at man kunne fylle såkalte datavarehus med data av alle slag.
- Eksploracja danych (spotyka się również określenie drążenie danych, pozyskiwanie wiedzy, wydobywanie danych, ekstrakcja danych) to jeden z etapów procesu odkrywania wiedzy z baz danych (ang. Knowledge Discovery in Databases, KDD). Istnieje wiele technik eksploracji danych, które wywodzą się z ugruntowanych dziedzin nauki takich jak statystyka (statystyczna analiza wielowymiarowa) i uczenie maszynowe.
- Prospecção de dados ou mineração de dados (também conhecida pelo termo inglês data mining) é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados.
- Exploatarea datelor (adesea definită prin termenul englez Data mining) este un proces de sortare a unor cantităţi mari de date şi de extragere a informaţiilor relevante din acestea.
- Интеллектуальный анализ данных — выявление скрытых закономерностей или взаимосвязей между переменными в больших массивах необработанных данных. Подразделяется на задачи классификации, моделирования и прогнозирования и другие.
- Informationsutvinning, även kallat Data mining betecknar sökandet efter mönster i stora datamängder. Begreppet har vuxit fram sedan växande databasers storlek har begränsat möjligheterna till kompletta statistiska analyser inom områden som biologi och finansiella kalkyler. Genom exempelvis algoritmer eller manuell observation försöker man finna relationer mellan datapunkterna, för att bättre kunna visualisera eller utnyttja den komplexa informationen.
- Basit bir tanım yapmak gerekirse veri madenciliği, büyük ölçekli veriler arasından bilgiye ulaşma, bilgiyi madenleme işidir. Ya da bir anlamda büyük veri yığınları içerisinden gelecekle ilgili tahminde bulunabilmemizi sağlayabilecek bağıntıların bilgisayar programı kullanarak aranmasıdır. Veri madenciliği deyimi yanlış kullanılan bir deyim olabileceğinden buna eş değer başka kullanımlar da literatüre geçmiştir. Veritabanlarında bilgi madenciliği (İng.
- Добува́ння да́них — виявлення прихованих закономірностей або взаємозв'язків між змінними у великих масивах необроблених даних. Як правило поділяється на задачі класифікації, моделювання та прогнозування.
|