Clustering is the classification of objects into different groups, or more precisely, the partitioning of a data set into subsets (clusters), so that the data in each subset share some common trait - often proximity according to some defined distance measure. Data clustering is a common technique for statistical data analysis, which is used in many fields, including machine learning, data mining, pattern recognition, image analysis and bioinformatics. The computational task of classifying the data set into k clusters is often referred to as k-clustering.

PropertyValue
p:abstract
  • Clustering is the classification of objects into different groups, or more precisely, the partitioning of a data set into subsets (clusters), so that the data in each subset share some common trait - often proximity according to some defined distance measure. Data clustering is a common technique for statistical data analysis, which is used in many fields, including machine learning, data mining, pattern recognition, image analysis and bioinformatics. The computational task of classifying the data set into k clusters is often referred to as k-clustering. Besides the term data clustering (or just clustering), there are a number of terms with similar meanings, including cluster analysis, automatic classification, numerical taxonomy, botryology and typological analysis. (en)
  • Кластерный анализ (англ. Data clustering) — задача разбиения заданной выборки объектов на непересекающиеся подмножества, называемые кластерами, так, чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров существенно отличались. Задача кластеризации относится к статистической обработке, а также к широкому классу задач обучения без учителя. (ru)
  • Un algoritmo de agrupamiento (en inglés, clustering) es un procedimiento de agrupación de una serie de vectores según criterios habitualmente de distancia; se tratará de disponer los vectores de entrada de forma que estén más cercanos aquellos que tengan características comunes. Un algoritmo de clustering permite extraer representantes de un conjunto de datos, que pueden ser posteriormente usados para transmisión, para eliminación de ruido o con una fase posterior de calibración, para clasificación de vectores en diferentes conjuntos. Algunos algoritmos de clustering conocidos y usados son el k medias, el ISODATA y el Mapa autoorganizado de Kohonen. Los algoritmos de clustering se usan en minería de datos, en las fases iniciales de visualización. (es)
  • Il Clustering o analisi dei cluster o analisi di raggruppamento è un insieme di tecniche di analisi multivariata dei dati volte alla selezione e raggruppamento di elementi omogenei in un insieme di dati. Tutte le tecniche di clustering si basano sul concetto di distanza tra due elementi. Infatti la bontà delle analisi ottenute dagli algoritmi di clustering dipende essenzialmente da quanto è significativa la metrica e quindi da come è stata definita la distanza. La distanza è un concetto fondamentale dato che gli algoritmi di clustering raggruppano gli elementi a seconda della distanza e quindi l'appartenenza o meno ad un insieme dipende da quanto l'elemento preso in esame è distante dall'insieme. Le tecniche di clustering si possono basare principalmente su due filosofie. Dal basso verso l'alto Questa filosofia prevede che inizialmente tutti gli elementi siano considerati cluster a sé e poi l'algoritmo provvede ad unire i cluster più vicini. L'algoritmo continua ad unire elementi al cluster fino ad ottenere un numero prefissato di cluster oppure fino a che la distanza minima tra i cluster non supera un certo valore. Dall'alto verso il basso All'inizio tutti gli elementi sono un unico cluster e poi l'algoritmo inizia a dividere il cluster in tanti cluster di dimensioni inferiori. Il criterio che guida la divisione è sempre quello di cercare di ottenere elementi omogenei. L'algoritmo procede fino a che non ha raggiunto un numero prefissato di cluster. Questo approccio è anche detto gerarchico. La tecniche di clustering vengono utlizzate generalmente quando si hanno tanti dati eterogenei e si è alla ricerca di elementi anomali. Per esempio le compagnie telefoniche utilizzano le tecniche di clustering per cercare di individuare in anticipo gli utenti che diventeranno morosi. Normalmente questi utenti hanno un comportamento nettamente diverso rispetto alla maggioranza degli utenti telefonici e le tecniche di clustering riescono sovente ad individuarli o comunque definiscono un cluster dove vengono concentrati tutti gli utenti che hanno un'elevata probabilità di diventare utenti morosi. (it)
  • Clustering é um técnica de Data Mining para fazer agrupamentos automáticos de dados segundo seu grau de semelhança. O critério de semelhança faz parte da definição do problema e, dependendo, do algoritmo. O procedimento de Clustering também pode ser aplicado à bases de texto utilizando algoritmos de Text Mining, onde o algoritmo procura agrupar textos que falem sobre o mesmo assunto e separar textos de conteúdo diferentes. Normalmente o usuário do sistema deve escolher a priori o número de grupos a serem detectados. Alguns algorítmos mais sofisticados pedem apenas o número mínimo, outros tem a capacidade de subdividir um grupo em dois. Os tipos de algoritmos de agrupamento de dados mais comuns são os: Particionais e os Hierárquicos. (pt)
  • 数据聚类 是对于静态数据分析的一门技术,在许多领域受到广泛应用,包括机器学习,数据挖掘,模式识别,图像分析以及生物信息。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集(subset),这样让在同一个子集中的成员对象都有忧相似的一些属性,常见的包括在坐标系中更加短的空间距离等。 一般把数据聚类归纳为一种无监督的学习(unsupervised learning}也可稱做非校稿式學習。 (zh)
  • Unter Clusteranalyse (der Begriff Ballungsanalyse wird selten verwendet) versteht man ein strukturentdeckendes, multivariates Analyseverfahren zur Ermittlung von Gruppen von Objekten, deren Eigenschaften oder Eigenschaftsausprägungen bestimmte Ähnlichkeiten (bzw. Unähnlichkeiten) aufweisen. Die an verschiedene Anforderungen angepassten Verfahren der Clusteranalyse lassen sich zur automatischen Klassifizierung, zur Erkennung von Mustern zum Beispiel in der Bildverarbeitung, zum Data-Mining oder im Information Retrieval einsetzen. Im Bereich Marketing wird dieses Analysewerkzeug gerne als Kundensegmentierungsverfahren verwendet, nicht zuletzt, weil es visuell präsentiert werden kann. (de)
p:hasPhotoCollection
rdf:type
rdfs:comment
  • Clustering is the classification of objects into different groups, or more precisely, the partitioning of a data set into subsets (clusters), so that the data in each subset share some common trait - often proximity according to some defined distance measure. Data clustering is a common technique for statistical data analysis, which is used in many fields, including machine learning, data mining, pattern recognition, image analysis and bioinformatics. The computational task of classifying the data set into k clusters is often referred to as k-clustering. (en)
  • Кластерный анализ (англ. Data clustering)� — задача разбиения заданной выборки объектов (ситуаций) на� непересекающиеся подмножества, называемые кластерами, так, чтобы каждый кластер состоял из� схожих объектов, а� объекты разных кластеров существенно отличались. (ru)
  • Un algoritmo de agrupamiento (en inglés, clustering) es un procedimiento de agrupación de una serie de vectores según criterios habitualmente de distancia; se tratará de disponer los vectores de entrada de forma que estén más cercanos aquellos que tengan características comunes. (es)
  • Il Clustering o analisi dei cluster o analisi di raggruppamento è un insieme di tecniche di analisi multivariata dei dati volte alla selezione e raggruppamento di elementi omogenei in un insieme di dati. Tutte le tecniche di clustering si basano sul concetto di distanza tra due elementi. (it)
  • Clustering é um técnica de Data Mining para fazer agrupamentos automáticos de dados segundo seu grau de semelhança. O critério de semelhança faz parte da definição do problema e, dependendo, do algoritmo. (pt)
  • 数据聚类 是对于静态数据分析的一门技术,在许多领域受到广泛应用,包括机器学� ,数据挖掘,模式识别,图像分析以及生物信息。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集(subset),这� �让在同一个子集中的成员对象都有忧相似的一些属性,常见的包括在坐� �系中更� 短的空间距离等。 一般把数据聚类归纳为一种� 监督的学� (unsupervised learning}也可稱做非� �稿式學習。 (zh)
  • Unter Clusteranalyse (der Begriff Ballungsanalyse wird selten verwendet) versteht man ein strukturentdeckendes, multivariates Analyseverfahren zur Ermittlung von Gruppen von Objekten, deren Eigenschaften oder Eigenschaftsausprägungen bestimmte Ähnlichkeiten (bzw. Unähnlichkeiten) aufweisen. (de)
rdfs:label
  • Cluster analysis (en)
  • Partitionnement de données (fr)
  • データ・クラスタリング (ja)
  • Analiza skupień (pl)
  • Кластерный анализ (ru)
  • Algoritmo de agrupamiento (es)
  • Clustering (it)
  • Clustering (pt)
  • 数据聚类 (zh)
  • Clusteranalyse (de)
owl:sameAs
skos:subject
foaf:page
is p:disambiguates of
is p:redirect of
is owl:sameAs of