About: Cluster analysis

Property	Value
dbo:abstract	La clusterització de dades és una tècnica molt comuna en l'anàlisi estadística de dades. Bàsicament és la classificació d'objectes similars en diferents grups, o més precisament, la partició de les dades en diferents subconjunts (o clústers). Així doncs, les dades de cada subgrup idealment comparteixen un tret comú. A grans trets, podem dividir els algorismes en jeràrquics o particionals. En els primers, es generen clústers successius a partir de clústers ja establerts prèviament. Aquests poden ser aglomeratius si cada element es considera un clúster diferent i posteriorment van agrupant-se. O bé divisoris, si a partir del conjunt sencer es procedeix a dividir-lo en subconjunts més petits.En el segon cas, tots els clústers es determinen en una passada, sovint optimitzant-ho segons un criteri determinat. Al final del procés, es pot tornar a ubicar algunes de les entitats en altres clústers. Per altra banda, cal destacar les tècniques de cerca per densitat i de 'clumping'.En les primeres, les entitats es consideren com a punts en un espai mètric i normalment es prima la incorporació de nous elements en clústers ja existents abans que crear-ne'n de nous.Les segones es caracteritzen per permetre l'existència de clústers que no siguin , això és, que els elements puguin incloure's en diferents subgrups simultàniament. (ca) Shluková analýza (též clusterová analýza, anglicky cluster analysis) je statistická metoda, která se používá ke klasifikaci objektů.Slouží k třídění jednotek do skupin (shluků) tak, aby si jednotky náležící do stejné skupiny byly podobnější než objekty z ostatních skupin. Shlukovou analýzu je možné provádět jak na množině objektů, z nichž každý musí být popsán prostřednictvím stejného souboru znaků, které má smysl v dané množině sledovat, tak na množině znaků, které jsou charakterizovány prostřednictvím určitého souboru objektů, nositelů těchto znaků. (cs) التحليل العنقودي (بالإنجليزية: Cluster analysis)‏ هو عبارة عن نوع من الأساليب الإحصائية التي يمكن تطبيقها على البيانات. يتولى التحليل العنقودي إفراز البيانات الأولية وتجميعها في مجموعات عنقودية (clusters). العنقود عبارة عن مجموعة من الحالات أو الملاحظات المتجانسة نسبيًا. تتميز العناصر المكونة للعنقود الواحد بأنها متشابهة مع بعضها، بينما تكون عناصر العناقيد المختلفة أقل تجانساً. التحليل العنقودي، مثل تحليل العوامل والقياس متعدد الأبعاد، هو أسلوب تكافلي: حيث إنه لا يفرق بين المتغيرات التابعة والمستقلة. يتم فحص مجموعة العلاقات المترابطة تبادليًا. ويتشابه التحليل العنقودي مع القياس متعدد الأبعاد في أن كلاً منهما يبحث في التشابه بين العناصر وبعضها عن طريق فحص المجموعة الكاملة من العلاقات المترابطة. ويتمثل الاختلاف في أن القياس متعدد الأبعاد يحدد الأبعاد الأساسية، بينما التحليل العنقودي يحدد المجموعات. التحليل العنقودي هو الوجه المقابل لتحليل العوامل. في حين أن تحليل العوامل يقلل عدد المتغيرات عن طريق تجميعهم في مجموعة عوامل أصغر، يقلل التحليل العنقودي عدد الملاحظات أو الحالات عن طريق تجميعها في مجموعة مجموعات عنقودية أصغر. (ar) Συσταδοποίηση είναι η διαδικασία εκείνη κατά την οποία ένα σύνολο από «αντικείμενα», διαχωρίζονται σε ένα σύνολο από λογικές ομάδες. Η καταχώρηση αντικειμένων σε ίδια ομάδα μεταφράζεται ως ομοιότητα των αντικειμένων αυτών και αντίστροφα (αντικείμενα που ανήκουν σε διαφορετικές ομάδες είναι ανόμοια). Η ομοιότητα ή μη, μεταξύ των αντικείμενων, ουσιαστικά εξαρτάται από το συγκεκριμένο πρόβλημα και τη μορφή των «αντικειμένων». Στη βιβλιογραφία συναντάται ως ομαδοποίηση και μη επιβλεπόμενη μάθηση. Τα αντικείμενα μπορούν να αναφερθούν και αυτά με διαφορετικούς όρους: πρότυπα, διανύσματα (παρακάτω θα αναφέρονται ως διανύσματα). (el) Cluster analysis or clustering is the task of grouping a set of objects in such a way that objects in the same group (called a cluster) are more similar (in some sense) to each other than to those in other groups (clusters). It is a main task of exploratory data analysis, and a common technique for statistical data analysis, used in many fields, including pattern recognition, image analysis, information retrieval, bioinformatics, data compression, computer graphics and machine learning. Cluster analysis itself is not one specific algorithm, but the general task to be solved. It can be achieved by various algorithms that differ significantly in their understanding of what constitutes a cluster and how to efficiently find them. Popular notions of clusters include groups with small distances between cluster members, dense areas of the data space, intervals or particular statistical distributions. Clustering can therefore be formulated as a multi-objective optimization problem. The appropriate clustering algorithm and parameter settings (including parameters such as the distance function to use, a density threshold or the number of expected clusters) depend on the individual data set and intended use of the results. Cluster analysis as such is not an automatic task, but an iterative process of knowledge discovery or interactive multi-objective optimization that involves trial and failure. It is often necessary to modify data preprocessing and model parameters until the result achieves the desired properties. Besides the term clustering, there is a number of terms with similar meanings, including automatic classification, numerical taxonomy, botryology (from Greek βότρυς "grape"), typological analysis, and community detection. The subtle differences are often in the use of the results: while in data mining, the resulting groups are the matter of interest, in automatic classification the resulting discriminative power is of interest. Cluster analysis was originated in anthropology by Driver and Kroeber in 1932 and introduced to psychology by Joseph Zubin in 1938 and Robert Tryon in 1939 and famously used by Cattell beginning in 1943 for trait theory classification in personality psychology. (en) Unter Clusteranalyse (Clustering-Algorithmus, gelegentlich auch: Ballungsanalyse) versteht man Verfahren zur Entdeckung von Ähnlichkeitsstrukturen in (meist relativ großen) Datenbeständen. Die so gefundenen Gruppen von „ähnlichen“ Objekten werden als Cluster bezeichnet, die Gruppenzuordnung als Clustering. Die gefundenen Ähnlichkeitsgruppen können graphentheoretisch, hierarchisch, partitionierend oder optimierend sein. Die Clusteranalyse ist eine wichtige Disziplin des Data-Minings, des Analyseschritts des Knowledge-Discovery-in-Databases Prozesses. Das Ziel der Clusteranalyse ist, neue Gruppen in den Daten zu identifizieren (im Gegensatz zur Klassifikation, bei der Daten bestehenden Klassen zugeordnet werden). Man spricht von einem „uninformierten Verfahren“, da es nicht auf Klassen-Vorwissen angewiesen ist. Diese neuen Gruppen können anschließend beispielsweise zur automatisierten Klassifizierung, zur Erkennung von Mustern in der Bildverarbeitung oder zur Marktsegmentierung eingesetzt werden (oder in beliebigen anderen Verfahren, die auf ein derartiges Vorwissen angewiesen sind). Die zahlreichen Algorithmen unterscheiden sich vor allem in ihrem Ähnlichkeits- und Gruppenbegriff, ihrem Cluster-Modell, ihrem algorithmischen Vorgehen (und damit ihrer Komplexität) und der Toleranz gegenüber Störungen in den Daten. Ob das von einem solchen Algorithmus generierte „Wissen“ nützlich ist, kann jedoch in der Regel nur ein Experte beurteilen. Ein Clustering-Algorithmus kann unter Umständen vorhandenes Wissen reproduzieren (beispielsweise Personendaten in die bekannten Gruppen „männlich“ und „weiblich“ unterteilen) oder auch für den Anwendungszweck nicht hilfreiche Gruppen generieren. Die gefundenen Gruppen lassen sich oft auch nicht verbal beschreiben (z. B. „männliche Personen“), gemeinsame Eigenschaften werden in der Regel erst durch eine nachträgliche Analyse identifiziert. In der Anwendung von Clusteranalyse ist es daher oft notwendig, verschiedene Verfahren und verschiedene Parameter abzufragen, die Daten vorzuverarbeiten und beispielsweise Attribute auszuwählen oder wegzulassen. (de) Estatistikan, multzokatzea elementu edo objektu ezberdinen sailkapen teknika bat da non elementuak multzo ezberdinetara biltzen diren, multzo bateko elementuen arteko antzekotasuna beste multzoetako elementuekiko antzekotasuna baino handiagoa izanik. Gehienetan bi elementuen arteko antzekotasuna distantzia (estatistika) baten bitartez neurtzen da, elementuen ezaugarri edo datuetan oinarrituz. Gehinetan multzokatzearen azken xedea dendrograma delako diagrama eratzea da, non prozesu osoan zehar osatutako multzo ezberdinak, berauek osatzen dituzten elementuak azaltzen diren, beraien arteko distantziekin batera. (eu) Análisis de grupos o agrupamiento es la tarea de agrupar objetos por similitud, en grupos o conjuntos de manera que los miembros del mismo grupo tengan características similares. Es la tarea principal de la minería de datos exploratoria y es una técnica común en el análisis de datos estadísticos. Además es utilizada en múltiples campos comoː * aprendizaje automático * reconocimiento de patrones * análisis de imágenes * búsqueda y recuperación de información * bioinformática * compresión de datos * computación gráfica. El análisis de grupos es un problema, es un planteamiento general, y existen miles de algoritmos que lo resuelven, cada uno con sus propias características. Muchos algoritmos difieren significativamente en su idea de qué constituye un grupo y cómo encontrarlos eficientemente. El agrupamiento, por tanto, puede ser formulado como un problema multi-objetivo de optimización. El algoritmo apropiado y sus parámetros dependen del conjunto de datos que se analiza y el uso que se le dará a los resultados. El agrupamiento como tal no es una tarea con solución directa, sino un proceso iterativo o interactivo que implica ensayo y error. Este proceso de prueba y error es iterativo en la medida que sea automático, e interactivo en la medida que requiera intervención humana. Es una práctica usual ejecutar un algoritmo de agrupamiento (un proceso iterativo), y a partir de los resultados ajustar los parámetros y repetir la operación (resultando en un proceso interactivo). Las aplicaciones del agrupamiento se dividen en dos tipos principalesː * aquellas en la que los grupos constituyen el resultado buscado * es el caso de análisis de grupos, minería de datos, análisis de imágenes * otras en las que los grupos constituyen el punto de partida para la clasificaciones de nuevas muestras de datos, desconocidas al momento de procesar el agrupamiento * es el caso de clasificación automática en el mundo del aprendizaje de máquina (es) Le partitionnement de données (ou data clustering en anglais) est une méthode en analyse des données. Elle vise à diviser un ensemble de données en différents « paquets » homogènes, en ce sens que les données de chaque sous-ensemble partagent des caractéristiques communes, qui correspondent le plus souvent à des critères de proximité (similarité informatique) que l'on définit en introduisant des mesures et classes de distance entre objets. Pour obtenir un bon partitionnement, il convient d'à la fois : * minimiser l'inertie intra-classe pour obtenir des grappes (cluster en anglais) les plus homogènes possibles ; * maximiser l'inertie inter-classe afin d'obtenir des sous-ensembles bien différenciés. (fr) Analisis kelompok adalah suatu teknik yang dapat digunakan untuk mengenali kelompok-kelompok yang dihasilkan dari pengelompokkan unsur-unsur yang lebih kecil berdasarkan adanya kemiripan satu sama lain. Kemiripan yang menjadi dasar pengelompokkan tidaklah bersifat universal, sehingga ukuran-ukuran penyamanya harus dijabarkan terlebih dahulu oleh peneliti atau penganalisis. (in) クラスタリング（英: clustering）、クラスタ解析（クラスタかいせき）、クラスター分析（クラスターぶんせき）は、データ解析手法（特に多変量解析手法）の一種。教師なしデータ分類手法、つまり与えられたデータを外的基準なしに自動的に分類する手法。また、そのアルゴリズム。さまざまな手法が提案されているが、大きく分けるとデータの分類が階層的になされる階層型手法と、特定のクラスタ数に分類する非階層的手法とがある。それぞれの代表的な手法としてウォード法、K平均法などがある。 (ja) Clusteranalyse is het classificeren of het groeperen in of klassen van objecten op grond van hun kenmerken. Het doel van clusteranalyse is het vormen van deelverzamelingen die elk hun eigen gedeelde kenmerken bevatten. Om het resultaat te visualiseren kan een dendrogram worden gebruikt. (nl) 클러스터 분석(Cluster analysis)이란 주어진 데이터들의 특성을 고려해 데이터 집단(클러스터)을 정의하고 데이터 집단의 대표할 수 있는 대표점을 찾는 것으로 데이터 마이닝의 한 방법이다. 클러스터란 비슷한 특성을 가진 데이터들의 집단이다. 반대로 데이터의 특성이 다르면 다른 클러스터에 속해야 한다. (ko) In statistica, il clustering o analisi dei gruppi (dal termine inglese cluster analysis, introdotto da Robert Tryon nel 1939) è un insieme di tecniche di analisi multivariata dei dati volte alla selezione e raggruppamento di elementi omogenei in un insieme di dati. Le tecniche di clustering si basano su misure relative alla somiglianza tra gli elementi. In molti approcci questa similarità, o meglio, dissimilarità, è concepita in termini di distanza in uno spazio multidimensionale. La bontà delle analisi ottenute dagli algoritmi di clustering dipende molto dalla scelta della metrica, e quindi da come è calcolata la distanza. Gli algoritmi di clustering raggruppano gli elementi sulla base della loro distanza reciproca, e quindi l'appartenenza o meno a un insieme dipende da quanto l'elemento preso in esame è distante dall'insieme stesso. (it) O clustering ou análise de agrupamento de dados é o conjunto de técnicas de prospecção de dados (data mining) que visa fazer agrupamentos automáticos de dados segundo o seu grau de semelhança. O critério de semelhança faz parte da definição do problema e, dependendo, do algoritmo. A cada conjunto de dados resultante do processo dá-se o nome de grupo, aglomerado ou agrupamento (cluster). O procedimento de agrupamento (clustering) também pode ser aplicado a bases de texto utilizando algoritmos de prospeção de texto (text mining), onde o algoritmo procura agrupar textos que falem sobre o mesmo assunto e separar textos de conteúdo diferentes. Normalmente o usuário do sistema deve escolher a priori o número de grupos a serem detectados. Alguns algoritmos mais sofisticados pedem apenas o número mínimo, outros tem a capacidade de subdividir um grupo em dois. Os tipos de algoritmos de agrupamento de dados mais comuns são: os particionais e os hierárquicos. (pt) Grupowanie (analiza skupień, klasteryzacja) (ang. data clustering) – metoda tzw. klasyfikacji bez nadzoru (ang. unsupervised learning). Jest to metoda dokonująca grupowania elementów we względnie jednorodne klasy. Podstawą grupowania w większości algorytmów jest podobieństwo pomiędzy elementami – wyrażone przy pomocy funkcji (metryki) podobieństwa. Poprzez grupowanie można również rozwiązać problemy z gatunku odkrywania struktury w danych oraz dokonywanie uogólniania. Grupowanie polega na wyodrębnianiu grup (klas, podzbiorów). Wybrane cele dokonywania grupowania są następujące: * uzyskanie jednorodnych przedmiotów badania, ułatwiających wyodrębnienie ich zasadniczych cech, * zredukowanie dużej liczby danych pierwotnych do kilku podstawowych kategorii, które mogą być traktowane jako przedmioty dalszej analizy, * zmniejszenie nakładu pracy i czasu analiz, których przedmiotem będzie uzyskanie klasyfikacji obiektów typowych, * odkrycie nieznanej struktury analizowanych danych, * porównywanie obiektów wielocechowych. Pionierem analizy skupień był psycholog Robert Tryon. (pl) Inom datavetenskap och statistik innebär klusteranalys gruppering av datamängder i delmängder som kallas . Klusteranalys refererar inte till en enskild algoritm, utan är ett samlingsnamn för analysmetoden. Klustring är en typ av maskininlärning, vilket är vanligt inom statistik, informationsutvinning, mönsterigenkänning, bildanalys, informationssökning och bioinformatik. Tekniken skiljer sig från klassificering genom att klasserna inte är kända på förhand. Klusteranalys genomförs genom att man definierar en avståndsfunktion, utifrån de features som beskriver ett element. Därefter beräknas avstånden, vilket möjliggör visualisering i exempelvis 2D eller 3D. På så vis uppvisar elementen i ett kluster likheter baserat på features. Genom att kombinera modern beräkningskapacitet och det mänskliga ögats förmåga att upptäcka avvikande element innebär klusteranalys ett kraftfullt analysverktyg. (sv) 聚类分析（英語：Cluster analysis）亦称为集群分析，是对于统计数据分析的一门技术，在许多领域受到广泛应用，包括机器学习，数据挖掘，模式识别，图像分析以及生物信息。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集（subset），这样让在同一个子集中的成员对象都有相似的一些属性，常见的包括在坐标系中更加短的空间距离等。一般把数据聚类归纳为一种非監督式學習。 (zh) Кластерний аналіз (англ. Data clustering) — задача розбиття заданої вибірки об'єктів (ситуацій) на підмножини, які називаються кластерами, так, щоб кожен кластер складався з схожих об'єктів, а об'єкти різних кластерів істотно відрізнялися. Завдання кластеризації відноситься до статистичної обробки, а також до широкого класу завдань навчання без вчителя. Кластерний аналіз — це не якийсь один алгоритм, а загальна задача, для розв'язання якої використовуються різні підходи. Зокрема, алгоритми побудови кластерів можуть суттєво відрізнятись у розумінні того, що відносити в один кластер і як їх ефективно шукати. Серед популярних концепцій кластерів є групи з елементами, які утворюються ґрунтуючись на відстані між ними, на щільності ділянок у просторі даних, інтервалах або на конкретних статистичних розподілах. Тому кластеризація може бути сформульована як задача багатокритеріальної оптимізації. Відповідний алгоритм кластеризації та вибору параметрів (включаючи такі параметри, як функція відстані, порогове значення щільності або кількість очікуваних кластерів) залежать від конкретного набору даних та мети використання результатів. Кластерний аналіз як такий є не автоматизованим завданням, а ітераційним процесом виявлення знань або інтерактивної багатокритеріальної оптимізації, який містить спроби та невдачі. Часто доводиться змінювати процес опрацювання даних та параметри моделі поки не буде отримано з результат з заданими властивостями. Окрім терміну кластеризація існує багато термінів з аналогічним значенням, серед яких автоматична класифікація, та типологічний аналіз. Тонкі розбіжності часто полягають у використанні результатів: для добування даних, отримані групи є предметом інтересу, при автоматичній класифікації, навпаки, більш важливий степінь розбіжності. Кластерний аналіз походить з антропології, де він був започаткований Драйвером (англ. Driver) і Крьобером (англ. Kroeber) у 1932 році. В психологію він був введений Зубіним у 1938 році і у 1939. Став відомий завдяки використанню Кеттелем для класифікації теорії ознак в психології особистості, починаючи з 1943 року. (uk) Кластерный анализ (англ. cluster analysis) — многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы. Задача кластеризации относится к статистической обработке, а также к широкому классу задач обучения без учителя. Большинство исследователей (см., напр.,) склоняются к тому, что впервые термин «кластерный анализ» (англ. cluster — гроздь, сгусток, пучок) был предложен психологом Р. Трионом. Впоследствии возник ряд терминов, которые в настоящее время принято считать синонимами термина «кластерный анализ»: автоматическая классификация, ботриология. Спектр применений кластерного анализа очень широк: его используют в археологии, медицине, психологии, химии, биологии, государственном управлении, филологии, антропологии, маркетинге, социологии, геологии и других дисциплинах. Однако универсальность применения привела к появлению большого количества несовместимых терминов, методов и подходов, затрудняющих однозначное использование и непротиворечивую интерпретацию кластерного анализа. (ru)
dbo:thumbnail	wiki-commons:Special:FilePath/Cluster-2.svg?width=300
dbo:wikiPageID	669675 (xsd:integer)
dbo:wikiPageLength	67539 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID	1116924542 (xsd:integer)
dbo:wikiPageWikiLink	dbr:Belief_propagation dbr:Probability_distribution dbr:List_of_algorithms dbr:List_of_gene_families dbr:Multimodal_distribution dbr:Natural_language_processing dbr:Nearest_neighbor_search dbr:Neighbourhood_components_analysis dbr:Neural_network dbr:Algorithm dbr:Anomaly_detection dbc:Cluster_analysis dbr:Curse_of_dimensionality dbr:Cycle_(graph_theory) dbr:DNA_microarray dbr:Davies–Bouldin_index dbr:Determining_the_number_of_clusters_in_a_data_set dbr:Deterministic_algorithm dbr:DevOps dbr:Dunn_index dbr:Information_retrieval dbr:Topological_index dbr:Numerical_taxonomy dbr:Signed_graph dbr:Communities dbr:Conceptual_clustering dbr:Correlation dbr:Correlation_and_dependence dbc:Geostatistics dbr:Matthews_correlation_coefficient dbr:Median dbr:Medical_imaging dbr:Gene_duplication dbr:Genotype dbr:Social_network dbr:R-tree dbr:Enzyme dbr:Genes dbr:Genomics dbr:Google dbr:Graph_(discrete_mathematics) dbr:Multivariate_normal_distribution dbr:Mutual_information dbr:NP-hard dbr:Confusion_matrix dbr:Consensus_clustering dbr:Constrained_clustering dbr:Consumer dbr:Correlation_clustering dbr:Crime_analysis dbr:WPGMA dbr:Recommender_systems dbr:Animal dbr:Machine_learning dbr:Sign_(mathematics) dbr:Silhouette_(clustering) dbr:Statistics dbr:Climatology dbr:Clique_(graph_theory) dbr:Cluster-weighted_modeling dbr:Clustering_high-dimensional_data dbr:Community_structure dbr:Computer_graphics dbr:Computer_science dbr:Dendrogram dbr:Hopkins_statistic dbr:Joseph_Zubin dbr:Kernel_density_estimation dbr:Metabolic_pathway dbr:Path_(graph_theory) dbr:Pattern_recognition dbr:Personality_psychology dbr:Population dbr:Statistical_survey dbr:Structured_data_analysis_(statistics) dbr:Systematics dbr:Mathematical_chemistry dbr:Adjusted_mutual_information dbr:Centroid dbr:Data_analysis dbr:Data_compression dbr:Data_set dbr:Fuzzy_clustering dbr:HCS_clustering_algorithm dbr:K-means++ dbr:K-means_clustering dbr:K-medians_clustering dbr:K-medoids dbr:Latent_class_model dbr:Lloyd's_algorithm dbr:Local_optimum dbr:Adjusted_Rand_index dbr:Customers dbr:DBSCAN dbr:Data_stream_clustering dbr:Ecology dbr:False_negative dbr:False_positive dbr:Flickr dbr:Balance_theory dbr:Balanced_clustering dbr:Birch_(data_clustering) dbr:Educational_data_mining dbr:Gold_standard_(test) dbr:Principal_component_analysis dbr:New_product_development dbr:Gaussian_distribution dbr:Dimension_reduction dbr:Object_recognition dbr:Positioning_(marketing) dbr:Rand_index dbr:Recall_(information_retrieval) dbr:OPTICS_algorithm dbr:Artificial_neural_network dbc:Data_mining dbr:Affinity_propagation dbr:Biclustering dbr:Big_data dbr:Bioinformatics dbr:Cohen's_kappa dbr:Hierarchical_clustering dbr:Tissue_(biology) dbr:SUBCLU dbr:Single-linkage_clustering dbr:Digital_data dbr:Automatic_clustering_algorithms dbr:Market_segmentation dbr:Phylogeny dbr:Plant dbr:Human_genetic_clustering dbr:Evolutionary_algorithms dbr:Expectation-maximization_algorithm dbr:Data_preprocessing dbr:Image_segmentation dbr:Information_theory dbr:Canopy_clustering_algorithm dbr:Raymond_Cattell dbr:Markedness dbr:Market_research dbr:Markov_chain_Monte_Carlo dbr:Medicine dbr:Multidimensional_scaling dbr:Self-organizing_map dbr:Sequence_analysis dbr:Voronoi_diagram dbr:World_Wide_Web dbr:Independent_Component_Analysis dbr:Statistical_classification dbr:Expectation–maximization_algorithm dbr:Exploratory_data_analysis dbr:Expressed_sequence_tag dbr:Facility_location_problem dbr:Image dbr:Image_analysis dbr:Fowlkes–Mallows_Index dbr:Unsupervised_learning dbr:Metric_(mathematics) dbr:Variation_of_information dbr:Software_evolution dbr:Evolutionary_biology dbr:Multi-objective_optimization dbr:Knowledge_discovery dbr:Sequence_clustering dbr:Statistical_physics dbr:Sequence_analysis_in_social_sciences dbr:Mean-shift dbr:UPGMA dbr:Overfitting dbr:Parallel_coordinates dbr:Sørensen–Dice_coefficient dbr:Robert_Tryon dbr:Spectral_clustering dbr:True_negative dbr:True_positive dbr:Principal_Component_Analysis dbr:Border_detection dbr:Statistical_distribution dbr:Centroids dbr:PET_scan dbr:False_negatives dbr:False_positives dbr:Lexical_ambiguity dbr:Transcriptomics dbr:Distance_function dbr:Divisive_clustering dbr:High-dimensional_data dbr:Genome_annotation dbr:Informedness dbr:OPTICS dbr:Clusty dbr:Complete_linkage_clustering dbr:F-measure dbr:Jaccard_coefficient dbr:K-means_algorithm dbr:Precision_(information_retrieval) dbr:Stock-keeping_unit dbr:Subspace_clustering dbr:File:Cluster-2.svg
dbp:wikiPageUsesTemplate	dbt:Citation_needed dbt:Commons_category dbt:Main dbt:Main_category dbt:More_citations_needed_section dbt:Reflist dbt:Rp dbt:See_also dbt:Short_description dbt:Snd dbt:Vanchor dbt:Statistics dbt:Machine_learning dbt:Differentiable_computing
dcterms:isPartOf	http://zbw.eu/stw/mapping/dbpedia/target
dcterms:subject	dbc:Cluster_analysis dbc:Geostatistics dbc:Data_mining
gold:hypernym	dbr:Task
rdf:type	owl:Thing dbo:Agent yago:Abstraction100002137 yago:Act100030358 yago:Activity100407535 yago:Algorithm105847438 yago:Code106355894 yago:CodingSystem106353757 yago:Communication100033020 yago:Event100029378 yago:Procedure101023820 yago:Program106568978 yago:PsychologicalFeature100023100 yago:WikicatInternetSearchEngines yago:Writing106359877 yago:WrittenCommunication106349220 yago:YagoPermanentlyLocatedEntity dbo:MusicGenre yago:Rule105846932 yago:SearchEngine106578654 yago:Software106566077 yago:WikicatAlgorithms
rdfs:comment	Shluková analýza (též clusterová analýza, anglicky cluster analysis) je statistická metoda, která se používá ke klasifikaci objektů.Slouží k třídění jednotek do skupin (shluků) tak, aby si jednotky náležící do stejné skupiny byly podobnější než objekty z ostatních skupin. Shlukovou analýzu je možné provádět jak na množině objektů, z nichž každý musí být popsán prostřednictvím stejného souboru znaků, které má smysl v dané množině sledovat, tak na množině znaků, které jsou charakterizovány prostřednictvím určitého souboru objektů, nositelů těchto znaků. (cs) Συσταδοποίηση είναι η διαδικασία εκείνη κατά την οποία ένα σύνολο από «αντικείμενα», διαχωρίζονται σε ένα σύνολο από λογικές ομάδες. Η καταχώρηση αντικειμένων σε ίδια ομάδα μεταφράζεται ως ομοιότητα των αντικειμένων αυτών και αντίστροφα (αντικείμενα που ανήκουν σε διαφορετικές ομάδες είναι ανόμοια). Η ομοιότητα ή μη, μεταξύ των αντικείμενων, ουσιαστικά εξαρτάται από το συγκεκριμένο πρόβλημα και τη μορφή των «αντικειμένων». Στη βιβλιογραφία συναντάται ως ομαδοποίηση και μη επιβλεπόμενη μάθηση. Τα αντικείμενα μπορούν να αναφερθούν και αυτά με διαφορετικούς όρους: πρότυπα, διανύσματα (παρακάτω θα αναφέρονται ως διανύσματα). (el) Analisis kelompok adalah suatu teknik yang dapat digunakan untuk mengenali kelompok-kelompok yang dihasilkan dari pengelompokkan unsur-unsur yang lebih kecil berdasarkan adanya kemiripan satu sama lain. Kemiripan yang menjadi dasar pengelompokkan tidaklah bersifat universal, sehingga ukuran-ukuran penyamanya harus dijabarkan terlebih dahulu oleh peneliti atau penganalisis. (in) クラスタリング（英: clustering）、クラスタ解析（クラスタかいせき）、クラスター分析（クラスターぶんせき）は、データ解析手法（特に多変量解析手法）の一種。教師なしデータ分類手法、つまり与えられたデータを外的基準なしに自動的に分類する手法。また、そのアルゴリズム。さまざまな手法が提案されているが、大きく分けるとデータの分類が階層的になされる階層型手法と、特定のクラスタ数に分類する非階層的手法とがある。それぞれの代表的な手法としてウォード法、K平均法などがある。 (ja) Clusteranalyse is het classificeren of het groeperen in of klassen van objecten op grond van hun kenmerken. Het doel van clusteranalyse is het vormen van deelverzamelingen die elk hun eigen gedeelde kenmerken bevatten. Om het resultaat te visualiseren kan een dendrogram worden gebruikt. (nl) 클러스터 분석(Cluster analysis)이란 주어진 데이터들의 특성을 고려해 데이터 집단(클러스터)을 정의하고 데이터 집단의 대표할 수 있는 대표점을 찾는 것으로 데이터 마이닝의 한 방법이다. 클러스터란 비슷한 특성을 가진 데이터들의 집단이다. 반대로 데이터의 특성이 다르면 다른 클러스터에 속해야 한다. (ko) 聚类分析（英語：Cluster analysis）亦称为集群分析，是对于统计数据分析的一门技术，在许多领域受到广泛应用，包括机器学习，数据挖掘，模式识别，图像分析以及生物信息。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集（subset），这样让在同一个子集中的成员对象都有相似的一些属性，常见的包括在坐标系中更加短的空间距离等。一般把数据聚类归纳为一种非監督式學習。 (zh) التحليل العنقودي (بالإنجليزية: Cluster analysis)‏ هو عبارة عن نوع من الأساليب الإحصائية التي يمكن تطبيقها على البيانات. يتولى التحليل العنقودي إفراز البيانات الأولية وتجميعها في مجموعات عنقودية (clusters). العنقود عبارة عن مجموعة من الحالات أو الملاحظات المتجانسة نسبيًا. تتميز العناصر المكونة للعنقود الواحد بأنها متشابهة مع بعضها، بينما تكون عناصر العناقيد المختلفة أقل تجانساً. (ar) La clusterització de dades és una tècnica molt comuna en l'anàlisi estadística de dades. Bàsicament és la classificació d'objectes similars en diferents grups, o més precisament, la partició de les dades en diferents subconjunts (o clústers). Així doncs, les dades de cada subgrup idealment comparteixen un tret comú. A grans trets, podem dividir els algorismes en jeràrquics o particionals. (ca) Cluster analysis or clustering is the task of grouping a set of objects in such a way that objects in the same group (called a cluster) are more similar (in some sense) to each other than to those in other groups (clusters). It is a main task of exploratory data analysis, and a common technique for statistical data analysis, used in many fields, including pattern recognition, image analysis, information retrieval, bioinformatics, data compression, computer graphics and machine learning. (en) Unter Clusteranalyse (Clustering-Algorithmus, gelegentlich auch: Ballungsanalyse) versteht man Verfahren zur Entdeckung von Ähnlichkeitsstrukturen in (meist relativ großen) Datenbeständen. Die so gefundenen Gruppen von „ähnlichen“ Objekten werden als Cluster bezeichnet, die Gruppenzuordnung als Clustering. Die gefundenen Ähnlichkeitsgruppen können graphentheoretisch, hierarchisch, partitionierend oder optimierend sein. Die Clusteranalyse ist eine wichtige Disziplin des Data-Minings, des Analyseschritts des Knowledge-Discovery-in-Databases Prozesses. Das Ziel der Clusteranalyse ist, neue Gruppen in den Daten zu identifizieren (im Gegensatz zur Klassifikation, bei der Daten bestehenden Klassen zugeordnet werden). Man spricht von einem „uninformierten Verfahren“, da es nicht auf Klassen-Vorwi (de) Estatistikan, multzokatzea elementu edo objektu ezberdinen sailkapen teknika bat da non elementuak multzo ezberdinetara biltzen diren, multzo bateko elementuen arteko antzekotasuna beste multzoetako elementuekiko antzekotasuna baino handiagoa izanik. Gehienetan bi elementuen arteko antzekotasuna distantzia (estatistika) baten bitartez neurtzen da, elementuen ezaugarri edo datuetan oinarrituz. (eu) Análisis de grupos o agrupamiento es la tarea de agrupar objetos por similitud, en grupos o conjuntos de manera que los miembros del mismo grupo tengan características similares. Es la tarea principal de la minería de datos exploratoria y es una técnica común en el análisis de datos estadísticos. Además es utilizada en múltiples campos comoː * aprendizaje automático * reconocimiento de patrones * análisis de imágenes * búsqueda y recuperación de información * bioinformática * compresión de datos * computación gráfica. Las aplicaciones del agrupamiento se dividen en dos tipos principalesː (es) Le partitionnement de données (ou data clustering en anglais) est une méthode en analyse des données. Elle vise à diviser un ensemble de données en différents « paquets » homogènes, en ce sens que les données de chaque sous-ensemble partagent des caractéristiques communes, qui correspondent le plus souvent à des critères de proximité (similarité informatique) que l'on définit en introduisant des mesures et classes de distance entre objets. Pour obtenir un bon partitionnement, il convient d'à la fois : (fr) In statistica, il clustering o analisi dei gruppi (dal termine inglese cluster analysis, introdotto da Robert Tryon nel 1939) è un insieme di tecniche di analisi multivariata dei dati volte alla selezione e raggruppamento di elementi omogenei in un insieme di dati. (it) Grupowanie (analiza skupień, klasteryzacja) (ang. data clustering) – metoda tzw. klasyfikacji bez nadzoru (ang. unsupervised learning). Jest to metoda dokonująca grupowania elementów we względnie jednorodne klasy. Podstawą grupowania w większości algorytmów jest podobieństwo pomiędzy elementami – wyrażone przy pomocy funkcji (metryki) podobieństwa. Poprzez grupowanie można również rozwiązać problemy z gatunku odkrywania struktury w danych oraz dokonywanie uogólniania. Grupowanie polega na wyodrębnianiu grup (klas, podzbiorów). Wybrane cele dokonywania grupowania są następujące: (pl) O clustering ou análise de agrupamento de dados é o conjunto de técnicas de prospecção de dados (data mining) que visa fazer agrupamentos automáticos de dados segundo o seu grau de semelhança. O critério de semelhança faz parte da definição do problema e, dependendo, do algoritmo. A cada conjunto de dados resultante do processo dá-se o nome de grupo, aglomerado ou agrupamento (cluster). Os tipos de algoritmos de agrupamento de dados mais comuns são: os particionais e os hierárquicos. (pt) Кластерный анализ (англ. cluster analysis) — многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы. Задача кластеризации относится к статистической обработке, а также к широкому классу задач обучения без учителя. (ru) Inom datavetenskap och statistik innebär klusteranalys gruppering av datamängder i delmängder som kallas . Klusteranalys refererar inte till en enskild algoritm, utan är ett samlingsnamn för analysmetoden. Klustring är en typ av maskininlärning, vilket är vanligt inom statistik, informationsutvinning, mönsterigenkänning, bildanalys, informationssökning och bioinformatik. Tekniken skiljer sig från klassificering genom att klasserna inte är kända på förhand. (sv) Кластерний аналіз (англ. Data clustering) — задача розбиття заданої вибірки об'єктів (ситуацій) на підмножини, які називаються кластерами, так, щоб кожен кластер складався з схожих об'єктів, а об'єкти різних кластерів істотно відрізнялися. Завдання кластеризації відноситься до статистичної обробки, а також до широкого класу завдань навчання без вчителя. (uk)
rdfs:label	Cluster analysis (en) تحليل عنقودي (ar) Clusterització de dades (ca) Shluková analýza (cs) Clusteranalyse (de) Συσταδοποίηση (el) Análisis de grupos (es) Multzokatze (estatistika) (eu) Analisis kelompok (in) Partitionnement de données (fr) Clustering (it) 클러스터 분석 (ko) データ・クラスタリング (ja) Clusteranalyse (nl) Analiza skupień (pl) Clustering (pt) Кластерный анализ (ru) Klusteranalys (datavetenskap) (sv) Кластерний аналіз (uk) 聚类分析 (zh)
rdfs:seeAlso	dbr:Phylogeny dbr:A_data_set dbr:Determining_the_number_of_clusters dbr:Distance_matrices
owl:sameAs	freebase:Cluster analysis yago-res:Cluster analysis dbpedia-commons:Cluster analysis wikidata:Cluster analysis dbpedia-ar:Cluster analysis dbpedia-bg:Cluster analysis http://bn.dbpedia.org/resource/ক্লাস্টার_বিশ্লেষণ dbpedia-ca:Cluster analysis dbpedia-cs:Cluster analysis dbpedia-da:Cluster analysis dbpedia-de:Cluster analysis dbpedia-el:Cluster analysis dbpedia-es:Cluster analysis dbpedia-et:Cluster analysis dbpedia-eu:Cluster analysis dbpedia-fa:Cluster analysis dbpedia-fr:Cluster analysis dbpedia-he:Cluster analysis http://hi.dbpedia.org/resource/पुंज_विश्लेषण dbpedia-hr:Cluster analysis dbpedia-hu:Cluster analysis http://hy.dbpedia.org/resource/Կլաստեր-անալիզ dbpedia-id:Cluster analysis dbpedia-it:Cluster analysis dbpedia-ja:Cluster analysis dbpedia-ko:Cluster analysis http://lt.dbpedia.org/resource/Klasterių_analizė http://lv.dbpedia.org/resource/Klasteru_analīze dbpedia-nl:Cluster analysis dbpedia-no:Cluster analysis dbpedia-pl:Cluster analysis dbpedia-pt:Cluster analysis dbpedia-ru:Cluster analysis dbpedia-sh:Cluster analysis dbpedia-simple:Cluster analysis dbpedia-sk:Cluster analysis dbpedia-sl:Cluster analysis dbpedia-sv:Cluster analysis dbpedia-th:Cluster analysis dbpedia-tr:Cluster analysis dbpedia-uk:Cluster analysis dbpedia-vi:Cluster analysis dbpedia-zh:Cluster analysis http://data.wordlift.io/wl0216/entity/cluster_analysis https://global.dbpedia.org/id/4oa7t
skos:exactMatch	http://zbw.eu/stw/descriptor/15397-0
prov:wasDerivedFrom	wikipedia-en:Cluster_analysis?oldid=1116924542&ns=0
foaf:depiction	wiki-commons:Special:FilePath/SLINK-density-data.svg wiki-commons:Special:FilePath/Cluster-2.svg wiki-commons:Special:FilePath/DBSCAN-Gaussian-data.svg wiki-commons:Special:FilePath/DBSCAN-density-data.svg wiki-commons:Special:FilePath/EM-Gaussian-data.svg wiki-commons:Special:FilePath/EM-density-data.svg wiki-commons:Special:FilePath/KMeans-Gaussian-data.svg wiki-commons:Special:FilePath/KMeans-density-data.svg wiki-commons:Special:FilePath/OPTICS-Gaussian-data.svg wiki-commons:Special:FilePath/SLINK-Gaussian-data.svg
foaf:isPrimaryTopicOf	wikipedia-en:Cluster_analysis
is dbo:genre of	dbr:Carrot2
is dbo:knownFor of	dbr:Paul_McNicholas_(statistician)
is dbo:wikiPageDisambiguates of	dbr:Cluster
is dbo:wikiPageRedirects of	dbr:Cluster_Analysis dbr:Applications_of_cluster_analysis dbr:Clustering_algorithm dbr:Data_Clustering dbr:Data_clustering dbr:Soft_clustering dbr:Cluster_(statistics) dbr:Cluster_analyses dbr:Cluster_tendency dbr:Cluster_validation dbr:Clustered_data dbr:Clustering_metric dbr:Density-based_clustering
is dbo:wikiPageWikiLink of	dbr:Card_sorting dbr:Carrot2 dbr:Privacy_and_blockchain dbr:Scikit-learn dbr:Elbow_method_(clustering) dbr:List_of_algorithms dbr:List_of_datasets_for_machine-learning_research dbr:Mixture_(probability) dbr:Multivariate_statistics dbr:N-gram dbr:Nearest_neighbor_search dbr:Normalized_compression_distance dbr:Memetic_algorithm dbr:Stylometry dbr:Time_series dbr:Bioconductor dbr:Biostatistics dbr:Anomaly_detection dbr:Ansatz dbr:Archetypal_analysis dbr:History_of_tea dbr:Little_penguin dbr:Pathfinding dbr:Pearson_correlation_coefficient dbr:Peter_Rousseeuw dbr:Repertory_grid dbr:Rexer's_Annual_Data_Miner_Survey dbr:Richard_Samworth dbr:Robert_L._Thorndike dbr:Curse_of_dimensionality dbr:DNA_microarray dbr:DOME_project dbr:Uncertainty_coefficient dbr:Universities_in_the_United_Kingdom dbr:VMDS dbr:Vector_quantization dbr:ViennaRNA_Package dbr:Vietnamese_people dbr:Vorombe dbr:Dependent_Dirichlet_process dbr:Design_effect dbr:Design_structure_matrix dbr:Deterministic_blockmodeling dbr:Duncan's_new_multiple_range_test dbr:Earth_mover's_distance dbr:Indicators_of_spatial_association dbr:News360 dbr:Life_on_Mars dbr:Rule_induction dbr:Word-sense_induction dbr:Numerical_taxonomy dbr:String_kernel dbr:SimRank dbr:Total_correlation dbr:Terminal_restriction_fragment_length_polymorphism dbr:Computational_genomics dbr:Conceptual_clustering dbr:Analysis dbr:Matthew_Linford dbr:Median dbr:SAP_HANA dbr:Chemical_shift_index dbr:Chemometrics dbr:Gene_expression_profiling_in_cancer dbr:Generalized_blockmodeling dbr:Genetic_and_anthropometric_studies_on_Japanese_people dbr:Geography dbr:Geometric_data_analysis dbr:Oracle_Data_Mining dbr:Weighted_correlation_network_analysis dbr:Similarity_learning dbr:Quantum_clustering dbr:Quirkos dbr:R-tree dbr:Race_and_genetics dbr:Cluster_Analysis dbr:Colin_Lingwood_Mallows dbr:Alexander_Strehl dbr:Elżbieta_Pleszczyńska dbr:Enterprise_feedback_management dbr:Fung_Ying_Ki dbr:Genetic_algorithm dbr:Glossary_of_artificial_intelligence dbr:Glossary_of_probability_and_statistics dbr:Bounding_sphere dbr:Miroslav_Fiedler dbr:Molecular_phylogenetics dbr:Multimedia_information_retrieval dbr:Mutual_information dbr:Cophenetic dbr:Coreference dbr:Correlation_clustering dbr:CrimeStat dbr:Statistical_inference dbr:Optimal_matching dbr:Oracle_Advertising dbr:Organizational_structure dbr:WPGMA dbr:Anuška_Ferligoj dbr:Apache_Mahout dbr:Apache_Spark dbr:Applications_of_cluster_analysis dbr:Machine_learning dbr:Machine_olfaction dbr:Mallet_(software_project) dbr:Silhouette_(clustering) dbr:Simalto dbr:Strategic_early_warning_system dbr:Stéphane_Bonhomme dbr:Cluster_hypothesis dbr:Clustering_high-dimensional_data dbr:Combinatorial_data_analysis dbr:Common_factors_theory dbr:Competitive_learning dbr:Complete-linkage_clustering dbr:Computational_phylogenetics dbr:Zero_Patience dbr:Feature_extraction dbr:Feature_learning dbr:Feature_selection dbr:Federated_learning dbr:Friction_of_distance dbr:Cluster dbr:Clustering dbr:Clustering_algorithm dbr:Hoshen–Kopelman_algorithm dbr:Journal_of_Classification dbr:Kernel_(statistics) dbr:Kernel_embedding_of_distributions dbr:Kernel_method dbr:Kernel_principal_component_analysis dbr:Paul_McNicholas_(statistician) dbr:Persona_(user_experience) dbr:Prediction_by_partial_matching dbr:Machine_learning_in_bioinformatics dbr:Structured_data_analysis_(statistics) dbr:Supercluster_(genetic) dbr:T-distributed_stochastic_neighbor_embedding dbr:Temple_Mount_Sifting_Project dbr:Marketing_engineering dbr:Master_in_Data_Science dbr:Maya_Ackerman dbr:Mayan_genetics dbr:Mean_shift dbr:Medoid dbr:Unstructured_data dbr:MyDemocracy.ca dbr:2004_Venezuelan_recall_referendum dbr:Adaptive_website dbr:Adi_Ben-Israel dbr:Central_tendency dbr:Agreeableness dbr:Turkish_Cypriots dbr:U-matrix dbr:Data_Applied dbr:Data_analysis_techniques_for_fraud_detection dbr:Data_and_information_visualization dbr:Data_cleansing dbr:Data_driven_marketing dbr:Data_exploration dbr:Data_mining dbr:Data_sonification dbr:Weka_(machine_learning) dbr:Distribution_learning_theory dbr:Document_management_system dbr:Domain_generation_algorithm dbr:Fuzzy_clustering dbr:Fuzzy_concept dbr:Fuzzy_set dbr:HCS_clustering_algorithm dbr:Heat_map dbr:Iris_flower_data_set dbr:K-means_clustering dbr:K-medians_clustering dbr:Landscape_ecology dbr:Landscape_genetics dbr:Large-scale_brain_network dbr:Large_margin_nearest_neighbor dbr:Latent_class_model dbr:Lawrence_Kohlberg's_stages_of_moral_development dbr:Learning_rule dbr:Linear_discriminant_analysis dbr:Locality-sensitive_hashing dbr:Minimum_cut dbr:RNA-Seq dbr:ADaMSoft dbr:Albert_Spaulding dbr:Alexey_Ivakhnenko dbr:Alogia dbr:Analytics dbr:DBSCAN dbr:Danielle_Belgrave dbr:Data_stream_clustering dbr:ELKI dbr:Eudyptula_novaehollandiae dbr:Event_camera dbr:Evolution_of_a_random_network dbr:Explainable_artificial_intelligence dbr:Formal_concept_analysis dbr:Balanced_clustering dbr:Barnes_interpolation dbr:North_American_English_regional_phonology dbr:Numbers_(season_4) dbr:PICRUSt dbr:Partition_of_a_set dbr:Carbohydrate_Structure_Database dbr:Center_of_mass dbr:Dialogical_self dbr:Dimensionality_reduction dbr:Educational_data_mining dbr:Flow_cytometry_bioinformatics dbr:Fowlkes–Mallows_index dbr:Godfried_Toussaint dbr:Graphlets dbr:KHOPCA_clustering_algorithm dbr:Knowledge_extraction dbr:Knowledge_graph_embedding dbr:Taxonomy_of_the_Gastropoda_(Bouchet_&_Rocroi,_2005) dbr:Principal_component_analysis dbr:List_of_MeSH_codes_(E05) dbr:List_of_MeSH_codes_(G03) dbr:List_of_MeSH_codes_(H01) dbr:List_of_MeSH_codes_(N05) dbr:Positioning_(marketing) dbr:Quadratic_unconstrained_binary_optimization dbr:Reeb_graph dbr:Reverse_engineering dbr:Hans-Peter_Kriegel dbr:Hash_table dbr:JUNG dbr:Jean-Paul_Benzécri dbr:Jenny_Bryan dbr:Taxonomy_(biology) dbr:OPTICS_algorithm dbr:Social_research dbr:Affinity_analysis dbr:Affinity_propagation dbr:Biclustering dbr:Big_data dbr:Bioinformatics dbr:Biological_network_inference dbr:Block-matching_and_3D_filtering dbr:Blockmodel dbr:Blockmodeling dbr:Blockmodeling_linked_networks dbr:Support_vector_machine dbr:Ecological_classification dbr:Hierarchical_Taxonomy_of_Psychopathology dbr:Hierarchical_clustering dbr:Jaccard_index dbr:Transduction_(machine_learning) dbr:Psychological_statistics dbr:SUBCLU dbr:Single-linkage_clustering dbr:Discrete_Laplace_operator dbr:Distance_matrix dbr:Document_clustering dbr:Arthur_Zimek dbr:Author_name_disambiguation dbr:Automated_decision-making dbr:Automated_essay_scoring dbr:Automated_machine_learning dbr:Automatic_clustering_algorithms dbr:Automatic_summarization dbr:Market_segmentation dbr:Mary_D'Imperio dbr:Bootstrap_error-adjusted_single-sample_technique dbr:Business_analytics dbr:Social_media_analytics dbr:Classification_System_for_Serial_Criminal_Patterns dbr:Finale_Doshi-Velez dbr:Frequent_pattern_discovery dbr:Group_concept_mapping dbr:Growing_self-organizing_map dbr:Human_Genetic_Diversity:_Lewontin's_Fallacy dbr:Human_genetic_clustering dbr:Human–computer_information_retrieval dbr:Yves_Jeannin dbr:Data_Clustering dbr:Data_clustering dbr:Idea_networking dbr:Image_segmentation dbr:Kouros dbr:Michael_J._Fox dbr:Microbiota dbr:Microtargeting dbr:MinHash dbr:Ming_T._Tsuang dbr:Minimum_spanning_tree dbr:Neighbor_joining dbr:Orange_(software) dbr:Automated_ECG_interpretation dbr:Categorization dbr:Catherine_Sugar dbr:R_(programming_language) dbr:Race_(human_categorization) dbr:Recommender_system dbr:Change_detection dbr:WordNet dbr:Klein_Sexual_Orientation_Grid
is dbp:class of	dbr:HCS_clustering_algorithm
is rdfs:seeAlso of	dbr:Machine_learning dbr:Statistical_classification
is foaf:primaryTopic of	wikipedia-en:Cluster_analysis