| dbpprop:abstract
|
- In statistics and machine learning, k-means clustering is a method of cluster analysis which aims to partition n observations into k clusters in which each observation belongs to the cluster with the nearest mean. It is similar to the expectation-maximization algorithm for mixtures of Gaussians in that they both attempt to find the centers of natural clusters in the data.
- Ein k-Means-Algorithmus ist ein Verfahren, das in einer Menge von Objekten ähnliche Objekte zu k Gruppen zusammenfasst. Der Algorithmus ist eine Implementiertung eines EM-Algorithmus und zeichnet sich durch seine Einfachheit aus. Diese Art von Algorithmen wurde intensiv erforscht. k-Means-Algorithmen bestechen mehr durch Schnelligkeit, als durch ein möglichst präzises Ergebnis. Die Ähnlichkeit der Objekte wird durch eine Abstandsfunktion modelliert.
- L'algoritmo K-Means è un algoritmo di clustering che permette di suddividere gruppi di oggetti in K partizioni sulla base dei loro attributi. È una variante dell'Algoritmo di aspettazione-massimizzazione il cui obiettivo è determinare i K gruppi di dati generati da distribuzioni gaussiane. Si assume che gli attributi degli oggetti possano essere rappresentati come vettori, e che quindi formino uno spazio vettoriale.
- K平均法(Kへいきんほう)は、MacQueen、Anderberg、Forgyらにより提案された非階層型クラスタリング手法の1つ。クラスタの平均を用い、与えられたクラスタ数K個に分類することから、MacQueenによりこう呼ばれた。K-平均法(K-means)、c-平均法(c-means)とも呼ばれる。 単純なアルゴリズムで計算することができるため、現在広く用いられている。分類をファジィ化したファジィc-平均法やエントロピー法をはじめ、データ構造を発見するさまざまな応用手法が提案されている。
- Algorytm centroidów jest jednym z algorytmów stosowanym w analizie skupień, wykorzystywanym m. in. w kwantyzacji wektorowej. Algorytm nazywany jest także algorytmem klastrowym lub - od nazwisk twórców Linde, Buzo i Graya - algorytmem LBG.
- k-means (иногда называемый k-средних) - наиболее популярный метод кластеризации. Алгоритм представляет собой модификацию EM-алгоритма для разделения смеси гауссиан. Он разбивает множество элементов векторного пространства на заранее известное число кластеров k. Действие алгоритма таково, что он стремится минимизировать среднеквадратичное отклонение на точках каждого кластера: <math>V = \sum_{i=1}^{k} \sum_{x_j \in S_i} (x_j - \mu_i)^2 </math> где <math>k</math> - число кластеров, <math>S_i</math> - полученные кластеры, <math>i = 1, 2, \dots, k</math> и <math>\mu_i</math> - центры масс векторов <math>x_j \in S_i</math>. Основная идея заключается в том, что на каждой итерации перевычисляется центр масс для каждого кластера, полученного на предыдущем шаге, затем векторы разбиваются на кластеры вновь в соответствии с тем, какой из новых центров оказался ближе по выбраной метрике. Алгоритм завершается, когда на какой-то итерации не происходит изменения кластеров. Как показали Д. Артур и С. Вассилвицкий, на некоторых классах множеств сложность алгоритма по времени, нужному для сходимости, равна <math>2^{\Omega(\sqrt{n})}</math>.
- Кластериза́ція зобра́ження ме́тодом k-сере́дніх полягає у наступному: будується деяка цільова функція Ф(°), що виражає якість поточного розбиття зображення на k кластерів із центрами у точках Сі, і=1,…,n; k — задано. Вибравши в початковий момент центри кластерів довільним чином, далі для кожного пікселя зображення ітеративно визначаємо його приналежність до одного із k кластерів і обчислюємо нові значення для центрів кластерів, намагаючись при цьому мінімізувати функцію Ф(°). Одним із недоліків цього методу є порушення умови зв'язності пікселів одного кластера, ось чому розвиваються різні модифікації методу k-середніх, а також його нечіткі аналоги (fuzzy k-means methods), у яких на першій стадії алгоритму допускається приналежність одного пікселя до декількох кластерів (із різним ступенем приналежності). Алгоритм методу «Кластеризація за схемою к-середніх»: вибрати k інформаційних точок в якості центрів кластерів; поки не завершиться процес зміни центрів кластерів; співставити кожну інформаційну точку з кластером, відстань до центра якого мінімальна; переконатися, що в кожному кластері міститься хоча б одна точка; для цього кожний порожній кластер потрібно доповнити довільною точкою, що розташована; «далеко» від центра кластера; центр кожного кластера замінити середнім від елементів кластера; кінець.
- k-means algorithm算法是一个聚类算法,把n的对象根据他们的属性分为<math>k</math>个分割,<math>k < n</math>。它与处理混合正态分布的最大期望算法很相似,因为他们都试图找到数据中自然聚类的中心。 <math>V = \sum_{i=1}^{k} \sum_{x_j \in S_i} (x_j - \mu_i)^2 </math>
|
| rdfs:comment
|
- In statistics and machine learning, k-means clustering is a method of cluster analysis which aims to partition n observations into k clusters in which each observation belongs to the cluster with the nearest mean. It is similar to the expectation-maximization algorithm for mixtures of Gaussians in that they both attempt to find the centers of natural clusters in the data.
- Ein k-Means-Algorithmus ist ein Verfahren, das in einer Menge von Objekten ähnliche Objekte zu k Gruppen zusammenfasst. Der Algorithmus ist eine Implementiertung eines EM-Algorithmus und zeichnet sich durch seine Einfachheit aus. Diese Art von Algorithmen wurde intensiv erforscht. k-Means-Algorithmen bestechen mehr durch Schnelligkeit, als durch ein möglichst präzises Ergebnis. Die Ähnlichkeit der Objekte wird durch eine Abstandsfunktion modelliert.
- L'algoritmo K-Means è un algoritmo di clustering che permette di suddividere gruppi di oggetti in K partizioni sulla base dei loro attributi. È una variante dell'Algoritmo di aspettazione-massimizzazione il cui obiettivo è determinare i K gruppi di dati generati da distribuzioni gaussiane. Si assume che gli attributi degli oggetti possano essere rappresentati come vettori, e che quindi formino uno spazio vettoriale.
- Algorytm centroidów jest jednym z algorytmów stosowanym w analizie skupień, wykorzystywanym m. in. w kwantyzacji wektorowej. Algorytm nazywany jest także algorytmem klastrowym lub - od nazwisk twórców Linde, Buzo i Graya - algorytmem LBG.
- k-means (иногда называемый k-средних) - наиболее популярный метод кластеризации. Алгоритм представляет собой модификацию EM-алгоритма для разделения смеси гауссиан. Он разбивает множество элементов векторного пространства на заранее известное число кластеров k.
- Кластериза́ція зобра́ження ме́тодом k-сере́дніх полягає у наступному: будується деяка цільова функція Ф(°), що виражає якість поточного розбиття зображення на k кластерів із центрами у точках Сі, і=1,…,n; k — задано.
- k-means algorithm算法是一个聚类算法,把n的对象根据他们的属性分为<math>k</math>个分割,<math>k < n</math>。它与处理混合正态分布的最大期望算法很相似,因为他们都试图找到数据中自然聚类的中心。 <math>V = \sum_{i=1}^{k} \sum_{x_j \in S_i} (x_j - \mu_i)^2 </math>
|