dbo:abstract
|
- معامل سورنسن-دايس هي طريقة إحصائية تستخدم لمقارنة تشابه اثنين من العينات، تم تطويرها بشكل مستقل من قبل علماء النبات سورنس ودايس وتم نشرها في عام 1948 و عام 1945 على التوالي. (ar)
- El coeficiente ó índice de Sørensen-Dice, también conocido por otros nombres tales como el índice de Sørensen, coeficiente de Dice, es un estadístico utilizado para comparar la similitud de dos muestras. Fue desarrollado independientemente por los botánicos Thorvald Sørensen y Lee Raymond Dice, que publicaron en 1948 y 1945 respectivamente. (es)
- L'indice de Sørensen-Dice, connu aussi sous les noms d'indice de Sørensen, coefficient de Dice et ) est un indicateur statistique qui mesure la similarité de deux échantillons. Il a été développé indépendamment par les botanistes Thorvald Sørensen et Lee Raymond Dice dans des articles publiés en 1948 et 1945 respectivement. (fr)
- The Sørensen–Dice coefficient (see below for other names) is a statistic used to gauge the similarity of two samples. It was independently developed by the botanists Thorvald Sørensen and Lee Raymond Dice, who published in 1948 and 1945 respectively. (en)
- Indice di similarità di Sørensen misura la somiglianza tra due comunità e si basa su dati di presenza e assenza. Viene definito come il rapporto tra il numero di specie condivise in due siti (s) e il numero di specie presente in ogni sito (a). (it)
- Współczynnik Sørensena, znany także jako współczynnik podobieństwa Sørensena, to wielkość używana do porównania podobieństwa dwóch próbek. Został wprowadzony przez botanika Thorvalda Sørensena w 1948 roku. Dany jest on wzorem gdzie i są liczbami gatunków na stanowiskach A i B, odpowiednio, a jest liczbą gatunków wspólnych dla obu stanowisk. Wyrażenie to jest łatwo rozszerzyć do porównywania dowolnych zasobów. Ta ilościowa wersja współczynnika Sørensena jest znana także jako indeks Czekanowskiego. Współczynnik Sørensena jest równy , który jest zawsze w przedziale Czasami jest też on używany jako miara odległości jest równe z i . Współczynnik Sørensena jest głównie używany w analizie danych ekologicznych (np. Looman & Campbell, 1960). Uzasadnienie do jego stosowania jest bardziej empiryczne niż teoretyczne (choć może być ono uzasadnione teoretycznie jako przecięcie dwóch zbiorów rozmytych). W porównaniu do odległości Euklidesowej, odległość Sørensena jest bardziej wrażliwa na zróżnicowane zestawy danych i zwraca mniejszą uwagę na skrajne dane. (pl)
- Мера Сёренсена — бинарная мера сходства, предложенная датским учёным в 1948 году. Фамилия автора коэффициента в литературе переводится самыми различными способами: Съёренсен, Съеренсен, Соренсен, Серенсен. Вариант «Сёренсен» приводится в известной работе X.X.Трасса. Мера Сёренсена эквивалентна (связаны одной монотонно возрастающей зависимостью) мере Жаккара и мере Сокала-Снита для конечных множеств (множественная интерпретация). На основе индекса Сёренсена получен : . Для случая дескриптивных множеств (дескриптивная интерпретация), в экологии это выборки по обилию, аналогом указанной меры является мера Чекановского: Если сравнивается встречаемость видов (вероятностная интерпретация), то есть учитываются вероятности встреч признаков, то аналогом меры Сёренсена будет симметричная мера Дайса (coincidence index), предложенная Л.Дайсом в 1945 году, в дальнейшем использовался Р.Бреем. Поэтому меру часто называют индексом Дайса-Брея. В некоторых работах используется под названием индекса Дайса или индекса Брея-Кёртиса (реже индекса Ланса-Вильямса): Для информационной аналитической интерпретации мера взаимозависимости была независимо предложена Б. И. Сёмкиным и чешскими авторами. Мера применяется в научных исследованиях для определения степени взаимозависимости двух признаков. (ru)
- 戴斯系数(Dice coefficient),也称索倫森-戴斯系数(Sørensen–Dice coefficient),取名於和,是一种集合相似度度量函数,通常用于计算两个样本的相似度: 它在形式上和Jaccard指数没多大区别,但是有些不同的性质。 和Jaccard类似,它的范围为0到1。 与Jaccard不同的是,相应的差异函数 不是一个合适的距离度量措施,因为它没有三角形不等性的性质。例如给定 {a}, {b}, 和 {a,b}, 前两个集合的距离为1,而第三个集合和其他任意两个集合的距离为三分之一。 与Jaccard类似, 集合操作可以用两个向量 A 和B的操作来表示: 上式给出了两个向量的距离输出,也给出了更一般情况下向量之间的相似度度量措施。戴斯系数可以计算两个字符串的相似度:Dice(s1,s2)=2*comm(s1,s2)/(leng(s1)+leng(s2))。其中,comm (s1,s2)是s1、s2 中相同字符的个数leng(s1),leng(s2)是字符串s1、s2 的长度。 在信息检索中, 给定关键词集合X 和Y ,相似度定义为两倍的共同信息(重叠部分)除以基数的总和 : 当作为字符串之间的相似度度量时, 计算两个字符串之间的系数, x 和y,使用 bigrams 公式如下: 其中nt 是两个字符串共有的bigrams的个数, nx 是 x中bigrams的个数 ,ny 是 y中bigrams的个数。例如要计算下面两个字符串之间的相似度: nightnacht 我们可以在各个单词中得出如下bigrams集合: {ni,ig,gh,ht}{na,ac,ch,ht} 每个集合有4个元素, 这个两个集合只有一个相同的元素: ht. 代入公式我们可以计算出, s = (2 · 1) / (4 + 4) = 0.25. (zh)
- Індекс Соренсена (Індекс подібності Соренсена) — статистичний коефіцієнт, який використовується для порівняння двох статистичних вибірок. Він був розроблений ботаніком в 1948 році. Індекс Соренсена обраховується за наступною формулою , де А і В число видів в зразках А і В, відповідно. С — число видів, які є спільними для двох зразків. Цей вираз може бути розширеним для визначення поширеності видів замість кількості. Ця кількісна версія індексу Соренсена також відома як . Індекс Соренсена ідентичний до , який має межі [0, 1]. Індекс Соренсена також використовується для вимірювання відстані, 1 — QS, і в такій подачі є ідентичним до і . Коефіцієнт Соренсена найкорисніший для аналізу даних екологічних спільнот (див. Looman & Campbell, 1960)Арґументація щодо його використання є швидше емпірично, ніж теоретично підтвредженою (проте використання цього індексу може аргументуватись теоретично як перетин двох нечітких множин). Якщо порівнювати з відстанню Евкліда, то відстань Соренсена зберігає чутливість в більш гетерогенних наборах даних і дає меншу вагу точкам, які випадають із загальної картини (англ. outliers). (uk)
|
rdfs:comment
|
- معامل سورنسن-دايس هي طريقة إحصائية تستخدم لمقارنة تشابه اثنين من العينات، تم تطويرها بشكل مستقل من قبل علماء النبات سورنس ودايس وتم نشرها في عام 1948 و عام 1945 على التوالي. (ar)
- El coeficiente ó índice de Sørensen-Dice, también conocido por otros nombres tales como el índice de Sørensen, coeficiente de Dice, es un estadístico utilizado para comparar la similitud de dos muestras. Fue desarrollado independientemente por los botánicos Thorvald Sørensen y Lee Raymond Dice, que publicaron en 1948 y 1945 respectivamente. (es)
- L'indice de Sørensen-Dice, connu aussi sous les noms d'indice de Sørensen, coefficient de Dice et ) est un indicateur statistique qui mesure la similarité de deux échantillons. Il a été développé indépendamment par les botanistes Thorvald Sørensen et Lee Raymond Dice dans des articles publiés en 1948 et 1945 respectivement. (fr)
- The Sørensen–Dice coefficient (see below for other names) is a statistic used to gauge the similarity of two samples. It was independently developed by the botanists Thorvald Sørensen and Lee Raymond Dice, who published in 1948 and 1945 respectively. (en)
- Indice di similarità di Sørensen misura la somiglianza tra due comunità e si basa su dati di presenza e assenza. Viene definito come il rapporto tra il numero di specie condivise in due siti (s) e il numero di specie presente in ogni sito (a). (it)
- Współczynnik Sørensena, znany także jako współczynnik podobieństwa Sørensena, to wielkość używana do porównania podobieństwa dwóch próbek. Został wprowadzony przez botanika Thorvalda Sørensena w 1948 roku. Dany jest on wzorem (pl)
- Мера Сёренсена — бинарная мера сходства, предложенная датским учёным в 1948 году. Фамилия автора коэффициента в литературе переводится самыми различными способами: Съёренсен, Съеренсен, Соренсен, Серенсен. Вариант «Сёренсен» приводится в известной работе X.X.Трасса. Мера Сёренсена эквивалентна (связаны одной монотонно возрастающей зависимостью) мере Жаккара и мере Сокала-Снита для конечных множеств (множественная интерпретация). На основе индекса Сёренсена получен : . (ru)
- Індекс Соренсена (Індекс подібності Соренсена) — статистичний коефіцієнт, який використовується для порівняння двох статистичних вибірок. Він був розроблений ботаніком в 1948 році. Індекс Соренсена обраховується за наступною формулою , де А і В число видів в зразках А і В, відповідно. С — число видів, які є спільними для двох зразків. (uk)
- 戴斯系数(Dice coefficient),也称索倫森-戴斯系数(Sørensen–Dice coefficient),取名於和,是一种集合相似度度量函数,通常用于计算两个样本的相似度: 它在形式上和Jaccard指数没多大区别,但是有些不同的性质。 和Jaccard类似,它的范围为0到1。 与Jaccard不同的是,相应的差异函数 不是一个合适的距离度量措施,因为它没有三角形不等性的性质。例如给定 {a}, {b}, 和 {a,b}, 前两个集合的距离为1,而第三个集合和其他任意两个集合的距离为三分之一。 与Jaccard类似, 集合操作可以用两个向量 A 和B的操作来表示: 上式给出了两个向量的距离输出,也给出了更一般情况下向量之间的相似度度量措施。戴斯系数可以计算两个字符串的相似度:Dice(s1,s2)=2*comm(s1,s2)/(leng(s1)+leng(s2))。其中,comm (s1,s2)是s1、s2 中相同字符的个数leng(s1),leng(s2)是字符串s1、s2 的长度。 在信息检索中, 给定关键词集合X 和Y ,相似度定义为两倍的共同信息(重叠部分)除以基数的总和 : 当作为字符串之间的相似度度量时, 计算两个字符串之间的系数, x 和y,使用 bigrams 公式如下: nightnacht 我们可以在各个单词中得出如下bigrams集合: (zh)
|