About: Sørensen–Dice coefficient

Property	Value
dbo:abstract	معامل سورنسن-دايس هي طريقة إحصائية تستخدم لمقارنة تشابه اثنين من العينات، تم تطويرها بشكل مستقل من قبل علماء النبات سورنس ودايس وتم نشرها في عام 1948 و عام 1945 على التوالي. (ar) El coeficiente ó índice de Sørensen-Dice, también conocido por otros nombres tales como el índice de Sørensen, coeficiente de Dice, es un estadístico utilizado para comparar la similitud de dos muestras. Fue desarrollado independientemente por los botánicos Thorvald Sørensen y Lee Raymond Dice, que publicaron en 1948 y 1945 respectivamente. (es) L'indice de Sørensen-Dice, connu aussi sous les noms d'indice de Sørensen, coefficient de Dice et ) est un indicateur statistique qui mesure la similarité de deux échantillons. Il a été développé indépendamment par les botanistes Thorvald Sørensen et Lee Raymond Dice dans des articles publiés en 1948 et 1945 respectivement. (fr) The Sørensen–Dice coefficient (see below for other names) is a statistic used to gauge the similarity of two samples. It was independently developed by the botanists Thorvald Sørensen and Lee Raymond Dice, who published in 1948 and 1945 respectively. (en) Indice di similarità di Sørensen misura la somiglianza tra due comunità e si basa su dati di presenza e assenza. Viene definito come il rapporto tra il numero di specie condivise in due siti (s) e il numero di specie presente in ogni sito (a). (it) Współczynnik Sørensena, znany także jako współczynnik podobieństwa Sørensena, to wielkość używana do porównania podobieństwa dwóch próbek. Został wprowadzony przez botanika Thorvalda Sørensena w 1948 roku. Dany jest on wzorem gdzie i są liczbami gatunków na stanowiskach A i B, odpowiednio, a jest liczbą gatunków wspólnych dla obu stanowisk. Wyrażenie to jest łatwo rozszerzyć do porównywania dowolnych zasobów. Ta ilościowa wersja współczynnika Sørensena jest znana także jako indeks Czekanowskiego. Współczynnik Sørensena jest równy , który jest zawsze w przedziale Czasami jest też on używany jako miara odległości jest równe z i . Współczynnik Sørensena jest głównie używany w analizie danych ekologicznych (np. Looman & Campbell, 1960). Uzasadnienie do jego stosowania jest bardziej empiryczne niż teoretyczne (choć może być ono uzasadnione teoretycznie jako przecięcie dwóch zbiorów rozmytych). W porównaniu do odległości Euklidesowej, odległość Sørensena jest bardziej wrażliwa na zróżnicowane zestawy danych i zwraca mniejszą uwagę na skrajne dane. (pl) Мера Сёренсена — бинарная мера сходства, предложенная датским учёным в 1948 году. Фамилия автора коэффициента в литературе переводится самыми различными способами: Съёренсен, Съеренсен, Соренсен, Серенсен. Вариант «Сёренсен» приводится в известной работе X.X.Трасса. Мера Сёренсена эквивалентна (связаны одной монотонно возрастающей зависимостью) мере Жаккара и мере Сокала-Снита для конечных множеств (множественная интерпретация). На основе индекса Сёренсена получен : . Для случая дескриптивных множеств (дескриптивная интерпретация), в экологии это выборки по обилию, аналогом указанной меры является мера Чекановского: Если сравнивается встречаемость видов (вероятностная интерпретация), то есть учитываются вероятности встреч признаков, то аналогом меры Сёренсена будет симметричная мера Дайса (coincidence index), предложенная Л.Дайсом в 1945 году, в дальнейшем использовался Р.Бреем. Поэтому меру часто называют индексом Дайса-Брея. В некоторых работах используется под названием индекса Дайса или индекса Брея-Кёртиса (реже индекса Ланса-Вильямса): Для информационной аналитической интерпретации мера взаимозависимости была независимо предложена Б. И. Сёмкиным и чешскими авторами. Мера применяется в научных исследованиях для определения степени взаимозависимости двух признаков. (ru) 戴斯系数（Dice coefficient），也称索倫森-戴斯系数（Sørensen–Dice coefficient），取名於和，是一种集合相似度度量函数，通常用于计算两个样本的相似度：它在形式上和Jaccard指数没多大区别，但是有些不同的性质。和Jaccard类似，它的范围为0到1。与Jaccard不同的是，相应的差异函数不是一个合适的距离度量措施，因为它没有三角形不等性的性质。例如给定 {a}, {b}, 和 {a,b}, 前两个集合的距离为1，而第三个集合和其他任意两个集合的距离为三分之一。与Jaccard类似, 集合操作可以用两个向量 A 和B的操作来表示: 上式给出了两个向量的距离输出，也给出了更一般情况下向量之间的相似度度量措施。戴斯系数可以计算两个字符串的相似度：Dice（s1,s2）=2*comm(s1,s2)/(leng(s1)+leng(s2))。其中，comm (s1,s2)是s1、s2 中相同字符的个数leng(s1)，leng(s2)是字符串s1、s2 的长度。在信息检索中, 给定关键词集合X 和Y ，相似度定义为两倍的共同信息(重叠部分)除以基数的总和 : 当作为字符串之间的相似度度量时, 计算两个字符串之间的系数, x 和y，使用 bigrams 公式如下: 其中nt 是两个字符串共有的bigrams的个数, nx 是 x中bigrams的个数，ny 是 y中bigrams的个数。例如要计算下面两个字符串之间的相似度: nightnacht 我们可以在各个单词中得出如下bigrams集合: {ni,ig,gh,ht}{na,ac,ch,ht} 每个集合有4个元素, 这个两个集合只有一个相同的元素: ht. 代入公式我们可以计算出, s = (2 · 1) / (4 + 4) = 0.25. (zh) Індекс Соренсена (Індекс подібності Соренсена) — статистичний коефіцієнт, який використовується для порівняння двох статистичних вибірок. Він був розроблений ботаніком в 1948 році. Індекс Соренсена обраховується за наступною формулою , де А і В число видів в зразках А і В, відповідно. С — число видів, які є спільними для двох зразків. Цей вираз може бути розширеним для визначення поширеності видів замість кількості. Ця кількісна версія індексу Соренсена також відома як . Індекс Соренсена ідентичний до , який має межі [0, 1]. Індекс Соренсена також використовується для вимірювання відстані, 1 — QS, і в такій подачі є ідентичним до і . Коефіцієнт Соренсена найкорисніший для аналізу даних екологічних спільнот (див. Looman & Campbell, 1960)Арґументація щодо його використання є швидше емпірично, ніж теоретично підтвредженою (проте використання цього індексу може аргументуватись теоретично як перетин двох нечітких множин). Якщо порівнювати з відстанню Евкліда, то відстань Соренсена зберігає чутливість в більш гетерогенних наборах даних і дає меншу вагу точкам, які випадають із загальної картини (англ. outliers). (uk)
dbo:wikiPageID	9701718 (xsd:integer)
dbo:wikiPageLength	13796 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID	1096446555 (xsd:integer)
dbo:wikiPageWikiLink	dbr:Morisita's_overlap_index dbr:Botanist dbr:Hugo_Steinhaus dbr:Information_retrieval dbr:Lexicography dbr:Correlation dbr:Thorvald_Sørensen dbc:String_metrics dbr:Hellinger_distance dbr:Overlap_coefficient dbr:Mantel_test dbc:Similarity_measures dbr:Triangle_inequality dbr:Fuzzy_set dbr:E._C._Pielou dbr:Bray–Curtis_dissimilarity dbr:Cardinality dbr:Hamming_distance dbr:Jan_Czekanowski dbr:Renkonen_similarity_index dbr:Tversky_index dbr:Abundance_(ecology) dbc:Measure_theory dbr:Bigram dbr:Jaccard_index dbr:Image_segmentation dbc:Information_retrieval_evaluation dbr:Sample_(statistics) dbr:Similarity_measure dbr:Euclidean_distance dbr:Metric_(mathematics) dbr:Statistic dbr:Most_frequent_k_characters dbr:F1_score dbr:Lee_Raymond_Dice dbr:Universal_adaptive_strategy_theory_(UAST) dbr:String_similarity dbr:Olavi_Renkonen
dbp:wikiPageUsesTemplate	dbt:Reflist dbt:Wikibooks
dcterms:subject	dbc:String_metrics dbc:Similarity_measures dbc:Measure_theory dbc:Information_retrieval_evaluation
gold:hypernym	dbr:Statistic
rdf:type	yago:WikicatStringSimilarityMeasures yago:Abstraction100002137 yago:Act100030358 yago:Action100037396 yago:Choice100161243 yago:Decision100162632 yago:Event100029378 yago:Maneuver100168237 yago:Measure100174412 yago:Move100165942 yago:PsychologicalFeature100023100 yago:YagoPermanentlyLocatedEntity
rdfs:comment	معامل سورنسن-دايس هي طريقة إحصائية تستخدم لمقارنة تشابه اثنين من العينات، تم تطويرها بشكل مستقل من قبل علماء النبات سورنس ودايس وتم نشرها في عام 1948 و عام 1945 على التوالي. (ar) El coeficiente ó índice de Sørensen-Dice, también conocido por otros nombres tales como el índice de Sørensen, coeficiente de Dice, es un estadístico utilizado para comparar la similitud de dos muestras. Fue desarrollado independientemente por los botánicos Thorvald Sørensen y Lee Raymond Dice, que publicaron en 1948 y 1945 respectivamente. (es) L'indice de Sørensen-Dice, connu aussi sous les noms d'indice de Sørensen, coefficient de Dice et ) est un indicateur statistique qui mesure la similarité de deux échantillons. Il a été développé indépendamment par les botanistes Thorvald Sørensen et Lee Raymond Dice dans des articles publiés en 1948 et 1945 respectivement. (fr) The Sørensen–Dice coefficient (see below for other names) is a statistic used to gauge the similarity of two samples. It was independently developed by the botanists Thorvald Sørensen and Lee Raymond Dice, who published in 1948 and 1945 respectively. (en) Indice di similarità di Sørensen misura la somiglianza tra due comunità e si basa su dati di presenza e assenza. Viene definito come il rapporto tra il numero di specie condivise in due siti (s) e il numero di specie presente in ogni sito (a). (it) Współczynnik Sørensena, znany także jako współczynnik podobieństwa Sørensena, to wielkość używana do porównania podobieństwa dwóch próbek. Został wprowadzony przez botanika Thorvalda Sørensena w 1948 roku. Dany jest on wzorem (pl) Мера Сёренсена — бинарная мера сходства, предложенная датским учёным в 1948 году. Фамилия автора коэффициента в литературе переводится самыми различными способами: Съёренсен, Съеренсен, Соренсен, Серенсен. Вариант «Сёренсен» приводится в известной работе X.X.Трасса. Мера Сёренсена эквивалентна (связаны одной монотонно возрастающей зависимостью) мере Жаккара и мере Сокала-Снита для конечных множеств (множественная интерпретация). На основе индекса Сёренсена получен : . (ru) Індекс Соренсена (Індекс подібності Соренсена) — статистичний коефіцієнт, який використовується для порівняння двох статистичних вибірок. Він був розроблений ботаніком в 1948 році. Індекс Соренсена обраховується за наступною формулою , де А і В число видів в зразках А і В, відповідно. С — число видів, які є спільними для двох зразків. (uk) 戴斯系数（Dice coefficient），也称索倫森-戴斯系数（Sørensen–Dice coefficient），取名於和，是一种集合相似度度量函数，通常用于计算两个样本的相似度：它在形式上和Jaccard指数没多大区别，但是有些不同的性质。和Jaccard类似，它的范围为0到1。与Jaccard不同的是，相应的差异函数不是一个合适的距离度量措施，因为它没有三角形不等性的性质。例如给定 {a}, {b}, 和 {a,b}, 前两个集合的距离为1，而第三个集合和其他任意两个集合的距离为三分之一。与Jaccard类似, 集合操作可以用两个向量 A 和B的操作来表示: 上式给出了两个向量的距离输出，也给出了更一般情况下向量之间的相似度度量措施。戴斯系数可以计算两个字符串的相似度：Dice（s1,s2）=2*comm(s1,s2)/(leng(s1)+leng(s2))。其中，comm (s1,s2)是s1、s2 中相同字符的个数leng(s1)，leng(s2)是字符串s1、s2 的长度。在信息检索中, 给定关键词集合X 和Y ，相似度定义为两倍的共同信息(重叠部分)除以基数的总和 : 当作为字符串之间的相似度度量时, 计算两个字符串之间的系数, x 和y，使用 bigrams 公式如下: nightnacht 我们可以在各个单词中得出如下bigrams集合: (zh)
rdfs:label	معامل سورنسن-دايس (ar) Coeficiente de Sorensen-Dice (es) Indice di similarità di Sørensen (it) Indice de Sørensen-Dice (fr) Współczynnik Sørensena (pl) Sørensen–Dice coefficient (en) Коэффициент Сёренсена (ru) Dice系数 (zh) Індекс Соренсена (uk)
owl:sameAs	freebase:Sørensen–Dice coefficient wikidata:Sørensen–Dice coefficient dbpedia-ar:Sørensen–Dice coefficient dbpedia-es:Sørensen–Dice coefficient dbpedia-fr:Sørensen–Dice coefficient dbpedia-it:Sørensen–Dice coefficient dbpedia-pl:Sørensen–Dice coefficient dbpedia-ru:Sørensen–Dice coefficient dbpedia-uk:Sørensen–Dice coefficient dbpedia-zh:Sørensen–Dice coefficient https://global.dbpedia.org/id/2StAu
prov:wasDerivedFrom	wikipedia-en:Sørensen–Dice_coefficient?oldid=1096446555&ns=0
foaf:isPrimaryTopicOf	wikipedia-en:Sørensen–Dice_coefficient
is dbo:wikiPageRedirects of	dbr:Dice_similarity_coefficient dbr:Sørensen-Dice_coefficent dbr:Sørensen-Dice_coefficient dbr:Sørensen_similarity_index dbr:Sørensen–Dice_coefficent dbr:Dice's_coefficient dbr:Dice_coefficient dbr:Sorensen-Dice_coefficient dbr:Sorensen–Dice_coefficient dbr:Sorenson_index dbr:Sorensen_similarity_index
is dbo:wikiPageWikiLink of	dbr:Timeline_of_Polish_science_and_technology dbr:Cosine_similarity dbr:Thorvald_Sørensen dbr:String_metric dbr:Lee_R._Dice dbr:Studierfenster dbr:Cluster_analysis dbr:Mantel_test dbr:Dice_similarity_coefficient dbr:Tversky_index dbr:Bigram dbr:Sørensen-Dice_coefficent dbr:Sørensen-Dice_coefficient dbr:Sørensen_similarity_index dbr:Sørensen–Dice_coefficent dbr:Jaccard_index dbr:Dice's_coefficient dbr:Dice_coefficient dbr:Sorensen-Dice_coefficient dbr:Sorensen–Dice_coefficient dbr:Word_sketch dbr:Semantic_folding dbr:Referring_expression_generation dbr:Sorenson_index dbr:Sorensen_similarity_index
is rdfs:seeAlso of	dbr:Qualitative_variation
is foaf:primaryTopic of	wikipedia-en:Sørensen–Dice_coefficient