About: Jaccard index

An Entity of Type: Abstraction100002137, from Named Graph: http://dbpedia.org, within Data Space: dbpedia.org:8891

The Jaccard index, also known as the Jaccard similarity coefficient, is a statistic used for gauging the similarity and diversity of sample sets. It was developed by Grove Karl Gilbert in 1884 as his ratio of verification (v) and now is frequently referred to as the Critical Success Index in meteorology. It was later developed independently by Paul Jaccard, originally giving the French name coefficient de communauté, and independently formulated again by T. Tanimoto. Thus, the Tanimoto index or Tanimoto coefficient are also used in some fields. However, they are identical in generally taking the ratio of Intersection over Union. The Jaccard coefficient measures similarity between finite sample sets, and is defined as the size of the intersection divided by the size of the union of the samp

Property Value
dbo:abstract
  • L'índex de Jaccard és una mesura de semblança entre dues particions d'objectes (per exemple, entre les categories resultants d'aplicar dos métodes de categorització). (ca)
  • Der Jaccard-Koeffizient oder Jaccard-Index nach dem Schweizer Botaniker Paul Jaccard (1868–1944) ist eine Kennzahl für die Ähnlichkeit von Mengen. Oft wird er auch nach seiner Definition als IoU (Intersection over Union) bezeichnet. (de)
  • El índice de Jaccard ( IJ ) o coeficiente de Jaccard ( IJ ) mide el grado de similitud entre dos conjuntos, sea cual sea el tipo de elementos. La formulación es la siguiente: Es decir, la cardinalidad de la intersección de ambos conjuntos dividida por la cardinalidad de su unión. Siempre toma valores entre 0 y 1, correspondiente este último a la igualdad total entre ambos conjuntos. En ecología se usa para medir la similitud, disimilitud o distancias (estas dos últimas si se le resta el índice a 1) que existen entre dos estaciones de muestreo, con una formulación equivalente:​IJ: c / (a+b-c) Donde: * a: es el número de especies presentes en la estación A. * b: es el número de especies presentes en la estación B. * c: es el número de especies presentes en ambas estaciones, A y B. Existe otra forma de representar este índice Donde: * a: es el número de especies presentes SOLO en la estación A. * b: es el número de especies presentes SOLO en la estación B. * c: es el número de especies presentes en ambas estaciones, A y B. En este sentido 0 significa que las estaciones no presentan especies en común, y tiende a 1 a medida que aumenta el número de especies compartidas. En informática se utiliza para medir la distancia entre vectores definidos sobre un espacio vectorial booleano (las componentes del vector sólo pueden ser 0 o 1). J(A,B) = |A ∧ B| / |A ∨ B| donde ∧ y ∨ son, respectivamente, las operaciones × (AND) y + (OR) de la lógica booleana, y |A|=∑ai. (es)
  • The Jaccard index, also known as the Jaccard similarity coefficient, is a statistic used for gauging the similarity and diversity of sample sets. It was developed by Grove Karl Gilbert in 1884 as his ratio of verification (v) and now is frequently referred to as the Critical Success Index in meteorology. It was later developed independently by Paul Jaccard, originally giving the French name coefficient de communauté, and independently formulated again by T. Tanimoto. Thus, the Tanimoto index or Tanimoto coefficient are also used in some fields. However, they are identical in generally taking the ratio of Intersection over Union. The Jaccard coefficient measures similarity between finite sample sets, and is defined as the size of the intersection divided by the size of the union of the sample sets: Note that by design, If A intersection B is empty, then J(A,B) = 0. The Jaccard coefficient is widely used in computer science, ecology, genomics, and other sciences, where binary or binarized data are used. Both the exact solution and approximation methods are available for hypothesis testing with the Jaccard coefficient. Jaccard similarity also applies to bags, i.e., Multisets. This has a similar formula, but the symbols mean bag intersection and bag sum (not union). The maximum value is 1/2. The Jaccard distance, which measures dissimilarity between sample sets, is complementary to the Jaccard coefficient and is obtained by subtracting the Jaccard coefficient from 1, or, equivalently, by dividing the difference of the sizes of the union and the intersection of two sets by the size of the union: An alternative interpretation of the Jaccard distance is as the ratio of the size of the symmetric difference to the union. Jaccard distance is commonly used to calculate an n × n matrix for clustering and multidimensional scaling of n sample sets. This distance is a metric on the collection of all finite sets. There is also a version of the Jaccard distance for measures, including probability measures. If is a measure on a measurable space , then we define the Jaccard coefficient by and the Jaccard distance by Care must be taken if or , since these formulas are not well defined in these cases. The MinHash min-wise independent permutations locality sensitive hashing scheme may be used to efficiently compute an accurate estimate of the Jaccard similarity coefficient of pairs of sets, where each set is represented by a constant-sized signature derived from the minimum values of a hash function. (en)
  • Indeks Jaccard (disebut juga koefisien kemiripan Jaccard) adalah ukuran kemiripan dan keragaman himpunan sampel. Indeks ini dikembangkan oleh (awalnya bernama coefficient de communauté) dan dirumuskan secara mandiri oleh T. Tanimoto. Karenanya, istilah indeks Tanimoto atau koefisien Tanimoto juga dipakai dalam bidang-bidang tertentu. Namun, keduanya juga secara umum mengambil rasio Irisan per Gabungan (bahasa Inggris: Intersection over Union/IoU). Indeks ini bisa diukur sebagai berikut: (in)
  • L'indice et la distance de Jaccard sont deux métriques utilisées en statistiques pour comparer la et la (en) entre des échantillons. Elles sont nommées d'après le botaniste suisse Paul Jaccard. (fr)
  • 자카드 지수(Jaccard index)는 두 집합 사이의 를 측정하는 방법 중 하나이다. 자카드 계수(Jaccard coefficient) 또는 자카드 유사도(Jaccard similarity)라고도 한다. 자카드 지수는 0과 1 사이의 값을 가지며, 두 집합이 동일하면 1의 값을 가지고, 공통의 원소가 하나도 없으면 0의 값을 가진다. 자카드 지수는 아래의 식으로 정의된다. (ko)
  • Indeks Jaccarda, współczynnik podobieństwa Jaccarda – statystyka używana do porównywania zbiorów. Współczynnik Jaccarda mierzy podobieństwo między dwoma zbiorami i jest zdefiniowany jako iloraz mocy części wspólnej zbiorów i mocy sumy tych zbiorów: Wartości przyjmowane przez współczynnik Jaccarda zawierają się w podzbiorze zbioru liczb rzeczywistych <0,1>. Jeśli współczynnik Jaccarda przyjmuje wartości bliskie zeru, zbiory są od siebie różne, natomiast gdy jest bliski 1, zbiory są do siebie podobne. (pl)
  • L'indice di Jaccard, noto anche come coefficiente di similarità di Jaccard (originariamente denominato coefficient de communauté da ), è un indice statistico utilizzato per confrontare la similarità e la diversità di insiemi campionari. Il coefficiente di Jaccard misura la similarità tra insiemi campionari, ed è definito come la dimensione dell'intersezione divisa per la dimensione dell'unione degli insiemi campionari: La distanza di Jaccard, che misura la dissimilarità tra insiemi campionari, è complementare al coefficiente di Jaccard e si ottiene sottraendo il coefficiente di Jaccard da 1, o, in modo equivalente, dividendo la differenza delle dimensioni dell'unione e dell'intersezione di due insiemi per la dimensione dell'unione: Questa distanza è propriamente una metrica. (it)
  • Мера Жаккара (коэффициент флористической общности, фр. coefficient de communaute, нем. Gemeinschaftskoeffizient) — бинарная мера сходства, предложенная Полем Жаккаром в 1901 году. : , где а — количество видов на первой пробной площадке, b — количество видов на второй пробной площадке, с — количество видов, общих для 1-й и 2-й площадок. Это первый известный коэффициент сходства. Фамилия автора коэффициента в литературе также переводилась как Жаккард или Джаккард. Коэффициент Жаккара в различных модификациях и записях активно используется в экологии, геоботанике, молекулярной биологии, биоинформатике, геномике, протеиномике, информатике и др. направлениях. Мера Жаккара эквивалентна (связаны одной монотонно возрастающей зависимостью) мере Сёренсена и мере Сокала-Снита для конечных множеств (множественная интерпретация): Меру различия, которая является дополнением до 1 коэффициента сходства Жаккара называют мерой флористического контраста.Для случая дескриптивных множеств (дескриптивная интерпретация), в экологии это выборки по обилию, аналогом указанной меры является мера Ружички: . В частном случае, когда используются компоненты булевых векторов, то есть компоненты, принимающие только два значения 0 и 1 мера известна под названием коэффициента Танимото или расширенного коэффициента Жаккара.Если сравниваются объекты по встречаемости видов (вероятностная интерпретация), то есть учитываются вероятности встреч, то аналогом меры Жаккара будет вероятностная мера Иверсена: . Для информационной аналитической интерпретации используется мера взаимозависимости Райского: Мера различия коэквивалентная мере сходства Жаккара есть расстояние: (ru)
  • Мі́ра Жакка́ра (коефіціє́нт флористи́чної спі́льності, фр. coefficient de communaute, нім. Gemlinschaftskoefficient) — міра подібності, запропонована Полем Жаккаром в 1901 році. Запропонований метод здобув поширення і нині використовується для оцінки подібності скінченних множин, в інформатиці, для пошуку подібних документів, плагіату тощо. Коефіцієнт Jaccard вимірює подібність між множинами і визначається як міра спільної частини, поділена на міру об'єднання множин: (Коли A та B обидві порожні, тоді J(A,B) = 1.) Відстань Жаккара, яка вимірює відмінність множин, є доповненням коефіцієнта Жаккара до 1 і отримується відніманням коефіцієнта Жаккара від 1, або, еквівалентно, діленням різниці мір об'єднання і перетину двох множин на міру об'єднання: Інакше можна пояснити відстань Жаккара, як відношення міри симетричної різниці до об'єднання. Відстань Жаккара є метрикою на множині всіх скінченних множин. (uk)
  • 雅卡尔指数(英語:Jaccard index),又称为交并比(Intersection over Union)、雅卡尔相似系数(Jaccard similarity coefficient),是用于比较样本集的相似性与多样性的统计量。雅卡尔系数能够量度有限样本集合的相似度,其定义为两个集合交集大小与并集大小之间的比例: 如果A与B完全重合,则定义J(A,B) = 1。于是有 雅卡尔距离(Jaccard distance)则用于量度样本集之间的不相似度,其定义为1减去雅卡尔系数,即 此外,亦有人将雅卡尔距离定义两集合对称差的大小与并集大小之间的比例。 雅卡尔距离是所有有限样本集合间的度量。 (zh)
dbo:thumbnail
dbo:wikiPageExternalLink
dbo:wikiPageID
  • 2203756 (xsd:integer)
dbo:wikiPageLength
  • 26378 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID
  • 1114464621 (xsd:integer)
dbo:wikiPageWikiLink
dbp:direction
  • vertical (en)
dbp:footer
  • Intersection over Union as a similarity measure for object detection on images - an important task in computer vision. (en)
  • Intersection and union of two sets A and B (en)
dbp:image
  • Intersection over Union - poor, good and excellent score.png (en)
  • Intersection of sets A and B.svg (en)
  • Intersection over Union - visual equation.png (en)
  • Union of sets A and B.svg (en)
  • Intersection over Union - object detection bounding boxes.jpg (en)
dbp:width
  • 200 (xsd:integer)
  • 300 (xsd:integer)
dbp:wikiPageUsesTemplate
dcterms:subject
rdf:type
rdfs:comment
  • L'índex de Jaccard és una mesura de semblança entre dues particions d'objectes (per exemple, entre les categories resultants d'aplicar dos métodes de categorització). (ca)
  • Der Jaccard-Koeffizient oder Jaccard-Index nach dem Schweizer Botaniker Paul Jaccard (1868–1944) ist eine Kennzahl für die Ähnlichkeit von Mengen. Oft wird er auch nach seiner Definition als IoU (Intersection over Union) bezeichnet. (de)
  • Indeks Jaccard (disebut juga koefisien kemiripan Jaccard) adalah ukuran kemiripan dan keragaman himpunan sampel. Indeks ini dikembangkan oleh (awalnya bernama coefficient de communauté) dan dirumuskan secara mandiri oleh T. Tanimoto. Karenanya, istilah indeks Tanimoto atau koefisien Tanimoto juga dipakai dalam bidang-bidang tertentu. Namun, keduanya juga secara umum mengambil rasio Irisan per Gabungan (bahasa Inggris: Intersection over Union/IoU). Indeks ini bisa diukur sebagai berikut: (in)
  • L'indice et la distance de Jaccard sont deux métriques utilisées en statistiques pour comparer la et la (en) entre des échantillons. Elles sont nommées d'après le botaniste suisse Paul Jaccard. (fr)
  • 자카드 지수(Jaccard index)는 두 집합 사이의 를 측정하는 방법 중 하나이다. 자카드 계수(Jaccard coefficient) 또는 자카드 유사도(Jaccard similarity)라고도 한다. 자카드 지수는 0과 1 사이의 값을 가지며, 두 집합이 동일하면 1의 값을 가지고, 공통의 원소가 하나도 없으면 0의 값을 가진다. 자카드 지수는 아래의 식으로 정의된다. (ko)
  • Indeks Jaccarda, współczynnik podobieństwa Jaccarda – statystyka używana do porównywania zbiorów. Współczynnik Jaccarda mierzy podobieństwo między dwoma zbiorami i jest zdefiniowany jako iloraz mocy części wspólnej zbiorów i mocy sumy tych zbiorów: Wartości przyjmowane przez współczynnik Jaccarda zawierają się w podzbiorze zbioru liczb rzeczywistych <0,1>. Jeśli współczynnik Jaccarda przyjmuje wartości bliskie zeru, zbiory są od siebie różne, natomiast gdy jest bliski 1, zbiory są do siebie podobne. (pl)
  • 雅卡尔指数(英語:Jaccard index),又称为交并比(Intersection over Union)、雅卡尔相似系数(Jaccard similarity coefficient),是用于比较样本集的相似性与多样性的统计量。雅卡尔系数能够量度有限样本集合的相似度,其定义为两个集合交集大小与并集大小之间的比例: 如果A与B完全重合,则定义J(A,B) = 1。于是有 雅卡尔距离(Jaccard distance)则用于量度样本集之间的不相似度,其定义为1减去雅卡尔系数,即 此外,亦有人将雅卡尔距离定义两集合对称差的大小与并集大小之间的比例。 雅卡尔距离是所有有限样本集合间的度量。 (zh)
  • The Jaccard index, also known as the Jaccard similarity coefficient, is a statistic used for gauging the similarity and diversity of sample sets. It was developed by Grove Karl Gilbert in 1884 as his ratio of verification (v) and now is frequently referred to as the Critical Success Index in meteorology. It was later developed independently by Paul Jaccard, originally giving the French name coefficient de communauté, and independently formulated again by T. Tanimoto. Thus, the Tanimoto index or Tanimoto coefficient are also used in some fields. However, they are identical in generally taking the ratio of Intersection over Union. The Jaccard coefficient measures similarity between finite sample sets, and is defined as the size of the intersection divided by the size of the union of the samp (en)
  • El índice de Jaccard ( IJ ) o coeficiente de Jaccard ( IJ ) mide el grado de similitud entre dos conjuntos, sea cual sea el tipo de elementos. La formulación es la siguiente: Es decir, la cardinalidad de la intersección de ambos conjuntos dividida por la cardinalidad de su unión. Siempre toma valores entre 0 y 1, correspondiente este último a la igualdad total entre ambos conjuntos. En ecología se usa para medir la similitud, disimilitud o distancias (estas dos últimas si se le resta el índice a 1) que existen entre dos estaciones de muestreo, con una formulación equivalente:​IJ: c / (a+b-c) (es)
  • L'indice di Jaccard, noto anche come coefficiente di similarità di Jaccard (originariamente denominato coefficient de communauté da ), è un indice statistico utilizzato per confrontare la similarità e la diversità di insiemi campionari. Il coefficiente di Jaccard misura la similarità tra insiemi campionari, ed è definito come la dimensione dell'intersezione divisa per la dimensione dell'unione degli insiemi campionari: Questa distanza è propriamente una metrica. (it)
  • Мі́ра Жакка́ра (коефіціє́нт флористи́чної спі́льності, фр. coefficient de communaute, нім. Gemlinschaftskoefficient) — міра подібності, запропонована Полем Жаккаром в 1901 році. Запропонований метод здобув поширення і нині використовується для оцінки подібності скінченних множин, в інформатиці, для пошуку подібних документів, плагіату тощо. Коефіцієнт Jaccard вимірює подібність між множинами і визначається як міра спільної частини, поділена на міру об'єднання множин: (Коли A та B обидві порожні, тоді J(A,B) = 1.) Відстань Жаккара є метрикою на множині всіх скінченних множин. (uk)
  • Мера Жаккара (коэффициент флористической общности, фр. coefficient de communaute, нем. Gemeinschaftskoeffizient) — бинарная мера сходства, предложенная Полем Жаккаром в 1901 году. : , где а — количество видов на первой пробной площадке, b — количество видов на второй пробной площадке, с — количество видов, общих для 1-й и 2-й площадок. Это первый известный коэффициент сходства. Фамилия автора коэффициента в литературе также переводилась как Жаккард или Джаккард. Коэффициент Жаккара в различных модификациях и записях активно используется в экологии, геоботанике, молекулярной биологии, биоинформатике, геномике, протеиномике, информатике и др. направлениях. Мера Жаккара эквивалентна (связаны одной монотонно возрастающей зависимостью) мере Сёренсена и мере Сокала-Снита для конечных множеств (м (ru)
rdfs:label
  • Índex de Jaccard (ca)
  • Jaccard-Koeffizient (de)
  • Índice de Jaccard (es)
  • Indice et distance de Jaccard (fr)
  • Indeks Jaccard (in)
  • Jaccard index (en)
  • Indice di Jaccard (it)
  • 자카드 지수 (ko)
  • Indeks Jaccarda (pl)
  • Коэффициент Жаккара (ru)
  • 雅卡尔指数 (zh)
  • Коефіцієнт Жаккара (uk)
owl:sameAs
prov:wasDerivedFrom
foaf:depiction
foaf:isPrimaryTopicOf
is dbo:wikiPageDisambiguates of
is dbo:wikiPageRedirects of
is dbo:wikiPageWikiLink of
is foaf:primaryTopic of
Powered by OpenLink Virtuoso    This material is Open Knowledge     W3C Semantic Web Technology     This material is Open Knowledge    Valid XHTML + RDFa
This content was extracted from Wikipedia and is licensed under the Creative Commons Attribution-ShareAlike 3.0 Unported License