In statistics, contingency tables are used to record and analyse the relationship between two or more variables, most usually categorical variables. Suppose that we have two variables, sex (male or female) and handedness (right- or left-handed). We observe the values of both variables in a random sample of 100 people.

PropertyValue
dbpprop:abstract
  • In statistics, contingency tables are used to record and analyse the relationship between two or more variables, most usually categorical variables. Suppose that we have two variables, sex (male or female) and handedness (right- or left-handed). We observe the values of both variables in a random sample of 100 people. Then a contingency table can be used to express the relationship between these two variables, as follows: The figures in the right-hand column and the bottom row are called marginal totals and the figure in the bottom right-hand corner is the grand total. The table allows us to see at a glance that the proportion of men who are right-handed is about the same as the proportion of women who are right-handed. However the two proportions are not identical, and the statistical significance of the difference between them can be tested with a Pearson's chi-square test, a G-test or Fisher's exact test or Barnard's test, provided the entries in the table represent a random sample from the population contemplated in the null hypothesis. If the proportions of individuals in the different columns varies between rows (and, therefore, vice versa) we say that the table shows contingency between the two variables. If there is no contingency, we say that the two variables are independent. The example above is for the simplest kind of contingency table, in which each variable has only two levels; this is called a 2 x 2 contingency table. In principle, any number of rows and columns may be used. There may also be more than two variables, but higher order contingency tables are hard to represent on paper. The relationship between ordinal variables, or between ordinal and categorical variables, may also be represented in contingency tables, though this is less often done since the distributions of ordinal variables can be summarised efficiently by the median. The degree of association between the two variables can be assessed by a number of coefficients: the simplest is the phi coefficient defined by <math>\phi=\sqrt{\frac{\chi^2}{N}}</math> where χ is derived from the Pearson test, and N is the grand total number of observations. φ varies from 0 (corresponding to no association between the variables) to 1 (complete association). This coefficient can only be used for 2 x 2 tables. Alternatives include the tetrachoric correlation coefficient (also only useful for 2 × 2 tables), the contingency coefficient C and Cramér's V. C suffers from the disadvantage that it does not reach a maximum of 1 with complete association in asymmetrical tables (those where the numbers of row and columns are not equal). The tetrachoric correlation coefficient the Pearson product-moment correlation coefficient between hypothetical row and column variables with Normal distributions, that would reproduce the observed contingency table if they were divided into two categories in the appropriate proportions. It should not be confused with the Pearson product-moment correlation coefficient computed by assigning values 0 and 1 to the cells. In tables with more than two levels for each variable an analogous quantity is called the polychoric correlation coefficient. The formulae for the other coefficients are: <math>C=\sqrt{\frac{\chi^2}{N+\chi^2}}</math> <math>V=\sqrt{\frac{\chi^2}{N(k-1)}}</math> k being the number of rows or the number of columns, whichever is less. C can be adjusted so it reaches a maximum of 1 when there is complete association in a table of any number of rows and columns by dividing it by <math>\sqrt{\frac{k-1}{k}}</math>. The term contingency table was first used by Karl Pearson in "On the Theory of Contingency and its Relation to Association and Normal Correlation" in Drapers' Company Research Memoirs (1904) Biometric Series I.
  • Kontingenztafeln (Kontingenztabellen) sind Kreuztabellen. Sie enthalten die absoluten Häufigkeiten oder relativen Häufigkeiten(Häufigkeitstabellen) von Kombinationen bestimmter Merkmalsausprägungen. Kontingenz hat dabei die Bedeutung des gemeinsamen Auftretens von zwei Merkmalen. Das bedeutet, es werden Häufigkeiten für mehrere miteinander durch „und“ oder „sowie“ verknüpfte Merkmale dargestellt. Diese Häufigkeiten werden ergänzt durch deren Randsummen, die die sogenannten Randhäufigkeiten bilden. Der häufige Spezialfall einer Kontingenztabelle mit zwei Merkmalen ist eine Konfusionsmatrix. Die statistische Auswertung einer Kontingenztafel erfolgt mit dem Chi-Quadrat-Test. Der Exakte Fisher-Test ist ein Signifikanztest auf Unabhängigkeit in der Kontingenztafel. Im Gegensatz zu einer normalen ("flachen") Tabelle, die in der 1. Zeile Attributnamen und in allen weiteren Zeilen Ausprägungen dieser Attribute besitzt, enthalten in einer Kreuztabelle sowohl Zeilen- als auch Spaltenüberschriften Merkmalsausprägungen und am Schnittpunkt der entsprechenden Spalte und Zeile wird ein Wert dargestellt, der von den in der jeweiligen Spalte und Zeile angegebenen Merkmalen abhängt. Siehe folgendes Beispiel.
  • Kontingenční tabulka se užívá k přehledné vizualizaci vzájemného vztahu dvou statistických znaků. Řádky kontingenční tabulky odpovídají možným hodnotám prvního znaku, sloupce pak možným hodnotám druhého znaku. V příslušné buňce kontingenční tabulky je pak zařazen počet případů, kdy zároveň měl první znak hodnotu odpovídající příslušnému řádku a druhý znak hodnotu odpovídající příslušnému sloupci. Například prvním znakem může být pohlaví člověka a druhým znakem měsíc jeho narození. Kontingenční tabulka o 2 řádcích (žena, muž) a 12 sloupcích (leden, únor,…, prosinec) pak popisuje počty výskytů všech kombinací pohlaví a měsíce v nějakém souboru sledovaných jedinců. Je možné, aby jeden řádek či sloupec odpovídal více možným hodnotám znaku. To se děje v případě, kdy znak nabývá některých hodnot příliš zřídka, takže je vhodné spojit více možných hodnot. Součty všech hodnot v každém řádku, resp. sloupci nesou informaci o počtu výskytů jevů, při nichž nabyl první (resp. druhý znak) příslušné hodnoty bez ohledu na hodnotu druhého (resp. prvního) znaku. Kromě prostého popisu četností kombinací hodnot dvou znaků nabízí kontingenční tabulka možnost testovat, zda mezi oběma znaky existuje nějaký vztah. K tomu lze užít např. test dobré shody. Znaky užité k zobrazení v kontingenční tabulce pak musí představovat diskrétní hodnoty (je možné tedy využít kvalitativní, diskrétně kvantitativní či spojitě kvantitativní znaky, v posledním případě však pouze s rozdělením jednotlivých znaků do skupin – tzv. skupinové třídění).
  • En estadística las tablas de contingencia se emplean para registrar y analizar la relación entre dos o más variables, habitualmente de naturaleza cualitativa -nominales u ordinales-. Supóngase que se dispone de dos variables, la primera el sexo (hombre o mujer) y la segunda que recoge si el individuo es zurdo o diestro. Se ha observado esta pareja de variables en una muestra aleatoria de 100 individuos. Se puede emplear una tabla de contingencia para expresar la relación entre estas dos variables, del siguiente modo: Las cifras en la columna de la derecha y en la fila inferior reciben el nombre de frecuencias marginales y la cifra situada en la esquina inferior derecha es el gran total. La tabla nos permite ver de un vistazo que la proporción de hombres diestros es aproximadamente igual a la proporción de mujeres diestras. Sin embargo, ambas proporciones no son idénticas y la significación estadística de la diferencia entre ellas puede ser evaluada con la prueba χ² de Pearson, supuesto que las cifras de la tabla son una muestra aleatoria de una población. Si la proporción de individuos en cada columna varía entre las diversas filas y viceversa, se dice que existe asociación entre las dos variables. Si no existe asociación se dice que ambas variables son independientes. El grado de asociación entre dos variables se puede evaluar empleando distintos coeficientes: el más simple es el coeficiente phi que se define por φ = √(χ / N) donde χ se deriva del test de Pearson, y N es el total de observaciones -el gran total-. Φ puede oscilar entre 0 (que indica que no existe asociación entre las variables) e infinito. A diferencia de otras medidas de asociación, el coeficiente Φ de Cramer no está acotado.
  • Le tabelle di contingenza sono un particolare tipo di tabelle a doppia entrata (cioè tabelle con etichette di riga e di colonna), utilizzate in statistica per rappresentare e analizzare le relazioni tra due o più variabili. In esse si riportano le frequenze congiunte delle variabili. Il caso più semplice è quello delle tabelle tetracoriche, in cui ciascuna delle due variabili assume solo due possibili valori, ad esempio: Dove, tra le 100 persone esaminate, 30 presentano capelli biondi, 40 occhi chiari e soltanto 21 hanno capelli biondi e occhi chiari. Da questi dati è possibile ricavare i dati restanti della tabella. Utilizzando le tabelle di contingenza e operando specifici calcoli su di esse, si può arrivare a determinare la dipendenza o indipendenza tra le due variabili considerate, in base al valore assunto dall’indice di contingenza quadratico <math> X^2 </math> . Le due variabili considerate sono di tipo quantitativo discreto o qualitativo. Indicando tali variabili con X e Y e rispettivamente con <math> x_i </math> (i = 1,2,…,h) e <math> y_j </math> (j=1,2,…,k) le modalità rilevate per le due variabili, ad ogni coppia (<math> x_i </math>,<math> y_j </math>) si fa corrispondere nella tabella la sua frequenza associata <math> n_{i,j} </math>, cioè il numero di elementi, tra gli n della popolazione, che possiedono contemporaneamente la modalità di <math> x_i </math> di X e <math> y_j </math> di Y. dove <math>n_{i,. } = \sum_{j-1}^k n_{i,j}</math> (i = 1,2,…,h) rappresenta le frequenze marginali assolute di X <math>n_{. ,j} = \sum_{i-1}^h n_{i,j}</math> (j = 1,2,…,k) rappresenta le frequenze marginali assolute di Y Ovviamente, sommando tutte le frequenze assolute presenti nella tabella, troveremo la numerosità n della popolazione: <math>\sum_{i-1}^h \sum_{j-1}^k n_{i,j} = \sum_{i-1}^h n_{i,. } = \sum_{j-1}^k n_{. ,j} = n </math> Dalle frequenze assolute <math>n_{i,j}</math> si ottengono le frequenze relative <math>f_{i,j}</math> calcolando: <math>f_{i,j} = \left(\frac{n_{i,j}}{n}\right)</math>
  • Een kruistabel wordt in de statistiek gebruikt om snel een globaal visueel inzicht te krijgen in het verloop van en het mogelijk verband tussen twee of meer variabelen. Het meetniveau van de variabelen is nominaal of ordinaal. Variabelen van een hoger meetniveau kunnen op nominaal of ordinaal niveau weergegeven worden door groepering in klassen.
  • Em estatística, as tabelas de contingência são usadas para registar e analisar o relacionamento entre duas ou mais variáveis, normalmente de escala nominal. Suponhamos que temos duas variáveis, sexo (masculino ou feminino) e mão com que escreve (destro ou canhoto). Observamos os valores de ambas as variáveis de uma amostra casual de 100 pessoas. Uma tabela de contingência pode ser usada para expressar o relacionamento entre estas duas variáveis, como se segue:
dbpprop:date
  • September 2008
dbpprop:discuss
  • Talk:Cross tabulation Merge proposal
dbpprop:hasPhotoCollection
dbpprop:reference
dbpprop:wikiPageUsesTemplate
rdfs:comment
  • In statistics, contingency tables are used to record and analyse the relationship between two or more variables, most usually categorical variables. Suppose that we have two variables, sex (male or female) and handedness (right- or left-handed). We observe the values of both variables in a random sample of 100 people.
  • Kontingenztafeln (Kontingenztabellen) sind Kreuztabellen. Sie enthalten die absoluten Häufigkeiten oder relativen Häufigkeiten(Häufigkeitstabellen) von Kombinationen bestimmter Merkmalsausprägungen. Kontingenz hat dabei die Bedeutung des gemeinsamen Auftretens von zwei Merkmalen. Das bedeutet, es werden Häufigkeiten für mehrere miteinander durch „und“ oder „sowie“ verknüpfte Merkmale dargestellt.
  • Kontingenční tabulka se užívá k přehledné vizualizaci vzájemného vztahu dvou statistických znaků. Řádky kontingenční tabulky odpovídají možným hodnotám prvního znaku, sloupce pak možným hodnotám druhého znaku. V příslušné buňce kontingenční tabulky je pak zařazen počet případů, kdy zároveň měl první znak hodnotu odpovídající příslušnému řádku a druhý znak hodnotu odpovídající příslušnému sloupci.
  • En estadística las tablas de contingencia se emplean para registrar y analizar la relación entre dos o más variables, habitualmente de naturaleza cualitativa -nominales u ordinales-. Supóngase que se dispone de dos variables, la primera el sexo (hombre o mujer) y la segunda que recoge si el individuo es zurdo o diestro. Se ha observado esta pareja de variables en una muestra aleatoria de 100 individuos.
  • Le tabelle di contingenza sono un particolare tipo di tabelle a doppia entrata (cioè tabelle con etichette di riga e di colonna), utilizzate in statistica per rappresentare e analizzare le relazioni tra due o più variabili. In esse si riportano le frequenze congiunte delle variabili.
  • Een kruistabel wordt in de statistiek gebruikt om snel een globaal visueel inzicht te krijgen in het verloop van en het mogelijk verband tussen twee of meer variabelen. Het meetniveau van de variabelen is nominaal of ordinaal. Variabelen van een hoger meetniveau kunnen op nominaal of ordinaal niveau weergegeven worden door groepering in klassen.
  • Em estatística, as tabelas de contingência são usadas para registar e analisar o relacionamento entre duas ou mais variáveis, normalmente de escala nominal. Suponhamos que temos duas variáveis, sexo (masculino ou feminino) e mão com que escreve (destro ou canhoto). Observamos os valores de ambas as variáveis de uma amostra casual de 100 pessoas. Uma tabela de contingência pode ser usada para expressar o relacionamento entre estas duas variáveis, como se segue:
rdfs:label
  • Contingency table
  • Kontingenztafel
  • Kontingenční tabulka
  • Tabla de contingencia
  • Tabella di contingenza
  • Kruistabel
  • Tabela de contingência
owl:sameAs
skos:subject
foaf:page
is dbpprop:redirect of