An Entity of Type: Election, from Named Graph: http://dbpedia.org, within Data Space: dbpedia.org

In statistics, imputation is the process of replacing missing data with substituted values. When substituting for a data point, it is known as "unit imputation"; when substituting for a component of a data point, it is known as "item imputation". There are three main problems that missing data causes: missing data can introduce a substantial amount of bias, make the handling and analysis of the data more arduous, and create reductions in efficiency. Because missing data can create problems for analyzing data, imputation is seen as a way to avoid pitfalls involved with listwise deletion of cases that have missing values. That is to say, when one or more values are missing for a case, most statistical packages default to discarding any case that has a missing value, which may introduce bias

Property Value
dbo:abstract
  • Chybějící hodnoty v analyzovaných datech mohou způsobovat velmi zásadní zkreslení výsledků a následně tak zapříčinit chybné rozhodnutí. K řešení tohoto problému není příliš vhodné použít tzv. ad-hoc přístupy. Proto byly vyvinuty metodiky pro práci s chybějícími daty, jako například multiple imputation, která může být použita v mnoha odvětvích výzkumu (biomedicíně, sociálnímu výzkumu, atd.). Menší nevýhodou metody MI je, že vyžaduje interakci s uživatelem, protože po vytvoření zvoleného počtu datových souborů se nad nimi provádí analýza, kterou uživatel musí předem stanovit. (cs)
  • Unter dem Begriff Imputation werden in der Mathematischen Statistik Verfahren zusammengefasst, mit denen fehlende Daten in statistischen Erhebungen – die sogenannten Antwortausfälle – in der Datenmatrix vervollständigt werden. Die Schweigeverzerrung, die durch die Antwortausfälle entsteht, wird dadurch verringert. (de)
  • In statistics, imputation is the process of replacing missing data with substituted values. When substituting for a data point, it is known as "unit imputation"; when substituting for a component of a data point, it is known as "item imputation". There are three main problems that missing data causes: missing data can introduce a substantial amount of bias, make the handling and analysis of the data more arduous, and create reductions in efficiency. Because missing data can create problems for analyzing data, imputation is seen as a way to avoid pitfalls involved with listwise deletion of cases that have missing values. That is to say, when one or more values are missing for a case, most statistical packages default to discarding any case that has a missing value, which may introduce bias or affect the representativeness of the results. Imputation preserves all cases by replacing missing data with an estimated value based on other available information. Once all missing values have been imputed, the data set can then be analysed using standard techniques for complete data. There have been many theories embraced by scientists to account for missing data but the majority of them introduce bias. A few of the well known attempts to deal with missing data include: hot deck and cold deck imputation; listwise and pairwise deletion; mean imputation; non-negative matrix factorization; regression imputation; last observation carried forward; stochastic imputation; and multiple imputation. (en)
  • En estadística, la imputación es la sustitución de valores no informados en una observación por otros. A veces es un paso necesario para poder tratar los datos con determinadas técnicas estadísticas de análisis. Idealmente, este análisis debería tener en cuenta el hecho de que algunos de los datos no son observados sino que han sido imputados. Existen diversas técnicas de imputación. (es)
  • En statistique, l’imputation désigne le processus de remplacement des données manquantes avec des valeurs substituées. Quand un point de données est substitué, on parle d’imputation unitaire ; quand une composante de point de données est substituée, on parle d’imputation d'items. Des données manquantes peuvent être à l'origine de trois types de problèmes : * elles peuvent introduire une quantité importante de biais statistiques ; * elles peuvent rendre le traitement et l'analyse des données plus laborieux ; * elles peuvent réduire l'efficacité des méthodes statistiques. L'imputation est considérée comme un moyen d'éviter les pièges liées aux valeurs manquantes, en préservant tous les cas par le remplacement des données manquantes par une valeur estimée basée sur d'autres informations disponibles. Une fois toutes les valeurs manquantes imputées, on peut alors analyser l'ensemble de données à l'aide des techniques standard applicables à des jeux de données complets. De nombreuses techniques ont été développées pour traiter les données manquantes, mais la majorité d'entre elles introduisent des biais. Parmi les plus courantes, on trouve notamment : * la suppression de données manquantes : par liste ou par paires ; * des techniques d'imputation unique : hot deck et cold deck, par la dernière observation reportée, par la moyenne, par factorisation matricielle non négative, par régression, stochastique ; * des techniques d'imputation multiple. (fr)
  • 統計学において、 代入法(だいにゅうほう)とは欠測データを代入値で置き換えるプロセスを指す。 データポイントを置き換える場合はユニット代入、データポイントの構成要素を置き換える場合はアイテム代入と呼ばれる。 欠測データが引き起こす主な問題として、「相当量の偏りをもたらす」「データの処理と分析を困難にする」「効率を低下させる」の 3 つがある 。 欠測データはデータの分析に問題を引き起こす可能性があり、代入は欠測データを持つケースのリストワイズ削除に伴う落とし穴を回避する方法と見なされる。つまり、ほとんどの統計パッケージでは、欠測データのあるケースをデフォルトで破棄するが、それによりバイアスが増えたり、結果の代表性に影響を及ぼしたりする可能性がある。代入法では、欠測データを他の利用可能な情報に基づいた推定値で置き換えることにより、すべてのケースを保持する。 すべての欠測データを代入すると、欠測のないデータ(完全データ)を前提とした標準的な手法を使用してデータセットを分析することができる 。 欠測データを説明するための理論が科学者によっていろいろと採用されてきたが、それらの大部分ではバイアスが増える。 欠測データを処理するための試みとして、ホットデッキ代入法、コールドデッキ代入法、リストワイズ削除、ペアワイズ削除、平均値代入法、非負行列因子分解、回帰代入法、LOCF (last observation carried forward)、確率的代入法、多重代入法などがある。 (ja)
  • 대치법은 결측치가 많은 결측자료가 있을 때 표준이나, 대표성이 있는 다른 데이터를 활용하여 대체 될 수 있는 값들로 계산하여 입력 하는 과정을 일컫는다. 이것은 데이터 분석을 할때, 컴퓨터 프로그램이 죽거나, 치우침을 주는 분석의 오류를 최대한 줄이기 위해, 일종의 가짜 데이터를 산술적으로 집어 넣은 것을 뜻한다. 특히, 게놈연구 분야에서는, 유전자 서열들중에서 해독이 잘 안되어 빠져 있는 경우, 유전자 변이로 처리를 하기가 어렵기 때문에, 일반적으로 많은 대치법을 적용하게 된다. (ko)
  • Imputacja – sztuczne wstawienie pewnych wartości do tabeli danych. Na ogół imputacja jest wykonywana w celu usunięcia tzw. braków danych, czyli wartości nieznanych. Wiele metod statystycznych nie akceptuje bowiem obserwacji z brakami danych. Istnieje wiele różnych metod (ang. missing data imputation), najprostszą jest zastąpienie braków danych średnią ze wszystkich wartości danej zmiennej w próbce. (pl)
  • Imputation innebär att saknade värden i en statistisk undersökning ersätts med värden så att en statistisk analys kan göras av hela materialet. Imputation kan göras på olika sätt metoder, som alla på ett eller annat sätt substituerar de saknade värdena på tidigare förekomna värden. Ett exempel på imputationsteknik är så kallad Hot Deck-imputation, där substitutionsvärdet slumpmässigt dras ur de tidigare förekomna värdena. En annan imputationsteknik som med främst används inom statistisk analys på tidsseriedata är medelvärdesimputation som innebär att ett saknat värde ersätts av ett medelvärde av intilliggande värden. (sv)
dbo:wikiPageExternalLink
dbo:wikiPageID
  • 1309220 (xsd:integer)
dbo:wikiPageLength
  • 20478 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID
  • 1118637345 (xsd:integer)
dbo:wikiPageWikiLink
dbp:wikiPageUsesTemplate
dcterms:subject
gold:hypernym
rdf:type
rdfs:comment
  • Chybějící hodnoty v analyzovaných datech mohou způsobovat velmi zásadní zkreslení výsledků a následně tak zapříčinit chybné rozhodnutí. K řešení tohoto problému není příliš vhodné použít tzv. ad-hoc přístupy. Proto byly vyvinuty metodiky pro práci s chybějícími daty, jako například multiple imputation, která může být použita v mnoha odvětvích výzkumu (biomedicíně, sociálnímu výzkumu, atd.). Menší nevýhodou metody MI je, že vyžaduje interakci s uživatelem, protože po vytvoření zvoleného počtu datových souborů se nad nimi provádí analýza, kterou uživatel musí předem stanovit. (cs)
  • Unter dem Begriff Imputation werden in der Mathematischen Statistik Verfahren zusammengefasst, mit denen fehlende Daten in statistischen Erhebungen – die sogenannten Antwortausfälle – in der Datenmatrix vervollständigt werden. Die Schweigeverzerrung, die durch die Antwortausfälle entsteht, wird dadurch verringert. (de)
  • En estadística, la imputación es la sustitución de valores no informados en una observación por otros. A veces es un paso necesario para poder tratar los datos con determinadas técnicas estadísticas de análisis. Idealmente, este análisis debería tener en cuenta el hecho de que algunos de los datos no son observados sino que han sido imputados. Existen diversas técnicas de imputación. (es)
  • 대치법은 결측치가 많은 결측자료가 있을 때 표준이나, 대표성이 있는 다른 데이터를 활용하여 대체 될 수 있는 값들로 계산하여 입력 하는 과정을 일컫는다. 이것은 데이터 분석을 할때, 컴퓨터 프로그램이 죽거나, 치우침을 주는 분석의 오류를 최대한 줄이기 위해, 일종의 가짜 데이터를 산술적으로 집어 넣은 것을 뜻한다. 특히, 게놈연구 분야에서는, 유전자 서열들중에서 해독이 잘 안되어 빠져 있는 경우, 유전자 변이로 처리를 하기가 어렵기 때문에, 일반적으로 많은 대치법을 적용하게 된다. (ko)
  • Imputacja – sztuczne wstawienie pewnych wartości do tabeli danych. Na ogół imputacja jest wykonywana w celu usunięcia tzw. braków danych, czyli wartości nieznanych. Wiele metod statystycznych nie akceptuje bowiem obserwacji z brakami danych. Istnieje wiele różnych metod (ang. missing data imputation), najprostszą jest zastąpienie braków danych średnią ze wszystkich wartości danej zmiennej w próbce. (pl)
  • In statistics, imputation is the process of replacing missing data with substituted values. When substituting for a data point, it is known as "unit imputation"; when substituting for a component of a data point, it is known as "item imputation". There are three main problems that missing data causes: missing data can introduce a substantial amount of bias, make the handling and analysis of the data more arduous, and create reductions in efficiency. Because missing data can create problems for analyzing data, imputation is seen as a way to avoid pitfalls involved with listwise deletion of cases that have missing values. That is to say, when one or more values are missing for a case, most statistical packages default to discarding any case that has a missing value, which may introduce bias (en)
  • En statistique, l’imputation désigne le processus de remplacement des données manquantes avec des valeurs substituées. Quand un point de données est substitué, on parle d’imputation unitaire ; quand une composante de point de données est substituée, on parle d’imputation d'items. Des données manquantes peuvent être à l'origine de trois types de problèmes : * elles peuvent introduire une quantité importante de biais statistiques ; * elles peuvent rendre le traitement et l'analyse des données plus laborieux ; * elles peuvent réduire l'efficacité des méthodes statistiques. (fr)
  • 統計学において、 代入法(だいにゅうほう)とは欠測データを代入値で置き換えるプロセスを指す。 データポイントを置き換える場合はユニット代入、データポイントの構成要素を置き換える場合はアイテム代入と呼ばれる。 欠測データが引き起こす主な問題として、「相当量の偏りをもたらす」「データの処理と分析を困難にする」「効率を低下させる」の 3 つがある 。 欠測データはデータの分析に問題を引き起こす可能性があり、代入は欠測データを持つケースのリストワイズ削除に伴う落とし穴を回避する方法と見なされる。つまり、ほとんどの統計パッケージでは、欠測データのあるケースをデフォルトで破棄するが、それによりバイアスが増えたり、結果の代表性に影響を及ぼしたりする可能性がある。代入法では、欠測データを他の利用可能な情報に基づいた推定値で置き換えることにより、すべてのケースを保持する。 すべての欠測データを代入すると、欠測のないデータ(完全データ)を前提とした標準的な手法を使用してデータセットを分析することができる 。 欠測データを説明するための理論が科学者によっていろいろと採用されてきたが、それらの大部分ではバイアスが増える。 (ja)
  • Imputation innebär att saknade värden i en statistisk undersökning ersätts med värden så att en statistisk analys kan göras av hela materialet. Imputation kan göras på olika sätt metoder, som alla på ett eller annat sätt substituerar de saknade värdena på tidigare förekomna värden. (sv)
rdfs:label
  • Multiple Imputation (cs)
  • Imputation (Statistik) (de)
  • Imputación (estadística) (es)
  • Imputation (statistique) (fr)
  • Imputation (statistics) (en)
  • 대치법 (통계학) (ko)
  • 代入法 (統計学) (ja)
  • Imputacja (pl)
  • Imputation (sv)
owl:sameAs
prov:wasDerivedFrom
foaf:isPrimaryTopicOf
is dbo:wikiPageDisambiguates of
is dbo:wikiPageRedirects of
is dbo:wikiPageWikiLink of
is foaf:primaryTopic of
Powered by OpenLink Virtuoso    This material is Open Knowledge     W3C Semantic Web Technology     This material is Open Knowledge    Valid XHTML + RDFa
This content was extracted from Wikipedia and is licensed under the Creative Commons Attribution-ShareAlike 3.0 Unported License