Robust statistics provides an alternative approach to classical statistical methods. The motivation is to produce estimators that are not unduly affected by small departures from model assumptions.

PropertyValue
dbpprop:abstract
  • Robust statistics provides an alternative approach to classical statistical methods. The motivation is to produce estimators that are not unduly affected by small departures from model assumptions.
  • Robustes Schätzverfahren ist ein Begriff der Inferenzstatistik. Ein Schätzverfahren oder Testverfahren heißt robust, wenn es nicht sensibel auf Ausreißer (Werte außerhalb eines aufgrund einer Verteilung erwarteten Wertebereiches) reagiert. Die klassischen Schätzmethoden, die in der ersten Hälfte des 20. Jahrhunderts entwickeln wurden, tendieren häufig dazu, bei Vorliegen von Ausreißern in der Stichprobe irreführende Ergebnisse zu liefern. Ein robustes Schätzverfahren orientiert sich deshalb an der Masse der Daten und integriert eine Ausreißeranalyse, um den Einfluss von Modellabweichungen zu reduzieren und ihn bei zunehmender Devianz gegen Null streben zu lassen. Die Entwicklung robuster Schätzer zur Effizienzsteigerung von Schätzverfahren ist seit den 1980er Jahren ein wichtiges Forschungsanliegen in der mathematischen Statistik. Zu den robusten Verfahren gehört zum Beispiel der RANSAC-Algorithmus und Verfahren die eine hohe Bruchpunktresistenz aufweisen. Ein einfaches robustes Schätzverfahren stellt der (empirische) Median dar, den man anstelle des arithmetischen Mittels verwenden kann, um den Erwartungswert einer symmetrischen Verteilung zu schätzen. Den empirischen Median erhält man, indem man die Beobachtungen der Größe nach sortiert und dann den der Reihenfolge nach mittleren Beobachtungswert als Schätzwert wählt. Ein Beispiel: Es werde eine gewisse Zahl von Messungen durchgeführt, um eine physikalische Größe (etwa die Gravitationskonstante) experimentell zu bestimmen. Man nimmt an, dass die auftretenden Messfehler unsystematisch sind und in beide Richtungen gehen können, die Messwerte also mal zu groß, mal zu klein sind; formal genauer: unabhängige und identisch verteilte Beobachtungen mit symmetrischer Verteilung und dem wahren Wert der zu bestimmenden Größe als Erwartungswert. Es gibt nun gelegentlich einzelne Messwerte, die deutlich von den übrigen abweichen („Ausreißer“, die oben beschriebenen Modellabweichungen); sie sind in der Regel auf Fehler bei der Durchführung des Experiments zurückzuführen („verwackeln“ der Apparatur, „verschreiben“ o. ä.). Obwohl extreme Abweichungen eher auf einen Fehler hindeuten und daher solche Beobachtungen eher weniger Einfluss auf das Ergebnis haben sollten, beeinflussen sie das arithmetische Mittel stark; der Einfluss wird sogar umso größer, je deutlicher die Abweichung ist. Der Median hingegen ist gegen solche Ausreißer unempfindlich, also „robust“. Sofern keine Ausreißer vorliegen, liefert er allerdings bei gleicher Zahl von Messwerten im Allgemeinen eine ungenauere Schätzung, da „im Kleinen“ der Schätzwert nur durch eine einzige – nämlich die mittlere – Beobachtung bestimmt wird.
  • La estadística robusta es una aproximación alternativa a los métodos estadísticos clásicos. El objeto es producir estimadores que no sean afectados por variaciones pequeñas respecto a las hipótesis de los modelos. Las estadísticas robustas intentan proporcionar métodos que emulan a los métodos clásicos, pero que no son afectados indebidamente por valores atípicos u otras pequeñas discrepancias respecto de las asunciones del modelo. En estadísticas, los métodos clásicos confían en hipótesis que no se resuelven o no se verifican a menudo en la práctica. Por ejemplo, se asume a menudo que los residuales de los datos están distribuidos normalmente, por lo menos aproximadamente, o que se puede confiar en el Teorema de Límite Central para producir estimaciones normalmente distribuidas. Desafortunadamente, cuando hay valores atípicos en los datos, los resultados producidos por los métodos clásicos son a menudo de baja calidad. Esto puede estudiarse empíricamente examinando la distribución muestral de varios estimadores bajo un modelo de mezcla, en los que se mezcla en una pequeña cantidad (1% a 5%) de contaminación en una muestra dada. Por ejemplo, uno puede utilizar una mezcla de 95% de datos de una distribución normal, con el 5% de datos de otra distribución normal con el mismo promedio pero con una desviación estándar significativamente mayor (los errores). Para cuantificar la robustez de un método, es necesario definir algunas medidas de robustez. Quizás las más comunes de estas medidas sean el punto de quiebre y la función de influencia. Las estadísticas paramétricas robustas tienden a confiar en el reemplazo de la distribución normal de los métodos clásicos por la distribución T con grados de libertad bajos (alta curtosis; se ha encontrado que a menudo grados de libertad de entre 4 y 6 son útiles en la práctica) o con una mezcla de dos o más distribuciones.
  • En statistiques, la robustesse d'un estimateur est sa capacité à ne pas être modifié par une petite modification dans les données ou dans les paramètres du modèle choisi pour l'estimation.
  • Statystyka odpornościowa lub odporne metody statystyczne – gałąź statystyki, obejmująca metody projektowane pod kątem odporności na niewielkie odejście od założeń modelu lub rezygnacji z niektórych założeń.
  • Робастность в статистике предоставляет подходы, направленные на снижение влияния выбросов и других отколонений в исследуемой величине от моделей, используемых в классических методах статистики. На практике наличие в выборках даже небольшого числа резко выделяющихся наблюдений способно фатально повлиять на результат статистического исследования, и значения, получяемые в результате, могут перестать нести в себе какой-либо смысл. Для того, чтобы избежать подобных неприятностей, необходимо каким-то образом снизить влияние «плохих» наблюдений, либо вовсе исключить их. Однако возникает вопрос: «Как отличить „плохое“ наблюдение от „хорошего“?» Даже самый простой из подходов — субъективный (основанный на внутренних ощущениях статистика) — может принести значительную пользу, однако для отбраковки все же предпочтительнее применять методы, имеющие в своей основе некие строгие математические обоснования, а не только интуитивные предположения исследователя. Этот процесс представляет собой весьма нетривиальную задачу для статистика и определяет собой одно из направлений статистической науки.
dbpprop:hasPhotoCollection
dbpprop:reference
rdfs:comment
  • Robust statistics provides an alternative approach to classical statistical methods. The motivation is to produce estimators that are not unduly affected by small departures from model assumptions.
  • Robustes Schätzverfahren ist ein Begriff der Inferenzstatistik. Ein Schätzverfahren oder Testverfahren heißt robust, wenn es nicht sensibel auf Ausreißer (Werte außerhalb eines aufgrund einer Verteilung erwarteten Wertebereiches) reagiert. Die klassischen Schätzmethoden, die in der ersten Hälfte des 20. Jahrhunderts entwickeln wurden, tendieren häufig dazu, bei Vorliegen von Ausreißern in der Stichprobe irreführende Ergebnisse zu liefern.
  • La estadística robusta es una aproximación alternativa a los métodos estadísticos clásicos. El objeto es producir estimadores que no sean afectados por variaciones pequeñas respecto a las hipótesis de los modelos. Las estadísticas robustas intentan proporcionar métodos que emulan a los métodos clásicos, pero que no son afectados indebidamente por valores atípicos u otras pequeñas discrepancias respecto de las asunciones del modelo.
  • En statistiques, la robustesse d'un estimateur est sa capacité à ne pas être modifié par une petite modification dans les données ou dans les paramètres du modèle choisi pour l'estimation.
  • Statystyka odpornościowa lub odporne metody statystyczne – gałąź statystyki, obejmująca metody projektowane pod kątem odporności na niewielkie odejście od założeń modelu lub rezygnacji z niektórych założeń.
  • Робастность в статистике предоставляет подходы, направленные на снижение влияния выбросов и других отколонений в исследуемой величине от моделей, используемых в классических методах статистики.
rdfs:label
  • Robust statistics
  • Robuste Schätzverfahren
  • Estadística robusta
  • Robustesse (Statistiques)
  • Statystyka odpornościowa
  • Робастность в статистике
owl:sameAs
skos:subject
foaf:page
is dbpprop:redirect of