Corrige el sesgo estadístico en la estimación de la varianza poblacional, y algunos (pero no todos) los sesgos en la estimación de la desviación estándar poblacional.
Los términos poblacional y muestral se asocian a su vez a los conceptos anteriormente citados de población y de muestra.
En este cálculo se usa el factor multiplicador 1/n (correspondiente al concepto de media aritmética)— que como se analiza más adelante, es un estimador sesgado a la baja de la varianza poblacional.
A veces[1][2] el factor n/(n − 1) es llamado Corrección de Bessel.
Ya que la raíz cuadrada es una función cóncava, se produce un sesgo por defecto debido a la desigualdad de Jensen.
Sin embargo, el efecto de la corrección es especialmente relevante para muestras pequeñas (formadas por 10 o menos observaciones), como las que Bessel manejaba habitualmente.
Supóngase que la media de cierta población es 2050, pero el estadístico no la conoce.
Por lo tanto, la estima basado en una pequeña muestra elegida al azar de entre la población: Se puede calcular la media muestral: Este valor puede servir como un estimador insesgado de la media poblacional, que es desconocida.
Ahora, hay que enfrentarse al problema de estimar la varianza poblacional.
Por lo tanto, a menos que la muestra tenga como media un valor igual al de la media poblacional, su estimador siempre subestimará la varianza poblacional.
se representa la desviación de una observación individual con respecto a la media muestral, y con
Nótese que lo que se ha hecho ha sido simplemente descomponer la desviación respecto a la media poblacional (que es desconocida) en dos componentes: la desviación respecto a la media muestral -que se conoce- y la desviación adicional respecto a la media poblacional -que se desconoce-.
Ahora, aplicando esta identidad, se descompone: Operando los cuadrados: Ahora se aplica esta fórmula desarrollada a las 5 observaciones, y se analiza el patrón resultante: La suma de los valores de la columna del medio debe ser cero, porque la suma de las desviaciones respecto a la media muestral debe ser cero.
Esta corrección es tan común, que los términos "varianza muestral" y "desvío estándar muestral" se refieren frecuentemente al estimador corregido, usando n − 1.
Sin embargo se debe ser cauto: algunas calculadoras y paquetes estadísticos pueden dar la opción de usar ambos estimadores, o solamente la versión menos usual.
Este artículo usa los siguientes símbolos y definiciones: Las desviaciones estándar se obtienen aplicando la raíz cuadrada a sus varianzas respectivas.
Ya que las desviaciones estándar producen sesgo, la terminología "no corregido" o "corregido" se prefiere para los estimadores de la varianza poblacional.
Una observación muy útil es que para cualquier distribución, la varianza es igual a la mitad del valor esperado de
El resultado requerido se obtiene sustituyendo estas dos fórmulas: