Paradoja de Berkson

Específicamente, surge cuando existe un sesgo muestral inherente al diseño de un estudio.

A menudo se describe en los campos de la estadística médica o la bioestadística, como en la descripción original del problema por Joseph Berkson.

Ese resultado se obtendrá sin importar si exista cualquiera asociación entre la diabetes y la colecistitis sobre el público en general.

Un ejemplo presentado por Jordan Ellenberg es así: supongamos que Alex solo saldrá con un hombre si su amabilidad más su hermosura superan un cierto umbral.

Si un observador solo considera las estampillas en exhibición, observará una relación negativa espuria entre la belleza y la rareza como resultado del sesgo de selección (es decir, la falta de belleza indica fuertemente la rareza en la exhibición, pero no en la colección total).

(Este papel a menudo se cita mal como Berkson, J. (1949) Biological Bulletin 2, 47–53.)

Un ejemplo de la paradoja de Berkson:
En la figura 1, suponga que el talento y el atractivo no estén correlacionados en la gente.
En la figura 2, alguien que tome muestras de la población por celebridades puede inferir erróneamente que el talento se correlacione negativamente con el atractivo, ya que gente ni talentosa ni atractiva normalmente no se convierte en celebridades.
Una ilustración de la paradoja de Berkson. El gráfico superior representa la distribución real, en la que se observa una correlación positiva entre la calidad de las hamburguesas y la de las papas fritas. Sin embargo, alguien que no come en ningún lugar donde ambos sean malos observa solo la distribución en el gráfico inferior, que parece mostrar una correlación negativa.