La estadística tiene que agradecerle a Guinness por la prueba t de Student. Crédito:Flickr / Scott Thompson, CC BY
Este día de San Patricio, juerguistas de todo el mundo se agolpan en las calles en busca de una de las bebidas nacionales de Irlanda:una pinta de Guinness. Pero además de esta sabrosa cerveza negra, Una de las herramientas científicas más fundamentales y de uso común también tiene sus orígenes en la fábrica de cerveza Guinness.
Hacia finales del siglo XIX, Guinness estaba ampliando sus operaciones, y estaba interesado en aplicar un enfoque científico a todos los aspectos de la producción de Guinness:desde el crecimiento de la cebada hasta el sabor Guinness.
Antes de adoptar un enfoque científico, los cerveceros de Guinness se basaron en métodos subjetivos, como la apariencia y el aroma del lúpulo, para evaluar la calidad de los productos.
Ciencia en la cerveza
Una vez que se contrató a los cerveceros científicos, se adoptó un enfoque más objetivo. El primer cervecero científico, Caso Thomas Bennett, Fue contratado en 1893 y creía que la cantidad de resinas blandas en el lúpulo estaba relacionada con la calidad de Guinness. Por tanto, deseaba estimar la cantidad de resina blanda en cultivos concretos de lúpulo.
El desafío que enfrentó Case fue que él, como cualquier científico, no podía medir todo a la vez. No le fue posible evaluar la cantidad de resina blanda en cada una de las innumerables flores de lúpulo (sumadas por miles a enormes cubas de la futura Guinness) a su cargo.
En lugar de, tomó una muestra de lúpulo (11 medidas de 50 gramos cada una) y calculó el contenido promedio de resina blanda. Su esperanza era que el contenido promedio de resina blanda de su pequeña muestra pudiera usarse para estimar el contenido de resina blanda de toda la cosecha (lo que los estadísticos llamarían "la población") de lúpulo.
Para comparacion, un colega tomó otras 14 mediciones de 50 gramos cada una del mismo lote de lúpulo. Case encontró una pequeña diferencia en la cantidad promedio de resinas blandas entre estas muestras.
Estaba perplejo. ¿Fueron estas diferencias en el contenido de lúpulo debido a diferencias reales en toda la cosecha de lúpulo, ¿O se debieron a un error aleatorio introducido al utilizar tamaños de muestra pequeños?
El tamaño importa
En el momento, las estadísticas se basaron en lo que se denomina "teoría de muestras grandes", lo que, como era de esperar, requiere muestras grandes (150 o más) para funcionar. Aplicarlo a problemas que involucran muestras pequeñas (como los que enfrentó Case en Guinness) fue difícil.
Este fue el problema que William Sealy Gosset, un recién graduado de química y matemáticas en la Universidad de Oxford, estaba ansioso por abordar. Gosset comenzó a trabajar como aprendiz de cervecero en la fábrica de Guinness en Dublín en 1899.
En 1906, Gosset, ahora un estadístico autodidacta, fue a estudiar con Karl Pearson, una figura destacada en estadística, en el University College de Londres.
Gosset estaba dispuesto a adaptar los métodos de muestra grande de Pearson para tratar las muestras pequeñas que usaban en Guinness. Allí, desarrolló sus ideas y las preparó para su publicación.
Sin embargo, hasta finales de la década de 1930, Guinness no permitiría a los empleados publicar con sus propios nombres por temor a que otros cerveceros se enteraran de sus enfoques científicos sobre la cerveza. Como resultado, Gosset publicó su artículo más importante, El error probable de una media, bajo el seudónimo de "Estudiante" en la revista Biometrika en 1908.
Este fue el origen de la prueba t de Student, un método estadístico fundamental que se utiliza ampliamente hasta el día de hoy.
Prueba t de Student
El problema que enfrentó Case fue que el uso de pequeñas muestras de lúpulo introduce una nueva fuente de incertidumbre en el análisis, dejándolo menos capaz de distinguir entre lo real, verdaderas diferencias entre dos lotes de lúpulo y diferencias debidas a esta incertidumbre.
El genio de Gosset fue idear una forma de explicar esto:la distribución t. Esto define matemáticamente la relación entre el tamaño de la muestra y la cantidad de incertidumbre que esto impone.
Básicamente, al realizar experimentos, la distribución t (y la famosa prueba t que depende de ella) permite que los cerveceros y los científicos tengan en cuenta el tamaño de la muestra que han utilizado en su trabajo, y luego definir qué tan confiados están en sus hallazgos.
Siguiendo con el caso de los cerveceros, tendrías información de las dos muestras, como el contenido medio de resina blanda de los lúpulos y la dispersión de cada medición alrededor del promedio de cada muestra.
Sin entrar en demasiados detalles, la prueba t ayuda a determinar si existe evidencia de una diferencia entre los dos promedios según el tamaño de la muestra (es decir, el número de mediciones tomadas de un cultivo de lúpulo en particular). En el caso de los cerveceros, buscaban una diferencia cero entre sus dos muestras.
Un legado duradero
El método de Gosset no llamó la atención de la comunidad estadística hasta otra figura estadística destacada, Ronald Aylmer Fisher, abrazó con entusiasmo el método y proporcionó una prueba matemática.
Desde ese tiempo, la prueba t se ha utilizado para abordar una amplia gama de problemas científicos, a partir de la evaluación de la función cerebral en pacientes con accidente cerebrovascular, a la medición del contenido de carbono y nitrógeno en bacterias que habitan en los océanos costeros, a cómo el comportamiento de los mineros del carbón puede conducir o no a accidentes (el consumo de Guinness por estos mineros fue, quizás como era de esperar, no es un foco del estudio).
De hecho, La prueba t de Student se ha empleado en prácticamente todos los campos de la actividad científica:biología, física, psicología, biometría, economía y medicina.
Es un elemento básico de las estadísticas de pregrado que se enseñan en estas disciplinas, pero es posible que pocos sean conscientes del papel de Gosset en la creación de la prueba t y sus razones de cerveza para hacerlo.
Gosset permaneció en Guinness durante toda su vida como Jefe de Cervecería Experimental, luego Jefe del Departamento de Estadística que formó en Guinness, antes de su ascenso a Head Brewer para la nueva fábrica de cerveza Guinness en Londres en 1935. Publicó varios artículos como "Estudiante", pero su verdadera identidad sólo se reveló públicamente tras su muerte en 1937.
Entonces, si estás bebiendo una Guinness este día de San Patricio, levante una copa al personaje poco conocido que jugó un papel fundamental en la cerveza, estadísticas y, de hecho, ciencia moderna:William Sealy Gosset.
Este artículo se publicó originalmente en The Conversation. Lea el artículo original.