
¿Es un tamaño de muestra de n = 6 un número “Mágico”?
El análisis estadístico muestra cuántos análisis son necesarios para entregar un resultado estimado confiable
SOLUCIONES ESTADÍSTICAS
Chris Burgess
El análisis estadístico muestra cuántos análisis son necesarios para entregar un resultado estimado confiable
Los fabricantes se apoyan en los químicos analíticos para llevar a cabo análisis y pruebas de muestras para asegurar que los productos están conformes con las especificaciones y para pronosticar las propiedades del lote basadas en el análisis de una muestra. Suponga por un momento que una muestra es representativa del lote. ¿Cuántos análisis de la muestra son necesarios para obtener un resultado estimado confiable que sea aplicable al lote? Esta pregunta tiene implicaciones financieras asó como técnicas. Los negocios necesitan -y los reguladores requieren- que se hayan hecho análisis para dar una respuesta dentro de un nivel de confianza.
Cuando se analiza un número de muestras de un lote, los analistas habitualmente estiman el valor para el lote sacando un promedio y la confianza en éste calculando su desviación estándar. En otras palabras, ellos adoptan un modelo matemático que describe la forma de los datos analíticos continuos y les permite estimar dos parámetros que definen la distribución: una medida de ubicación (en este caso la media) y una medida de la dispersión (la varianza o la desviación estándar). La distribución para los datos analíticos de este tipo generalmente se asume que es una distribución normal o Gaussiana.
El cálculo del promedio no es un estadístico real ¿verdad?
Sobre esta base, el cálculo de la humilde media o promedio toma un nuevo significado. Considere 10 mediciones de un parámetro analítico particular de interés, como la densidad de una muestra líquida. En el ejemplo mostrado en la Tabla I, se calculó el promedio en 1.503 y la desviación estándar en 0.0124, labor fácilmente lograda con una calculadora de bolsillo o en Microsoft Excel. ¿Cómo pueden estos cálculos relacionarse con un modelo matemático?
Si le damos un vistazo más de cerca a los cálculos de la Tabla I, restando el valor de la media de cada uno de los n valores individuales da como resultado un residual. La suma de los residuales es cero, como era de esperar.
Sin embargo, cuando se elevan al cuadrado los residuales y se suman, la respuesta es no cero. Esta suma del cuadrado de los residuales, SSR, se muestra en la Ecuación 1:
Mediante el uso de un pequeño cálculo, es fácil mostrar que, de acuerdo al principio de los cuadrados mínimos (1), el mejor estimado de la ubicación será cuando SSR está en un mínimo. Por lo tanto, el diferencial se ajusta a cero (Ecuación 2),
y, por lo tanto, (Ecuación 3)