4) DISEÑO EXPERIMENTAL DE CUADRADO LATINO
JESSICA GARCIA
En el diseño de cuadrado latino (DCL) se controlan dos factores de bloque y se estudia un factor de tratamientos, por lo que se tienen cuatro fuentes de variabilidad que pueden afectar la respuesta observada. Éstas son: los tratamientos, el factor de bloque I (columnas), el factor de bloque II (renglones) y el error aleatorio.
Dicho diseño se llama Cuadrado Latino por dos razones:
- 1) Es un cuadrado debido a que tiene la restricción adicional de que los tres factores involucrados se prueban en la misma cantidad de niveles.
- 2) Es latino porque se utilizan letras latinas para denotar a los tratamientos o niveles del factor de interés.
Sean A, B, C, ......, K, los k tratamientos a comparar, por lo tanto ambos factores de bloques tienen también k niveles cada uno. A continuación se mostrará la tabla del aspecto de los datos:
El modelo estadístico para describir el comportamiento de las observaciones está dado por:
donde Y es la observación del tratamiento i, en el nivel j del factor renglón y en el nivel l del factor columna; e es el error atribuible a dicha observación. De acuerdo con este modelo, la variabilidad total presente en los datos se puede descomponer como:
y los grados de libertad correspondientes son:
El ANOVA para el diseño en cuadrado latino se muestra a continuación:
En él se prueba la hipótesis sobre los efectos de tratamiento del factor renglón y del factor columna. Otra vez, la hipótesis fundamental es la de los tratamientos; las otras dos proporcionan un adicional al objetivo inicial y permiten comprobar la relevancia de controlar los factores de bloque.
SELECCIÓN Y ALEATORIZACIÓN DE UN CUADRADO LATINO
Es importante destacar que no cualquier arreglo de letras latinas en forma de cuadrado es un cuadro latino. La regla fundamental es que cada letra debe aparecer sólo una vez en cada renglón y en cada columna. Siempre es fácil construir un cuadro latino estándar en el que en la primera columna y en el primer renglón aparecen las letras en orden alfabético. Por
ejemplo, un cuadro latino estándar de tamaño cuatro está dado por:
Existen además los siguientes tres cuadros latinos estándar de dimensión cuatro:
Para cuatro tratamientos se pueden construir un total de 576 cuadrados latinos, de los cuales cuatro son estándar. La selección del diseño debería ser elegir uno al azar de los 576 posibles; no obstante, es prácticamente imposible construir todos para seleccionar uno al azar. Sin embargo, ocurre que dado un cuadrado latino, cualquier intercambio de columnas o de renglones también es un cuadrado latino. Por eso la estrategia de selección y aleatorización recomendada en la práctica es la siguiente:
- Se construye el cuadrado latino estándar más sencillo.
- Se aleatoriza el orden de los renglones (o columnas) y después se aleatoriza el orden de las columnas (o renglones).
- Por último, los tratamientos a comparar se asignan en forma aleatoria a las letras latinas.
El cuadrado latino tiene dos restricciones a la aleatorización que se deben a los dos factores de bloque, lo cual implica que a la hora de correr el experimento no hay ningún margen de aleatorización. Es decir, se puede correr por columna o por renglón según convenga. Lo que no es correcto es hacer todas las pruebas de un tratamiento, luego todas las de otro, y así sucesivamente, puesto que se puede introducir ruido adicional debido a factores no controlables que cambian con el tiempo.
EJERCICIO
Una compañía de mensajería está interesada en determinar cuál marca de llantas tiene mayor duración en términos del desgaste. Para ello se planea un experimento en cuadrado latino, en el que se comparan las cuatro marcas de llantas sometiéndolas a una prueba de 32.000 kilómetros de recorrido, utilizando cuatro diferentes tipos de auto y las cuatro posiciones posibles de las llantas en el auto. Así, el factor de interés es el tipo de llanta o marca, y se controlan dos factores de bloques: el tipo de carro y la posición de la llanta en el carro. Estos factores de bloques se controlan ya que, por experiencia, se sabe que el tipo de carro y la posición de la llanta tienen efecto en el desgaste de la misma.
La elección del cuadrado latino a utilizar se hace antes de obtener los datos. Para ello, a partir de un cuadrado latino inicial se aleatorizan las columnas y los renglones; después, las diferentes marcas de llanta se asignan de manera aleatoria a las letras latinas que denotan los niveles del factor de interés.
Las pruebas se hacen al mismo tiempo con chóferes, a quienes se les instruye para que manejen de manera similar sobre el mismo terreno para los cuatro automóviles. Al hacer las pruebas de los cuatro autos al mismo tiempo se evita el efecto del ambiente en el desgaste; asimismo, el conductor y el tipo de terreno podrían influir, pero se considera suficiente mantenerlos lo más homogéneos posible durante el experimento. El diseño y los datos observados se muestran a continuación.
Se mide la diferencia máxima entre el grosor de la llanta nueva y el grosor de la llanta después de haber recorrido los 32.000 kilómetros. Obviamente, a mayor diferencia en grosor mayor desgaste. Las unidades de medición son milésimas de pulgada.
El ANOVA resultante es el siguiente:
Se observa que existen diferencias entre las marcas de llanta y entre los tipos de carro, a un nivel de significancia de a = 0.05. Además, no hay evidencia suficiente para concluir que la posición tiene un efecto importante, puesto que su correspondiente valor p es mayor que 0.05.
Para investigar cuáles marcas de llantas son diferentes entre sí, se aplica la prueba LSD y se obtienen los resultados de la siguiente tabla:
Las conclusiones sobre las cuatro marcas se leen en la columna de grupos homogéneos como sigue: marcas con signos “X” en la misma columna son iguales estadísticamente entre sí. Por ejemplo, la marca A no tiene X en la primera columna y es la única con X en la segunda columna, lo cual indica que es distinta al resto de las marcas. Considerando que mientras la diferencia máxima en grosor sea mayor la llanta se desgasta más, se concluye que la marca A sufre mayor desgaste que las otras tres, por lo que es la peor llanta. Entre las tres marcas restantes (C, D y B) no se encontró una diferencia significativa en cuanto al desgaste medio.
Se concluye que desde el punto de vista estadístico y a la luz de los resultados experimentales, estas tres marcas de llantas pueden considerarse iguales. Esto no quiere decir que sean idénticas, sino que sus diferencias son menores, por lo que no se alcanzan a detectar en el análisis del experimento. Dicho lo anterior, y si aún se quisiera detectar esas pequeñas diferencias para decidirse por alguna llanta, entonces habría que aumentar el número de llantas probadas, para así incrementar la potencia de la prueba. Sin embargo, quizá la mejor decisión sea no probar más llantas y decidir entre las tres marcas (C, D y B), con base en otros criterios, como el económico por ejemplo.
En la figura "a" se presenta la gráfica de medias para los tratamientos, donde los intervalos están construidos con el método LSD. Si los intervalos de confianza se traslapan, las respuestas medias de los tratamientos son iguales estadísticamente. Observe que el intervalo correspondiente a la marca A no se traslapa con ningún otro, luego, su media poblacional es diferente y mayor que las otras. Las marcas C y D son las de menor desgaste muestral y, aunque estadísticamente no difieren en media poblacional de B, sí hay cierta evidencia a favor de estas dos marcas.
La gráfica de medias para el factor carro, es decir, la figura "b" muestra las diferencias entre ellos: el carro 1 es el que tiene el mayor desgaste muestral de llantas, y el carro 4 es el de menor desgaste. Es posible verificar que estadísticamente son diferentes en media, el carro 4 de todos los demás y el carro 3 del carro 1. En la figura "c" se muestra la gráfica de medias para las posiciones y todos los intervalos se traslapan, lo cual indica que no existe suficiente evidencia para concluir que las posiciones tienen algún efecto en el desgaste.
Esto es congruente con el hecho de detectar en el ANOVA que no hay efecto de la posición de las llantas. Sin embargo, se observa cierta tendencia que tiene la posición 1 a generar un menor desgaste, aunque no llega a ser significativa. Como las pruebas se hicieron en un circuito, las vueltas siempre eran en el mismo sentido, y esto puede generar mayor desgaste en una posición determinada.
La validez del análisis de varianza recae en tres supuestos que siempre deben verificarse: normalidad, varianza constante e independencia de los residuos; además de la ausencia de observaciones atípicas o aberrantes. Como se observa en la siguiente gráfica, el supuesto de normalidad se cumple al caer los residuos o puntos “más o menos en línea recta” (figura a). También se cumple el supuesto de varianza constante de acuerdo a las figuras b y c, en las que los residuos se ubican aleatoriamente dentro de una banda horizontal; su dispersión vertical es la misma a lo largo de los gráficos.
No se comprobó el supuesto de independencia por que no se conoce el orden en que se realizaron las mediciones del desgaste.
Este comentario ha sido eliminado por el autor.
ResponderBorrarCuadro latino:
ResponderBorrarDiseño en el que se controlan dos factores de bloque y uno de tratamientos; los tres factores tienen la misma cantidad de niveles. Los tratamientos se representan por letras latinas y se distribuyen en forma adecuada en un cuadro.
Dos factores interaccionan cuando el efecto de uno de ellos depende del nivel en que se encuentra el otro. Por ejemplo, los métodos y los operadores interactúan si la eficacia de un método depende
de cuál operador lo aplique. Esto complicaría la interpretación del resultado de la comparación de los
métodos, ya que debido a la interacción puede ocurrir que el mejor método no lo sea con todos los
operadores, lo cual implica que para hablar del mejor método se debe decir primero de cuál operador se habla.