Estadística en Microcomputadores/Presentación Variancia

5.1 PRESENTACION

Dado un conjunto de dos o más variables estadísticas relacionadas el objeto principal del Análisis de Variancia consiste en establecer el efecto que sobre una de ellas, dependiente o respuesta, tienen las restantes variables, denominadas independientes o factores, y si dicho efecto es significativo.

Los siguientes son ejemplos de casos típicos donde puede aplicarse el Análisis de Variancia:

- Establecer el grado de relación entre el aumento de peso en animales y el tipo de alimento que se les ha suministrado.

- Evaluar las diferencias en los efectos que diversos medicamentos producen sobre una cierta variable fisiológica medida en personas enfermas.

El Análisis de Variancia se desarrolló inicialmente como herramienta estadística para evaluar resultados de experimentos físicos o biológicos. En un experimento se obtiene un resultado de una (o más) variable respuesta, en función de condiciones en general controladas, definidas por valores específicos de variables independientes o factores del experimento. Esta aplicación del Análisis de Variancia sigue siendo la más importante, pero la técnica se utiliza también para analizar relaciones entre variables cuyos valores no surgen necesariamente de experimentos controlados.

El Análisis de Variancia considera que se puede establecer un modelo que explique el comportamiento de la variable respuesta Y, en función de un conjunto de factores X1 a Xk:

Y = f(X1, X2, ..., Xk)

Los factores pueden ser tanto cuantitativos como cualitativos, aunque es usual que sean de este último tipo y que en las observaciones consideradas cada uno de ellos tome un conjunto predefinido y pequeño de valores posibles. En el caso de que los factores sean cuantitativos, sus valores son considerados en la técnica como categorías similares a las de una variable cualitativa. Cada valor o combinación de valores de los factores forma un grupo de valores de la variable respuesta Y.

A su vez, la variable respuesta debe ser de tipo cuantitativo y, en general, se presupone que sigue una distribución normal. No obstante, existen algunos casos específicos, denominados no paramétricos, que no requieren esa condición y que pueden trabajar con variables respuesta aún de tipo ordinal.

La técnica tiene una relación estrecha con el análisis de Regresión, que veremos en el Capítulo 6, ya que ambas técnicas estudian la relación entre una variable respuesta y otras independientes relacionadas con ella, teniendo además la misma base teórica. No obstante, difieren en sus características de aplicación, ya que la Regresión requiere en principio que todas las variables sean de tipo cuantitativo, mientras que el Análisis de Variancia, como ya dijimos, requiere unicamente como condición que la variable respuesta sea de tipo cuantitativo, o aun ordinal, en los casos no paramétricos.

Por otra parte, las estructuras posibles del modelo Y= f() en el caso del Análisis de Variancia son más limitadas que en el caso de Regresión, debido al carácter cualitativo que se presupone para las variables independientes.

Un aspecto a mencionar es que la aplicación del modelo de Análisis de Variancia cuando se define un sólo factor puede considerarse una generalización de la prueba estadística sobre los valores esperados de dos variables independientes (Capítulo 4), al caso de k variables.

En los puntos siguientes presentamos en forma genérica los modelos más usuales del Análisis de variancia, de tipo parámetrico y cómo ellos se resuelven. A continuación de ello se presentan variantes de la técnica, como el Análisis de Covariancia y los casos no paramétricos. En el capítulo 15 se incluyen detalles del tratamiento computacionales de algunos modelos paramétricos típicos.