1.7 Clasificaciones de las variables.
Ya hemos estudiado las escalas de medida de las variables, ahora veamos algunas clasificaciones de las variables según diversos criterios:
Variables independientes (vv.ii) - Variables dependientes (vv.dd)
Las variables independientes son las características en las que difieren los objetos de estudio (sexo, edad, etc.) (en estudios de encuesta y en estudios observacionales) mientras que en estudios experimentales son las diferentes condiciones a las que exponemos a los objetos de estudio. También se les llama variables explicativas o predictoras. Las variables dependientes son aquellas cuyo comportamiento es explicado o pronosticado por una o mas variables independientes. También se las llama variables criterio o respuesta. En las investigaciones no experimentales no siempre está claro si una variable es dependiente o independiente, siendo el contexto de la investigación la que hace decidir aunque a veces una variable puede desempeñar diferentes roles en distintas situaciones.En algunas aplicaciones del análisis multivariable, todas las variables tienen el mismo estatus y se habla de relaciones de interdependencia entre variables. En estos casos no hay variables dependientes e independientes.
b)
Clasificación de las variables por los valores que pueden tomar. La clasificación de las escalas de medida no siempre deja las cosas claras, por eso frecuentemente en el análisis de datos se divide a las variables en dos grandes grupos:Variables no métricas o cualitativas
(escalas nominal y ordinal)Variables métricas o cuantitativas ( escalas de intervalo o de razón)
O también:
En relación al análisis de datos se clasifican las variables en función de ciertas clasificaciones de escala y de origen:
Puntuaciones directas o brutas
, son las obtenidas directamente y se suelen representar con letras mayúsculas (X,Y, ...) y tienen Medias (x , ý , ...) y desviaciones típicas (s x , s y ...) Puntuaciones centradas en la media o diferenciales, se suelen representar con letras minúsculas y son un cambio de origen al restar la media de las puntuaciones originales (x = X - x; T = T-T ..) estas variables tienen media cero y su desviación típica coincide con la de las puntuaciones originales. Es un cambio de origen pero no de escala Puntuaciones típicas o estandarizadas, normalmente representadas por la letra z con el subíndice correspondiente a la variable ( z x , z y ...). Se obtiene restando a los valores originales la media y dividiendo por la desviación típica ( z x = ( X - x ) / s xLas puntuaciones típicas están libres de escala y siempre tiene media 0 y desviación típica 1.
La combinación lineal de variables
La mayor parte de las técnicas multivariables combinan las variables de alguna forma "útil". Normalmente esta combinación es una combinación lineal, a veces llamada variante, aunque también hay combinaciones no lineales, no las estudiaremos este curso. Una combinación lineal es una suma ponderada de las variables, para un conjunto p de variables observadas tendremos
V = w1 X1 + w2 X2 + ... w p X k
V es la nueva variante o combinación lineal, y X j y w j representan las variables originales y sus pesos, respectivamente (j = 1,2, p). Esa misma ecuación se puede representar como el producto de dos vectores v = w' x
En cuanto al número de variables que interesa incluir en un análisis multivariante como regla general se debe observar
la parsimonia científica, es decir obtener la mejor solución con el menor número posible de variables.