DISEÑO EXPERIMENTAL y ANÁLISIS DE DATOS
(NOCIONES BÁSICAS)

 
 
 
 
 


 
 

José A. Díaz
Departamento de Biología Animal I
(Zoología de Vertebrados)
Facultad de Biología, Universidad Complutense
28040 Madrid



    En Zoología de Vertebrados, como en cualquier otra disciplina científica, la construcción de un cuerpo de conocimientos objetivo, preciso, sistemático y repetible, está supeditada al empleo de métodos de obtención de datos que tengan en cuenta los principios básicos del diseño experimental y las técnicas de análisis de datos.

MÉTODOS DE ESTUDIO

    Pueden resumirse en tres: comparado, observacional y experimental. El primero actúa en la escala del tiempo “evolutivo” y los dos segundos en la del tiempo “ecológico”.

     Método comparado

    Tiene como objeto estudiar la diversidad y organización de los Vertebrados en un contexto evolutivo y, por lo tanto, histórico. La comparación entre especies es uno de los métodos más utilizados para estudiar la forma en que los vertebrados están adaptados a su ambiente y modo de vida. Por ejemplo: si, con los datos de la Figura 1, comparamos el dimorfismo sexual (0 = sin dimorfismo; 1 = con dimorfismo) y el sistema de apareamiento (a = especies monógamas; b = especies polígamas) de 11 especies de aves, podemos comprobar que las 7 especies sin dimorfismo son todas monógamas, mientras que las 4 especies dimórficas son todas polígamas. Este resultado, estadísticamente significativo (chi-cuadrado = 11, p < 0.001), nos lleva a conjeturar que la selección sexual promovida por la poligamia ha favorecido la evolución del dimorfismo. Este tipo de pruebas comparadas suministran gran parte de los argumentos centrales de Darwin en El origen de las especies.

Figura 1.- Tablas de contingencia para dos caracteres (por ejemplo dimorfimo sexual presente [1] o ausente [0], frente a sistema de apareamiento monógamo [a] o polígamo [b]). La tabla superior, construida tomando las especies como si fueran datos independientes, parece demostrar una asociación entre sistema de apareamiento y dimorfismo (P<0.001), pero en realidad esconde un problema de pseudorreplicación. La tabla inferior, construida siguiendo el método de Ridley, considera - correctamente- que sólo ha habido un cambio evolutivo en ambos caracteres, y que con tan pocos datos no es posible concluir nada sobre la asociación entre ellos.


    Sin embargo, a partir de los años 80 está teniendo lugar una profunda revisión del método comparado relacionada con el hecho de que las distintas especies no pueden considerarse datos independientes (uno de los requisitos básicos de un buen diseño experimental; ver más abajo) por formar parte de una escala jerárquica de relaciones de parentesco: las especies tienden a ser más parecidas cuanto más emparentadas están (inercia filogenética). Volviendo al ejemplo de la Figura 1, al examinar el cladograma resulta obvio que la poligamia y el dimorfismo sexual han evolucionado conjuntamente sólo una vez, y no 4. ¿Cuál es la diferencia? Que con sólo un dato, no podemos afirmar nada. Así, por poner otro ejemplo, nadie concluiría que una especie es dimórfica en cuanto al tamaño comparando un único macho (de, por ejemplo, 10 cm de longitud)  con una única hembra (de, por ejemplo, 6 cm de longitud). Mientras que con más datos (por ejemplo: tres machos de 9, 10 y 11 cm de longitud, frente a tres hembras de 5, 6 y 7 cm de longitud) sí podríamos afirmar, con menos riesgo de equivocarnos, que se trata de una especie dimórfica.

    Existen diversos métodos para abordar este tipo de problemas. En la asignatura Biología Experimental Aplicada se aborda uno de ellos (el método de Ridley) que, en síntesis, sustituye la especie (unidad muestral no independiente) por los linajes del cladograma que experimentan cambios (unidades muestrales independientes). Para clasificar esas unidades muestrales (linajes), se contemplan los estados terminales. Si ciertas combinaciones de caracteres son más frecuentes, y otras menos, de lo que cabría esperar por azar, se concluye que los cambios evolutivos en los dos caracteres están correlacionados (si los cambios ocurrieran al azar, no debería haber asociación entre los estados terminales). En el cladograma de la Figura 1, por ejemplo, habría una sola rama que cambia, correspondiente a los estados terminales de “poligamia” y “dimorfismo sexual”. Evidentemente, con un solo dato no es posible estimar la significación (no puede calcularse el chi-cuadrado).

     Método observacional

    Las variables objeto de estudio no se manipulan, sino que simplemente se anotan sus valores; se aprovecha la variabilidad natural en las características que nos interesan para ver si se ajustan o no a lo que predicen nuestras hipótesis. Si, por ejemplo, nuestra hipótesis acerca del dimorfismo sexual es que ha evolucionado por selección sexual debida a la preferencia de las hembras, podemos predecir que los machos más vistosos, por ejemplo, lograrán atraer más hembras a su territorio. El  problema de la aproximación observacional es que no excluye el efecto de terceras variables o variables confundidoras: puede ocurrir que los individuos más vistosos tengan mejores territorios, y que sea esto, y no la vistosidad en sí misma, lo que atraiga a las hembras (si consiguiéramos disociar la vistosidad de la calidad del territorio, los machos más vistosos dejarían de tener más éxito).

     Método experimental

    El investigador manipula directamente la variable cuyo efecto quiere investigar. En el ejemplo anterior, podríamos manipular la longitud de la cola de algunos machos para ver cómo afecta esta manipulación a su éxito de cría, medido como número de hembras que nidifican en sus territorios. Si, en efecto, el éxito de los machos con la cola alargada es superior al de los machos control (no manipulados o con la cola cortada y vuelta a pegar) y al de los machos con la cola acortada, se demuestra de forma concluyente que las colas muy largas son preferidas por las hembras. Estos resultados no pueden atribuirse a diferencias previas entre los grupos de machos (por ejemplo en la calidad del territorio), ya que ésta no ha sido modificada en el experimento, ni tampoco a terceras variables relacionadas con el manejo de los pájaros, como ponen de manifiesto los grupos control.

     Respecto a los dos últimos métodos, es importante hacer un par de aclaraciones:

- Ningún método es mejor que otro; en realidad, son complementarios. El método observacional es el adecuado para describir patrones, sintetizar información y estudiar asociaciones entre variables. Su validez externa es grande (los resultados son generalizables a una amplia gama de situaciones naturales parecidas) pero su validez interna (la seguridad con que pueden establecerse relaciones de causa-efecto) es menor que en el caso del método experimental.

- La distinción no tiene nada que ver con los instrumentos de medida ni con el lugar de la toma de datos (campo o laboratorio), sino sólo con el hecho de que se manipule o no las variables cuyo efecto se quiere investigar. Como ejemplo de experimento sencillo llevado a cabo en el campo, podríamos pensar en una manipulación del número de huevos en un determinado paseriforme que utilizase cajas-nido (a unas parejas se les quitan huevos y a otras se les añaden, mientras que a las parejas control sólo se les intercambian huevos) para ver cómo afecta el tamaño de puesta a la condición física, capacidad de supervivencia o éxito reproductor futuro de los padres y/o pollos.

Vuelta al inicio

EL MUESTREO

    El muestreo es necesario porque normalmente no podemos medir las variables en todos los elementos de la población (en sentido estadístico) que estamos investigando. Estos elementos son las unidades muestrales (que pueden ser individuos, poblaciones, especies, localidades, etc..., según el tipo de estudio). El objeto de nuestra investigación es detectar, integrar e interpretar relaciones entre variables (características que difieren entre unidades muestrales) en la población. Para ello, necesitamos seleccionar un subconjunto de unidades muestrales sobre las que tomar los datos u observaciones (valores que adoptan las variables para cada una de las unidades de la muestra). Esta "selección" de unidades muestrales es precisamente el muestreo.

    De lo que acabamos de decir se deduce de forma inmediata que un buen muestreo es aquel en el que la muestra es representativa de lo que realmente ocurre en la población. Hay dos requisitos esenciales que garantizan que la muestra sea representativa:

    Aleatoriedad

   En sentido estricto, muestreo aleatorio es aquel en el que todas y cada una de las unidades muestrales de la población tienen igual probabilidad de ser seleccionadas para formar parte de la muestra. Si, por ejemplo, queremos muestrear al azar los árboles "disponibles" en el esquema de la Figura 2, para compararlos con los utilizados por un ave insectívora que se alimenta en los troncos (picos, trepadores, agateadores, etc.), podríamos pensar en obtener al azar pares de coordenadas X e Y (por ejemplo 157, 72) para luego muestrear los árboles más próximos. Sin embargo, este procedimiento de muestreo, aunque impide concentrar nuestra atención en los árboles más accesibles o más "atractivos" para las aves (desde nuestro punto de vista), no es aleatorio en sentido estricto: si los árboles presentan una distribución agregada, como de hecho es normal que suceda, los individuos aislados o periféricos tienen una probabilidad mucho mayor de ser incluidos en el muestreo que los localizados en el centro de los agregados (Figura 2). Habría que asegurarse, por tanto, de que estos árboles no difieren de los centrales (en tamaño, edad, etc.) para garantizar la representatividad de la muestra.

Figura 2.- El muestreo aleatorio requiere que todas las unidades muestrales tengan la misma probabilidad de ser seleccionadas. El área sombreada indica la probabilidad de selección para un individuo aislado (a) y otro localizado en el centro de un agregado (b). La probabilidad de ser incluido en la muestra es unas 30 veces mayor para el primero. La única solución consistiría en numerar todas las unidades muestrales y a continuación efectuar una extracción aleatoria.


    El ejemplo anterior pone de manifiesto que, desde un punto de vista práctico, en el trabajo de campo resulta muchas veces imposible garantizar la aleatoriedad. Una posible alternativa es tener datos que confirmen que no hay sesgos (si, por ejemplo, queremos conocer la distribución de tamaños de una población en la que los machos son más activos y capturables que las hembras, habrá que comprobar que no hay dimorfismo sexual en el tamaño para estar seguros de que nuestra muestra no está sesgada). La tendencia alternativa a hablar de muestreo “arbitrario” es una trampa peligrosa: equivale a afirmar que el muestreo no fue aleatorio, pero que esto no introdujo ningún sesgo importante. Y esto, sin datos, no hay forma de saberlo.

Independencia (y pseudorreplicación)

    El segundo requisito de un buen muestreo es que las unidades muestrales sean independientes unas de otras, es decir, que no formen "subconjuntos" definidos por la compartición de historias semejantes, ambientes parecidos, mismas características de muestreo, etc. Veamos con un ejemplo en qué consiste el problema de la no independencia. Supongamos que queremos comparar el peso de los huevos de Carbonero Común en dos localidades a partir de una muestra de 18 huevos (9 de la localidad A y 9 de la localidad B). Si los 9 huevos de cada localidad procedieran de un solo nido, los datos no serían independientes sino que estarían pseudorreplicados, y podríamos obtener "falsos" resultados atribuibles a efectos como la condición física o edad de la madre, la calidad del territorio, etc., que no tienen nada que ver con la localidad de origen.

    En Zoología de Vertebrados existen dos fuentes principales de pseudorreplicación (Figura 3):

  1. Filogenética, por compartición de ancestro común. Los actuales desarrollos del método comparado (ver más arriba) tratan de controlar el efecto confundidor de la filogenia.
  2. Muestral, por compartición de características ambientales, condiciones de muestreo, etc.
Figura 3.- Fuentes de "no independencia" que pueden dar lugar a resultados espúreos.
    Para garantizar la independencia de los datos y evitar la pseudorreplicación muestral hay que determinar "a priori" cuál es la unidad muestral adecuada y asegurarse de que esas unidades muestrales constituyen réplicas genuinas del factor cuyos efectos queremos investigar (p. ej. sexo o clase de edad); muchas veces, esto equivale a asegurarse de que los niveles del factor (p. ej. machos y hembras, o jóvenes y adultos) están correctamente entremezclados. Veamos otro ejemplo: supongamos que queremos medir la abundancia de tritones en el fondo de un lago. Preparamos 8 trampas de embudo, las cebamos y las colocamos antes de anochecer en un punto del lago a 1 m de profundidad. A la mañana siguiente, retiramos las trampas, contamos los tritones y calculamos una abundancia media. El problema del diseño es que con sólo un punto es difícil generalizar sobre la abundancia a 1 m de profundidad, y no digamos ya en todo el fondo del lago. Pero, por lo demás, como no nos hemos planteado ninguna pregunta concreta la situación no reviste especial gravedad.

    Supongamos ahora que usando este mismo protocolo queremos comparar la abundancia de tritones a 1 m y 10 m, para lo cual colocamos 8 trampas en un punto a 1 m de profundidad y otras 8 en otro punto a 10 m de profundidad, y a la mañana siguiente efectuamos los conteos. A continuación aplicamos un test estadístico (p. ej. ANOVA) para ver si las medias difieren (P < 0.05) o no (P > 0.05). En este segundo ejemplo, tenemos una pregunta claramente definida (¿difiere o no la abundancia a las dos profundidades?) y no podemos colocar las ocho trampas en el mismo punto. Si lo hiciéramos (como resultado de nuestra pereza o del fácil acceso a los puntos seleccionados) todavía podríamos seguir calculando ANOVAs. Sin embargo, si encontramos que la diferencia es significativa, esto constituye una evidencia sólo de que existen diferencias entre los dos puntos muestreados, a uno de los cuales le “ocurre estar” a 1 m de profundidad mientras que al otro le “ocurre estar” a 10 m de profundidad. Lo que no podemos es utilizar ese resultado significativo como prueba de que existen diferencias entre las dos profundidades. Con lo que sabemos, la diferencia encontrada no tiene por qué ser mayor que la que podría haber entre dos puntos distintos del lago situados a la misma profundidad. Si insistimos en interpretar la diferencia significativa como prueba de que existen diferencias entre las dos profundidades, estaremos cometiendo pseudorreplicación. Así que la única solución es dispersar y entremezclar las trampas de una manera adecuada, por ejemplo colocándolas al azar en ocho localidades distintas para cada una de las dos profundidades. Sólo así tendremos réplicas genuinas del efecto de la profundidad.

Vuelta al inicio





REPASO DE TÉCNICAS ESTADÍSTICAS

    Como introducción a los conceptos estadísticos básicos y a los principios fundamentales que subyacen a las distintas técnicas, recomendamos utilizar el Manual Electrónico de StatSoft, Inc. - un servicio gratuito on-line de esta compañía de software -, que debe citarse (en trabajos, publicaciones, etc.) como:

    StatSoft, Inc. (1999). Electronic Statistics Textbook. Tulsa, Oklahoma: StatSoft.

    Las consultas on-line pueden realizarse desde la página principal del Manual Electrónico http://www.statsoft.com/textbook/stathome.html. Recomendamos especialmente estudiar el capítulo de "Elementary Concepts" (http://www.statsoft.com/textbook/esc.html ).

    Los archivos del Manual Electrónico - que tienen formato htm y pueden visualizarse con Netscape o Internet Explorer - pueden también descargarse al disco duro (para no tener que prolongar la conexión) en la dirección http://www.statsoft.com/download5.html#stathelp. En este segundo caso, el archivo guardado es help.zip, y ocupa 7.31 Mb. Después de descomprimirlo, puede crearse un acceso directo al archivo stathome.html, p. ej. C:\STAT\textbook\stathome.html

    A continuación se resumen algunas pruebas estadísticas que pueden ser útiles para el análisis de los datos en Zoología de Vertebrados (contraste de hipótesis):