DISEÑOS FACTORIALES Y ANÁLISIS DE EXPERIMENTOS EN CIENCIAS NATURALES 

Sociedad de Amigos del Museo (SAM), Museo Nacional de Ciencias Naturales (CSIC, Madrid), 23 de Enero al 3 de Febrero 2017

 

Luis M. Carrascal

  Grupo de Biogeografía Ecológica Integrativa

 

TEMARIO:

Entendiendo los diseños factoriales

  * Tipo de variables respuesta y predictoras (gausianas, gamma, poisson, binomiales negativas, binomiales, multinomiales). Factores entre- y dentro-de sujetos. Factores fijos y aleatorios. Factores anidados.

  * Modelos Generales y Generalizados Lineales. Transformación de variables (log, raíz y Box-Cox). Varianza y devianza. Parametrización de efectos no lineales mediante transformaciones polinomiales.

  * Efectos simples, parciales e interacciones. Tipos de sumas de cuadrados (I, II y III) y sus equivalentes en modelos generalizados no gausianos. Partición de la variación: eta2 y eta2 parcial.

  * Tablas de contrastes en diseños factoriales. Comparaciones planificadas.

  * Revisión de los supuestos canónicos trabajando con los residuos de los modelos. Desvío de la normalidad de los residuos, heterocedasticidad de los residuos, heterogeneidad de varianzas en las celdas n-factoriales.

  * Re-cálculo de coeficientes, errores estándar y significaciones utilizando las matrices de varianza-covarianza (estimadores sándwich, HC3 y HC4m).

  * Estimas robustas, Bootstrapping y validación cruzada de los modelos.

  * Comparación entre modelos usando el criterio de información de Akaike (IACc). 

Tipos de diseños factoriales

  * Diseños n-factoriales univariantes: AN(c)OVAs. Diseños de bloques, cuadrados latinos.

  * Diseños n-factoriales multivariantes: MAN(c)OVAs

  * Modelos mixtos I: diseños n-factoriales univariantes que mezclan covariantes, factores de efectos fijos y aleatorios. Establecimiento de términos error deseables y posibles.

  * Modelos mixtos II: Aproximaciones de Kenward-Roger y Satterthwaite a la estima de los grados de libertad y significaciones. Aproximación de bootstrap paramétricos.

  * Diseños de factores anidados con y sin celdas de interacciones vacías.

  * Diseños de medidas repetidas. Diseños “split-plot”. Supuesto de esfericidad y simetría compuesta; corrección de grados de libertad y significaciones; aproximación multivariante.

 

 

Literatura seleccionada:

* Hairston, N.G. (1989). Ecological Experiments: Purpose, Design and Execution. Cambridge Studies in Ecology, Cambridge Univ. Press, Cambridge.

* Underwood, A.J. (1997). Experiments in ecology: their logical design and interpretation using analysis of variance. Cambridge Univ. Press, Cambridge.

* Scheiner, S.M.; Gurevitch, J. (2001). Design and analysis of ecological experiments. Chapman & Hall, New York.

* Quinn, G.P.; Keough, M.J. (2002). Experimental design and data analysis for biologists. Cambridge Univ. Press, Cambridge.

* Keppel, G. (1991). Design and analysis: a researcher’s handbook. Prentice Hall, New Jersey. Nueva versión.

* Crawley, M.J. (1998). GLIM for Ecologists. Blackwell Science.

* Maxwell, S.E.; Delaney, H.D. (1990). Designing Experiments and Analyzing Data. A model comparison perspective. Wadsworth Publishing Company, Belmont, CA. Nueva versión.

* Burnham, K.P.; Anderson, D. (2003). Model Selection and Multi-Model Inference. Springer.

* Davison, A.C.; Hinkley, D.V. (2007). Bootstrap methods and their application. Cambridge Univ. Press. [link]

 

 

 

ASPECTOS GENERALES

Elementary Concepts in Statistics [pdf]

P values and statistical significance [pdf]

Errores de tipo I y II [pdf]

The logic of Hypotesis Testing
Null hypothesis testing
Citations Questioning the Indiscriminate Use of  Null Hypothesis Significance Tests in Observational Studies - Quotes Regarding Hypothesis Testing

Presentación general sobre estadística [pdf]

Trampas en los análisis de datos [pdf]

Choosing statistical tests [pdf]

The Most Important Points

 

Significación

When should we use one-tailed hypothesis testing?

Heads I win, tails you lose - testing directional alternative hypotheses in ecological and evolutionary research

Revised standards for statistical evidence

The fickle P value generates irreproducible results

Statistical errors

An investigation of the false discovery rate and the misinterpretation of p-values

The ASA's statement on p-values: context, process, and purpose

It’s not the p-values’ fault – reflections on the recent ASA statement

The Enduring Evolution of the P Value

Optimizing alpha for statistical hypothesis tests

P values are just the tip of the iceberg

Publication Bias (The “File-Drawer Problem") in Scientific Inference

 

Potencia de los tests

Presentación sencilla

Capítulo 7 - Experimental Design and Data Analysis for Biologists

STATSOFT – Power Analysis

Programa GPOWER

Power, sample size and experimental design

Post-hoc power: Don’t do it

The Abuse of Power: The Pervasive Fallacy of Power. Calculations for Data Analysis

Peer review of statistics in medical research: the other problem

Magnitudes de efectos – Effect Size

Múltiples estimas de probabilidad

Interpreting Nonsignificant P values [pdf]

Resultados no significativos en investigación [pdf] [pdf] [pdf] [pdf] [pdf]

 

Diagnósticos de regresión

distancia de CookDFFITSresiduo studentizadoautocorrelación de residuos, leverage, puntos influyentes

multicolinearidadtoleranciafactor de inflado de la varianza (VIF)

Analyzing outliers: influential or nuisance?

 

Transformaciones

Box-Cox Transformation: An Overview

The arcsine is asinine: the analysis of proportions in ecology

Spatial Autocorrelation: Trouble or New Paradigm? – sobre uso de términos polinomiales

 

Residuos de modelos

On the misuse of residuals in ecology: regression of residuals vs. multiple regression
Problemas derivados del uso de residuos [
pdf] [pdf]

 

Inferencia multimodelos, AIC y simplificación de modelos

Reducción de modelos: Akaike information criterion [pdf] [pdf]

                                       Ejemplo de uso de AIC

Multimodel inference

Model Based Inference in the Life Sciences - A Primer on Evidence - Quantifying the Evidence About Science Hypotheses

Model Based Inference in the Life Sciences - A Primer on Evidence – Appendices … interesantes los E y F

Model Based Inference in the Life Sciences - A Primer on Evidence - Introduction

Information criterion

Model selection in ecology and evolution

Multimodel inference in ecology and evolution challenges and solutions

AIC myths and misunderstandings

Avoiding Pitfalls When Using Information-Theoritic Methods

Model selection and multimodel inference

Information theory and hypothesis testing - a call for pluralism

Concerns regarding a call for pluralism of information theory and hypothesis testing

Kullback-Leibler information as a basis for strong inference in ecological studies

Multimodel Inference: Understanding AIC and BIC in Model Selection

Information theory in willdlife science - critique and viewpoint

Uninformative parameters and model selection using Akaike’s Information Criterion

Testing ecological theory using the information-theoretic approach - Examples and cautionary results

Performance of several variable-selection methods applied to real ecological data

Model averaging and muddled multimodel inferences

Multimodel Inference: Understanding AIC relative variable importance values

Why do we still use stepwise modelling in ecology and behaviour?

 

 

 

 

 

DISEÑO EXPERIMENTAL - ANOVAs

GENERALIDADES

Capítulo 8 - Experimental Design and Data Analysis for Biologists

ANOVA (generalidades) [pdf]

Introduction to ANOVAs

ANOVA/MANOVA (StatSoft)

Measuring effect size

Ejemplo de distribución de datos y desvío de la normalidad [pdf]

 

ANOVAs N-FACTORIALES "between subjects"

Facorial (n-ways) ANOVAs
Post Hoc Tests; Duncan's new multiple range test

Ejemplos: [pdf] [pdf] [pdf] [pdf] [pdf]

 

ANCOVAs

Presentación general [pdf]

ANCOVA

ANCOVA II
The mistreatment of covariate interaction terms in linear model analyses of behavioural and evolutionary ecology studies

Ejemplos: [pdf] [pdf] [pdf] [pdf] [pdf]

 

DISEÑOS DE BLOQUES

Capítulo 10 - Experimental Design and Data Analysis for Biologists

The randomized block design

Randomized Complete Block Design

Randomised block and latin square designs

Ejemplos: [pdf] [pdf] [pdf] [pdf] [pdf]

 

ANOVAS DE MEDIDAS REPETIDAS 

Within-subjects ANOVAs

REPEATED MEASURES MODELS y presentación

Repeated-Measures ANOVA with two trials plus a between-subjects effect

Ejemplos: [pdf] [pdf] [pdf] [pdf] [pdf]

 

MANOVAs

Capítulo 16 - Experimental Design and Data Analysis for Biologists

Multivariate Analysis of Variance

MANOVA: aproximación no paramétrica [pdf]

Ejemplos: [pdf] [pdf] [pdf] [pdf

 

ANALISIS ENCAJADOS DE LA VARIANZA

Capítulo 9 - Experimental Design and Data Analysis for Biologists

Two-way Nested ANOVAs

Ejemplos: [pdf] [pdf]

 

MODELOS MIXTOS; EFECTOS ALEATORIOS

Distinguishing Between Random and Fixed: Variables, Effects, and Coefficients

Capítulo 8 – Analysing Ecological Data

Ejemplos: [pdf] [pdf] [pdf] [pdf

 

 

SIMULACIONES DE HIPÓTESIS NULAS, REMUESTREO, VALIDACIÓN

Aspectos generales

What are cross-validation and bootstrapping? - Warren Sarle

Resampling, Bootstrap, Jackknife, Permutation tests – Bootstrap – Cross-validation - Monte Carlo method

Bootstrap Methods and their Application - Anthony Davison

Resampling Methods for statistical inference

Randomization, Bootstrap and Monte Carlo Methods in Biology

The Bootstrap, Permutation Tests, Simulation - Susan Holmes

Bootstrapping – David C. Howell

Null versus neutral models: what’s the difference? – N.J. Gotelli

Ecologists should not use statistical significance tests to interpret simulation model results

 

En regresión

Permutation tests for linear models

Resampling and Regression - Bob Andersen

Bootstrapping Regression Models - John Fox

Resampling techniques for statistical modeling - Gianluca Bontempi

 

 

 

EXPLORACION DE PATRONES MEDIANTE REGRESION

MODELOS DE REGRESION GENERALES LINEALES

Presentación de conceptos (Wikipedia)
Regresión Múltiple - StatSoft

Capítulos 5 y 6 - Experimental Design and Data Analysis for Biologists

Analysing ecological data – Linear regression

A Primer on Interpreting Regression Models

Linear Methods for Regression

Regression Methods in Biostatistics - Linear Regression

Simple means to improve the interpretability of regression coeficients

A protocol for data exploration to avoid common statistical problems

Limitations of Linear Regression Applied on Ecological Data

 

REGRESIÓN POR EL MÉTODO DE LOS MÍNIMOS CUADRADOS PARCIALES

A Beginner’s Guide to Partial Least Squares Analysis

Partial Least Squares (PLS) Regression. - H. Abdi – otra versión

An Introduction to Partial Least Squares Regression - Randall D. Tobias
An lnterpretation of Partial Least Squares - Paul H. Garthwaite

Partial least squares regression as an alternative to most currently used regression methods in Ecology

Partial Least Squares - StatSoft