viernes, 11 de marzo de 2016

Grado de significación (p). Revisión ASA

Desde hace tiempo, se ha venido señalando que los valores de p son, en el mejor de los casos, un estadístico con bajo valor informativo sobre la investigación realizada, y muchas veces engañoso. Y sobre todo a raíz de artículo de E.Vul (2009), este concepto del grado de significación (pruebas p), ha sido objeto de críticas generalizadas. Se han intentado corregir sus resultados más contradictorios, como podemos observar en distintas librerías implementadas por ejemplo en R (Herrero et al., 2011), e incluso eliminarlo (Newcombe, 2013), pero la gran aceptación que tiene en el campo de las publicaciones científicas ha resistido hasta ahora todos los intentos.

No obstante, la corriente de fondo ha llevado a la ASA (American Statistical Association) finalmente ha tomar una posición crítica de los valores de p, o por lo menos a la manera en que se usan frecuentemente en las investigaciones. Ha tenido que precisar todos los inconvenientes del estadístico y como se debe usar, incluyendo seis principios que subyacen en el uso adecuado y la interpretación del valor p:
1. Los valores p puden indicarnos la incompatibilidad de nuestros datos con un modelo estadístico especificado.
2. Los valores p no miden la probabilidad, en una investigación , que la probabilidad estudiada sea cierta, o que la probabilidad de los datos fueron producto solo del azar. 
3. Las conclusiones científicas y las decisiones de negocios o políticas no deben basarse sólo en si un valor p sobrepasa un umbral específico.  
4. La inferencia apropiada requiere un informe completo y transparente. 
5. Un valor p, o la significación estadística, no mide el tamaño de un efecto o la importancia de un resultado. 
6. Por si mismo, un valor p no proporciona una buena medida de la evidencia con respecto a un modelo o hipótesis. 

Y recordando además que el valor de p no fue diseñado para ser un sustituto del razonamiento científico. (Wasserstein,R.L. & Lazar,N.A. ,2016).

Desde luego, no se prohíbe el uso de los valores de p, simplemente se insta a los investigadores a no utilizarlos tal como venían haciendo hasta ahora. Y aún cuando se ha creado un circulo vicioso difícil de romper, ya que cuanto más se usaba, más investigadores se sienten forzados a unirse al mismo tipo de análisis y valoración estadística, este nuevo posicionamiento de la ASA llevará poco a poco al cambio de paradigma.

Por último, señalar que estas precisiones sobre este estadístico, no debe ser la base para suplantar con métodos arbitrarios de toda índole, que no nos permitan evaluar, controlar y alertarnos sobre las interpretaciones erróneas de los datos. Sino que se aconseja ser preciso en su uso, y en su caso sustituir el grado de significación por procedimientos más adecuados durante el proceso de toma de decisiones (Newcombe, 2013).

Referencias:

*Herrero,F.J.; Cuesta,M.; Fernández,P. y Vallejo,G., 2011. Uso de 4 procedimientos de ajuste del grado de significación en una matriz de correlaciones: Un algoritmo R incrustado en SPSS. Grupo Diseños de Investigación y Análisis de Datos, Report DPAM#18.08.1.A, Informe inédito, Universidad de Oviedo
*Newcombe, R. G. (2013). Confidence intervals for proportions and related measures of effect size. Boca Raton,FL:CRC Press.
*Vul, E., Harris, C., Winkielman, P., & Pashler, H. (2009). Puzzlingly high correlations in fMRI studies of emotion, personality, and social cognition. Perspectives on psychological science, 4(3), 274-290.
*Wasserstein,R.L. & Lazar,N.A. (2016): The ASA's statement on p-values: context, process, and purpose, The American Statistician, DOI: 10.1080/00031305.2016.1154108 (URL: http://dx.doi.org/10.1080/00031305.2016.1154108, acceso 9-03-2016)