Análise Estatística de Dados | p-valor, Effect Size e Intervalos de Confiança: Interpretação e Valores de Referência

p-valor, Effect Size e Intervalos de Confiança: Interpretação e Valores de Referência

O p-valor, o tamanho do efeito (effect size) e os intervalos de confiança são três componentes centrais da inferência estatística. Apesar de frequentemente utilizados em conjunto, representam conceitos distintos e complementares. A sua correta interpretação é fundamental na investigação científica e na elaboração de teses, dissertações e artigos académicos.

1. O p-valor: Definição e Interpretação

O p-valor representa a probabilidade de observar resultados tão extremos quanto os obtidos, assumindo que a hipótese nula é verdadeira. Importa salientar que o p-valor não representa a probabilidade da hipótese nula ser verdadeira, nem mede a magnitude do efeito observado.

A prática convencional tem utilizado o nível de significância α = 0,05 como critério de decisão. No entanto, conforme salientado pela American Statistical Association (ASA), o p-valor não deve ser utilizado como único critério para conclusões científicas (Wasserstein & Lazar, 2016).

2. Tamanho do Efeito (Effect Size)

O tamanho do efeito quantifica a magnitude da diferença ou associação observada. Ao contrário do p-valor, o effect size não depende diretamente do tamanho da amostra.

Cohen (1988) propôs valores de referência amplamente utilizados para o d de Cohen: d ≈ 0,2 (pequeno), 0,5 (moderado) e 0,8 (grande). Estes valores são indicativos e devem ser interpretados no contexto específico da área científica.

Lakens (2013) reforça a importância de reportar medidas de tamanho do efeito para permitir comparações entre estudos e meta-análises.

3. Intervalos de Confiança

Os intervalos de confiança (IC) fornecem um intervalo plausível de valores para o parâmetro populacional. Um IC de 95% indica que, em amostragens repetidas, 95% dos intervalos construídos conteriam o verdadeiro parâmetro.

Cumming (2014) argumenta que os intervalos de confiança devem ser privilegiados em detrimento da interpretação exclusiva baseada no p-valor, por fornecerem informação sobre precisão e magnitude.

4. Integração dos Três Elementos

A interpretação adequada de resultados estatísticos deve integrar: (1) significância estatística (p-valor), (2) magnitude do efeito (effect size), e (3) precisão da estimativa (intervalo de confiança).

5. Como reportar em Teses e Artigos Científicos

Segundo o Publication Manual of the American Psychological Association (2020), devem ser reportados valores exatos de p (por exemplo, p = 0,032), juntamente com o tamanho do efeito e, sempre que possível, intervalos de confiança.

Exemplo de reporte adequado: ‘Verificou-se uma diferença estatisticamente significativa entre os grupos, t(98) = 2,45, p = 0,016, d = 0,49, IC95% [0,10, 0,88].’

Referências

American Psychological Association. (2020). Publication manual of the American Psychological Association (7th ed.).

Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Lawrence Erlbaum Associates.

Cumming, G. (2014). The new statistics: Why and how. Psychological Science, 25(1), 7–29.

Lakens, D. (2013). Calculating and reporting effect sizes to facilitate cumulative science. Frontiers in Psychology, 4, 863.

Wasserstein, R. L., & Lazar, N. A. (2016). The ASA’s statement on p-values. The American Statistician, 70(2), 129–133.