Análise Estatística de Dados

Para investigação e estudos de mercado

Diferença entre p-valor e Effect Size: Significância Estatística vs Magnitude do Efeito

Distinguir o valor p (p-value) e o tamanho do efeito (effect size) é fundamental em análise estatistica e prática muito comum e recorrente na investigação e artigos científicos de estudos quantitativos

A distinção entre p-valor e tamanho do efeito (effect size) é fundamental para uma interpretação rigorosa dos resultados estatísticos em investigação científica. Embora frequentemente reportados em conjunto, estes dois indicadores respondem a questões diferentes. Enquanto o p-valor informa sobre evidência contra a hipótese nula, o effect size quantifica a magnitude real da diferença ou relação observada.

1. O que mede o p-valor?

O p-valor representa a probabilidade de obter um resultado igual ou mais extremo do que o observado, assumindo que a hipótese nula (H0) é verdadeira. Se p ≤ α (tipicamente 0,05), rejeita-se H0. No entanto, o p-valor não indica a magnitude do efeito nem a sua relevância prática.

Conforme destacado pela American Statistical Association (ASA), o p-valor não mede a importância de um resultado nem a probabilidade de uma hipótese ser verdadeira (Wasserstein & Lazar, 2016).

2. O que é o Effect Size?

O tamanho do efeito (effect size) quantifica a magnitude da diferença entre grupos ou a força da relação entre variáveis. Exemplos comuns incluem o d de Cohen, eta quadrado (η²), r de Pearson e odds ratio.

O effect size responde à pergunta: ‘Quão grande é o efeito observado?’ Enquanto o p-valor responde apenas se o efeito é estatisticamente detetável.

3. Porque o p-valor não é suficiente?

O p-valor é fortemente influenciado pelo tamanho da amostra. Em amostras muito grandes, efeitos pequenos podem tornar-se estatisticamente significativos. Por outro lado, em amostras pequenas, efeitos relevantes podem não atingir significância estatística.

Por essa razão, investigadores como Cohen (1988) defenderam a necessidade de reportar sempre medidas de tamanho do efeito juntamente com testes de significância.

4. Interpretação conjunta: boa prática científica

A interpretação adequada de resultados estatísticos deve considerar simultaneamente:

– p-valor (evidência estatística)

– Effect size (magnitude do efeito)

– Intervalos de confiança

– Enquadramento teórico e relevância prática

A literatura recente reforça que decisões científicas não devem basear-se exclusivamente num limiar arbitrário de significância (Cumming, 2014; Lakens, 2013).

5. Exemplo prático

Imagine um estudo que compara dois métodos de ensino. O teste t apresenta p = 0,001, indicando diferença estatisticamente significativa. No entanto, o d de Cohen = 0,15, o que corresponde a um efeito pequeno. Neste caso, apesar da significância estatística, a relevância prática pode ser limitada.

Conclusão

A distinção entre p-valor e effect size é crucial para garantir rigor metodológico. O p-valor indica evidência contra a hipótese nula; o effect size informa sobre a magnitude do fenómeno observado. Uma investigação estatisticamente sólida deve reportar ambos e interpretar os resultados de forma integrada.

Referências

Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Lawrence Erlbaum Associates.

Cumming, G. (2014). The new statistics: Why and how. Psychological Science, 25(1), 7–29. https://doi.org/10.1177/0956797613504966

Lakens, D. (2013). Calculating and reporting effect sizes to facilitate cumulative science. Frontiers in Psychology, 4, 863. https://doi.org/10.3389/fpsyg.2013.00863

Wasserstein, R., & Lazar, N. (2016). The ASA statement on p-values: Context, process, and purpose. The American Statistician, 70(2), 129–133. https://doi.org/10.1080/00031305.2016.1154108