Para investigação e estudos de mercado

A validade de conteúdo em questionários é uma etapa essencial no processo de construção e adaptação de questionários. É uma etapa central no desenvolvimento e adaptação de instrumentos de medida, sendo amplamente reconhecida como a base para as restantes formas de validade.
Tal como referido por Haynes, Richard e Kubany (1995), refere-se ao grau em que os itens representam adequadamente o construto que se pretende medir. Esta perspetiva é reforçada por abordagens mais recentes, que sublinham que sem validade de conteúdo dificilmente se pode garantir validade de construto ou de critério.
Neste artigo apresentamos uma visão geral do processo, sendo os procedimentos específicos aprofundados em artigos dedicados.
A validade de conteúdo implica assegurar que os itens são relevantes, claros e representativos do domínio do construto. Não se trata apenas de uma avaliação superficial, mas de um processo sistemático de alinhamento entre teoria e medição. Autores como Delgado-Rico et al. (2012) destacam que esta validade envolve múltiplas dimensões, incluindo a representatividade do conteúdo e a adequação da formulação dos itens. De forma complementar, estudos recentes sublinham a importância de considerar também o contexto cultural e a população-alvo.
O processo de validade de conteúdo em questionários envolve geralmente:
Este processo deve ser devidamente documentado em trabalhos científicos.
Antes da avaliação por especialistas, é essencial um planeamento rigoroso do instrumento. Neste contexto, o test blueprint assume particular relevância, funcionando como um mapa conceptual que orienta a construção dos itens.
Este blueprint define o construto, as suas dimensões e a forma como os itens são distribuídos, garantindo coerência e cobertura adequada.
Dada a sua importância, este tema será aprofundado num artigo específico dedicado ao desenvolvimento de instrumentos.
A seleção de especialistas é um dos pontos mais críticos na validade de conteúdo. A literatura sugere frequentemente entre 3 a 5 especialistas em fases iniciais, podendo este número aumentar para 5 a 10 em estudos mais robustos (Lynn, 1986; Polit & Beck, 2006; Roebianto et al., 2023).
No entanto, mais importante do que o número é a qualidade dos especialistas, nomeadamente a sua experiência científica e conhecimento do construto.
Adicionalmente, importa considerar a inclusão de participantes da população-alvo, especialmente para avaliar a clareza e compreensão dos itens. Esta ligação entre especialistas e utilizadores finais conduz naturalmente à importância do estudo piloto.
Os principais índices utilizados são:
Valores mais elevados indicam maior concordância entre especialistas.
Cada um destes índices apresenta características específicas e diferentes formas de interpretação. Dada a sua complexidade e importância, serão abordados em artigos dedicados, permitindo uma explicação detalhada e aplicação prática. A interpretação deve ser feita com base na literatura e no contexto do estudo.
A análise de estudos empíricos recentes mostra uma forte consistência na forma como a validade de conteúdo é aplicada.
De forma geral, os estudos utilizam painéis de especialistas entre 5 e 10 elementos, aplicam escalas de avaliação de relevância e clareza e recorrem a índices como o CVI e o CVR para quantificar os resultados. Após esta fase, é comum a revisão ou eliminação de itens com base nos critérios definidos.
Alguns estudos de adaptação cultural evidenciam a importância desta etapa na garantia de equivalência semântica e conceptual, mostrando que a validade de conteúdo é essencial antes da realização de análises fatoriais.
Outros trabalhos demonstram que, mesmo quando os índices apresentam valores elevados, a revisão qualitativa dos itens continua a ser necessária, reforçando a ideia de que a validade de conteúdo deve integrar abordagens quantitativas e qualitativas.
Segue em baixo as referências de alguns estudos recentes realizados em Portugal e a nível internacional com aplicação da validade de conteúdo em questionários.
Haynes, S., Richard, D., & Kubany, E. (1995). Content validity in psychological assessment: A functional approach to concepts and methods. Psychological Assessment, 7(3), 238–247. https://doi.org/10.1037/1040-3590.7.3.238
Lynn, M. (1986). Determination and quantification of content validity. Nursing Research, 35(6), 382–386. https://doi.org/10.1097/00006199-198611000-00017
Polit, D., & Beck, C. (2006). The content validity index: Are you sure you know what’s being reported? Critique and recommendations. Research in Nursing & Health, 29 (5), 489–497. https://doi.org/10.1002/nur.20147
Polit, D., Beck, C., Owen, S. (2007). Is the CVI an acceptable indicator of content validity? Appraisal and recommendations. Research in Nursing Health, 30 (4), 459-467. https://doi.org/10.1002/nur.20199
Delgado-Rico, E., Carrctero-Dios, H., & Ruch, W. (2012). Content validity evidences in test development: An applied perspective International. Journal of Clinical and Health Psychology, 12 (3), 449-459. https://www.researchgate.net/publication/279618267_Content_validity_evidences_in_test_development_An_applied_perspective
Robianto, A., Savitri, S., Aulia, I., Suciyana, A., & Mubarokah, L. (2023). Content Validity: Definition and Procedure of Content Validation in Psychological Research. TPM, 30 (1), 5-18. https://doi.org/10.4473/TPM30.1.1

A construção e adaptação de questionários é um processo metodológico rigoroso que envolve definição conceptual clara, desenvolvimento sistemático de itens e validação estatística das propriedades psicométricas do instrumento.
No presente artigo apresentamos algumas noções mais gerais de todo este processo, que depois iremos explicar de modo mais detalhado em diversos outros artigos.
O processo inicia-se com a definição teórica do construto com base na literatura científica. A operacionalização implica traduzir conceitos abstratos em indicadores observáveis. Segundo DeVellis (2016), a clareza conceptual é condição essencial para garantir validade de construto.
A criação inicial de itens deve basear-se em revisão de literatura, entrevistas exploratórias ou adaptação de escalas previamente validadas. Hinkin (1998) recomenda a criação de um conjunto alargado de itens iniciais, seguido de avaliação e eliminação progressiva.
A validade de conteúdo avalia a representatividade dos itens face ao construto. Este processo envolve juízes especialistas e pode recorrer ao cálculo do Content Validity Index (CVI).
O cálculo do CVI e do CVR será explicado detalhadamente num artigo específico dedicado à validade de conteúdo.
A aplicação piloto permite avaliar clareza semântica, tempo de resposta e consistência preliminar. Esta fase contribui para o refinamento final do instrumento. Uma explicação mais detalhada será dada num artigo mais especifico.
Esta fase implica a obtenção e/ou validação de uma estrutura fatorial. Realiza-se geralmente através de dois processos estatísticos que são a análise fatorial exploratória (AFE) e análise fatorial confirmatória (AFC), e também pela análise da validade convergente e divergente. É importante realçar que a utilização de AFE e depois AFC é mais comum em processos de construção e adaptação de questionários, sendo a AFC isolada mais comum quando se pretende apenas validar determinada estrutura fatorial já anteriormente validada e definida.
Este processo, assim como as análises mais especificas que o definem também serão alvo de artigos explicativos mais especificos
A AFE permite identificar a estrutura latente dos dados. Recomenda-se verificar a adequação da amostra através do índice KMO e do teste de esfericidade de Bartlett. Segundo Worthington e Whittaker (2006) e Hair et al. (2019) é necessário ter em conta as cargas fatoriais dos itens nos fatores para a definição correcta dos mesmos.
Num artigo próprio abordaremos passo a passo a AFE, incluindo interpretação do KMO, teste de Bartlett , critérios de retenção de fatores e de agrupamento de itens no fator respetivo.
A AFC testa empiricamente o modelo de medida previamente definido. Autores como Hair et al. (2019) e Kline (2016) sugerem avaliar índices de ajustamento para validação do modelo de medida. Existem intervalos de valores que diferem de acordo com diferentes autores, que passaremos a discutir num artigo mais específico.
A validade convergente pode ser avaliada pela Average Variance Extracted (AVE ). A validade discriminante pode ser examinada pelo critério de Fornell-Larcker ou pelo rácio HTMT. Para este caso também existem valores de referência que passamos a explicar num artigo mais especifico.
A consistência interna é tradicionalmente avaliada através do alfa de Cronbach, existindo porém outros metodos de análise da fiabilidade como o teste-reteste. Em contextos confirmatórios, para a análise da consistência interna recomenda-se também a fiabilidade composta (CR) e o coeficiente omega.
As várias medidas de análise da fiabilidade fatorial, assim como os seus principais indicadores (alfa de Cronbach, omega, fiabilidade composta) serão aprofundados num artigo dedicado.
A adaptação de instrumentos para novos contextos culturais deve seguir procedimentos de tradução e retrotradução. Beaton et al. (2000) e a International Test Commission (2017) fornecem diretrizes metodológicas detalhadas para esse processo. Para além disso também é importante o recurso a validade de conteúdo, realização de estudo piloto e também a análise da validade de construto e da fiabilidade.
O processo de tradução e retrotradução será explicado detalhadamente num artigo específico sobre adaptação transcultural.
O relato académico deve incluir descrição do construto, procedimentos de desenvolvimento, resultados das análises fatoriais, índices de ajustamento, medidas de fiabilidade e evidências de validade. O Publication Manual da APA (2020) recomenda transparência e apresentação completa dos resultados.
American Psychological Association. (2020). Publication manual of the American Psychological Association (7th ed.).
Beaton, D. E., et al. (2000). Guidelines for the process of cross-cultural adaptation of self-report measures. Spine, 25(24), 3186–3191.
DeVellis, R. F. (2016). Scale development: Theory and applications (4th ed.). Sage.
Hair, J. F., et al. (2019). Multivariate data analysis (8th ed.). Cengage.
Hinkin, T. R. (1998). A brief tutorial on the development of measures. Organizational Research Methods, 1(1), 104–121.
International Test Commission. (2017). The ITC guidelines for translating and adapting tests (2nd ed.).
Kline, R. B. (2016). Principles and practice of structural equation modeling (4th ed.). Guilford Press.
Nunnally, J. C., & Bernstein, I. H. (1994). Psychometric theory (3rd ed.). McGraw-Hill.
Worthington, R. L., & Whittaker, T. A. (2006). Scale development research. The Counseling Psychologist, 34(6), 806–838.