Validade de Conteúdo em Questionários: Como aplicar e principais índices (CVR, CVI e V de Aiken)

A validade de conteúdo em questionários é uma etapa essencial no processo de construção e adaptação de questionários. É uma etapa central no desenvolvimento e adaptação de instrumentos de medida, sendo amplamente reconhecida como a base para as restantes formas de validade.

Tal como referido por Haynes, Richard e Kubany (1995), refere-se ao grau em que os itens representam adequadamente o construto que se pretende medir. Esta perspetiva é reforçada por abordagens mais recentes, que sublinham que sem validade de conteúdo dificilmente se pode garantir validade de construto ou de critério.

Neste artigo apresentamos uma visão geral do processo, sendo os procedimentos específicos aprofundados em artigos dedicados.

1. O que é a validade de conteúdo em questionários?

A validade de conteúdo implica assegurar que os itens são relevantes, claros e representativos do domínio do construto. Não se trata apenas de uma avaliação superficial, mas de um processo sistemático de alinhamento entre teoria e medição. Autores como Delgado-Rico et al. (2012) destacam que esta validade envolve múltiplas dimensões, incluindo a representatividade do conteúdo e a adequação da formulação dos itens. De forma complementar, estudos recentes sublinham a importância de considerar também o contexto cultural e a população-alvo.

2. Processo de Avaliação de Conteúdo

O processo de validade de conteúdo em questionários envolve geralmente:

Teste Blueprint
Seleção de especialistas
Avaliação dos itens (relevância, clareza)
Cálculo de índices
Revisão dos itens

Este processo deve ser devidamente documentado em trabalhos científicos.

2.1. Planeamento do instrumento (test blueprint)

Antes da avaliação por especialistas, é essencial um planeamento rigoroso do instrumento. Neste contexto, o test blueprint assume particular relevância, funcionando como um mapa conceptual que orienta a construção dos itens.

Este blueprint define o construto, as suas dimensões e a forma como os itens são distribuídos, garantindo coerência e cobertura adequada.

Dada a sua importância, este tema será aprofundado num artigo específico dedicado ao desenvolvimento de instrumentos.

2.2. Seleção de especialistas e considerações práticas

A seleção de especialistas é um dos pontos mais críticos na validade de conteúdo. A literatura sugere frequentemente entre 3 a 5 especialistas em fases iniciais, podendo este número aumentar para 5 a 10 em estudos mais robustos (Lynn, 1986; Polit & Beck, 2006; Roebianto et al., 2023).

No entanto, mais importante do que o número é a qualidade dos especialistas, nomeadamente a sua experiência científica e conhecimento do construto.

Adicionalmente, importa considerar a inclusão de participantes da população-alvo, especialmente para avaliar a clareza e compreensão dos itens. Esta ligação entre especialistas e utilizadores finais conduz naturalmente à importância do estudo piloto.

2.3. Principais índices para avaliação da validade de conteúdo em questionários

Os principais índices utilizados são:

CVR (Content Validity Ratio)
CVI (Content Validity Index)
V de Aiken
Coeficientes de concordância

Valores mais elevados indicam maior concordância entre especialistas.

Cada um destes índices apresenta características específicas e diferentes formas de interpretação. Dada a sua complexidade e importância, serão abordados em artigos dedicados, permitindo uma explicação detalhada e aplicação prática. A interpretação deve ser feita com base na literatura e no contexto do estudo.

3. Evidência empírica: alguns estudos com aplicação da validade de conteúdo em questionários

A análise de estudos empíricos recentes mostra uma forte consistência na forma como a validade de conteúdo é aplicada.

De forma geral, os estudos utilizam painéis de especialistas entre 5 e 10 elementos, aplicam escalas de avaliação de relevância e clareza e recorrem a índices como o CVI e o CVR para quantificar os resultados. Após esta fase, é comum a revisão ou eliminação de itens com base nos critérios definidos.

Alguns estudos de adaptação cultural evidenciam a importância desta etapa na garantia de equivalência semântica e conceptual, mostrando que a validade de conteúdo é essencial antes da realização de análises fatoriais.

Outros trabalhos demonstram que, mesmo quando os índices apresentam valores elevados, a revisão qualitativa dos itens continua a ser necessária, reforçando a ideia de que a validade de conteúdo deve integrar abordagens quantitativas e qualitativas.

Segue em baixo as referências de alguns estudos recentes realizados em Portugal e a nível internacional com aplicação da validade de conteúdo em questionários.

Dalawi, I, Isa, M., Chen, X., Azhar, Z., & Aimran, N. (2023). Development of the Malay Language of understanding, attitude, practice and health literacy questionnaire on COVID-19 (MUAPHQ C-19): content validity & face validity analysis. BMC Public Health, 23. https://doi.org/10.1186/s12889-023-16044-5
Loureiro, A., Ibanez-Cubillas, P., Miranda-Pinto, M. (2024). Validade de Conteúdo por avaliação de especialistas para medir as competências digitais de estudantes de mestrado em Educação Especial. Texto Livre, 17. https://doi.org/10.1590/1983-3652.2024.52564
Martins, M., Paiva-Santos, F., Todo Bom, L., Dixe, M. dos A., & Costeira, C. (2025). Cultural adaptation and content validation of the RAC (Rodríguez-Almeida-Cañon) adult infection risk assessment scale for Portuguese from Portugal. Millenium – Journal of Education, Technologies, and Health, 2(28). https://doi.org/10.29352/mill0228.41505
Moreira, W., Campos, L., Dias, P., & Nóbrega, M. (2025). Adaptation and content validity of the Brazilian version of the Mental Health Literacy questionnaire. Rev Bras Enferm, 78(4). https://doi.org/10.1590/0034-7167-2024-0309pt
Vilhena, D., Guimarães, M., Guimarães, R., & Pinheiro, A. (2023). Validade de Conteúdo e Fidedignidade do Teste de Taxa de Leitura. Avaliação Psicológica, 22 (2). https://doi.org/10.15689/ap.2023.2202.22980.10
Trindade, C., Kato, S., Gurgel, L., & Reppold, C. (2018). Processo de Construção e Busca de Evidências de Validade de Conteúdo da Equalis-OAS. Avaliação Psicológica, 17(2), 271-277. https://doi.org/10.15689/ap.2018.1702.14501.13

4. Recomendações práticas

A validade de conteúdo em questionários deve ser realizada antes do estudo piloto.
É importante justificar decisões e reportar resultados de forma transparente.

5. Alguns artigos relacionados (No nosso site)

O que é o CVI e como interpretar (I-CVI e S-CVI)
Como calcular o CVR (Lawshe) passo a passo
Quantos especialistas usar na validade de conteúdo?

Referências Bibliográficas

Haynes, S., Richard, D., & Kubany, E. (1995). Content validity in psychological assessment: A functional approach to concepts and methods. Psychological Assessment, 7(3), 238–247. https://doi.org/10.1037/1040-3590.7.3.238

Lynn, M. (1986). Determination and quantification of content validity. Nursing Research, 35(6), 382–386. https://doi.org/10.1097/00006199-198611000-00017

Polit, D., & Beck, C. (2006). The content validity index: Are you sure you know what’s being reported? Critique and recommendations. Research in Nursing & Health, 29 (5), 489–497. https://doi.org/10.1002/nur.20147

Polit, D., Beck, C., Owen, S. (2007). Is the CVI an acceptable indicator of content validity? Appraisal and recommendations. Research in Nursing Health, 30 (4), 459-467. https://doi.org/10.1002/nur.20199

Delgado-Rico, E., Carrctero-Dios, H., & Ruch, W. (2012). Content validity evidences in test development: An applied perspective International. Journal of Clinical and Health Psychology, 12 (3), 449-459. https://www.researchgate.net/publication/279618267_Content_validity_evidences_in_test_development_An_applied_perspective

Robianto, A., Savitri, S., Aulia, I., Suciyana, A., & Mubarokah, L. (2023). Content Validity: Definition and Procedure of Content Validation in Psychological Research. TPM, 30 (1), 5-18. https://doi.org/10.4473/TPM30.1.1

Construção e Adaptação de Questionários: Fundamentos Metodológicos e Validação Estatística

Breve Guia Explicativo do Processo de Construção, Adaptação e Validação de Questionários

A construção e adaptação de questionários é um processo metodológico rigoroso que envolve definição conceptual clara, desenvolvimento sistemático de itens e validação estatística das propriedades psicométricas do instrumento.

Etapas da Construção e Adaptação de Questionários

No presente artigo apresentamos algumas noções mais gerais de todo este processo, que depois iremos explicar de modo mais detalhado em diversos outros artigos.

1. Definição Conceptual e Operacionalização do Construto

O processo inicia-se com a definição teórica do construto com base na literatura científica. A operacionalização implica traduzir conceitos abstratos em indicadores observáveis. Segundo DeVellis (2016), a clareza conceptual é condição essencial para garantir validade de construto.

2. Criação e Refinamento de Itens

A criação inicial de itens deve basear-se em revisão de literatura, entrevistas exploratórias ou adaptação de escalas previamente validadas. Hinkin (1998) recomenda a criação de um conjunto alargado de itens iniciais, seguido de avaliação e eliminação progressiva.

3. Validade de Conteúdo em questionários ciêntificos

A validade de conteúdo avalia a representatividade dos itens face ao construto. Este processo envolve juízes especialistas e pode recorrer ao cálculo do Content Validity Index (CVI).

O cálculo do CVI e do CVR será explicado detalhadamente num artigo específico dedicado à validade de conteúdo.

4. Estudo Piloto

A aplicação piloto permite avaliar clareza semântica, tempo de resposta e consistência preliminar. Esta fase contribui para o refinamento final do instrumento. Uma explicação mais detalhada será dada num artigo mais especifico.

5. Validade de Construto

Esta fase implica a obtenção e/ou validação de uma estrutura fatorial. Realiza-se geralmente através de dois processos estatísticos que são a análise fatorial exploratória (AFE) e análise fatorial confirmatória (AFC), e também pela análise da validade convergente e divergente. É importante realçar que a utilização de AFE e depois AFC é mais comum em processos de construção e adaptação de questionários, sendo a AFC isolada mais comum quando se pretende apenas validar determinada estrutura fatorial já anteriormente validada e definida.

Este processo, assim como as análises mais especificas que o definem também serão alvo de artigos explicativos mais especificos

5.1. Análise Fatorial Exploratória (AFE)

A AFE permite identificar a estrutura latente dos dados. Recomenda-se verificar a adequação da amostra através do índice KMO e do teste de esfericidade de Bartlett. Segundo Worthington e Whittaker (2006) e Hair et al. (2019) é necessário ter em conta as cargas fatoriais dos itens nos fatores para a definição correcta dos mesmos.

Num artigo próprio abordaremos passo a passo a AFE, incluindo interpretação do KMO, teste de Bartlett , critérios de retenção de fatores e de agrupamento de itens no fator respetivo.

5.2. Análise Fatorial Confirmatória (AFC)

A AFC testa empiricamente o modelo de medida previamente definido. Autores como Hair et al. (2019) e Kline (2016) sugerem avaliar índices de ajustamento para validação do modelo de medida. Existem intervalos de valores que diferem de acordo com diferentes autores, que passaremos a discutir num artigo mais específico.

6. Validade Convergente e Discriminante

A validade convergente pode ser avaliada pela Average Variance Extracted (AVE ). A validade discriminante pode ser examinada pelo critério de Fornell-Larcker ou pelo rácio HTMT. Para este caso também existem valores de referência que passamos a explicar num artigo mais especifico.

7. Avaliação da Fiabilidade

A consistência interna é tradicionalmente avaliada através do alfa de Cronbach, existindo porém outros metodos de análise da fiabilidade como o teste-reteste. Em contextos confirmatórios, para a análise da consistência interna recomenda-se também a fiabilidade composta (CR) e o coeficiente omega.

As várias medidas de análise da fiabilidade fatorial, assim como os seus principais indicadores (alfa de Cronbach, omega, fiabilidade composta) serão aprofundados num artigo dedicado.

9. Adaptação Transcultural de Instrumentos de Medida

A adaptação de instrumentos para novos contextos culturais deve seguir procedimentos de tradução e retrotradução. Beaton et al. (2000) e a International Test Commission (2017) fornecem diretrizes metodológicas detalhadas para esse processo. Para além disso também é importante o recurso a validade de conteúdo, realização de estudo piloto e também a análise da validade de construto e da fiabilidade.

O processo de tradução e retrotradução será explicado detalhadamente num artigo específico sobre adaptação transcultural.

10. Como reportar em Teses e Artigos Científicos

O relato académico deve incluir descrição do construto, procedimentos de desenvolvimento, resultados das análises fatoriais, índices de ajustamento, medidas de fiabilidade e evidências de validade. O Publication Manual da APA (2020) recomenda transparência e apresentação completa dos resultados.

Referências

American Psychological Association. (2020). Publication manual of the American Psychological Association (7th ed.).

Beaton, D. E., et al. (2000). Guidelines for the process of cross-cultural adaptation of self-report measures. Spine, 25(24), 3186–3191.

DeVellis, R. F. (2016). Scale development: Theory and applications (4th ed.). Sage.

Hair, J. F., et al. (2019). Multivariate data analysis (8th ed.). Cengage.

Hinkin, T. R. (1998). A brief tutorial on the development of measures. Organizational Research Methods, 1(1), 104–121.

International Test Commission. (2017). The ITC guidelines for translating and adapting tests (2nd ed.).

Kline, R. B. (2016). Principles and practice of structural equation modeling (4th ed.). Guilford Press.

Nunnally, J. C., & Bernstein, I. H. (1994). Psychometric theory (3rd ed.). McGraw-Hill.

Worthington, R. L., & Whittaker, T. A. (2006). Scale development research. The Counseling Psychologist, 34(6), 806–838.

Tipos e Métodos de Amostragem

As amostragens probabilísticas

A amostragem será classificada como probabilística caso cada elemento na população tenha a mesma probabilidade de pertencer a mesma amostra e esta seja diferente de zero, sendo as técnicas de amostragens probabilísticas mais frequentes a saber: amostragem aleatória simples; a amostragem sistemática, amostragem aleatória estratificada e a amostragem em Cachos.

Amostragem Aleatória Simples

A amostragem aleatória simples é uma técnica de acordo com a qual cada um dos indivíduos da população alvo tem a mesma probabilidade de ser selecionado para integrar uma amostra, sendo utilizado no caso de uma população ser homogênea. Para tanto, deve-se proceder à numeração de todos os sujeitos da população e, por meio de um sorteio ou ajuda de uma tabela formada por números aleatórios, conseguir aqueles que formarão a amostra almejada. Assim, uma amostra aleatória simples pode ser formada conforme duas técnicas: amostra com reposição ou amostra sem reposição, sendo que na amostragem com reposição, a unidade escolhida volta para a população enquanto que na amostragem realizada sem reposição, a unidade escolhida não volta para a população. Assim sendo, é válido notar que, de modo geral, as amostragens são realizadas sem reposição e os cálculos de estatística nos dois tipos são iguais.

Amostragem Sistemática

A amostragem sistemática também poderá ser utilizada apenas se existir uma relação ordenada de integrantes da população, como, por exemplo por ordem alfabética ou lista telefónica. Tal técnica está baseada na retirada de K integrantes dessa lista sendo o primeiro deles retirado ao acaso, sendo que equivale à razão entre a extensão da população e da amostra. Assim sendo, a amostragem sistemática é a mais adequada pois é possível a definição de um até conseguir a amostra do tamanho almejado.

Amostragem Aleatória Estratificada

A amostragem estratificada será utilizada quando a população tiver características precisas como, por exemplo, idade e sexo, que possibilitem a formação de subconjuntos homogêneos ou os denominados estratos, uma vez que, nestas situações, as amostras selecionadas por amostragem simples tem menor representatividade, sendo em seguida retirado de modo aleatório uma amostra relativa a cada um dos estratos. Assim, tal forma de amostragem é uma das mais aplicadas, já que a maioria das populações possuem estratos bem definidos, como, por exemplo, os de homens e os de mulheres, sendo que entre suas vantagens estão as seguintes:
 Os dados são em geral mais homogéneos dentro de cada subconjunto do que na população total;
 O custo para recolha e análise dos dados é quase sempre mais baixo do que na aleatória simples;
 É possível conseguir estimativas separadas dos parâmetros da população para cada estrato sem escolher outra amostra, ou seja, sem qualquer custo extra.

Amostragem em Cachos ou conglomerados

A amostragem em cachos está baseada na retirada de modo aleatório dos elementos por cachos e não unidades, sendo útil quando os elementos da população devem ser considerados como grupos ou quando não é viável obter uma relação de todos os sujeitos da população-alvo. Assim, é válido saber que em todo agrupamento (cachos ou estratos), a amostra só é tida como probabilística se os grupos forem selecionados ao acaso antes da separação aleatória dos indivíduos nos estratos. O número de integrantes em cada conglomerado deve ser pequeno em comparação a extensão da população, mas devem conter grandes quantidades de estratos. Tal amostragem será indicada quando não se tem um sistema de referência ordenando todos os integrantes da população, ou tal elaboração seja muito custosa, sendo que o custo do alcance de dados aumenta com o crescimento da distância entre os mesmos.

As Amostragens Não Probabilísticas

É uma estratégia de seleção de acordo com a qual cada integrante da população não tem a mesma probabilidade de ser selecionado para constituir a amostra, sendo a extensão da amostra extremamente importante uma vez que quanto maior for, menor será a probabilidade de que casos incomuns possam influenciar a totalidade de maneira significativa. Por isso, as amostras provenientes desta modalidade de amostragem devam ter sempre um número acima daquele que representaria a totalidade caso fosse usada uma amostragem da modalidade probabilística. Assim sendo, as técnicas de amostragens não-probabilísticas são: amostragem acidental ou de conveniência (por substituição da aleatória simples); amostragem por cotas (por substituição da amostragem estratificada ou por cachos); amostragem de seleção racional ou tipicidade (por substituição da estratificada); amostragem por Redes ou Bola de Neve (por substituição da sistemática).

Amostragem Acidental ou de Conveniência

É constituída por indivíduos que possam ser contactados de modo fácil, que estão numa localidade específica e momento preciso, tendo a vantagem de ser de simples organização e custo baixo, entretanto, tal modalidade de amostra gera enviesamentos, pois nada aponta que os primeiros 30 sujeitos sejam representativos da população-alvo. Assim sendo, são aplicadas a pesquisas que não têm como fim generalizar os resultados sendo muitas vezes usadas em hospitais. Dessa forma, é relevante a visão crítica do investigador para evitar vieses, por exemplo, não escolher sempre sujeitos com idades próximas, empregando critérios específicos de inclusão e exclusão.

Amostragem por Quotas

Igual à amostragem aleatória estratificada, uma vez que é formada por uma quantidade pré-determinada de sujeitos em cada uma das diversas categorias da população. Tal amostragem será diferente da estratificada somente pelo facto dos indivíduos não serem selecionados de modo aleatório dentro de cada cota ou grupo.

Amostragem por Seleção Racional, Julgamento ou por Tipicidade

Tem como pilar a avaliação do pesquisador ou especialista para formar uma amostra de indivíduos em função do seu carácter típico ou atípico cujos integrantes tenham ótimas possibilidades de fornecerem os dados que o estudo demanda, como, por exemplo, a investigação de casos que fogem à regra como uma doença muito rara.

Amostragem por Redes ou Bola de Neve

Este método está baseado na seleção de indivíduos que não seriam fáceis de serem encontrados de outro modo, tendo-se em mente as redes sociais, ciclo de amigos e conhecimentos, por exemplo, caso o pesquisador ache pessoas que satisfaçam os critérios estabelecidos e solicita que recomendem outros indivíduos que possuam características semelhantes.

Bibliografia

Pocinho, M. (2009) Teoria e exercícios passo-a-passo: Amostra e tipos de amostragem. Publicado por Research Gate. https://www.researchgate.net/publication/268150358

Validação, Tradução e Adaptação de Instrumentos Psicológicos

A adaptação de instrumentos psicológicos é difícil e exige alto rigor na metodologia utilizada. Assim, a adaptação de tais instrumentos não é fácil e demanda planeamento e exigências no que toca à preservação do conteúdo, psicometria e validação para a amostra a quem se direciona (Cassepp-Borges, Balbinotti, & Teodoro, 2010).

Por isso, será devida a comprovação das evidências que provam a correspondência de sentidos dos pontos estudados assim como as medidas psicométricas da versão reformulada do instrumento em questão (International Test Commission [ITC], 2010).

Além disso, esta adaptação inclui um ajustamento à cultura, ou seja, a preparação do instrumento para utilização em contextos novos (Beaton, Bombardier, Guillemin, & Ferraz, 2000; Hambleton, 2005; Sireci, Yang, Harter, & Ehrlich, 2006).

A International Test Commission (ITC) trabalha desde 1992 para sugerir orientações para a traduzir e adaptar instrumentos psicológicos entre sociedades com culturas distintas (ITC, 2010).

Assim, traduzir é a primeira ação para tal adaptação, uma vez que ao adaptarmos um instrumento, teremos que ter em conta uma série de aspetos tais como aqueles da cultura, idioma, língua e contextos próprios à tradução do mesmo (Hambleton, 2005). Após feita essa adaptação, é viável a realização de pesquisas entre populações distintas, fazendo analogias entre traços de pessoas de culturas distintas (Gjersing, Caplehorn, & Clausen, 2010; Hambleton, 2005).

O processo de adaptação de um instrumento que já existe para criar um outro instrumento, voltado para a população-alvo, é vantajoso por várias razões uma vez que ao fazer tal ajuste do instrumento, o investigador pode comparar informações de amostras distintas, advindas de mais de um contexto, o que possibilita aumento da equivalência na hora de avaliar resultados, pois se refere a uma igual medida, que realiza uma avaliação partindo de uma mesma visão a nível teórico e metodológico, o que viabilizará também um maior potencial para fazer generalizações e estudar aquilo que é diferente em outras populações (Hambleton, 2005; Vivas, 1999).

Assim, de modo amplo, a literatura indica que para adaptar um instrumento deve haver cinco etapas importantes: (1) traduzir o instrumento do idioma original para o idioma da minha população-alvo, (2) realizar um resumo das versões já traduzidas, (3) analisar a versão resumida por meio de juízes especializados, (4) traduzir de forma reversa para o idioma de original, e (5) estudo-piloto (Hambleton, 2005; Sireci et al., 2006).

Entretanto, percebe-se que, nessas etapas, não constam demais aspetos significativos para a adaptação do novo instrumento elaborado, como, por exemplo, a avaliar de forma conceitual alguns pontos pela própria população-alvo e discutir com quem fez o instrumento original acerca de adaptações e alterações sugeridas para o modelo reformulado do instrumento.

O primeiro ponto significativo a se ter em conta, na adaptação de um instrumento, é a sua tradução para o idioma da população-alvo, ou seja, o idioma no qual o novo instrumento será aplicado, sendo este passo algo difícil, pois, demanda vários cuidados para que o instrumento obtido seja bem adaptado para o contexto de destino e ao mesmo tempo esteja em congruência com aquela versão anterior (Tanzer, 2005).

Dessa forma, antigamente era consenso que somente um tradutor seria o bastante para fazer esta tradução, mas atualmente os estudiosos aconselham que a tradução seja feita por dois tradutores bilíngues, o que reduzirá o risco de outras interpretações com base na linguagem, psicológicas, culturais e de perceção da teoria e da aplicação prática do instrumento (Cassepp-Borges et al., 2010).

A segunda etapa equivale a comparação entre as distintas traduções e avaliação das discrepâncias a nível semântico, idiomático, conceitual, linguístico e contextual, com o propósito de alcance de apenas uma versão, sendo nesse momento possível que surjam dois complicadores: (1) traduções difíceis que tornem mais difícil o entendimento da população-alvo ou (2) traduções muito simplificadas que reduzem o conteúdo de um dado ponto do estudo.

Assim, opções inadequadas serão identificadas e solucionadas por meio de trocas entre os juízes especialistas e investigadores incumbidos de avaliar o instrumento em causa.

Depois do resumo da nova versão, o investigador ter a ajuda de um comitê de especialistas em avaliação a nível psicológico ou que sejam especializados no construto que o instrumento procura avaliar, o qual fará a avaliação de fatores ainda não considerados, como a estrutura e amplitude do novo instrumento.

Nesse momento, os especialistas farão uma avaliação, por exemplo, se algumas expressões empregadas poderão ser ampliadas para outros contextos e amostras populacionais, como as de diversas zonas de uma mesma nação e se estas são apropriadas para a população-alvo.

A tradução reversa é compreendida como uma checagem do controlo de qualidade incremental. Assim, tal etapa irá acontecer depois de todos os ajustes de significados e de idioma, pois, nesse momento o instrumento precisará estar em condições de ser submetido a avaliação por aquele autor que criou originalmente o instrumento (Sireci et al., 2006)..

Dessa forma, a tradução reversa diz respeito a tradução da versão já resumida e revista para o idioma original, tendo como meta avaliar em que nível de precisão a versão nova reflete o conteúdo dos pontos propostos pela versão de origem.

Entretanto, antes de confirmarmos que o novo instrumento está válido para ser aplicado, deve ser conduzido um estudo-piloto, que diz respeito a uma aplicação em momento prévio do instrumento em uma amostra reduzida que esteja de acordo com traços da amostra-alvo (Gudmundsson, 2009).

Assim, depois das alterações propostas no primeiro estudo-piloto, deverá ser feito um segundo estudo-piloto ou a quantidade que for necessária para avaliação precisa do instrumento, antes que este seja aplicado.

No campo da Psicologia têm crescido o número de estudos transculturais, o que, têm demandado maior rigor e cuidado no que toca ao aperfeiçoamento da qualidade e adequação de medições ajustadas e válidas para utilização em diversos cenários (ITC, 2010).

Embora seja sabido que a relevância da adaptação desses instrumentos para culturas diferentes, investigadores têm ressaltado que a maior parte dos estudos nessa área têm sido invalidados devido ao facto de serem consideradas inadequadas a tradução e adaptação dos instrumentos em questão. (Hambleton, 2005).

Tais adaptações são baseadas na tradução de itens para o idioma da população-alvo, sendo que muitas vezes são feitas pelos investigadores da pesquisa que realizam a tradução reversa, na qual verifica-se somente o nível de equidade de sentidos entre um modelo adaptado e aquele original (Cassepp-Borges et al., 2010; Hambleton, 2005; Reichenheim & Moraes, 2003).

Nos estudos da área da psicologia é comum a pesquisa sobre um constructo psicológico por meio do uso de certos instrumentos, como inventários de autorrelato, inquéritos e escalas, especialmente na clínica ou no setor da saúde.

Por isso, se num determinado contexto não existe um instrumento de medição para um certo constructo, este será procurado em países onde já foram feitos testes para validação de versões do instrumento já aplicadas a estudos da mesma natureza e âmbito (Cassep-Borges; Balbinotti; Teodoro, 2010; Duarte; Bordin, 2000).

Não existe um consenso acerca do modo de adaptação de um instrumento para sua utilização no contexto de outra cultura, pois, este procedimento vai variar de acordo com o instrumento e contexto onde se aplica e amostra de destino. Entretanto, existe um consenso de que tal adaptação inclui mais do que a simples tradução, que não assegura a validação do construto e a confiabilidade daquilo que se pretende medir.

De acordo com o International Test Commission (ITC, 2005) as orientações para adaptar testes e demais instrumentos psicológicos devem ter como base a comparação com códigos que já existem no país, procurando fazer com que estes sejam devidamente reconhecidos e tidos como consistentes em outros países. Assim, a tradução e adaptação deve abranger os contextos da língua e cultura da amostra de destino, sendo conservado o mesmo nível de qualidade do instrumento de origem.

Tais orientações da Comissão de Testes Internacional englobam: (a) a utilização da língua devendo ser adequada para todas as amostras populacionais no que toca á diversidade de culturas e línguas de destino; (b) a escolha de uma técnica, forma dos itens e meios de ação, que precisa ser conhecida a todas as amostras-alvo; (c) o conteúdo dos itens e materiais precisam ser já conhecidos a todas as amostras-alvo; e (d) deve ser assegurado que o projeto de recolha de dados possibilita a utilização das técnicas estatísticas pertinentes para estabelecimento da equivalência de itens entre os diversos modelos linguísticos da(s) testagem (s) ou instrumento(s) (ITC, 2005).

A validade de construto se refere ao potencial do instrumento em refletir realmente o tema que procura estudar (Kazdin, 2010).

Assim, uma das opções é usar outro instrumento que possa proceder a avaliação do mesmo construto e fazer a medição da correlação entre eles, sendo que os resultados alcançados através de outro teste validado vão predizer igual desempenho que o anterior e vão servir de base para estabelecer a validação do novo instrumento validado (Pasquali, 2009).

Dessa forma, ambos os instrumentos precisam mostrar evidências de validação ao convergirem ou mostrarem importantes e altos indicadores que apontam correlações. (Shaughnessy; Zechmeister; Zechmeister, 2012).

A confiabilidade é capacidade de produzir resultados consistentes no tempo e espaço, ou por meio de observadores distintos, apontando aspetos acerca da coerência, precisão, estabilidade, equivalência e homogeneidade. (Terwee et al, 2007).

Então, a escolha dos testes estatísticos utilizados para avaliação da confiabilidade varia conforme aquilo que se quer medir (Keszei, Novak e Streiner, 2010).

Já no que toca à validade, existem três tipos mais importantes, validade de conteúdo, validade de critério e validade de construto, sendo que no que toca a este último, é difícil que seja obtida sua validação através de uma única pesquisa, sendo realizadas inúmeras pesquisas acerca da teoria do constructo que se deseja medir (Polit & Beck, 2011; Martins, 2006), pois, quanto maiores as evidências, maior validação terão as conclusões acerca dos resultados obtidos (Kimberlin & Winterstein, 2008).

Assim, os investigadores fizeram uma subdivisão da validade de um constructo em três modalidades: o teste de hipóteses, a validade estrutural e a validade transcultural (Mokkink et al, 2010; Polit, 2015).

Bibliografia

Beaton, D. E., Bombardier, C., Guillemin, F., & Ferraz, M. B. (2000). Guidelines for the process of crosscultural adaptation of self-report measures. Spine, 25(24), 3186-3191.

Cassepp-Borges, V., Balbinotti, M. A. A., & Teodoro, M. L. M. (2010). Tradução e validação de conteúdo: Uma proposta para a adaptação de instrumentos. In L. Pasquali, Instrumentação psicológica: Fundamentos e práticas (pp. 506-520). Porto Alegre: Artmed.

Duarte, C; Bordin, I.A.S. Instrumentos de Avaliação. Rev. Bras. Psiquiatr, v. 22, n. Supl II, p. 55–58, 2000.

Gjersing, L., Caplehorn, J. R. M., & Clausen, T. (2010). Cross-cultural adaptation of research instruments: Language, setting, time and statistical considerations. BMC Medical Research Methodology, 10, 13. doi:10.1186/1471-2288-10-13

Gudmundsson, E. (2009). Guidelines for translating and adapting psychological instruments. Nordic Psychology, 61(2), 29-45. doi:10.1027/1901-2276.61.2.29

Hambleton, R. K. (2005). Issues, designs, and technical guidelines for adapting tests into multiple languages and cultures. In R. K. Hambleton, P. F. Merenda, & C. D. Spielberger (Eds.), Adapting educational and psychological tests for cross-cultural assessment (pp. 3-38). Mahwah, NJ: Lawrence Erlbaum.

Haughnessy, J. J; Zechmeister, E.B; Zechmeister, J.S. Metodologia de Pesquisa em Psicologia. Porto Alegre: AMGH Editora, 2012.

ITC. ITC Guidelines for Translating and Adaptating Tests. [s.l: s.n.]. Disponível em: <http://www.intestcom.org/upload/sitefiles/40.pdf>.

International Test Commission. (2010). International Test Commission guidelines for translating and adapting tests. Recuperado em 24 julho 2012, de http://www.intestcom.org/upload/sitefi les/40.pdf

Kazdin, A. E. Research Design in Clinical Psychology. 4. ed. New York: Allyn&Bacon, 2010.

Keszei AP, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res. 2010 Apr;68(4):319-23.

Kimberlin CL, Winterstein AG. Validity and reliability of measurement instruments used in research. Am J Health Syst Pharm. 2008 Dec;65(23):2276-84.

Mokkink LB, Prinsen CAC, Bouter LM, Vet HCW, Terwee CB. The COnsensus-based Standards for the selection of health Measurement Instruments (COSMIN) and how to select an outcome measurement instrument. Braz J Phys Ther. 2016 Mar-Apr;20(2):105-13.

Pasquali, L. Psicometria. Rev Esc EnfermUSP, v. 43, p. 992–999, 2009.

Reichenheim, M. E., & Moraes, C. L. (2003). Adaptação transcultural do instrumento Parent-Child Confl ict Tactics Scale (CTSPC) utilizado para identificar a violência contra a criança. Cadernos de Saúde Pública, 19(6), 1701-1712. doi:10.1590/S0102-311X2003000600014

Sireci, S. G., Yang, Y., Harter, J., & Ehrlich, E. J. (2006). Evaluating guidelines for test adaptations: A methodological analysis of translation quality. Journal of Cross-Cultural Psychology, 37(5), 557-567. doi:10.1177/0022022106290478

Tanzer, N. K. (2005). Developing tests for use in multiple languages and cultures: A plea for simultaneous development. In R. K. Hambleton, P. F. Merenda, & C. D. Spielberger (Eds.), Adapting educational and psychological tests for cross-cultural assessment (pp.

235-264). Mahwah, NJ: Lawrence Erlbaum.

Terwee CB, Schellingerhout JM, Verhagen AP, Koes BW, Vet HC. Methodological quality of studies on the measurement properties of neck pain and disability questionnaires: a systematic review. J Manipulative Physiol Ther. 2011 May;34(4):261-72.

Vivas, E. (1999). Estudios transculturales: Una perspectiva desde los trastornos alimentarios. In S. M. Wechsler & R. S. L. Guzzo (Orgs.), Avaliação psicológica: Perspectiva internacional (2a ed., pp. 463-481). São Paulo: Casa do Psicólogo.

Teoria de Amostragem e Cálculo Amostral

A Teoria da Amostragem diz respeito à estratégia a ser utilizada para seleção de uma amostra, além de fornecer mais informações acerca do modo de ação no que toca ao uso de uma metodologia de amostragem para uma investigação ou estudo.

Dessa forma, assim que o pesquisador estabeleça a população potencial para sua investigação, ele deve fixar critérios de escolha dos seus constituintes, que podem ser para incluir ou excluir pessoas que integrarão o estudo, sendo que uma amostra é considerada representativa caso as suas características se pareçam o mais possível às da população-alvo.

É assim importante que a amostra ilustre não apenas as variáveis sob investigação, mas também outros fatores que possam exercer algum impacto sobre as variáveis da pesquisa, como a idade, o sexo, a escolaridade e o rendimento.

Assim, o potencial de representatividade de uma amostra, é avaliado através da comparação entre as médias da amostra com as da população-alvo, sendo o conceito de amostra definido como o conjunto de elementos extraídos de uma população, que de modo suficiente, representem essa população. Assim sendo, após a definição da amostra, estaremos prontos para efetuar a análise dos resultados como se investigássemos a população na sua totalidade.

A amostra será sempre finita, entretanto, quanto maior for esta, mais valiosa é a pesquisa. No entanto, como sempre há dúvidas de que todas as características da população estão representadas numa amostra, já que estas não costumam ser conhecidas, partindo-se do princípio de que um certo grau de erro sempre estará presente.

Assim, os resultados de investigações por amostragem estão sempre expostos a uma determinado grau de incerteza, não apenas porque se estudou somente uma parte da população, mas também devido a falhas de mensuração, sendo que tal grau de incerteza pode ser diminuído com o crescimento do tamanho da amostra e através do uso de ferramentas mais eficazes de mensuração.

A teoria da amostragem tem em conta duas dimensões:

1ª) Dimensionamento da Amostra e

2ª) Composição da Amostra, sendo inúmeros os meios de determinação da extensão de uma amostra. No entanto, será preciso voltar a atenção para os seguintes pontos:

Análise do inquérito ou roteiro da entrevista e selecionar uma ou mais variáveis que avalie serem mais significativas para o estudo.
Conferir o nível de mensuração da variável: nominal, ordinal ou intervalar;
Ter em conta a extensão da população: infinita ou finita
O tamanho da amostra é determinado em função do grau de mensuração da variável selecionada.
São inúmeras as fórmulas que possibilitam o cálculo da extensão de uma amostra e sua seleção dependerá do que é estudado ou dos parâmetros à disposição.

A seguir são apresentadas algumas fórmulas para cálculos amostrais:

Variável intervalar e população finita

Quando a variável é de nível intervalar e a população é considerada finita, determina-se o tamanho da amostra pela fórmula:

onde:

Z = abscissa da normal padrão

N = tamanho da população

d = erro amostral

Variável qualitativa (nominal ou ordinal) e população finita

Quando a variável for nominal ou ordinal e a população for considerada finita, determina-se a extensão da amostra através da fórmula:

onde:

Z = abscissa da normal padrão

N = tamanho da população

p = estimativa da proporção.

𝑞 = 1- p

d = erro amostral

Assim, as fórmulas citadas acima são básicas para toda modalidade de composição da amostra. No entanto, existem fórmulas específicas de acordo com o critério relativo à composição da amostra. Caso não existam condições de previsão do possível valor para 𝑝, será admitida 𝑝 =0,50 pois, assim, teremos a maior extensão da amostra, considerando constantes os outros elementos.

Determinação da Margem de Erro da Amostra

A Margem de erro de uma amostra que representará de modo aproximado uma população é explicada da seguinte forma: Pot exemplo caso uma investigação possua uma margem de erro de 3% e um certa doença teve 20% de prevalência na amostra formada, podemos falar que, naquele momento, na população em questão, ela terá uma prevalência entre 17% e 23% (20% menos 3% e 20% mais 3%). O nível de confiança é definido como um parâmetro utilizado pelas investigações, que é frequentemente de 95%, que significam que caso realizemos uma nova pesquisa, com uma amostra de igual extensão, nas mesmas datas e lugares e com a mesma ferramenta para coleta de dados, existirá uma probabilidade de 95% de que os resultados sejam iguais e uma probabilidade de 5% de que tudo seja diferente.

Fórmula para conhecer a margem de erro padrão

sp =raiz quadrada de (p. q) /n

De acordo com Agranonik e Hirokata (2009), é notório que a extensão da amostra para estimar uma proporção cresce, quando o nível de confiança do intervalo aumenta ou quando é reduzida a margem de erro. Por isso, caso o objetivo seja fazer a comparação entre proporções, a extensão da amostra aumentará, quando for diminuído o nível de significância, quando é aumentada a eficácia do teste, ou quando for reduzida a menor diferença relevante que almeja-se identificar entre as proporções.

Assim sendo, caso seja identificado um efeito de significância, igual ou superior ao estabelecido no cálculo, ele será percebido como importante do ponto de vista estatístico. Já ao ser estimada uma proporção por meio de intervalo de confiança, para reduzirmos a extensão da amostra, será preciso reduzir o nível de confiança, ou fazer crescer a margem de erro, sendo que a prevalência aplicada deve ser a encontrada em pesquisas anteriores conduzidas em uma amostra advinda de uma população parecida e de forma aproximada ao da investigação atual.

Entretanto, é facto conhecido que, em algumas situações, há limitações à extensão da amostra, por causa de recursos financeiros ou do tempo de recolha. No entanto, o tamanho da amostra deve ser o reflexo do verdadeiro objetivo da investigação, no sentido da extensão de efeito ou precisão do cálculo da estimativa

Exemplo de cálculo de tamanho de amostra para uma proporção

Almeja-se estimar a prevalência do tabagismo em jovens do Porto, com nível de confiança de 95% e margem de erro de 0,05. Não havendo estudos prévios, é possível utilizar a proporção de 50% na fórmula 2, sendo obtido o seguinte tamanho de amostra:

p = 0,50

1- p = 1- 0,50 = 0,50

Nível de confiança: 95% Z = 1,96

É relevante notar que o cálculo da extensão da amostra ilustra o número mínimo necessário de indivíduos que devem ser entrevistados para alcançar um determinado objetivo. Assim, caso o valor auferido não seja um número inteiro, ele deverá ser arredondado para mais.

Para determinação da extensão da amostra a fim de comparar 2 proporções, é essencial que o investigador defina:

1- Qual a hipótese nula e decida se a hipótese alternativa é uni ou bidirecional;

2- A estimativa da magnitude de efeito e a variabilidade em termos de p1 (proporção de sujeitos em um dos grupos) e p2 (proporção de sujeitos com o desfecho no outro grupo);

3- O nível de significância (α) e o poder (1 – β).

A extensão da amostra para comparar 2 proporções (p1 e p2), para grupos de igual tamanho, pode ser estimada pelo uso da fórmula que segue onde:

n: é o número de sujeitos necessários em cada um dos grupos

p1: é a proporção esperada para o grupo 1,

p2: é a proporção esperada para o grupo 2

Bibliografia

Agranonik, M e Hirokata, V. Cálculo de tamanho de amostra: proporções. Revista HCPA. 2011; 31 (3): 382-388. Seção de Bioestatística.

Pocinho, M. (2009) Teoria e exercícios passo-a-passo: Amostra e tipos de amostragem. Publicado por Research Gate. https://www.researchgate.net/publication/268150358

Discussão dos resultados obtidos no SPSS

Após a obtenção de resultados e análise estatística dos mesmos, através de testes existentes no SPSS, realiza-se de forma clara e objetiva a ponte entre a teoria previamente construída (pressupostos teóricos, estudos de investigação) e os resultados obtidos, com a finalidade de comprovar ou esclarecer de forma concisa e coerente as questões e objetivos levantados numa fase metodológica inicial.

A discussão dos resultados obtidos pelo SPSS permite assim a retirada de conclusões relativas a uma determinada amostra ou população em estudo, servindo como referência à realização de novos estudos de investigação ou desenvolvimento e implementação de programas de intervenção em determinadas áreas.

Análise Estatística de Dados

Validade de Conteúdo em Questionários: Como aplicar e principais índices (CVR, CVI e V de Aiken)

1. O que é a validade de conteúdo em questionários?

2. Processo de Avaliação de Conteúdo

2.1. Planeamento do instrumento (test blueprint)

2.2. Seleção de especialistas e considerações práticas

2.3. Principais índices para avaliação da validade de conteúdo em questionários

3. Evidência empírica: alguns estudos com aplicação da validade de conteúdo em questionários

4. Recomendações práticas

5. Alguns artigos relacionados (No nosso site)

Referências Bibliográficas

Construção e Adaptação de Questionários: Fundamentos Metodológicos e Validação Estatística

Etapas da Construção e Adaptação de Questionários

1. Definição Conceptual e Operacionalização do Construto

2. Criação e Refinamento de Itens

3. Validade de Conteúdo em questionários ciêntificos

4. Estudo Piloto

5. Validade de Construto

5.1. Análise Fatorial Exploratória (AFE)

5.2. Análise Fatorial Confirmatória (AFC)

6. Validade Convergente e Discriminante

7. Avaliação da Fiabilidade

9. Adaptação Transcultural de Instrumentos de Medida

10. Como reportar em Teses e Artigos Científicos

Referências

Tipos e Métodos de Amostragem

Validação, Tradução e Adaptação de Instrumentos Psicológicos

Teoria de Amostragem e Cálculo Amostral

Discussão dos resultados obtidos no SPSS