Resumo Justificativa: Um tipo de delineamento bastante utilizado na literatura epidemiológica é o transversal, cujos desfechos são, freqüentemente, binários. A regressão logística é a técnica mais utilizada na análise destes estudos quando se deseja controlar possíveis fatores de confusão, em função da grande disponibilidade de aplicativos e da familiaridade dos pesquisadores com a técnica. No entanto, a medida de efeito neste modelo é a razão de odds e não a razão de prevalências ou incidências, medidas naturais nos estudos transversais e longitudinais. O problema reside no fato de que a razão de odds superestima a razão de prevalências em determinadas situações, distorcendo a interpretação dos resultados, especialmente do ponto de vista da saúde pública. Neste trabalho estudamos as situações em que a superestimação é mais importante, e três formas de conversão da razão de odds em razão de prevalências em situações em que há um fator de confundimento importante.MÉTODOS: A RELAÇÃO ENTRE RAZÃO DE PREVALÊNCIAS E RAZÃO DE ODDS FOI ESTUDADA GRAFICAMENTE, PARA DETERMINADOS VALORES DA PREVALÊNCIA DE DOENÇA ENTRE NÃO EXPOSTOS E O RISCO RELATIVO. ALÉM DISSO, FORAM UTILIZADOS CENÁRIOS ONDE SE SIMULOU SITUAÇÕES RELATIVAMENTE COMUNS EM RELAÇÃO ÀS PREVALÊNCIAS DA DOENÇA E DE CONFUNDIMENTO. NESTES CENÁRIOS, FOI OBSERVADA A PERFORMANCE DE TRÊS FÓRMULAS PARA A CONVERSÃO DA RAZÃO DE ODDS EM RAZÃO DE PREVALÊNCIAS, ATRAVÉS DE GRÁFICOS E DA AVALIAÇÃO DO ERRO PERCENTUAL.Resultados: A superestimação da razão de prevalências pode chegar a 5 vezes em determinadas situações, distorcendo fortemente a interpretação e a priorização de intervenções a nível da saúde pública. Verificou-se que, de maneira geral, a transformação aproxima de forma importante a estimativa da razão de prevalências do valor real ajustado. Nos casos em que há confundimento na razão de prevalências e não na razão de odds, a performance das transformações é a pior. Dentre as formas de conversão estudadas, não se observou grandes diferenças em relação à correção obtida.CONCLUSÕES: A TRANSFORMAÇÃO DA RAZÃO DE ODDS EM RAZÃO DE PREVALÊNCIAS ATRAVÉS DAS EQUAÇÕES APRESENTADAS É JUSTIFICADA DO PONTO DE VISTA DA INTERPRETAÇÃO DA MEDIDA EM TERMOS DE SUA RELEVÂNCIA NO CONTEXTO DA SAÚDE PÚBLICA. NO ENTANTO, NOS CASOS EM QUE HÁ CONFUNDIMENTO A NÍVEL DA RAZÃO DE PREVALÊNCIAS E NÃO A NÍVEL DA RAZÃO DE ODDS, A ESTIMATIVA TRANSFORMADA PODE SER PIOR QUE A RAZÃO DE PREVALÊNCIAS BRUTA, SEM CONTROLE PARA FATORES DE CONFUNDIMENTO. ABSTRACT Introduction: Cross sectional studies with binary outcomes are very frequent in epidemiology, and logistic regression is often used when one wishes to control for confounding factors and test for interactions. However, the odds ratio is the measure of effect yielded by this model, not the prevalence ratio, considered the measure of choice for cross sectional studies. Although frequently interpreted as a prevalence ratio, the odds ratio overestimates it in situations where the outcome is frequent or the association is strong. This may not be an important issue in statistical terms, but it may be misleading in terms of public health. In this paper, situations where this overestimation happens are explored, and three ways of transforming an odds ratio into a prevalence ratio in the presence of a confounding factor are presented and compared. Methods: The relationship between prevalence and odds ratios was studied graphically, for a range of prevalences and relative risks. Also, several scenarios were constructed, mimicking common situations in relation to prevalence and confounding, The performance of the three methods for transforming the odds ratio into a prevalence ratio were assessed by graphics and error percentage compared to the known prevalence ratio. Results: In the situations explored, the odds ratio overestimated the prevalence ratio in up to five times, making clear that the odds ratio cannot generally be interpreted as a prevalence ratio without the risk of important distortions. In most cases, transforming the odds ratio into a prevalence ratio makes the estimate much closer to the real prevalence ratio. However, in cases where there is strong confounding for the prevalence ratio but not for the odds ratio, the transformations performance is worse, and the crude prevalence ratio estimate may be better than the transformed odds ratio. There was no important difference among the three methods used. Conclusions: Transforming the odds ratio into a prevalence ratio is a simple matter and can improve the interpretability of the results when logistic regression is used for the analysis. However, as confounding is different for the two measures studied, the rationale of using logistic regression to control for confounding when the measure of interest is the prevalence ratio is questioned. In some cases the crude prevalence ratio may be better than the transformed adjusted odds ratio.Alternativas de análise utilizando modelos estatísticos para a estimativa da razão de prevalências e de incidências em estudos transversais e longitudinais: uma comparação empíricaRESUMO JUSTIFICATIVA: UM DOS DELINEAMENTOS MAIS UTILIZADOS NA LITERATURA EPIDEMIOLÓGICA É O TRANSVERSAL, UTILIZANDO COMO DESFECHO, VARIÁVEIS BINÁRIAS. NESTE CONTEXTO, A REGRESSÃO LOGÍSTICA É A TÉCNICA MAIS UTILIZADA NESTES ESTUDOS PARA O CONTROLE DE VARIÁVEIS DE CONFUNDIMENTO E MODIFICADORES DE EFEITO. NO ENTANTO, ELA ESTIMA A RAZÃO DE ODDS, MEDIDA DE EFEITO QUE SUPERESTIMA A RAZÃO DE PREVALÊNCIAS OU DE INCIDÊNCIAS. ALÉM DE SER UMA MEDIDA DE DIFÍCIL INTERPRETAÇÃO, NO CONTEXTO DE SAÚDE PÚBLICA, PODE DISTORCER A MAGNITUDE DO EFEITO QUE SE DESEJA ESTIMAR. DIVERSAS ALTERNATIVAS PARA CONTORNAR TÊM SIDO PROPOSTAS NA LITERATURA. SERÃO ABORDADOS TRÊS DIFERENTES MODELOS, COM ALGUNS TIPOS DE AJUSTES, CUJOS COEFICIENTES ESTIMAM DIRETAMENTE O RISCO RELATIVO, UTILIZANDO DADOS REAIS.MATERIAL E MÉTODOS: UMA ABORDAGEM UTILIZADA FOI A REGRESSÃO DE COX, SUPONDO UM PERÍODO DE RISCO CONSTANTE. COMO OCORRE UMA SUPERESTIMATIVA DA VARIÂNCIA, FOI UTILIZADA UMA ESTIMATIVA ROBUSTA DA VARIÂNCIA. OUTRA TÉCNICA ATÉ ENTÃO NÃO SUGERIDA NESTE CONTEXTO, E MUITO SIMILAR À REGRESSÃO DE COX É A REGRESSÃO DE POISSON, COM UM AJUSTE DO PARÂMETRO DE ESCALA PELO DESVIO (DEVIANCE) E PELO QUI-QUADRADO. TAMBÉM FOI ABORDADA A REGRESSÃO LOG-BINOMIAL QUE, NUM CONTEXTO DE MODELOS LINEARES GENERALIZADOS, UTILIZA O LOGARITMO DA PROPORÇÃO COMO A FUNÇÃO DE LIGAÇÃO E DISTRIBUIÇÃO BINOMIAL. OS RESULTADOS FORAM COMPARADOS EM TERMOS DE ESTIMATIVA PONTUAL E DO INTERVALO DE CONFIANÇA, TENDO COMO REFERÊNCIA OS RESULTADOS OBTIDOS NUMA ANÁLISE ESTRATIFICADA UTILIZANDO AS TÉCNICAS DE MANTEL E HAENSZEL.Resultados: Foram estudados três desfechos com diferentes níveis de prevalência: o déficit de peso/altura (4%), asma (31%) e trabalho da mãe (51%). Na situação de menor prevalência, o modelo de Cox robusto, o modelo log-binomial e Poisson com ajuste no parâmetro de escala pelo ?2 foram os que apresentaram resultados mais aproximados aos do risco relativo de Mantel-Haenszel. Para a asma, diferentes resultados foram observados nos diferentes níveis de confundimento, sendo que com confudimento alto (21%), somente fornecem bons resultados os modelos de Cox robusto e da log-binomial. No desfecho mais prevalente, o modelo da regressão de Cox robusta forneceu o intervalo de confiança mais ajustado com o do risco relativo de Mantel-Haenszel.Conclusão: O modelo que apresentou resultados mais consistentes (fornecendo a melhor estimativa em todas as situações foi a regressão de Cox com estimativa da variância robusta, embora a regressão de Poisson com ajuste no parâmetro de escala pelo ?2 e a regressão log-binomial também reduzam o erro na estimativa dos erros padrões de forma considerável. ABSTRACT Introduction: Cross sectional studies with binary outcomes are frequently used in epidemiology, and logistic regression is often used for the analysis. However, two problems arise: the odds ratio can importantly overestimate the prevalence ratio (the measure of choice) and controlling for confounding for the odds ratio is not the same as for the prevalence ratio. In this paper we explore several alternatives for modeling data of such studies with techniques that directly estimate the prevalence ratio. Methods: In the epidemiologic literature two models have been proposed for the analysis of cross sectional data with binary outcome: Cox regression with constant time at risk for the subjects and the log-binomial regression. We compared these two models plus Poisson regression against the standard the Mantel-Haenszel estimator and Cornfield confidence interval. As Cox and Poisson regression overestimate the coefficients’ standard errors and confidence intervals, correcting them by changing the scale parameter in Poisson regression and by using robust variance estimators was studied as well. Results: Three outcomes with different levels of prevalence were explored: weight-for-height deficit (4%), asthma (31%) and mother in a paid job (51%). When the prevalence was lowest, Cox regression with robust variance, log-binomial regression and Poisson with scale parameter adjusted by the Pearson ?² were the models that performed best. For asthma, robust Cox and log-binomial regression were the best performers. For the most prevalent outcome, robust Cox regression was the model that yielded the confidence interval closest to Cornfield’s. Conclusion: Cox regression with robust variance was the model that consistently produced the best point and interval estimates. Our results suggest that this method is a better alternative for the analysis of cross sectional data with a binary outcome than logistic regression. Robust variance estimates are also available for Poisson regression that should perform in a similar way. |