Introdução
As fraturas da extremidade proximal do fêmur causam grande morbidade e mortalidade a curto e médio prazo nos idosos,[1]
[2]
[3] sendo que um terço dos pacientes evolui para óbito em um ano, e metade se torna dependente para locomoção.[4]
[5] Estas fraturas também podem acometer pacientes jovens vitimados por trauma de alta energia.[4] O tratamento destas lesões requer a atuação de uma equipe multidisciplinar.[6] Estas lesões têm tratamento eminentemente cirúrgico e, para que se defina o melhor tratamento, entre outros dados, é necessário que se classifique a fratura.
Um sistema ideal de classificação deve permitir a comunicação entre médicos, padronizar a terminologia para pesquisa e guiar a decisão do tratamento.[6] Muitas tentativas de se criar um sistema de classificação de fraturas do fêmur proximal foram descritas, sendo as classificações de Garden,[7] Evans,[8] Boyd e Griffin,[9] Tronzo[10] e do Arbeitsgemeinschaft für Osteosynthesefragen/Orthopaedic Trauma Association (AO/OTA),[11] as mais conhecidas. A classificação AO/OTA tem evidência favorável de confiabilidade na região trocantérica[12]
[13]
[14] e no colo do fêmur[15] quando comparada as outras classificações comumente utilizadas. Porém, suas ramificações adicionais tendem a diminuir a confiança interobservadores[13]
[16] e requerem grande prática.[16]
[17]
A validação de uma classificação ocorre com a demonstração de alguns critérios: boa correlação clínica, adequação em termos de concordância e acurácia e também validação construtiva (relevância).[18] Preocupações com a terminologia e linha de fluxo complexa da classificação AO/OTA prévia[19] motivaram a modernização da classificação. Entretanto, não localizamos estudos na literatura sobre a confiabilidade desta nova versão.
Nesse sentido, este estudo teve como objetivos avaliar o grau de concordância intra e interobservadores em cada subdivisão sequencial da nova classificação AO/OTA para fraturas da extremidade proximal do fêmur, em observadores considerados experientes (cirurgiões de quadril) e observadores inexperientes (residentes de ortopedia).
Materiais e Métodos
Este estudo retrospectivo incluiu registros radiográficos de pacientes que sofreram fraturas da extremidade proximal do fêmur entre os anos de 2015 e 2019, tratados em um centro de referência em trauma ortopédico. Foram selecionados 100 casos consecutivos para esta avaliação. O tamanho da amostra foi arbitrado com base em estudos prévios[4]
[5]
[6]
[12]
[13]
[18] que utilizaram amostras menores para validação de classificações (entre 40–70 casos). O projeto foi previamente submetido e aprovado pela Comissão de Ética em Pesquisa da Instituição (CAAE: 30754120.7.0000.5226).
Os critérios de inclusão foram: presença de fratura da extremidade proximal do fêmur (osso 3, região anatômica 1), da região trocantérica (grupo A) ou do colo do fêmur (grupo B), em indivíduos esqueleticamente maduros. Fraturas da cabeça do fêmur (que são melhor avaliadas por tomografia axial computadorizada) e fraturas patológicas não foram incluídas neste estudo.
Cada participante recebeu as imagens digitalizadas de radiografia nas incidências em anteroposterior e perfil para análise. Não havia nenhuma informação do paciente ou do tratamento nas imagens utilizadas para classificação. Quatro ortopedistas especializados em cirurgia do quadril e 4 médicos residentes do 2° ano de ortopedia e traumatologia classificaram todos os casos (de maneira sequencial e ininterrupta, sem limitação de tempo) em 2 momentos distintos, com intervalo de 4 semanas. No início das avaliações, a descrição detalhada da nova classificação e suas imagens ilustrativas foram disponibilizadas aos avaliadores para aprendizagem do sistema. Cada avaliação foi realizada individualmente e não foi permitida a guarda das respostas ou a discussão dos resultados entre os mesmos.
A confiabilidade interobservador foi determinada através da primeira resposta entre os avaliadores e a intra observador através de nova avaliação quatro semanas após a inicial. Este intervalo foi utilizado para se reduzir o risco de viés de memória. Os dados foram coletados e armazenados em planilhas para análise estatística. Para avaliar a concordância intraobservador foi calculado o coeficiente kappa de Cohen e para avaliar a concordância interobservadores foi calculado o coeficiente kappa de Fleiss. Para as análises foram usados o software SPSS Statistics for Windows, Version 20.0 (IBM Corp., Armonk, NY, EUA) e a Online kappa Calculator
www.statisticssolutions.com. A avaliação de concordância incluiu 4 etapas: tipo de fratura (A- trocantérica ou B- colo), grupo (1, 2 ou 3), subgrupos (1, 2 ou 3–exceto no tipo B3, que não possui subgrupos) e também seus qualificadores quando disponíveis na classificação, ou seja, apenas nas A.1.1 (N ou O) ou B2 1, 2 ou 3 (P, Q ou R). A [Tabela 1] e a [Tabela 2] ilustram as diferenças entre as classificações AO/OTA antiga e a nova.
Tabela 1
|
AO/OTA Antiga
|
AO/OTA Nova
|
Grupo A1
|
Transtrocantérica simples
|
Transtrocantérica simples
|
A1.1
|
Simples sem desvio
|
|
Fratura isolada de trocânter
*Qualificadores:
n: trocânter maior
o: trocânter menor
|
|
A1.2
|
Simples desviada
|
|
Fratura em duas partes
|
|
A1.3
|
Simples com traço distal ao calcar
|
|
Fratura com parede lateral intacta (>20,5 mm)
|
|
Grupo A2
|
Transtrocantérica cominuta
|
Transtrocantérica multifragmentária, parede lateral incompetente (<20,5 mm)
|
A2.1
|
Cominuta sem desvio
|
|
|
A2.2
|
Cominuta desviada
|
|
Fratura com 1 fragmento intermediário
|
|
A2.3
|
Multifragmentada (> 3 fragmentos)
|
|
Fratura com 2 ou mais fragmentos intermediários
|
|
Grupo A3
|
Transtrocantérica Reversa
|
Transtrocantérica Reversa
|
A3.1
|
Traço reverso oblíquo
|
|
Traço reverso simples e oblíquo
|
|
A3.2
|
Traço reverso transverso
|
|
Traço reverso simples e transverso
|
|
A3.3
|
Traço reverso com fratura do pequeno trocanter
|
|
Traço reverso com cunha ou
multifragmentária
|
|
Tabela 2
|
AO/OTA Antiga
|
AO/OTA Nova
|
Grupo B1
|
Fratura subcapital com desvio mínimo
|
Fratura subcapital
|
B1.1
|
Impactada em valgo > 15 graus
|
|
Impactada em valgo
|
|
B1.2
|
Impactada em valgo < 15 graus
|
|
Sem desvio
|
|
B1.3
|
Não impactada
|
|
Desviada
|
|
Grupo B2
|
Fratura transcervical
|
Fratura transcervical
|
B2.1
|
Basocervical
|
|
Simples
Qualificadores: p <30° q = 30-70° r >70°
|
|
B2.2
|
Médio cervical em adução
|
|
Multifragmentada
Qualificadores: p <30° q = 30-70° r >70°
|
|
B2.3
|
Médio cervical com cisalhamento
|
|
Com cisalhamento
Qualificadores: p <30° q = 30-70° r >70°
|
|
Grupo B3
|
Fratura subcapital desviada, não impactada
|
Fratura Basocervical
|
|
B3.1
|
Desvio moderado em varo e rotação lateral
|
|
|
B3.2
|
Desvio moderado vertical e rotação lateral
|
|
B3.3
|
Desvio significativo
|
|
Embora o grau de concordância tenha formas distintas de interpretação,[19] adotamos a proposta clássica de Landis e Koch,[20] com valores entre 0.00 e 0.20 considerados como concordância leve; 0.21 e 0.40 concordância razoável; 0.41 e 0.60 concordância moderada; 0.61 e 0.80 concordância substancial, e 0.81 e 1.00 concordância quase perfeita (ou excelente).
Na amostra populacional estudada, a média de idade foi de 77,71 anos (variando de 57 a 98 anos, desvio padrão de 10,12). O sexo feminino foi predominante, com 63% dos casos, e o lado direito teve um caso a mais de fratura (51%).
Resultados
Concordância intraobservador
Na avaliação repetida com intervalo de 4 semanas, a concordância intraobservador de tipo foi quase perfeita para os especialistas com k médio de 0.92, enquanto que a dos residentes foi substancial (k médio 0.77). Já na classificação de grupo, os especialistas apresentam uma concordância substancial (k médio 0.68) e os residentes moderada (k médio 0.44). Para subgrupo, a concordância dos especialistas foi moderada (k médio 0.52), e a dos residentes foi razoável (k médio 0.28). Por fim, em relação aos qualificadores, a concordância dos especialistas também foi moderada (k médio 0.50) e a dos residentes foi razoável (k médio 0.27).
De modo geral, os especialistas apresentam desempenho melhor que os residentes. Observa-se ainda ([Figura 1]) que os coeficientes vão decrescendo à medida que se seguem as ramificações da classificação. A [Tabela 3] descreve detalhadamente os achados intraobservadores.
Fig. 1 Comparativo entre especialistas e residentes do coeficiente médio kappa (intraobservador).
Tabela 3
|
kappa (Cohen)
|
Especialista
|
Tipo
|
Grupo
|
Subgrupo
|
Qualificador
|
1
|
0,972
|
0,705
|
0,607
|
0,607
|
2
|
0,972
|
0,589
|
0,376
|
0,338
|
3
|
0,894
|
0,747
|
0,599
|
0,600
|
4
|
0,851
|
0,713
|
0,500
|
0,459
|
Residente
|
|
|
|
|
1
|
0,828
|
0,468
|
0,298
|
0,300
|
2
|
0,851
|
0,443
|
0,259
|
0,260
|
3
|
0,806
|
0,640
|
0,421
|
0,391
|
4
|
0,608
|
0,230
|
0,153
|
0,144
|
Concordância interobservador
Considerando a primeira rodada como padrão (usado na maioria dos estudos) para a avaliação interobservador, temos uma concordância no tipo de 93,67% para os especialistas (k 0.87, quase perfeita) e 90,17% para os residentes (k 0.80, substancial). No grupo, a concordância foi de 60,83% para os especialistas (k 0.53, moderada) 55,5% para os residentes (k 0.47, moderada). Avançando para subgrupo a concordância caiu para 44,5% entre os especialistas (k 0.41, moderada) e 42,7% para os residentes (k 0.39, razoável). Finalmente, nos qualificadores, a concordância foi 42,67% para os especialistas (k 0.40, razoável) e 41,0% para os residentes (k 0.39, razoável).
A [Tabela 4] detalha os resultados interobservadores. Tanto os especialistas quanto os residentes tiveram decréscimo dos coeficientes à medida que a classificação se ramifica. No entanto, na transição subgrupo-qualificador, o decréscimo da concordância foi pouco significativo. Na primeira rodada, os residentes alcançaram coeficientes sempre abaixo dos coeficientes dos especialistas ([Figura 2]), mas na segunda rodada, os residentes apresentam uma concordância maior entre si do que os especialistas ([Figura 3]).
Tabela 4
|
Avaliação 1
|
Avaliação 2
|
TIPO
|
% concordância
|
Kappa
|
% concordância
|
Kappa
|
Especialistas
|
93,67
|
0,87
|
97,00
|
0,94
|
Residentes
|
90,17
|
0,80
|
94,50
|
0,89
|
GRUPO
|
|
Especialistas
|
60,83
|
0,53
|
58,83
|
0,51
|
Residentes
|
55,50
|
0,47
|
69,50
|
0,63
|
SUBGRUPO
|
|
Especialistas
|
44,50
|
0,41
|
39,67
|
0,35
|
Residentes
|
42,67
|
0,39
|
57,67
|
0,55
|
QUALIFICADOR
|
|
Especialistas
|
42,67
|
0,40
|
37,33
|
0,35
|
Residentes
|
41,00
|
0,39
|
57,17
|
0,55
|
Fig. 2 Concordância interobservadores na primeira avaliação.
Fig. 3 Concordância interobservadores na segunda avaliação.
Discussão
Na classificação AO/OTA prévia, alguns padrões de fratura ocorriam tão raramente que não havia necessidade de uma codificação exclusiva para estes. A terminologia era foco de confusão, devido a grande variedade de termos para fraturas similares. Havia, ainda, dificuldade em definir-se as fraturas do grupo A2. Na nova classificação, as definições e os códigos foram atualizados e simplificados. As fraturas do colo foram reorganizadas e o qualificador de Pauwels agregado para melhor definição de instabilidade, especialmente em fraturas de alta energia.[19]
Um sistema de classificação de fraturas deve ter concordância adequada entre o mesmo observador em oportunidades diferentes (intraobservador) e entre diferentes observadores na mesma oportunidade (interobservador).[6]
[17]
[18] O coeficiente kappa (k) é um dos métodos mais usados para avaliar a acurácia diagnóstica de um sistema de classificação; tendo seu cálculo ajustado para possíveis coincidências ao acaso.[3]
Neste estudo, para os especialistas, a concordância intraobservador foi quase perfeita para tipo, substancial para grupo e moderada para subgrupo e qualificador, enquanto os residentes tiveram um desempenho abaixo em todas as divisões.
Comparar as concordâncias interobservadores nas duas rodadas foi um aspecto interessante desta pesquisa. Uma observação curiosa é que a concordância interobservadores dos residentes aumentou entre as rodadas, o que talvez tenha indicado a capacidade de aprendizado da nova classificação.
Estudos sobre o sistema AO/OTA anterior obtiveram resultados similares aos obtidos em nosso estudo, mas com pequenas variações. O estudo de Pervez et al.[3] obteve um k médio entre seus observadores de 0.62 para grupo, maior do que o observado em nosso estudo (k 0,53 - concordância moderada) e de 0.33 nos subgrupos, menor do que encontramos neste estudo (k 0,41 - concordância moderada). Urrutia et al.[6] obteve concordância moderada, como nossos resultados, entre seus 9 avaliadores para os grupos, e apenas razoável para os subgrupos menor do que em nosso estudo (k 0,41 - concordância moderada). Mattos et al.[4] também obteve resultados semelhantes com AO/OTA e Tronzo. Já Schwartsmann et al.,[14] em um estudo também englobando ortopedistas e residentes, obteve concordância moderada (0.60) para grupo, similar à presente pesquisa, e razoável (0.34) para os subgrupos, menor do que a observada no presente estudo (k 0,41). Outro estudo interessante,[15] com 100 fraturas do colo do fêmur, graduou a classificação de Garden[7] como de concordância interobservadores apenas razoável, que aumentou para moderada ao se simplificar o critério para fraturas desviadas ou não. Isto indica que, em determinadas fraturas, até mesmo uma classificação bastante simples pode gerar concordância apenas moderada.
Em resumo, em relação à classificação antiga, no presente estudo obtivemos concordância similar a da literatura para tipo e grupo e melhor concordância para subgrupo, enquanto qualificadores não eram disponíveis na classificação antiga. Isso indica que o novo sistema obteve sucesso ao trazer maior concordância nos subgrupos, que foram mais extensamente modificados.
Avaliando a questão de experiência dos examinadores na classificação AO/OTA, Crijins et al.[16] não observaram diferença entre 65 cirurgiões divididos entre mais e menos experientes de acordo com as variáveis de tempo de prática (> ou < 17 anos), tempo de trabalho dedicado ao trauma (> ou < 80%) e fraturas tratadas por ano (> ou < 50). Em uma analogia com nosso estudo, avaliamos que os residentes se equipararam aos especialistas na segunda avaliação, indicando uma curva rápida de aprendizado neste sistema. Fung et al.[21] também notou que residentes mais experientes, na sua parte final de treinamento, tinham uma avaliação melhor que os menos experientes, indicando o aprendizado da classificação antiga.
Sobre o novo sistema AO/OTA especificamente, é interessante notar a eliminação do subgrupo A2.1, o que pode auxiliar na distinção de padrões estáveis (grupo A1), dos instáveis (grupos A2 e A3). Estudos do sistema prévio[11] que tentaram discernir até que ponto uma fratura trocantérica era estável tiveram resultados algo conflitantes. Radaideh et al.[22] em um estudo sobre uso de hastes céfalo-medulares, definia os grupos A2 e A3 como instáveis, assim com Zhang et al.[23] Já Knobe et al.[24] citam que os grupos A2 e A3 são geralmente considerados instáveis na literatura, porém em uma avaliação direta a fratura do trocânter menor era o principal critério de instabilidade para 82% dos cirurgiões, entre outros fatores considerados (fratura do trocânter maior, fratura da parede lateral e traço reverso). Outro estudo[25] considerava com instáveis os subgrupos A2.1, A2.2 e A3.3.
A classificação atual tem a integridade da parede lateral (largura superior a 20,5 mm) como o padrão de divisão entre o grupo A1 e A2. O racional para esta divisão foi inicialmente descrito por Gottfried[26] e Palm et al.,[27] que definiram a parede lateral como importante estrutura para suporte de implantes. Posteriormente, Hsu et al.[28] conseguiram avaliar qual a espessura da parede lateral seria necessária para síntese com placa-parafuso deslizante com segurança, o que motivou a mudança atual da classificação. Outros estudos[29] revisaram o assunto e trouxeram estratégias para reconstrução da parede lateral mesmo com o uso de síntese intramedular. Com base nesta revisão da literatura e as dificuldades de classificação em subgrupos, achamos interessante a divisão dos grupos a partir de A2 (inclusive) como parâmetro para considerar uma fratura instável que requer acurada técnica de redução e síntese intramedular.
Nosso estudo evidencia as dificuldades em sistemas de classificação para fraturas da extremidade proximal do fêmur. Apesar destas dificuldades, este sistema demonstrou vantagens em relação ao seu antecessor[11] ao simplificar uma divisão para fraturas trocantéricas instáveis ao nível de grupo (A2 e A3) podendo facilitar uma eventual escolha de implante e técnicas de redução. Nas fraturas do colo (tipo B), a nova subdivisão é mais simples do que os complexos subgrupos prévios ([Tabela 1]), e também engloba o qualificador de Pauwels. Adicionalmente, verificamos através da literatura, uma confiabilidade superior da nova classificação AO/OTA quando comparada com outros sistemas muito difundidos (Garden, Evans, Boyd, Tronzo).
No presente estudo, buscamos uma metodologia consistente para avaliação de uma classificação de fraturas, tendo como pontos fortes o tamanho e representatividade da amostra (maior do que estudos prévios, sendo que todos os padrões da nova classificação foram identificados por pelo menos um avaliador), além de um número adequado de observadores para melhor confiabilidade do coeficiente de Kappa.[20] A metodologia de trabalhos de confiabilidade de classificações ortopédicas foi examinada por Audigé et al.,[18] e o presente estudo engloba todos os critérios de qualidade descritos. Além disso, não foi encontrado nenhum estudo com avaliação deste novo sistema nas bases de dados do Pubmed, Medline e Scielo, o que traz dados inéditos e relevantes sobre esta classificação muito popular entre cirurgiões ortopédicos. Outro ponto interessante foi a evolução da concordância interobservadores notada entre médicos residentes entre as avaliações, indicando o aprendizado do sistema. Um ponto deficitário nesta pesquisa foi a inclusão de especialistas de quadril em comparação com apenas quatro residentes do segundo ano. Talvez, a inclusão também de residentes do primeiro e do terceiro ano pudesse demonstrar ainda melhor o processo de aprendizado.
Como outra possível limitação do presente estudo, destacamos a idade média relativamente alta da amostra, indicando uma característica típica do perfil da população do hospital onde este foi realizado. Porém, embora exista risco potencial de não se representarem algumas fraturas mais específicas do trauma de alta energia, mais comum nos mais jovens, ainda assim, todos os padrões da nova classificação AO/OTA foram identificados em algum momento durante o estudo. Se buscássemos outros pacientes mais jovens para incluir na amostra, incorreríamos em viés de seleção. Além disso, estudos desta natureza possuem limitações inerentes ao seu desenho, como potencial vício de memória, que consideramos baixo devido ao grande número de casos, a complexidade da classificação e pelo tempo transcorrido entre as avaliações.
O novo sistema AO/OTA tem uma confiabilidade moderada interobservadores e substancial intraobservadores para avaliadores experientes. Médicos residentes são capazes de atingir os mesmos níveis de concordância após curto período de aprendizado. Mais estudos são necessários para avaliar sua capacidade em relação à indicação de tratamento (especialmente sobre tipo de síntese) e de prognóstico.
Conclusão
A nova classificação AO/OTA para fraturas da região trocantérica e do colo do fêmur mostrou concordâncias intra- e interobservadores adequadas para tipo e grupo, com queda nas ramificações subsequentes, ou seja, subgrupo e qualificador. Ainda assim, em relação à classificação AO/OTA antiga, houve melhora nas concordâncias para subgrupos.