CINTHIA ITABORAHY FERREIRA SILVA INTELIGÊNCIA ARTIFICIAL APLICADA AO DIAGNÓSTICO RADIOGRÁFICO DE DISPLASIA COXOFEMORAL EM CÃES LAVRAS – MG 2024 CINTHIA ITABORAHY FERREIRA SILVA INTELIGÊNCIA ARTIFICIAL APLICADA AO DIAGNÓSTICO RADIOGRÁFICO DE DISPLASIA COXOFEMORAL EM CÃES Dissertação apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós-Graduação em Ciências Veterinárias, área de concentração em Diagnóstico por Imagem, para a obtenção do título de Mestre. Orientador Prof. Dr. Antônio Carlos Cunha Lacreta Junior LAVRAS – MG 2024 Ficha catalográfica elaborada pelo Sistema de Geração de Ficha Catalográfica da Biblioteca Universitária da UFLA, com dados informados pelo(a) próprio(a) autor(a). Silva, Cinthia Itaborahy Ferreira. Inteligência Artificial aplicada ao Diagnóstico Radiográfico de Displasia Coxofemoral em Cães / Cinthia Itaborahy Ferreira Silva. - 2024. 53 p. : il. Orientador(a): Antônio Carlos Cunha Lacreta Júnior. Dissertação (mestrado acadêmico) - Universidade Federal de Lavras, 2024. Bibliografia. 1. Radiologia veterinária. 2. Displasia coxofemoral canina. 3. Inteligência artificial. I. Júnior, Antônio Carlos Cunha Lacreta. II. Título. O conteúdo desta obra é de responsabilidade do(a) autor(a) e de seu orientador(a). CINTHIA ITABORAHY FERREIRA SILVA INTELIGÊNCIA ARTIFICIAL APLICADA AO DIAGNÓSTICO RADIOGRÁFICO DE DISPLASIA COXOFEMORAL EM CÃES ARTIFICIAL INTELLIGENCE APPLIED TO RADIOGRAPHIC DIAGNOSIS OF HIP DYSPLASIA IN DOGS Dissertação apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós-Graduação em Ciências Veterinárias, área de concentração em Diagnóstico por Imagem, para a obtenção do título de Mestre. APROVADA em 27 de junho de 2024. Prof. Dr. Leonardo Augusto Lopes Muzzi UFLA Prof. Dr. André da Silva Abade IFMT Prof. Dr. Antônio Carlos Cunha Lacreta Júnior Orientador LAVRAS – MG 2024 Ao meu marido Lucas, por me instigar a desenvolver este trabalho, e por sua dedicação não somente a ele, mas também aos meus anseios pessoais e profissionais e aos nossos projetos de vida. AGRADECIMENTOS A Deus, por guiar meus passos, por minha vida e pela de quem a divide comigo. Aos meus amados pais, Beatriz e Nemérito, por terem nos dado uma vida repleta de amor, cuidado e apoio incondicionais, e por mais uma vez terem me garantido acesso às oportunidades que não tiveram, permitindo que agora eu conquiste um novo título. Ao meu irmão, Daniel, por sua firmeza, coragem e sabedoria para enfrentar desafios, em especial aqueles que nos cercaram nos últimos meses. Ao meu marido, Lucas, por ter acreditado neste projeto antes mesmo de ele nascer, tendo contribuído com grande expertise e entusiasmo. Por ser meu exemplo de responsabilidade e paixão pelo trabalho. Por tanto acreditar em mim e fomentar meus projetos de carreira e vida. Por buscar comigo o melhor para a nossa família. E por tornar tudo mais leve, a vida boa e os problemas pequenos. Às minhas queridas amigas Acacia, Lívia, Mariah e Mírian que, embora fisicamente distantes, me fazem sentir diariamente a força do seu amor. Ao professor Dr. Antônio Carlos Cunha Lacreta Júnior, por sua generosidade, por seus braços sempre abertos e pelos ensinamentos compartilhados ndos últimos anos. E por ser uma referência, de saber excepcional e grande habilidade de ensinar, mas principalmente por exercer tão bem o papel de mestre. Ao professor Dr. André Abade, por embarcar conosco neste desafio, por sua grande colaboração técnica, também cheia de entusiasmo e paixão e, principalmente, por sua confiança. À CIMVET e à Andreia Santos, pela amizade, pela troca de experiências e pela cessão das imagens utilizadas neste projeto, cuja contribuição foi fundamental para a sua condução. À Letícia Utsch, por seus conhecimentos, pela troca de experiências e por sua participação em nosso trabalho. Aos animais, que tanto me inspiram, pela confiança transmitida a mim por seu olhar. À UFLA e ao Programa de Pós-Graduação em Ciências Veterinárias, pela oportunidade de buscar conhecimento e gerar inovação. O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior – Brasil (CAPES) – Código de Financiamento 001. RESUMO O exame radiográfico é a principal ferramenta de diagnóstico de displasia coxofemoral em cães, por meio do qual classifica-se o grau da doença e evidencia-se sinais de frouxidão articular, doença articular degenerativa secundária, entre outras alterações inerentes à afecção. A interpretação destas imagens, no entanto, é uma tarefa desafiadora e propensa a erros, devido à variação de raças e portes, bem como da técnica e do posicionamento radiográfico. Tecnologias que combinam aprendizado de máquina, visão computacional e imagens médicas facilitam o diagnóstico de doenças e fornecem uma segunda opinião para os profissionais. O objetivo deste trabalho visa determinar a precisão de uma rede neural convolucional para detectar padrões radiográficos normais e anormais em articulações coxofemorais e classificá-las corretamente entre cães portadores e cães não portadores de displasia coxofemoral. Os resultados tiveram como uma de suas principais contribuições a criação de um banco de dados radiográfico nacional inédito, alinhado com padrões internacionais para a classificação de displasia coxofemoral em cães. A implementação de ferramentas de inteligência artificial mostrou-se promissora, com acurácia média de 92%, sensibilidade de 91%, e especificidade de 92. A curva ROC e a AUC reforçam o bom desempenho do modelo ao identificar corretamente 93% dos casos positivos. Palavras-chave: displasia coxofemoral canina; inteligência artificial. ABSTRACT Radiographic imaging is the main diagnostic tool for canine hip dysplasia, through which the degree of the disease is classified and signs of joint laxity, secondary degenerative joint disease and other alterations inherent to the condition are evidenced. However, interpreting these images is a challenging and error-prone task due to variations in breed and sizes, as well as radiographic techniques and positioning. Technologies that combine machine learning, computer vision and medical imaging facilitate disease diagnosis and provide a second opinion for professionals. This study aims to determine the accuracy of a convolutional neural network in detecting normal and abnormal radiographic patterns in hip joints and correctly classifying them among dogs with and without hip dysplasia. The results significantly contributed to creating a groundbreaking national radiographic database aligned with international standards for the classification of canine hip dysplasia. Implementing artificial intelligence tools proved promising, with an average accuracy of 92%, sensitivity of 91%, and specificity of 92%. The ROC curve and AUC further support the model's strong performance, correctly identifying 93% of positive cases. Keywords: canine hip dysplasia; artificial intelligence. INDICADORES DE IMPACTO Este estudo aborda a utilização de aprendizado profundo para a triagem radiográfica de displasia coxofemoral (DCF) em cães, com foco na avaliação da precisão de uma rede neural convolucional para detectar padrões normais e anormais em imagens. O exame radiográfico é a principal ferramenta para diagnosticar a doença, classificar seu grau e identificar sinais de frouxidão articular e degeneração secundária. Contudo, a interpretação dessas imagens é desafiadora devido à variação entre raças e portes, técnicas e posicionamentos radiográficos. O trabalho desenvolveu um banco de dados radiográfico nacional inédito que serviu de base para treinar o modelo de inteligência artificial. Os resultados demonstraram que a IA alcançou uma acurácia média de 92%, com sensibilidade de 91% e especificidade de 92%, além de identificar corretamente 93% dos casos positivos. Esta inovação tecnológica não só melhora a precisão do diagnóstico, mas também oferece uma segunda opinião valiosa para os profissionais, ajudando a minimizar erros decorrentes das variáveis na interpretação radiográfica. O impacto social é notável, pois facilita o acesso a um diagnóstico mais preciso e acessível, especialmente em áreas com recursos limitados. Tecnologicamente, o trabalho contribui para o avanço das ferramentas de aprendizado de máquina na medicina veterinária, enquanto economicamente, a triagem automatizada pode reduzir custos com diagnósticos e tratamentos. Culturalmente, a adoção de IA para a detecção de DCF pode influenciar práticas diagnósticas e terapêuticas na veterinária. Alinhado com as áreas de saúde e tecnologia e produção da Política Nacional de Extensão, este estudo também contribui para os Objetivos de Desenvolvimento Sustentável (ODS) da ONU, particularmente o ODS 3 (Saúde e Bem-Estar), ODS 9 (Indústria, Inovação e Infraestrutura) e ODS 15 (Vida terrestre), promovendo melhorias na saúde animal e inovações tecnológicas. INDICADORES DE IMPACTO This study addresses the use of deep learning for radiographic screening of hip dysplasia (HD) in dogs, focusing on evaluating the accuracy of a convolutional neural network to detect normal and abnormal patterns in images. Radiography is the primary tool for diagnosing HD, grading its severity, and identifying joint laxity and secondary degeneration. The study developed a novel national radiographic database to train the AI model, which achieved 92% accuracy, 91% sensitivity, and 92% specificity, correctly identifying 93% of positive cases. This innovation improves diagnostic precision and provides valuable second opinions to professionals. Socially, it facilitates more accurate and accessible diagnoses, particularly in resource-limited areas. Technologically, the work advances machine learning tools in veterinary medicine, while economically, automated screening reduces costs associated with diagnostics and treatments. Culturally, the adoption of AI for HD detection can influence veterinary diagnostic and therapeutic practices. Aligned with health, technology, and production areas of the National Extension Policy, this study also supports the UN's Sustainable Development Goals (SDGs), specifically SDG 3 (Good Health and Well-being), SDG 9 (Industry, Innovation, and Infrastructure), and SDG 15 (Life on Land), promoting improvements in animal health and technological innovations. LISTA DE ILUSTRAÇÕES Figura 1 – Principais componentes da articulação coxofemoral canina madura ...................... 16 Figura 2 – Representação esquemática de uma articulação sinovial ........................................ 17 Figura 3 – Representação esquemática de posicionamento radiográfico ................................. 22 Figura 4 – Projeções radiográficas de pelves caninas de indivíduos distintos ......................... 23 Figura 5 – Representação esquemática da classificação de imagens por um observador veterinário especialista e uma RNC ....................................................................... 28 Figura 6 – Imagens radiográficas em projeção ventrodorsal da pelve com os membros estendidos de articulações coxofemorais caninas selecionadas para o estudo .... 37 Figura 7 – Imagens radiográficas em projeção ventrodorsal da pelve com os membros estendidos de articulações coxofemorais caninas esquerda e direita selecionadas para o estudo após classificação pelo especialista (ground truth) ....................... 37 Figura 8 – Representação da divisão das amostras de treinamento e validação para os cinco treinamentos utilizando o conceito de validação cruzada (k-fold) ......................... 40 Figura 9 – Análise da acurácia para cada época durante o treinamento ................................... 42 Figura 10 – Análise da acurácia de validação do modelo para cada época durante o treinamento ................................................................................................................................. 43 Figura 11 – Curva ROC e área sob a curva para o modelo testado .......................................... 45 LISTA DE TABELAS Tabela 1 – Critérios utilizados na seleção das imagens radiográficas de articulações coxofemorais caninas ......................................................................................... 35 Tabela 2 – Métricas utilizadas para avaliar a performance da abordagem automática ............ 38 Tabela 3 – Hiperparâmetros utilizados no modelo processo de treinamento ........................... 38 Tabela 4. Métricas para avaliar a performance da abordagem automática ............................... 39 Tabela 5 – Resultados dos treinamentos para classificação automática da displasia ............... 44 Tabela 6 – Matriz de confusão construída a partir das previsões do modelo testado ............... 45 SUMÁRIO 1 INTRODUÇÃO ................................................................................................................... 12 2 REVISÃO DE LITERATURA .......................................................................................... 14 2.1 Displasia coxofemoral canina .......................................................................................... 14 2.1.1 Etiologia ......................................................................................................................... 15 2.1.2 Sinais clínicos ................................................................................................................. 19 2.1.3 Diagnóstico radiográfico padrão .................................................................................. 20 2.1.4 Tratamento .................................................................................................................... 24 2.1.5 Controle ......................................................................................................................... 24 2.2 Inteligência artificial ........................................................................................................ 26 2.2.1 Inteligência artificial e diagnóstico por imagem ......................................................... 29 2.2.2 Vantagens, desafios e limitações ................................................................................... 31 2.2.2 Estado da arte em medicina veterinária ...................................................................... 32 3 METODOLOGIA ............................................................................................................... 34 3.1 Aspectos éticos .................................................................................................................. 34 3.2 População .......................................................................................................................... 34 3.3 Critérios de inclusão e exclusão ....................................................................................... 35 3.4 Parâmetros avaliados e classificação das imagens ......................................................... 36 4 RESULTADOS E DISCUSSÃO ........................................................................................ 40 5 CONSIDERAÇÕES FINAIS ............................................................................................. 47 REFERÊNCIAS ..................................................................................................................... 48 13 1 INTRODUÇÃO A displasia coxofemoral (DCF) é uma das principais doenças ortopédicas não traumáticas em cães e cujo padrão-ouro para diagnóstico é o estudo radiográfico. Trata-se de um distúrbio poligênico e hereditário que se manifesta durante o desenvolvimento e é influenciado por fatores ambientais. Sua progressão envolve incongruência e frouxidão articular (FA), falha na ossificação endocondral, sinovite e osteoartrite (OA). Comumente bilateral em cães, a condição também pode acometer gatos, e manifesta-se com restrição da mobilidade articular, dor e claudicação. Uma vez presentes, as alterações progridem com a idade e, neste contexto, esta é uma grande preocupação de criadores, médicos veterinários e tutores. Programas de triagem fenotípica para controle da doença foram desenvolvidos e são amplamente utilizados por clubes de raça em todo o mundo na busca por evidências radiográficas de doença articular degenerativa (DAD). A partir da padronização de uma projeção ventrodorsal com os membros pélvicos estendidos, sinais de OA e incongruência articular são avaliados para classificar cães suspeitos ou portadores. Os achados mais comuns incluem incongruência articular, remodelamento de acetábulos, cabeças e colos femorais, esclerose de osso subcondral e formação de entesófitos e osteófitos pericondrais. Todavia, embora o exame radiográfico seja a principal ferramenta diagnóstica, a interpretação das imagens em medicina veterinária é uma tarefa desafiadora e propensa a erros, principalmente devido à variação de raças e portes, bem como a falhas técnicas e posicionamento inadequado. Além disso, esta avaliação não está isenta de interferências intra e interobservadores. Neste sentido, a detecção de sinais de DCF pode ser beneficiada pelas ferramentas de Inteligência Artificial (IA), cujos relatos disponíveis na literatura apontam-na como promissora ferramenta em medicina veterinária. Tecnologias interdisciplinares que combinam aprendizado de máquina, visão computacional e imagens médicas facilitam o diagnóstico de doenças e fornecem uma segunda opinião para radiologistas. Essas ferramentas utilizam técnicas de aprendizado profundo e desenvolvimento de redes neurais convolucionais, que são inspiradas nas redes neurais biológicas cerebrais e utilizam algoritmos de aprendizagem para detectar e reconhecer padrões complexos de forma autônoma. Considerando-se a necessidade contínua e crescente de acurácia diagnóstica, estas ferramentas podem promover resultados iguais ou superiores aos obtidos pelos radiologistas. 14 Entretanto, no Brasil esta é uma área pouco explorada e há poucos dados disponíveis: ainda não há literatura nacional que aborde imagens radiográficas de cães portadores de DCF avaliadas sob as perspectivas da IA. Sendo assim, este trabalho teve como objetivo determinar a precisão de uma rede neural convolucional para detectar padrões radiográficos normais e anormais em articulações coxofemorais e classificá-las corretamente entre cães portadores e não portadores de DCF. Além disso, o estudo também buscou catalogar imagens radiográficas e montar um banco de dados inexistente. Os resultados permitiram testar a arquitetura da rede neural, montar e catalogar um banco de dados nacional e inédito, eliminar o viés subjetivo da classificação humana e classificar corretamente as articulações coxofemorais entre portadores e não portadores de DCF. Além disso, estudos desta natureza podem permitir a colaboração entre bancos de dados e projetos de outros países, considerando-se que todos seguem um padrão internacional semelhante para a classificação radiográfica oficial de DCF em cães. A ampliação dos bancos de dados, associada à otimização das ferramentas de IA, certamente poderá contribuir para resultados de maior impacto. 15 2 REVISÃO DE LITERATURA 2.1 Displasia coxofemoral canina A DCF é a doença ortopédica mais prevalente em todo o mundo, o que a torna uma das principais condições de interesse em medicina veterinária (KING, 2017; MARTINS et al., 2017; FRANCO-GONÇALO et al., 2023). Trata-se do distúrbio articular canino mais comum e, em algumas raças, pode afetar mais de 50% da população (RISLER et al., 2009) e, desde a sua descrição na década de 1930, a etiologia poligênica e multifatorial da DCF desafia veterinários e pesquisadores (SCHACHNER et al., 2015). Estudos não mostram predileção sexual, no entanto, alguns sugerem que machos e fêmeas podem ter em risco aumentado, especialmente quando castrados precocemente. Qualquer porte ou raça pode ser afetado, no entanto, a condição é mais comumente diagnosticada em cães de raças grandes e gigantes. As raças com maior predisposição incluem Labrador Retriever, Golden Retriever, Pastor Alemão, Rottweiler, Bernese, Terra Nova, Samoieda, São Bernardo, Bulldog e Pug. Por outro lado, algumas raças identificadas como de menor risco incluem Schnauzer Miniatura, Chihuahua, Maltês, Poodle Toy e Dachshund (KING, 2017). Ainda, cães sem raça definida também podem desenvolvê-la com igual probabilidade (KING, 2017; SYRCLE, 2017). De acordo com MINTO et al. (2013), em estudo retrospectivo conduzido no Brasil, a raça Pastor Alemão mostrou-se a mais afetada por quadros graves de DCF (56%). A expressão fenotípica precoce em cães geneticamente predispostos é a FA, que é foco tanto de técnicas de triagem e diagnóstico, como também de métodos de tratamento em pacientes jovens. Entretanto, parece também haver variação racial e individual significativa na tolerância a um grau específico de FA, bem como da incidência do desenvolvimento de OA. Ainda, evidências sugerem que a DCF pode ser apenas um aspecto visível de uma condição generalizada em cães predispostos, com alto risco de desenvolver AO em outras articulações (KING, 2017). Embora a maioria dos cães não apresente nenhum sinal clínico, ou apenas sinais leves, a doença pode ser extremamente debilitante e sua prevalência afeta tanto animais de companhia quanto cães de trabalho e de serviço altamente treinados (KING, 2017). Há também grande variabilidade na progressão e na gravidade da doença, bem como relações inconsistentes entre as alterações radiográficas e os sinais clínicos (SCHACHNER et al., 2015). Além disso, embora suportada pela maioria dos cães, devido à elevada tolerância à dor crônica e à compensação dos 16 membros torácicos no suporte do peso, a DCF afeta o bem-estar e o desempenho destes animais, uma vez que pode ser uma doença incapacitante ou resultar em queda do desempenho físico, os quais reduzem a qualidade de vida do paciente (VEZZONI, 2007; RISLER et al., 2009). 2.1.1 Etiologia A DCF é uma doença complexa, causada pela interação de centenas de genes, cada um contribuindo com uma pequena parte para a doença, e dentre os quais acredita-se que pelo menos um par seja recessivo. É uma característica aditiva em que a gravidade é determinada pelo número de genes presentes (FRIES e REMEDIOS, 1995; GINJA et al., 2010). O papel principal é desempenhado pela predisposição hereditária; mesmo assim, a doença também pode ser observada em filhos de pais saudáveis (LYUBCHENKO et al., 2021). Os filhotes nascem com articulações morfológica e funcionalmente normais, mas cujo desenvolvimento no período pós-natal depende da sua predisposição genética, que determina as condições relacionadas a forma, tamanho, musculatura, inervação e tecidos cartilaginosos e ósseos, bem como a cargas e forças biomecânicas que atuam sobre a articulação, afetando seu crescimento e modelagem (ALEXANDER, 1992; MAREŠOVÁ et al., 2024). Uma vez que a FA já é bem aceita como um fator significativo na patogênese da DCF; o problema está em determinar o que é uma articulação normal de filhote e quanta frouxidão é suficiente para iniciar as alterações. Quadros graves normalmente resultam no desenvolvimento de DCF, enquanto articulações estáveis geralmente desenvolvem-se normalmente, conforme evidenciado na figura 1 (FRIES e REMEDIOS, 1995). 17 Figura 1 – Principais componentes da articulação coxofemoral canina madura. Nota: O acetábulo e a cabeça femoral encontram-se congruentes e bem ajustados, e a cabeça femoral é redonda, lisa e recoberta por camada de cartilagem articular – Fonte: Adaptado de BVA (2024). Os estabilizadores anatômicos primários da articulação coxofemoral incluem o ligamento da cabeça femoral, a cápsula articular e a borda acetabular dorsal, além do líquido sinovial (KING, 2017). A figura 2 representa os principais componentes de uma articulação sinovial. A cartilagem, embora promova cobertura e amortecimento para as articulações, é vulnerável, pobre em terminações nervosas e com suprimento sanguíneo limitado, o que favorece a progressão da DAD na medida em que danos extensos podem ocorrer antes que os sinais clínicos se manifestem (MORGAN, 1992). O momento mais crítico ocorre entre o nascimento e os 60 dias de idade, em que os tecidos são macios, plásticos e, portanto, propícios à modelagem. Assim, quaisquer alterações de equilíbrio biomecânico, estresse, compressão, tração muscular, lubrificação ou incongruência afetam o padrão programado de normalidade, fazendo com que o quadril adulto mantenha características semelhantes às do recém-nascido (VEZZONI, 2007). A lesão patológica básica na DAD é uma desintegração progressiva e suas consequências são irreversíveis (ALEXANDER, 1992; MAREŠOVÁ et al., 2024). 18 Figura 2 – Representação esquemática de uma articulação sinovial. Nota: A cápsula articular é formada por uma camada fibrosa externa e uma camada sinovial, que reveste a cavidade articular (exceto em áreas de cartilagem) e é banhada pelo líquido sinovial – Fonte: Adaptado de Junqueira e Carneiro (2013). A subluxação da cabeça femoral, portanto, resulta da imaturidade frente ao processo de crescimento, o que dificulta sua manutenção dentro do acetábulo. O alongamento da cápsula articular e do ligamento da cabeça do fêmur permite que a cabeça femoral se desloque lateralmente ao acetábulo, resultando em contato inadequado entre as superfícies articulares, o que altera as forças exercidas sobre o esqueleto, ainda plástico e imaturo (ALEXANDER, 1992; FRIES e REMEDIOS, 1995; KING, 2017). Estas alterações são observadas com 2 semanas de vida, acompanhadas por sinovite proliferativa e não supurativa, edema e fibroplasia do ligamento da cabeça do fêmur e derrame articular às 4 semanas. Esta sobrecarga produz fadiga, perda de elasticidade e do contorno tecidual e, eventualmente, microfraturas (FRIES e REMEDIOS, 1995). Por volta de 12 semanas, ocorre descamação e fissuras na cartilagem articular, que tornam o osso mais rígido após a recuperação e reduzem sua capacidade de amortecimento. As forças compressivas concentram-se na face medial da cabeça femoral e na borda acetabular dorsal, o que retarda sua ossificação e resulta em uma borda acetabular dorsal mais plana ou convexa e um acetábulo mais raso (ALEXANDER, 1992; FRIES e REMEDIOS, 1995; KING, 2017). O corpo acetabular perde sua curvatura e suas bordas sofrem desgaste e remodelamento, 19 enquanto focos de ruptura e sangramento estimulam a formação de osteófitos, iniciados nas regiões periarticulares cobertas pela membrana sinovial (ALEXANDER, 1992). Menos força é transmitida ao aspecto lateral da cabeça femoral e à face ventromedial do acetábulo, o que reduz o remodelamento, mas acelera a ossificação nessas regiões (FRIES e REMEDIOS, 1995). Maior força de sustentação é então transmitida à cartilagem, acelerando sua degeneração, enquanto o líquido sinovial perde viscosidade e lubrificação (KING, 2017). Com o tempo, a cartilagem torna-se incapaz de manter seus processos de reparo: o osso subcondral é exposto, resultando em mais inflamação, esclerose e necrose secundárias a atrito e microfraturas repetidas. Enquanto desgaste e remodelamento contínuos promovem achatamento da cabeça femoral, ocorre também espessamento do colo femoral (KING, 2017). O processo continua até que a relação entre a cabeça femoral e o acetábulo seja rompida (ALEXANDER, 1992). Neste ponto, a estabilidade articular pode melhorar ou progredir para completa luxação (FRIES e REMEDIOS, 1995): quanto mais extenso for o grau de subluxação, menor será o contato entre as superfícies articulares, e menor será o seu remodelamento (ALEXANDER, 1992). O grau de frouxidão e remodelamento aos 6 meses demonstrou ser um forte preditor de OA aos 2 anos de idade (KING, 2017). Além do caráter poligênico da DCF, sua natureza multifatorial também precisa ser compreendida: embora um indivíduo possa nascer geneticamente predisposto, elementos externos determinam se ela será manifestada e em qual grau. Fatores como porte, taxa de crescimento, nutrição, constituição corporal, trauma pós-natal, desequilíbrio hormonal e imaturidade neuromuscular condicionam o desenvolvimento da doença (FRIES e REMEDIOS, 1995; GINJA et al., 2010; KING, 2017; MAREŠOVÁ et al., 2024). Ainda, a expressão do fenótipo em cães geneticamente predispostos pode ser modificada por características como peso ao nascer, número de filhotes na ninhada, idade da mãe, cobertura do piso, taxa de mortalidade pré-desmame e estação do nascimento (GINJA et al., 2010). Cães displásicos tendem a ser aqueles cujos músculos do quadril podem não desenvolver força relativa suficiente para evitar a subluxação durante a sustentação de peso. Além disso, fatores como consumo alimentar excessivo de energia aumentam o crescimento esquelético e o peso corporal, enquanto o excesso de cálcio e vitamina D pode levar a maior absorção intestinal, retardo da ossificação endocondral e remodelamento ósseo. A supernutrição é mais crítica nos primeiros 6 meses de vida, e indivíduos de raças de crescimento mais rápido têm risco ainda maior. Exercício físico também pode acelerar o desenvolvimento das alterações degenerativas; por outro lado, a atividade pode promover efeito protetor, 20 reduzindo a energia disponível para o crescimento e melhorando a força muscular (FRIES e REMEDIOS, 1995). 2.1.2 Sinais clínicos Por definição, a DCF é uma condição de início juvenil, gradual e progressiva. Embora não estejam presentes ao nascimento, as evidências de FA podem ser detectáveis às 7 semanas de idade (SYRCLE, 2017) e seu comportamento foi tradicionalmente descrito como bifásico, visto com mais frequência antes dos 2 anos de idade e novamente quando na fase geriátrica. Agora, acredita-se em uma progressão com linear à medida em que os cães envelhecem (KING, 2017), e é o desenvolvimento de OA secundária que causa a maior morbidade (SYRCLE, 2017). De forma geral, a queixa mais comum é a claudicação, cujo grau pode variar de leve e intermitente nos estágios iniciais, até a não deambulação em casos graves (FRY e CLARK, 1992). No entanto, a apresentação clínica pode variar consideravelmente em relação ao grau de dor, gravidade dos sinais e progressão da doença, já que estas características nem sempre estão correlacionadas às alterações morfológicas (FRIES e REMEDIOS, 1995). Nesse contexto, a classificação entre animais com idade inferior e superior a 1 ano é útil para descrever o comportamento dos sinais clínicos (FRY e CLARK, 1992). No primeiro grupo, encontram-se cães jovens portadores de instabilidade e sobrecarga articular, cuja dor é provocada principalmente por ruptura ou estiramento do ligamento da cabeça do fêmur, sinovite e microfraturas acetabulares (GINJA et al., 2010). O desafio é determinar o significado da incongruência presente, já que a maioria destes indivíduos apresenta algum grau de frouxidão mensurável (FRIES e REMEDIOS, 1995). Qualquer anormalidade de marcha pode ser observada, geralmente exacerbada por exercício vigoroso ou traumas leves. Embora a condição seja tipicamente bilateral, claudicação unilateral pode ser observada, bem como dificuldade para andar, intolerância ao exercício e relutância em subir escadas e descer alturas. Pode haver dor acentuada em episódios que variam de acordo com a gravidade do quadro (FRY e CLARK, 1992; FRIES e REMEDIOS, 1995; GINJA et al., 2010; SYRCLE, 2017). Alguns cães apresentam sinais de dor aos 5 ou 6 meses de idade e aparente remissão espontânea entre 9 e 11 meses, o que pode estar associado à cicatrização de microfraturas (GINJA et al., 2010). O segundo grupo é composto por cães adultos com dor crônica decorrente de DAD, cuja manipulação das articulações causa desconforto especialmente durante extensão, abdução e 21 rotação. Além de rigidez e redução da amplitude de movimento, subluxação e crepitação articular e atrofia muscular também são achados comuns. As alterações de marcha incluem andar cambaleante ou curvado e postura dos membros pélvicos em base estreita ou larga (FRIES e REMEDIOS, 1995; GINJA et al., 2010; SYRCLE, 2017). Estes indivíduos podem também manifestar enrijecimento da musculatura, recolhimento do membro em posição flexionada e, em alguns casos, vocalização ou agressividade em resposta à dor (FRY e CLARK, 1992). Por outro lado, as alterações promovidas por remodelamento ósseo e fibrose podem melhorar a congruência e a estabilidade articular, resultando em limitação de movimento e melhora espontânea na função dos membros pélvicos (ALEXANDER, 1992; FRIES e REMEDIOS, 1995; GINJA et al., 2010; KING, 2017; SYRCLE, 2017). É importante lembrar que muitos cães mais velhos têm quadros subclínicos e, portanto, deve-se garantir que outras condições ortopédicas comuns, além daquelas de origem neurológica, sejam investigadas (FRIES e REMEDIOS, 1995). Além disso, há várias razões para a apresentação inicial de um cão displásico com mais 1 ano de idade: o paciente pode ter apresentado sinais quando filhote que não foram notados pelo proprietário e evoluíram sem diagnóstico veterinário ou com atraso no encaminhamento. Embora estes casos possam apresentar sinais semelhantes aos de pacientes juvenis, as alterações geralmente observadas não são sinais de FA e subluxação coxofemoral, mas sim osteoartríticas (SYRCLE, 2017). 2.1.3 Diagnóstico radiográfico padrão O rastreio da DCF depende da avaliação fenotípica dos indivíduos (FRANCO- GONÇALO et al., 2023). Diversas modalidades de imagem podem ser usadas tanto para diagnóstico preliminar, quanto para vigilância da progressão da doença e avaliação do sucesso das intervenções terapêuticas (BUTLER E GAMBINO, 2017). No entanto, técnicas avançadas, como tomografia computadorizada (TC) e ressonância magnética (RM), não são rotineiramente empregadas: embora as alterações morfológicas sejam claramente evidentes nas imagens de TC, os intervalos de referência requerem mais investigação. Já as sequências convencionais de RM têm limitações relacionadas à resolução espacial e não fornecem uma visão abrangente para a avaliação da cartilagem articular. Ainda assim, a RM pode potencialmente ser usada para avaliar aumento do líquido sinovial associado à FA ou ao desenvolvimento da DCF. À medida que a tecnologia avança, TC e RM estarão mais acessíveis e provavelmente se tornarão parte integrante do diagnóstico e avaliação da DCF (SANTANA, et al., 2021). 22 Sendo assim, a radiografia permanece estabelecida como técnica padrão para diagnóstico e é a única ferramenta aceita na triagem de cães em larga escala (MARTINS et al., 2017). Definida na década de 1960, ainda hoje a projeção ventrodorsal em extensão do quadril é recomendada por organizações em todo o mundo para fins de certificação (FRANCO- GONÇALO et al., 2023). Trata-se da técnica mais utilizada, e sua confiabilidade melhora com a idade a partir dos 6 meses de idade, alcançando precisão de 85% a 95% aos 24 meses (FRIES e REMEDIOS, 1995). Para o posicionamento padrão, o cão é colocado em decúbito dorsal, com os membros pélvicos estendidos caudal e paralelamente entre si, alinhados à coluna e acompanhados pelo posicionamento simétrico da pelve. Os membros são aduzidos e girados internamente e as patelas devem permanecer centralizadas em relação aos sulcos trocleares. Anestesia ou sedação facilitam o posicionamento adequado (FRIES e REMEDIOS, 1995; VERHOEVEN et al., 2009; BROECKX et al. (2014; FRANCO-GONÇALO et al., 2023), uma vez que o grau de relaxamento muscular pode influenciar em até 50% a capacidade de identificar anormalidades articulares (SCHACHNER et al., 2015). A figura 3 ilustra a técnica de posicionamento radiográfico e a imagem adquirida para adequada investigação de DCF. A articulação é considerada displásica quando a cabeça femoral não se adapta bem ao acetábulo, ou quando o espaço articular está aumentado ou quando há subluxação (FRIES e REMEDIOS, 1995). Os primeiros sinais radiográficos incluem subluxação da cabeça femoral e ossificação retardada da borda acetabular, que podem ser detectadas já entre 30 e 60 dias de idade em indivíduos gravemente acometidos. No entanto, os estes sinais podem não ser vistos por meses ou mesmo anos em cães menos afetados (RISLER et al., 2009). Na sua ausência, a subluxação articular é considerada diagnóstica, e seu grau pode ser avaliado subjetivamente ou quantificado objetivamente (BUTLER E GAMBINO, 2017). A sobreposição acetabular sobre a cabeça femoral é uma medida do deslocamento femoral em relação ao acetábulo. Em uma conformação normal, a sobreposição normal é de 50% e valores inferiores são consistentes com incongruência articular (FRIES e REMEDIOS, 1995; BUTLER E GAMBINO, 2017). Já o ângulo de Norberg representa o ângulo entre uma linha traçada entre os centros das cabeças femorais e a linha traçada do centro da cabeça femoral até a face craniolateral da borda acetabular dorsal. Ângulos maiores indicam acetábulos mais profundos e congruentes, enquanto ângulos menores são consistentes com graus crescentes de subluxação (BUTLER E GAMBINO, 2017; FRANCO-GONÇALO et al., 2023; MAREŠOVÁ et al., 2024). 23 Figura 3 – Representação esquemática de posicionamento radiográfico. Nota: A. Técnica de recomendada para adequado diagnóstico de DCF, com o cão em decúbito dorsal, membros pélvicos estendidos caudalmente, paralelos entre si e rotacionados internamente. B. Projeção radiográfica ventrodorsal de pelve canina padrão para diagnóstico de DCF, cujo foco deve estar centralizado nos limites caudais da pelve, incluindo as asas ilíacas e as articulações coxofemorais na área de colimação – Fonte: FLÜCKIGER (2007). Uma vez que a doença progride para OA grave, as alterações radiográficas são mais aparentes e a capacidade de diagnosticá-las torna-se menos complicada. Alterações na circunferência da cabeça femoral representam sinais iniciais que predizem o desenvolvimento de achados mais característicos de osteoartrite, incluindo a presença de osteófitos periarticulares, esclerose subcondral acetabular e remodelamento articular (FRIES e REMEDIOS, 1995; BUTLER E GAMBINO, 2017). A formação de entesófito curvilíneo caudolateral (Linha Morgan) na região proximal do colo femoral é um importante sinal radiográfico de DAD devido à DCF em cães jovens de raças grandes. Osteófitos circundando a junção entre colo e cabeça femorais na região de inserção da cápsula articular também são descritos (RISLER et al., 2009). As principais alterações morfológicas e radiográficas observadas na DCF estão ilustradas na figura 4. A B 24 Figura 4 – Projeções radiográficas de pelves caninas de indivíduos distintos. Nota: Pelves (A a C) e correspondentes alterações morfológicas em articulações coxofemorais (D a F), demonstrando graus leve (A e D), moderado (B e D) e severo (C e F) de DAD associados às lesões da cartilagem articular – Fonte: SCHACHNER et al. (2015). Entretanto, embora o estudo radiográfico desempenhe papel determinante na detecção de DCF, posicionamento adequado e técnica ideal de exposição são pré-requisitos essenciais para imagens com condições diagnósticas suficientes para avaliação (MAREŠOVÁ et al., 2024). Fatores como posicionamento, projeção e forças aplicadas durante a aquisição da imagem devem ser considerados (MARTINS et al., 2017), e erros podem derivar da variabilidade de examinadores, da qualidade de imagem e das diferenças entre animais, bem como de alterações articulares e hipotrofia muscular (SCHACHNER et al., 2015). Sabe-se que a rotação pélvica altera a morfologia radiográfica do quadril (MARTINS et al., 2017), enquanto falhas na extensão total dos membros, movimentos internos inadequados e rotação femoral insuficiente resultam em uma relação articular anormal (BUTLER e GAMBINO, 2017; MAREŠOVÁ et al., 2024). Por outro lado, o posicionamento de indivíduos portadores de DCF moderada ou grave é limitado pela menor capacidade de estender as articulações (MAREŠOVÁ et al., 2024). Além disso, VERHOEVEN et al. (2007) sugerem que há influência significativa da experiência dos observadores sobre a concordância entre eles, o que pode variar em até 70%. Apesar de todas as recomendações, a decisão final de aceitar ou rejeitar radiografias é sempre subjetiva (MAREŠOVÁ et al., 2024). 25 2.1.4 Tratamento Os resultados do manejo não cirúrgico da DCF são controversos a longo prazo (GINJA et al., 2010). Quando detectada em animais jovens, é possível alterar sua progressão antes do início da DAD (VEZZONI, 2007; RISLER et al., 2009). No entanto, a condição é geralmente diagnosticada pelo agravamento dos sintomas quando a OA já está avançada, o que torna praticamente inútil qualquer terapia que limite o desenvolvimento da doença ou sua gravidade. Os tratamentos, portanto, são paliativos, focados em aliviar a dor, melhorar a função das articulações do quadril e promover qualidade de vida, incluindo procedimentos de manejo preventivos, conservadores e cirúrgicos (RISLER et al., 2009; GINJA et al., 2010). Uma técnica cirúrgica padrão-ouro ainda não foi estabelecida (SCHACHNER et al., 2015). Quando indicadas, cirurgias preventivas podem interromper o desenvolvimento da doença e da osteoartrite, o que destaca a importância da avaliação precoce rotineira em filhotes predispostos (VEZZONI, 2007). Procedimentos como a sinfisiodese púbica juvenil foram propostos para cães predispostos e esqueleticamente imaturos (VEZZONI, 2007; RISLER et al., 2009; GINJA et al., 2010; SCHACHNER et al., 2015), enquanto a osteotomia pélvica tripla é uma técnica mais popular, normalmente realizada em animais com menos de 12 meses de idade, que já mostram sinais clínicos evidentes e alterações radiográficas mínimas (GINJA et al., 2010; SCHACHNER et al., 2015). Em casos mais graves, com dor crônica e incapacidade motora, artroplastia total do quadril e ostectomia de cabeça e colo femorais são opções cirúrgicas disponíveis, além do tratamento conservador com anti-inflamatórios, controle de peso e exercício (VEZZONI, 2007; SCHACHNER et al., 2015). De toda forma, o sucesso do tratamento preventivo é medido por sua capacidade de prevenir a osteoartrite em condições clínicas, uma vez que a janela de tempo entre o desenvolvimento da doença e o tratamento é limitado. Portanto, é importante que um tratamento profilático seja considerado e sugerido para o tutor, especialmente quando há grandes expectativas em relação à função normal do cão (VEZZONI, 2007). Por outro lado, as intervenções terapêuticas aumentam o custo dos cuidados ao longo da vida e, quando sem sucesso, levantam a opção da eutanásia (MERCA et al, 2020). 2.1.5 Controle Por mais que o diagnóstico e o tratamento sejam fundamentais para o atendimento individual ao paciente portador de DCF, a prevenção por reprodução seletiva ajuda a evitar uma 26 condição debilitante (FRIES e REMEDIOS, 1995; FRANCO-GONÇALO et al., 2023). O controle genético ativo, baseado em testes de diagnóstico e criação seletiva, é a melhor ferramenta para alcançar mudanças e reduzir a doença a níveis aceitáveis (GINJA et al., 2010). No entanto, embora sua frequência possa ser reduzida por meio da seleção de conformações normais de quadril ao longo de gerações sucessivas (FRIES e REMEDIOS, 1995), o progresso alcançado ainda é baixo (MARTINS et al., 2017). A doença ainda é altamente prevalente, com alguns autores relatando nenhuma melhoria ou tendências desfavoráveis nas populações estudadas (WILSON et al., 2017), além de prevalência inaceitavelmente elevada em muitas raças (KING, 2017). Em estudo conduzido por MINTO et al. (2013), os autores destacam que a elevada incidência de DCF nas populações caninas brasileiras pode ser explicada pela ineficiência do sistema de seleção de cães reprodutores no país. Dada a falta de tratamentos eficazes, são necessários esforços para diminuir a prevalência por meio da reprodução direcionada (KING, 2017). Muitos clubes estabeleceram programas de controle baseados no diagnóstico radiográfico e na triagem de cães em larga escala, padronizando a técnica em todo o mundo. Cada esquema de pontuação pode ser usado para selecionar cães de raça contra a DCF, cuja gravidade é avaliada com base no grau de subluxação e na presença sinais de DAD secundária. O objetivo principal de cada programa é identificar indivíduos geneticamente predispostos e, embora não existam características definidas por testes de diagnóstico molecular, o genótipo do animal é estimado avaliando-se o fenótipo do quadril (FLÜCKIGER, 2007; GINJA et al., 2010; VERHOEVEN et al., 2012; FRANCO-GONÇALO et al., 2023; MAREŠOVÁ et al., 2024). Atualmente, existem diferentes esquemas em uso para a classificação dos quadris, com alto grau de correlação entre seus resultados (GINJA et al., 2010). Os principais sistemas de pontuação utilizando a projeção radiográfica ventrodorsal do quadril estendido são os da Fédération Cynologique Internationale (FCI), da Orthopedic Foundation for Animals (OFA) e da British Veterinary Association/Kennel Club (BVA/KC) (MARTINS et al., 2017). A FCI é uma organização de mais de 80 autoridades em canis localizadas na maioria dos países europeus, na Rússia, na América do Sul e na Ásia. A OFA representa exclusivamente os EUA e o Canadá, enquanto a BVA/KC é usada na Grã-Bretanha, Irlanda, Austrália e Nova Zelândia (FLÜCKIGER, 2007). Embora divergentes em relação a terminologia, políticas e procedimentos, todos têm como objetivos padronizar a avaliação radiográfica considerando raça, idade e variações anatômicas, bem como manter registros sobre o status individual do quadril de um cão ao longo 27 de gerações, formar base de dados em populações caninas e auxiliar criadores e veterinários na redução da incidência de DCF (CORLEY, 1992). Considerada preditiva, a FA pode ser detectada a partir das 16 semanas de idade. No entanto, o diagnóstico precoce não é confiável, uma vez que a detecção de DAD latente é difícil em estágios iniciais. Portanto, a maioria dos programas requer exames nas idades de 1 e 2 anos, sempre em posicionamento padrão e sob sedação ou anestesia geral (VERHOEVEN et al., 2012). A classificação varia de acordo com a gravidade da condição entre articulações normais e quadros graves de DAD. De acordo com a FCI, cães com pontuação moderada ou grave não podem ser reproduzidos, enquanto restrições específicas podem ser aplicadas a cães levemente displásicos (FLÜCKIGER, 2007). Pais displásicos são os que mais provavelmente irão gerar descendentes afetados e mais gravemente afetados (HEDHAMMAR, 2007), no entanto, cães com fenótipo normal ainda podem ser portadores de genes de displasia e transmiti-los aos seus descendentes (GINJA et al., 2010). No entanto, a comparação entre estes programas é difícil: embora os critérios radiográficos sejam bem documentados, a interpretação e a aplicação destes parâmetros diferem entre profissionais. O grande problema é a obtenção de um padrão aceitável para avaliação das articulações em relação a idade e critérios de sedação ou posicionamento (CORLEY, 1992; VERHOEVEN et al., 2012; MAREŠOVÁ et al., 2024). Ainda, parte importante do desafio está nas mãos dos criadores e na sua capacidade de compreender e aderir às recomendações. Infelizmente, muitos clubes de raças específicas, com grandes números de cães, não seguem as orientações e a grande maioria de seus animais são aceitos para reprodução, fazendo com que nenhuma melhora seja alcançada (FLÜCKIGER, 2007). Uma vez que muitos criadores selecionam seus animais em idade jovem (VERHOEVEN et al., 2007), os veterinários enfrentam o desafio de determinar precocemente quais indivíduos desenvolverão a doença (FRIES e REMEDIOS, 1995). 2.2 Inteligência artificial A inteligência artificial (IA) é o ramo da ciência da computação dedicado à criação de sistemas para realizar tarefas que normalmente exigiriam inteligência humana. É um termo abrangente, que engloba uma variedade de subcampos e técnicas (APPLEBY e BASRAN, 2022). Uma das numerosas definições para IA é a capacidade de um sistema interpretar corretamente dados externos, aprender com estes dados e usar o aprendizado para alcançar metas e tarefas específicas por meio de adaptação flexível. Um exemplo é a visão 28 computacional, que treina computadores para permitir que eles entendam e obtenham informações de imagens e vídeos (OWENS et al., 2023). O aprendizado de máquina ou machine learning (AM) é um subcampo da IA no qual algoritmos são treinados para realizar tarefas identificando padrões a partir de dados, em vez de programação explícita (APPLEBY e BASRAN, 2022), que totalmente dependente da atuação humana. Os modelos tomam decisões e aplicam essa informações a uma tarefa, como fazer uma previsão (XIE et al., 2019; OWENS et al., 2023). Os algoritmos processam as imagens em duas etapas: inicialmente, um modelo desenvolvido manualmente extrai características importantes; em seguida, um método é aplicado para classificar ainda mais a imagem com base na extração das características. Já os algoritmos de aprendizado profundo ou deep learning (AP) são capazes de extrair características automaticamente, o que os torna mais adequados para processamento de imagens e para treinar modelos para identificação de objetos a partir de milhões de dados (ALJUAID e ANWAR, 2022). O AP pode ser classificado como supervisionado e não supervisionado. Na forma não supervisionada, a detecção de padrões ocorre em dados cujo resultado é desconhecido pelo algoritmo, ou seja, a IA trabalha de forma independente para gerar seus próprios critérios e encontrar padrões em dados não rotulados. Já no treinamento supervisionado, o conjunto de dados já é pré-rotulado e seus resultados já são conhecidos a partir de rótulos chamados ground truth (LAKHANI et al., 2018; McEVOY et al., 2021; ALJUAID e ANWAR, 2022; APPLEBY e BASRAN, 2022; OWENS et al., 2023). O aprendizado supervisionado tem apresentado resultados excepcionais e comparáveis aos humanos (ALJUAID e ANWAR, 2022). Inspirado no sistema nervoso humano, um modelo matemático para AM chamado de redes neurais artificiais (RNC) é comumente utilizado em conjunto com o aprendizado supervisionado (ALBADRANI et al., 2024) para classificação, detecção e segmentação a partir de grandes conjuntos de dados (ALJUAID e ANWAR, 2022; LI et al., 2023). As RNC superam o desempenho humano (ALJUAID e ANWAR, 2022; (BURTI et al., 2024) e são construídas para simular a conectividade em camadas do córtex cerebral, em que camadas de nós simulam os neurônios conectados (XIE et al., 2019). As representações visuais das RNC retratam uma arquitetura de nós em camadas verticais. Conexões são usadas para unir as camadas de modo que cada nó em uma camada esteja conectado a todos os nós de outra camada. Existem camadas ocultas entre a primeira camada, a camada de entrada, que recebe os dados a serem analisados (input), e a última camada, a camada de saída (output). Essas camadas são chamadas de ocultas porque seus resultados são inacessíveis ao usuário e ao software (ALBADRANI et al., 2024). Cada camada 29 – e sua interação com as outras – fornece outra camada a partir de uma permutação expansiva de características dinâmicas pelas quais o aprendizado pode se desenvolver. Embora este seja um processo muito mais exigente, o aprendizado teoricamente continua a melhorar com os dados disponíveis e, portanto, essas arquiteturas permitem níveis complexos de representação de dados, criando milhões de parâmetros para classificação eficaz de imagens (XIE et al., 2019). A figura 5 representa esta arquitetura. Figura 5 – Representação esquemática da classificação de imagens por um observador veterinário especialista e uma RNC. Nota: Fótons de luz acionam nervos na retina de um observador humano, que enviam sinais ao cérebro. No cérebro, redes de neurônios são ativadas (verde) ou desativadas (vermelho) seletivamente, o que desencadeia uma resposta para classificar a imagem como um quadro de DCF, com base em aprendizado anterior. Em uma RNC, os dados de pixel das imagens entram na camada de entrada antes de progredir por meio de uma série de camadas ocultas. Dependendo do grau de ativação ou desativação na camada oculta, nesse caso a rede classificaria a imagem como a de um paciente portador de DCF – Fonte: Adaptado de APPLEBY e BASRAN, 2022. Desta forma, as RNC podem ter mais de uma camada convolucional empilhada para produzir características hierárquicas. A saída da primeira camada é concatenada com características de baixo nível aprendidas e extraídas de uma segunda camada, e o processo continua até que as camadas muito profundas sejam mais específicas para classes (ALJUAID e ANWAR, 2022). As primeiras camadas aprendem filtros básicos de detecção de características 30 rudimentares, como bordas e texturas, enquanto as camadas intermediárias discernem progressivamente as características mais complexas e abstratas, aprendendo filtros que identificam parte dos objetos. Já as camadas finais aprendem a identificar objetos completos (GOMES et al., 2021; LI et al., 2022). Ou seja, de forma geral, as primeiras camadas extraem funções genéricas, enquanto as mais profundas extraem características de alto nível (ALJUAID e ANWAR, 2022). O modelo em si determina as características que cada camada aprende, não um engenheiro humano. Este apenas especifica a camada de entrada, o número de camadas ocultas, o número de nós em cada camada oculta e o número de repetições de treinamento (ALBADRANI et al., 2024). No entanto, treinar um modelo complexo de AP supervisionado, como uma RNC, requer inúmeras amostras rotuladas para obter um bom desempenho e generalização (ALJUAID e ANWAR, 2022), ou seja, sua capacidade de funcionar com eficiência em dados que diferem dos dados em que foi treinado (LI et al., 2022; BURTI et al., 2024). Um grande número de imagens organizadas em um conjunto de treinamento é necessário, configurando uma lista de classificações ou rótulos (McEVOY et al., 2021). Nos últimos anos, o advento da transferência de aprendizado ou transfer learning permitiu que um modelo treinado em um conjunto grande de dados pudesse ser ajustado para detectar e classificar objetos que não estavam presentes no conjunto original (McEVOY et al., 2021). 2.2.1 Inteligência artificial e diagnóstico por imagem Diante de todas as formas pelas quais o AP pode ser aplicado, a imagem médica é vista como o campo mais amplo e promissor (AGGARWAL et al., 2021). Fornecer o tratamento correto no momento certo representa uma importante preocupação e, em diagnóstico por imagem, grande parte das informações está disponível em imagens (XIE et al., 2019). Muitas instituições implementaram bases de dados eletrônicas de saúde ao longo das duas últimas décadas, incluindo imagens em PACS (Picture Archiving and Communication System), laudos e registros clínicos. Além disso, as próprias imagens são ricas em metadados armazenados no formato DICOM e também podem ser aproveitadas (LAKHANI et al., 2018). As tarefas de processamento de imagens podem ser agrupadas em classificação, detecção e segmentação, geralmente realizadas manualmente por especialistas. Os objetos são inicialmente categorizados em grupos com base em características específicas, em que a classificação pode ser binária, como lesão maligna ou benigna, ou multiclasse, como sua classificação em graus. A detecção consiste em encontrar a região de objetos em uma imagem, 31 desenhando caixas delimitadoras, como a diferenciação entre tecidos pela presença de lesões anômalas, por exemplo. Já a segmentação é importante para a delineação precisa de estruturas nas imagens, rotulando-as com contornos precisos. A segmentação pode ser semântica e gerar apenas uma máscara para toda a imagem, tratando os objetos como pertencentes a uma classe única, ou baseada em instância, que combina a detecção de objetos para identificar uma região de interesse (ROI) e a segmentação semântica para prever uma máscara de segmentação para cada ROI, separando os objetos individualmente (ALJUAID e ANWAR, 2022). Ao aplicar algoritmos de aprendizado supervisionado para tarefas de processamento de imagens, são necessárias métricas de desempenho para avaliar os modelos projetados. Para as tarefas de detecção e segmentação de objetos, as métricas de desempenho são uma medida da diferença entre as máscaras de segmentação propostas e previstas, ou seja, entre ground truth e as caixas delimitadoras de previsão (ALJUAID e ANWAR, 2022). Já para as tarefas de classificação, as métricas contam o número de previsões corretas e incorretas com base na abordagem de verdadeiro positivo (VP, um modelo que prevê corretamente a classe positiva), verdadeiro negativo (VN, um modelo que prevê corretamente a classe negativa), falso positivo (FP, um modelo que prevê incorretamente a classe positiva) e falso negativo (FN, um modelo que prevê incorretamente a classe negativa) para calcular acurácia (AC), precisão, recall, especificidade (SP) e pontuação F (ALJUAID e ANWAR, 2022). A AC é a métrica mais usada para avaliar o desempenho dos algoritmos, uma vez que se refere à proporção de todas as previsões corretas para o número total de previsões. Na prática, ela mede a porcentagem de imagens ou ROIs corretamente classificadas. Já a precisão mede a proporção de VP para o número total de previsões positivas e calcula a capacidade do modelo em classificar corretamente toda a classe positiva e evitar a classificação incorreta de amostras negativas como positivas. O recall, conhecido como sensibilidade (SE) e taxa de VP, é a razão de VP para o número total de amostras positivas, e calcula a capacidade de o modelo classificar amostras positivas. A SP, por sua vez, é a razão das amostras negativas que foram classificadas como negativas. Ela mede a proporção de resultados VN, que são o número de casos negativos corretamente identificados pelo algoritmo. Ainda, a pontuação F é uma média harmônica de recall e precisão, cujo valor, quando elevado, indica que o modelo tem alto recall e precisão e baixa taxa de FN e FP (ALJUAID e ANWAR, 2022; JOSLYN e ALEXANDER, 2021; LI et al., 2022; PEREIRA et al., 2023). O desempenho da classificação pode ser visualmente descrito usando uma tabela (matriz de confusão) ou gráfico (curva característica do operador receptor – ROC) e área sob a curva (AUC). A matriz de confusão fornece mais detalhes sobre o desempenho do modelo 32 considerando VP, VN, FP e FN para cada classe (ALJUAID e ANWAR, 2022). Esta é uma forma de visualizar em uma tabela o desempenho do modelo, por meio da apresentação das contagens dos valores previstos e reais. Já a ROC é uma representação gráfica de desempenho do modelo, com o recall no eixo y e a SP (taxa de FP) no eixo X e cujos valores diferem entre 0 e 1 (PEREIRA et al., 2023). Trata-se de uma curva de probabilidade, que mostra o equilíbrio entre a taxa de VP (SE) e FP (SP) em vários limiares. A ROC desenha o desempenho de um modelo sem considerar a distribuição ou os custos de erro de classe. Um bom modelo possui uma curva que atinge o canto superior esquerdo das curvas ROC. Ainda, a AUC é usada para comparar diferentes curvas ROC e deve ser elevada em bons modelos (ALJUAID e ANWAR, 2022). A AUC é uma métrica de avaliação usada para verificar o desempenho de um modelo de classificação ou a precisão de um teste diagnóstico, com 0 sendo o menor desempenho possível e 1 sendo o ideal (OWENS et al., 2023), o que indica previsão correta em 100% dos casos (PEREIRA et al., 2023). 2.2.2 Vantagens, desafios e limitações A utilização de algoritmos na análise de imagens médicas tem a capacidade de trazer melhorias substanciais nos resultados de saúde e transformar a utilização destes dados para diagnóstico e planejamento terapêutico, melhorando os resultados dos pacientes, reduzindo os custos de tratamento e mão-de-obra e aumentando a qualidade do atendimento prestado (LI et al., 2022). Além disso, os algoritmos têm o potencial de auxiliar radiologistas na tomada de decisões fornecendo uma segunda opinião, bem como de melhorar fluxos de trabalho e alocação de recursos, bem como de aprimorar a pesquisa médica por meio da análise de grandes conjuntos de dados (LI et al., 2022, (BURTI et al., 2024). Os grandes desafios são os gargalos na rotulagem. Um número massivo de amostras é necessário para bom desempenho e generalização robusta, no entanto, os conjuntos de imagens médicas de alta qualidade são escassos. Outro problema é o desequilíbrio de dados ou classes, em que a distribuição destes é assimétrica e o modelo aprende os atributos da classe majoritária mais do que os da classe minoritária (ALJUAID e ANWAR, 2022). Além disso, mesmo quando examinadas por especialistas, o reconhecimento de padrões em imagens ainda depende de interpretações visuais subjetivas e qualitativas. A variabilidade entre observadores e sua interpretação desafia a precisão diagnóstica e, por muitas vezes, mesmo após procedimentos diagnósticos, são necessários testes confirmatórios sequenciais. Em radiologia, é comum que 33 os especialistas apresentem conclusões distintas ou que não cheguem a um diagnóstico definitivo (XIE et al., 2019). Já considerações éticas e legais dizem respeito ao uso de dados de pacientes em pesquisas, à possibilidade de viés do algoritmo durante o treinamento e ao dever de pesquisadores e profissionais de saúde em garantir a aplicação segura e responsável destas ferramentas (APPLEBY e BASRAN, 2022; LI et al., 2022). Se o sistema for inicialmente programado com dados ou processos incorretos ou distorcidos, a IA irá automatizar e perpetuar esse modelo tendencioso (OWENS et al., 2023). Além disso, os vieses dos algoritmos e sua interpretabilidade também representam desafios, já que os sistemas de IA podem ter dificuldade em explicar suas decisões, levantando preocupações sobre transparência e responsabilidade (ALBADRANI et al., 2024). 2.2.2 Estado da arte em medicina veterinária Nos exames de imagem, diagnósticos precisos requerem diligência e expertise para extrair informações úteis de grandes quantidades de dados (ALJUAID e ANWAR, 2022). As investigações exigem a interpretação de um radiologista e, com a crescente demanda profissional, há também uma necessidade crescente de automação (AGGARWAL et al., 2021). No entanto, atualmente a IA está mais integrada à prática e à pesquisa em medicina humana do que em medicina veterinária, embora suas aplicações sejam igualmente relevantes. Enquanto há quadros regulatórios para a IA em medicina humana, esta realidade ainda não existe na medicina veterinária (APPLEBY e BASRAN, 2022). Mesmo assim, à medida que o uso de imagens aumenta, a escassez de radiologistas veterinários torna-se um problema global: menos de 5% dos profissionais têm formação formal em interpretação em imagens (FITZKE et al. 2021). Em um estudo com médicos veterinários brasileiros, FROES et al. (2014) observaram grande discrepância na interpretação de imagens radiográficas por grupos com menor nível de treinamento e experiência. Em medicina veterinária, um dos principais desafios é a necessidade de grande quantidade de dados de alta qualidade para treinar os algoritmos (APPLEBY e BASRAN, 2022; ALBADRANI et al., 2024). Os desafios emergem da grande variedade de espécies, raças e tamanhos, bem como de posicionamentos inconsistentes e falta de padronização, todos contribuindo para a má interpretação e para a degradação dos cuidados clínicos (FITZKE et al. 2021; JOSLYN e ALEXANDER, 2022). Outra razão pela qual a IA não está bem estabelecida 34 na prática veterinária é a falta de acesso aos recursos disponíveis para pesquisa, incluindo a falta de equipamentos e pessoal qualificado e os registros clínicos incompletos (OWENS et al., 2023). Além disso, variáveis como modelos de equipamentos, resolução, ruído, artefatos e técnica de imagem também podem comprometer a qualidade dos dados (LI et al., 2022). Destacam-se também os elevados níveis de estresse entre estes profissionais, muitas vezes relacionados à pressão de tempo, fatores que podem ser beneficiados por recursos tecnológicos que promovam melhores resultados (OWENS et al., 2023). Ainda, a qualidade dos dados depende dos rótulos aplicados e, consequentemente, da experiência do profissional. Isso levanta a preocupação sobre o que determina o diagnóstico, muitas vezes comprometido por fatores confundidores ou por diferenças de opinião, o que pode levar a falhas no ajuste dos modelos de IA. Viés é uma consideração adicional, que pode surgir diante de conjuntos de treinamento comprometidos por estes fatores (APPLEBY e BASRAN, 2022; JOSLYN e ALEXANDER, 2022). Por isso, alguns autores sugerem que estudos adicionais são imperativos para alcançar um nível robusto de generalização dos resultados neste campo (BURTI et al., 2024). O método de imagem mais utilizado em combinação com a IA é a radiografia (McEVOY e AMIGO, 2013; BURTI et al., 2020; OWENS et al., 2023). Embora os últimos anos tenham sido acompanhados por publicações crescentes em radiologia veterinária, a maioria restringe-se à avaliação do tórax e há poucos estudos que explorem o uso de IA em imagens ortopédicas. Algumas ferramentas comerciais com foco em pequenos animais foram desenvolvidas nos últimos anos e estão disponíveis, incluindo PicoxIA, Vetology e SignalPET, além do Dys4Vet, dedicado ao diagnóstico automatizado de DCF. Em relação a DCF, especificamente, em 2013, McEVOY e AMIGO (2013) desenvolveram um modelo para detectar a presença do quadril em 256 imagens de pelves caninas e, embora o número de dados tenha sido restrito, chegaram a 89% de SE e 6,7% de erro de classificação. Em 2021, McEVOY et al. ajustaram uma RNC pré-treinada, ou seja, em abordagem de transferência de aprendizado, usando extenso banco de dados, classificadas de acordo com os critérios da FCI. Seu objetivo era somente detectar a articulação do quadril, mas também determinar a presença de DCF e classificá-la de acordo com os graus indicados pela instituição. Seu modelo teve baixa SE (53%), o que indica dificuldade na identificação das articulações displásicas. No entanto, obteve-se 92% de SP, 91% de VPP e 81% de VPN em casos mais evidentes. Posteriormente, GOMES et al. (2021) realizaram estudo semelhante para classificar 225 pelves caninas como displásicas ou não e comparar os resultados entre a classificação de um 35 especialista e aqueles obtidos por um modelo de RNC pré-treinadas. No entanto, ROIs não foram usadas, e sim a imagem inteira, na tentativa de prever se o cão era ou não portador de DCF. Os autores encontraram resultados falhos em termos de generalização, com 66% de SP, apesar da identificação correta de 83% dos casos. AKULA et al. (2022) também utilizaram RNC para pesquisa de DCF, no entanto, exames de RM foram incluídos, além dos radiográficos. Os autores observaram que os grupos extremos entre normalidade e gravidade de DAD foram mais fáceis de categorizar e tiveram elevada precisão. O modelo desenvolvido para detectar os quadris apresentou 82,5% de precisão, enquanto aquele desenvolvido para classificar as articulações em níveis de DCF de acordo com a FCI teve resultado inferior e alcançou apenas 61% de precisão. Em 2023, BOUFENAR et al. publicaram resultados expressivos ao comparar seis redes neurais convolucionais, dentre as quais a de melhor desempenho atingiu pouco mais de 98% para AC, SE e precisão. Ainda, e mais recentemente, LOUREIRO et al. (2024) utilizaram um conjunto de 133 radiografias pélvicas e tiveram desempenho com precisão média de 81% para detecção do quadril canino, mesmo com um conjunto de dados pequeno. 3 METODOLOGIA 3.1 Aspectos éticos Este foi um estudo observacional retrospectivo baseado na avaliação de radiografias caninas cedidas por um centro de diagnóstico por imagem com sede na cidade de Belo Horizonte/MG. Os registros radiográficos, obtidos entre os anos de 2018 e 2022, e a partir de equipamentos distintos, foram selecionados durante duas semanas. A pesquisa não foi conduzida com utilização de animais e, devido à sua natureza, a aprovação do comitê de ética e o consentimento do proprietário foram dispensados. Não houve conflito de interesses do centro de diagnóstico por imagem que pudessem influenciar os resultados. 3.2 População Do banco de dados acessado, foram selecionados apenas estudos os radiográficos de pelves caninas suspeitas ou não para DCF, desde que bem posicionadas em incidência padrão ventrodorsal, obedecendo às recomendações de simetria entre os membros e o quadril. Estudos de 1911 cães foram analisados durante um mês, incluindo jovens, adultos e idosos com idades 36 entre 2 e 16 anos, sem distinção entre raça, porte, sexo e potencial reprodutivo. Embora estas sejam condutas pouco frequentes, e mais ainda, subnotificadas, analgesia e contenção química não foram considerados durante a seleção. 3.3 Critérios de inclusão e exclusão Após a coleta, as imagens passaram por um processo de triagem em relação ao posicionamento e à técnica radiográfica. Radiografias de pelves rotacionadas e mal posicionadas foram descartadas, assim como imagens de baixa resolução ou comprometidas por super ou subexposição. Com base no que orienta o Colégio Brasileiro de Radiologia Veterinária (CBRV), a avaliação definitiva de cães suspeitos para DCF só é possível a partir dos 24 meses de idade e, por esta razão, estudos de pacientes jovens em crescimento também foram descartados. Ainda, a presença de fraturas, colocefalectomias e a fixação de aparatos metálicos ortopédicos nos fêmures também foi incluída entre os critérios de exclusão, conforme evidenciado na tabela 1. Tabela 1 – Critérios utilizados na seleção das imagens radiográficas de articulações coxofemorais caninas. Critérios de inclusão Critérios de exclusão Pelve simétrica Pelve rotacionada Imagens de alta resolução Imagens de baixa resolução Idade superior a 24 meses Idade inferior a 24 meses Morfologia coxofemoral preservada Fraturas Aparatos de fixação ortopédica Colocefalectomia Fonte: Do autor (2024). Uma análise qualitativa das imagens foi realizada e os parâmetros avaliados restringiram-se às alterações morfológicas compatíveis com OA e FA. Eles incluem a proporção de cobertura acetabular sobre a cabeça femoral e quaisquer níveis de incongruência, subluxação ou luxação articular, remodelamento da borda acetabular dorsal, formação de osteófitos e entesófitos periarticulares, áreas de esclerose e erosão de osso subcondral. É importante destacar que, em um mesmo indivíduo, as características presentes em uma articulação coxofemoral, bem como os fatores limitantes, podem não ser observadas no membro 37 contralateral. Por isso, das imagens incluídas neste estudo, algumas contribuíram com ambas as articulações, enquanto outras tiveram apenas uma articulação selecionada. Tanto articulações de membro esquerdo quanto de membro direito foram incluídas, uma vez que uma prática comum em AM consiste no reconhecimento dos objetos independentemente da sua orientação (McEVOY e AMIGO, 2013). Como cada articulação do quadril foi considerada individualmente, de um total de 3822 articulações coxofemorais pré- selecionadas, 1500 atenderam aos critérios estabelecidos e foram escolhidas antes de serem rotuladas por um radiologista. 3.4 Parâmetros avaliados e classificação das imagens Adotou-se o método supervisionado de aprendizado de máquina a partir de uma base de dados rotulada por um especialista, o que define as classes que são utilizadas no processo de treinamento e indica para o modelo quais padrões devem ser utilizados na identificação e na classificação dos objetos (SATHYA et al., 2013). Após a seleção das imagens, de forma independente e respeitando-se as condições ideais de técnica e posicionamento radiográfico, duas classes foram definidas entre portadores e não portadores de DCF, indicadas a partir de imagens radiográficas de articulações coxofemorais evidenciadas em projeções ventrodorsais (ground truth). Os dados foram rotulados manualmente durante dois meses por um especialista, explicitando quais os objetos a serem identificados nas imagens. Este processo foi repetido uma vez. Marcações quadradas delimitaram suas localizações e indicavam suas respectivas classes, conforme ilustrado nas figuras 6 e 7. Para cada lado da pelve, uma ROI foi criada incluindo toda a extensão da articulação coxofemoral. Esse processo foi importante para a indicação correta da localização das articulações (bounding box) e o diagnóstico correto de cada uma delas, ou seja, sua classe (LIU et al., 2020). 38 Figura 6 – Imagens radiográficas em projeção ventrodorsal da pelve com os membros estendidos de articulações coxofemorais caninas selecionadas para o estudo. Fonte: Do autor (2023). Figura 7 – Imagens radiográficas em projeção ventrodorsal da pelve com os membros estendidos de articulações coxofemorais caninas esquerda e direita selecionadas para o estudo após classificação pelo especialista (ground truth). Nota: Bounding boxes. A. Articulação coxofemoral canina normal, sem sinais de DCF. B. Articulação coxofemoral canina anormal, com sinais de DCF avançada, que incluem incongruência articular, formação de osteófitos periarticulares e sinais de esclerose, remodelamento e esclerose subcondral em acetábulos, cabeças e colos femorais – Fonte: Do autor (2023). O modelo foi treinado para classificar, nas regiões correspondentes, a presença ou a ausência de displasia coxofemoral. A Tabela 2 apresenta as caraterísticas da sua arquitetura, A B 39 enquanto a Tabela 3 apresenta os hiperparâmetros utilizados por ele durante o processo de treinamento. Tabela 2 – Métricas utilizadas para avaliar a performance da abordagem automática. Modelo Tamanho Parâmetros Tamanho de imagem Profundidade Yolov5m 42,2 MB 20.875.359 640 x 640 369 Nota: Megabyte [MB] – Fonte: Jocher et al. (2021). Tabela 3 – Hiperparâmetros utilizados no modelo processo de treinamento. Algoritmo de otimização Tamanho do batch Impulso Queda de peso Taxa de aprendizado SDG 32 0,937 0,0005 0,01 Nota: Stochastic gradient descent [SDG] – Fonte: Do autor (2024). Para realizar o treinamento, foram utilizados os pesos e uma rede (modelo) já treinada previamente por meio da técnica de transferência de aprendizado. Neste processo foi adotada a rede (Yolov5m) já treinada utilizando a base de dados COCO composta por mais de 330 mil imagens e 1,5 milhões de instâncias de objetos para detectar um total de oitenta objetos (LIN et al., 2014). A transferência de aprendizado, também conhecida como transfer learning, é a técnica utilizada em abordagens aprendizado de máquina que usa o conhecimento adquirido de um modelo já treinado a partir de outra base de dados para treinar e gerar um novo modelo, em um novo contexto, utilizando um novo conjunto de imagens (TORREY et al., 2010). A técnica também tem como vantagens a não necessidade de um longo período de treinamento, além da possibilidade de treinar um novo modelo com um conjunto de imagens reduzido. Para avaliar o desempenho dos resultados, foram adotadas métricas de acurácia em diagnósticos (JOCHER et al., 2013), consideradas referências para a área, que permitem analisar AC, SE e SP utilizando os parâmetros VP (quando há predição correta do diagnóstico), VN (quando não identifica a articulação coxofemoral), FP (quando há predição incorreta do diagnóstico) e FN (quando existe o diagnóstico positivo e a predição infere que não há). Na tabela 4 são apresentados as fórmulas e os detalhes das métricas. Com as métricas de avaliação definidas, foi possível preparar e dividir a base de dados entre treinamento, validação e teste. A base de dados foi dividida de maneira aleatória em duas partes, mantendo as classes balanceadas, a primeira com mil imagens (sendo 500 amostras para 40 cada classe), utilizada no processo de treinamento/validação, e a segunda com 500 imagens (sendo 250 amostras para cada classe), para o procedimento de teste do modelo treinado. Tabela 4 – Métricas para avaliar a performance da abordagem automática. Métrica Fórmula Descrição Acurácia 𝐴𝐶 =∑ 𝑉𝑃𝑖 + 𝑉𝑁𝑖 𝑉𝑃𝑖 + 𝑉𝑁𝑖 + 𝐹𝑃𝑖 + 𝐹𝑁𝑖 𝑛 𝑖=0   Apresenta o quanto o modelo automático está acertando ou errando a inferência comparado com o valor correto Sensibilidade 𝑆𝐸 =∑ 𝑉𝑃𝑖 𝑉𝑃𝑖 + 𝐹𝑁𝑖 𝑛 𝑖=0 Representa a capacidade do modelo automático de identificar um diagnóstico positivo nas amostras portadoras de DCF Especificidade 𝑆𝑃 =∑ 𝑉𝑁𝑖 𝑉𝑃𝑖 + 𝐹𝑃𝑖 𝑛 𝑖=0 Representa a capacidade do modelo automático de não identificar um diagnóstico positivo nas amostras portadoras de DCF Nota: Acurácia [AC]; Especificidade [SP]; Falso Negativo [FN]; Falso Positivo [FP]; Número total de amostras [N]; Sensibilidade [SE]; Verdadeiro Negativo [VN]; Verdadeiro Positivo [VP] – Fonte: Jocher et al. (2013). No processo de treinamento, foi utilizada a abordagem de validação cruzada k-fold para treinamento e validação (Hastie et al., 2009; Kohavi, 1995). Neste caso, utilizou-se a validação cruzada de 5 partes (k-fold = 5), na qual as 1000 imagens foram separadas aleatoriamente em cinco experimentos, com 80% das amostras utilizadas para treinamento e 20% para validação. Este procedimento garantiu que nos cinco experimentos todas as amostras existentes na base de dados de treinamento fossem utilizadas para treinar e validar o modelo. A Figura 8 apresenta um exemplo da distribuição das amostras de treinamento e validação nos cinco experimentos utilizando a validação cruzada. É possível observar a estrutura e as divisões das amostras, em que toda a amostra é utilizada tanto para treinamento quanto para validação. Por fim, na segunda parte, durante o processo de teste, as 500 imagens restantes, que não fizeram parte do treinamento, foram utilizadas para avaliar a capacidade de generalização da solução, o que permitiu analisar o comportamento e a AC do modelo quando este é apresentado a uma amostra de dados desconhecida, replicando um cenário real. 41 Figura 8 – Representação da divisão das amostras de treinamento e validação para os cinco treinamentos utilizando o conceito de validação cruzada (k-fold). Fonte: Do autor (2024). 4 RESULTADOS E DISCUSSÃO Uma das principais contribuições deste estudo foi a formação de um banco de dados nacional inédito, a partir de busca e seleção de imagens radiográficas que podem permitir a colaboração inclusive junto a projetos de outros países, considerando-se que todos seguem um padrão internacional semelhante para a classificação de DCF em cães. Ao contrário do que ocorreu em estudos anteriores, como o de McEvoy e Amigo (2013), que sofreram com a limitação e a falta de padronização de dados, as informações já adquiridas são numerosas e podem ser mescladas a novos dados. A ampliação multicêntrica proposta pelo novo estudo pode contribuir para superar essas limitações, abordadas em outros trabalhos, como o de Gomes et al. (2021), que teve dificuldades com a generalização dos resultados. Ou seja, a alimentação dos bancos de dados, associada à otimização das ferramentas de IA, poderá contribuir para resultados de maior impacto em radiologia veterinária. A integração destes sistemas, por sua vez, pode fornecer informações preliminares aos profissionais, especialmente em locais sem acesso a radiologistas ou ortopedistas (ARCHER et al, 2022). A partir dos resultados obtidos, pode-se projetar trabalhos futuros que incluam, por exemplo, apenas pacientes jovens em fase de crescimento, incluindo aqueles com idades abaixo de 2 anos. Muitos destes animais têm quadros de prognóstico e tratamento desfavoráveis devido à doença subclínica e ao diagnóstico tardio da DCF. Assim, a construção de um banco de dados destes animais pode direcionar novas descobertas quanto a alterações morfológicas articulares 42 precoces, sutis e não perceptíveis à leitura manual pelo radiologista – geralmente limitada à pesquisa de FA. É importante notar que mais da metade das imagens pré-selecionadas para o estudo foi descartada por não atender aos critérios de inclusão no estudo, como resolução de imagem e adequado posicionamento. Isso ilustra o quão difícil pode ser a obtenção da quantidade necessária de dados rotulados para treinar uma rede neural em radiologia veterinária. Sabe-se que o posicionamento do paciente e a qualidade da imagem desempenham papel significativo no desempenho dos algoritmos (APPLEBY e BASRAN, 2022; JOSLYN e ALEXANDER, 2022). Por outro lado, o processo de rotulagem executado por apenas um radiologista pode ter influenciado a precisão e a confiabilidade do modelo e este fator deve ser ponderado como fonte de viés neste estudo. A qualidade dos dados sofre interferências subjetivas devido às diferenças conceituais entre radiologistas (APPLEBY e BASRAN, 2022; LI et al., 2022) e, em medicina veterinária, autores relatam baixa concordância intra e interobservador na classificação radiográfica do quadril (VERHOEVEN et al., 2007; BROECKX et al., 2014; FORTRIE et al., 2015; BUTLER e GAMBINO, 2017). Apesar das recomendações precisas, de acordo com MAREŠOVÁ et al. (2024) a decisão final em aceitar ou rejeitar radiografias para pesquisa de DCF é sempre subjetiva, e a concordância entre observadores pode variar em até 70%. Portanto, para garantir sua confiabilidade, os modelos devem ser treinados e rigorosamente testados, não apenas em pesquisa, mas também em circunstâncias práticas reais. As limitações referentes ao posicionamento e à aquisição das imagens, bem como da subjetividade na rotulagem dos dados, também são problemas levantados em outros estudos, como os de Verhoeven et al. (2007), que mencionaram a variabilidade interobservador na classificação de DCF, e Appleby e Basran (2022), que mencionaram a influência do viés nos modelos de IA. A situação reflete também a falta de padronização para aquisição das imagens radiográficas, de forma geral, mas principalmente para avaliação de DCF, cujas condições de triagem já são estabelecidas há décadas. Em relação ao desempenho do modelo testado, este estudo buscou avaliar se a solução automatizada consegue realizar diagnósticos precisos em comparação com um especialista. Esta seção apresenta a evolução do modelo durante o treinamento e explica como as métricas mencionadas foram utilizadas para avaliar os resultados de predição da metodologia proposta quanto às fases de treinamento e validação. Para avaliar o comportamento do modelo durante o treinamento, a precisão é mensurada em cada época ao longo do tempo – cada época refere- se ao número de vezes em que o algoritmo de aprendizado percorre todo o conjunto de dados 43 de treinamento. Com essas informações é possível observar a AC aumentando acima de 95% para o conjunto de treinamento e se aproximando de 90% para o conjunto de validação. A verdadeira demonstração do desempenho do algoritmo só pode ser considerada se eles forem validados externamente em conjuntos de testes separados, com dados inéditos, e que sejam representativos da população-alvo (AGGARWAL et al., 2021; JOSLYN e ALEXANDER, 2022). Alguns estudos, no entanto, não realizam essa etapa, confiando apenas nos resultados dos dados de validação interna, ou seja, do mesmo conjunto utilizado inicialmente para treinar o algoritmo, o que pode superestimar a sua precisão diagnóstica. Assim, é possível confirmar que o sistema de aprendizado testado e desenvolvido diagnosticou com precisão os quadros de DCF, e as figuras 9 e 10 apresentam os gráficos de evolução da AC e da validação do modelo, respectivamente. Figura 9 – Análise da acurácia para cada época durante o treinamento Fonte: Do autor (2024). 0,6 0,65 0,7 0,75 0,8 0,85 0,9 0,95 1 0 8 1 6 2 4 3 2 4 0 4 8 5 6 6 4 7 2 8 0 8 8 9 6 1 0 4 1 1 2 1 2 0 1 2 8 1 3 6 1 4 4 1 5 2 1 6 0 1 6 8 1 7 6 1 8 4 1 9 2 A cu rá ci a Época Acurácia Treinamento 44 Figura 10 – Análise da acurácia de validação do modelo para cada época durante o treinamento. Fonte: Do autor (2024). Durante o processo de treinamento por meio de validação cruzada, foi possível observar o comportamento do modelo utilizando todo o conjunto de dados tanto para treinamento quanto para validação. O treinamento resultou em um valor médio de AC de 92% nos cinco experimentos, com SE de 91% e especificidade de 92%, demonstrando o potencial da metodologia proposta. Estes resultados são superiores aos de McEvoy et al. (2021), que encontrou baixa sensibilidade (53%) em seus modelos e o de Gomes et al. (2021), com 66% de especificidade. Comparados aos resultados de Boufenar et al. (2023), destaca-se que os autores testaram seis diferentes redes neurais convolucionais para encontrar o melhor desempenho, o que pode explicar a acurácia superior daquele estudo. Os resultados de SE média indicam a probabilidade de prever corretamente um caso positivo de DCF quando o indivíduo realmente é portador, enquanto a especificidade média aponta que, quando o indivíduo não apresenta a doença, o modelo tende a concordar com o diagnóstico na sua predição. A tabela 5 mostra os resultados dos cinco experimentos realizados durante a validação cruzada. 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 A cu rá ci a Época Acurácia Validação 45 Tabela 5 – Resultados dos treinamentos para classificação automática da displasia. K-fold Acurácia Sensibilidade Especificidade Fold 1 91% 90% 93% Fold 2 92% 91% 90% Fold 3 90% 91% 92% Fold 4 93% 92% 91% Fold 5 93% 92% 92% Média 92% 91% 92% A matriz de confusão foi construída a partir das previsões do modelo obtidas no conjunto teste. As previsões corretas estão localizadas na diagonal da tabela 6, destacadas em azul, e representam VP e VN. O modelo classificou corretamente 93% das imagens de portadores de DCF e 91% de não portadores. De todas as imagens com características positivas para a doença, o algoritmo previu que 9% eram normais e, nos casos negativos, esta previsão foi de 7%. Assim, a previsão do modelo foi de (0,93+0,91)/(0,93+0,07+0,09+0,91) = 92%. Já a curva ROC, ilustrada na figura 11, compara a taxa de VP à de FP e mostra bom desempenho do modelo, cuja curva atinge o canto superior esquerdo devido ao valor elevado de VP. Ainda, a AUC corrobora com a elevada precisão do modelo, indicando previsão correta em 92% dos casos. Estes resultados mostram que o desenvolvimento de ferramentas de análise de imagem verdadeiramente eficazes tem o potencial de modificar a forma como a radiologia diagnóstica se relaciona com o paciente suspeito para DCF. Diagnósticos equivocados podem levar a um número considerável de FP, promovendo perda de variação genética, mas também de FN, mantendo na reprodução animais geneticamente acometidos. Portanto, e conforme sugerido por VERHOEVEN et al. (2007), a correta distinção entre cães displásicos e cães displásicos é muito mais importante do que a classificação das suas articulações em categorias fenotípicas. Utilizar cães FN na reprodução mantém a doença na população, enquanto FP, que poderiam favorecer a susceptibilidade dos descendentes, podem ser equivocadamente excluídos. Isso pode, inclusive, explicar o lento progresso na redução da incidência da displasia do quadril ao longo das últimas décadas (VERHOEVEN et al., 2007). 46 Tabela 6 – Matriz de confusão construída a partir das previsões do modelo testado. Fonte: Do autor (2024). Figura 11 – Curva ROC e área sob a curva para o modelo testado. Fonte: Do autor (2024). Mesmo considerando-se a possibilidade de viés e subjetividade na rotulagem da amostra, sistemas híbridos em que humanos colaboram com computadores podem ter desempenho superior ao trabalho de cada um isoladamente, com resultados mais rápidos e precisos. Além disso, BURTI et al. (2024) sugerem que remover o fator humano coloca em perigo o bem-estar do paciente e anula a responsabilidade veterinária. Portanto, estes profissionais devem permanecer responsáveis pelo manejo das ferramentas de IA e, de acordo 47 com WAITE et al. (2018), podem ser vistos como autoridades indispensáveis, cujas habilidades perceptuais e tomada de decisão devem estar integradas à supervisão ativa das ferramentas de diagnóstico por imagem auxiliado por computador. 48 5 CONSIDERAÇÕES FINAIS Este estudo demonstra a viabilidade do uso de aprendizado profundo para triagem radiográfica de pelves, classificando com precisão portadores e não portadores de DCF em cães. Embora existam limitações como a grande variação anatômica entre indivíduos, a subjetividade da avaliação e a falta de grandes bancos de dados em medicina veterinária, os elevados índices de acurácia (92%), sensibilidade (91%) e especificidade (92%) indicam que a IA tem grande potencial para auxiliar no diagnóstico, especialmente em ambientes com pouco acesso a especialistas. A combinação de sistemas híbridos, que integram IA e especialistas humanos, pode melhorar a acurácia diagnóstica por meio da triagem radiográfica em larga escala e contribuir para o controle da doença a longo prazo. Sendo assim, o sucesso inicial do diagnóstico radiográfico de DCF assistido por IA fornece base sólida para o aperfeiçoamento desta técnica baseada em tecnologias ainda mais precisas, o que depende da contínua alimentação do banco de dados e do aprimoramento do algoritmo em estudos futuros. Modelos bem sucedidos, como o testado neste trabalho, podem auxiliar na segurança dos diagnósticos, no direcionamento das condutas terapêuticas e na otimização do fluxo de trabalho neste campo. 49 REFERÊNCIAS ABUJUDEH, H.H., BOLAND, G.W., KAEWLAI, R., RABINER, P., HALPERN, E.F., GAZELLE, G.S., THRALL, J.H. Abdominal and pelvic computed tomography (CT) interpretation: discrepancy rates among experienced radiologists. European Radiology, v.20, n.8, p.1952-1957, 2010. AGGARWAL, R., SOUNDERAJAH, V., MARTIN, G., TING, D.S.W., KARTHIKESALINGAM, A., KING, D., ASHRAFIAN, H., DARZI, A. Diagnostic accuracy of deep learning in medical imaging: a systematic review and meta-analysis. Digital Medicine, v.4, n.65, 2021. AKULA, S.P., AKULA, P., KAMATI, N. Detection and Classification of Canine Hip Dysplasia According to FCI Grading System Using 3DCNN’s. In Proceedings of the 2022 First International Conference on Artificial Intelligence Trends and Pattern Recognition (ICAITPR), v.109, p.1-6, 2022. ALBADRANI, B.A., ABDEL-RAHEEM, M.A., AL-FARWACHI, M.I. Artificial Intelligence in Veterinary Care: A Review of Applications for Animal Health. Egyptian Journal of Veterinary Sciences, v.55, n.6, p.1725-1736, 2024. ALEXANDER, J. W. The pathogenesis of canine hip dysplasia. Veterinary Clinics of North America: Small Animal Practice, v.22, n.3, p.503-511, 1992. ALJUAID, A., ANWAR, M. Survey of Supervised Learning for Medical Image Processing. SN Computer Science, v.3, n.292, 2022. APPLEBY, R.B., BASRAN, P.S. Artificial intelligence in veterinary medicine. Journal of the American Veterinary Medical Association, v.260, n.8, 2022. ARCHER, H., REINE, S., ALSHAIKHSALAMA, A., WELLS, J., KOHLI, A., VAZQUEZ, L., HUMMER, A., DIFRANCO, M.D., LJUHAR, R., XI, Y., CHHABRA, A. Artificial intelligence- generated hip radiological measurements are fast and adequate for reliable assessment of hip dysplasia AN EXTERNAL VALIDATION STUDY. Jone & Boint Open, v.3, n.11, p.877-884, 2022. BOUFENAR, C., LOGOVI, T.E.M.N., SAMIR, D., LASSAKEUR, I.E. Computer-aided diagnosis of Canine Hip Dysplasia using deep learning approach in a novel X-ray image dataset. Computer Methods in Biomechanics and Biomedical Engineering: Imaging & Visualization, v.11, n;7, 2023. BRITISH VETERINARY ASSOCIATION: BVA. Disponível em: https://www.bva.co.uk/media/5670/fig-1-pelvis-and-hip-joint-normal.jpg. Acesso em: 1 de março de 2024. BROECKX, B.J.G.; VERHOEVEN, G.; COOPMAN, F.; VAN HAERINGEN, W.; BOSMANS, T.; GIELEN, I.; HENCKENS, S.; SAUNDERS, J.H.; VAN BREE, H.; VAN RYSSEN, B.; VERBEKE, V.; VAN STEENDAM, K.; VAN NIEUWERBURGH, F.; DEFORCE, D. The effects of positioning, reason for screening and the referring veterinarian on prevalence estimates of canine hip dysplasia. The Veterinary Journal, v.201, v.3, p.378- 384, 2014. https://www.bva.co.uk/media/5670/fig-1-pelvis-and-hip-joint-normal.jpg 50 BURTI, S., BANZATO, T., COGHLAN, S., WODZINSKI, M., BENDAZZOLI, M., ZOTTI, A. Artificial intelligence in veterinary diagnostic imaging: Perspectives and limitations. Research in Veterinary Science, v.175, 2024. BUTLER, J. R.; GAMBINO, J. Canine Hip Dysplasia – Diagnostic Imaging. Veterinary Clinics of North America, v.47, p.777-793, 2017. CORLEY, E. A. Role of the orthopedic foundation for animals in the control of canine hip dysplasia. Veterinary Clinics of North America: Small Animal Practice. v.22, n.3, p.579- 593, 1992. FITZKE, M., STACK, C., DOURSON, A., SANTANA, R.M.B., WILSON, D., ZIEMER, L., SOIN, A., LUNGREN, M.P., FISHER, P., PARKINSON, M. RapidRead: Global Deployment of State-of-the-art Radiology AI for a Large Veterinary Teleradiology Practice. arXiv, 2021. FLÜCKIGER, M. Scoring radiographs for canine Hip Dysplasia - The big three organisations in the world. The European Journal of Companion Animal Practice, v.17, ed.2, 2007. FORTRIE, R.R.; VERHOEVEN, G.; BROECKX, B.; DUCHATEAU, L.; JANSSENS, L.; SAMOY, Y.; SCHREURS, E.; SAUNDERS, J.; VAN BREE, H.; VANDEKERCKHOVE, P.; COOPMAN, F. Intra- and Interobserver Agreement on Radiographic Phenotype in the Diagnosis of Canine Hip Dysplasia. The American College of Veterinary Surgeons, v.44, n;4, p.467-473, 2015. FRANCO-GONÇALO, P.; ALVES-PIMENTA, S.; GONÇALVES, L.; COLAÇO, B.; LEITE, P.; RIBEIRO, A.; FERREIRA, M.; MCEVOY, F.; GINJA, M. Femoral parallelism: evaluation and impact of variation on canine hip dysplasia assessment. Frontiers in Veterinary Science, v.10, 2023. FRIES, C. L.; REMEDIOS, A. M. The pathogenesis and diagnosis of canine hip dysplasia: A review. The Canadian Veterinary Journal, v.36, p.494-502, 1995. FROES, T.R., ZWINGENBERGER, A.L., SATO, A., GARCIA, D.A.A., DE SOUZA, A.C., LEMOS, R.S., MAI, W. Interobserver agreement in interpretation of radiographic pulmonary changes in dogs in relation to radiology training. Semina: Ciências Agrárias, v.35, n.5, 2014. FRY, T. R., CLARK, D. M. Canine hip dysplasia: clinical signs and physical diagnosis. Veterinary Clinics of North America: Small Animal Practice. v.22, n.3, p.551-558, 1992. GINJA, M. M. D.; SILVESTRE, A. M.; GONZALO-ORDEN, J. M.; FERREIRA, A. J. A. Diagnosis, genetic control and preventive management of canine hip dysplasia: A review. The Veterinary Journal, v.184, p..269-276, 2010. GOMES, D.A., ALVES-PIMENTA, M.S., GINJA, M., FILIPE, V. Predicting Canine Hip Dysplasia in X-Ray Images Using Deep Learning. Springer, p.393-400, 2021. HASTIE, T., TIBSHIRANI, R., FRIEDMAN, J. The elements of statistical learning: data mining, inferenceand prediction. Springer, v.2, p.1-758, 2009. HEDHAMMAR, A. Canine Hip Dysplasia as influenced by genetic and environmental factors. The European Journal of Companion Animal Practice, v.17, ed.2, 2007. 51 JOCHER, G., STOKEN, A., AYUSH, C., BOROVEC, J., NANOCODE012, TAOXIE, KWON, Y., MICHAEL, K., CHANGYU, L., FANG, J., ABHIRAM, V., LAUGHING, TKIANAI, YXNONG, SKALSKI, P., HOGAN, A., NADAR, J., IMYHXY, MAMMANA, L., ALEXWANG1900, FATI, C., MONTES, D., HAJEK, J., DIACONU, L., MINH, M. YOLOV5, 2021. Disponível em: . Acesso em: 11 de outubro de 2021. JOSLYN, S., ALEXANDER, K. Evaluating artificial intelligence algorithms for use inveterinary radiology. Veterinary Radiology & Ultrasound, n.63, p.871-879, 2022. JUNQUEIRA, L.C., CARNEIRO, J. Histologia básica: texto e atlas. 12.ed. Rio de Janeiro: Guanabara Koogan, 2013. KING, M. D. Etiopathogenesis of Canine Hip Dysplasia, Prevalence, and Genetics Veterinary Clinics of North America: Small Animal Practice, v.47, ed.4, p.753-767, 2017. KOHAVI, R. A study of cross-validation and bootstrap for accuracy estimation and modelselection. International Joint Conference on Artificial Intelligence, v.14, p.1137– 1145, 1995. LAKHANI, P., PRATER, A., HUTSON, R.K., ANDRIOLE, K.P., DREYER, K.J., MOREY, J., PREVEDELLO, L.M., CLARK, T.J., GEIS, J.R., ITRI, J.N., HAWKINS, C.M. Machine Learning in Radiology: Applications Beyond Image Interpretation. American College of Radiology, v.15, p.350-359, 2020. LI, M., JIANG, Y., ZHANG, Y., ZHU, H. Medical image analysis using deep learning algorith