Pesquisa do MBA em IA e Big Data propõe técnica mais confiável para diagnóstico de câncer de mama

Trabalho de João Vitor Santillo prioriza a transparência dos resultados, aumentando a confiança em diagnósticos por IA e facilitando sua aplicação em larga escala

Imagine a angústia de passar por um momento crítico de saúde, como o câncer de mama, e o diagnóstico demorar demais ou não ser preciso o suficiente para que os médicos possam agir rapidamente?

Foi uma situação familiar como essa que motivou o pesquisador João Vitor Santillo a elaborar sua pesquisa de conclusão do MBA em IA e Big Data da USP São Carlos. Intitulado “Explicabilidade na Classificação de Câncer de Mama com Redes Neurais”, o trabalho propôs uma ferramenta baseada em Inteligência Artificial (IA) capaz de analisar e classificar imagens de ultrassonografia em busca de tumores de mama. A proposta se diferencia por priorizar a explicabilidade da classificação, pois além de apontar o resultado, a ferramenta indica quais áreas da imagem influenciaram a classificação, quais padrões foram identificados pela rede e por que ela apontou determinada probabilidade. 

“Isso traz mais confiança para os profissionais e ajuda a integrar melhor a IA na prática médica, garantindo que ela funcione como uma ferramenta de apoio ao diagnóstico, e não como uma “caixa preta” que simplesmente dá respostas sem justificativa. A  explicabilidade é a chave para que a IA ganhe escala e aplicação prática”, ressalta Santillo.

Imagem de ultrassonografia com tumor maligno. No cenário 08, a IA otimizada atinge alta precisão, com sobreposição de 84% da marcação médica (roxo)  | Imagem: Reprodução

Importância da pesquisa e seu desenvolvimento

O câncer de mama é o tipo mais comum e a incidência de casos deve aumentar em 30% até 2040 em todo o mundo, segundo dados do International Agency for Research on Cancer (IARC). Por isso, é cada vez mais importante diminuir o tempo entre a detecção do tumor e o início do tratamento, pois estudos apontam que isso é crucial para a possibilidade de cura. Dessa forma, a ideia de João Vitor não é substituir o papel do médico, mas otimizar o processo de diagnóstico. 

“A experiência com a minha mãe, que hoje está felizmente curada, me fez refletir sobre a importância de ferramentas que possam acelerar e melhorar a triagem no sistema de saúde. Com isso, casos de maior risco poderiam ser priorizados, tornando o encaminhamento mais ágil e, consequentemente, aumentando as chances de cura”, defende o pesquisador.

Com orientação do professor Fernando Pereira dos Santos, do Instituto de Ciências Matemáticas e da Computação (ICMC) da USP, João Vitor utilizou um banco de imagens de ultrassonografias, ajustando-as para garantir que fossem compatíveis com a rede neural utilizada. Para melhorar a capacidade de aprendizado do modelo, ele aplicou a técnica de data augmentation, que gera variações sutis nas imagens, como rotações e inclinações.

“Esse aumento na variabilidade dos dados é fundamental para evitar o problema de sobreajuste (overfitting), garantindo que o modelo consiga generalizar melhor em novas imagens”, explica.

Com as imagens tratadas, João treinou oito cenários diferentes da rede neural, alguns com data augmentation e outros sem. Os resultados foram claros: os cenários com aumento de dados apresentaram uma melhora significativa na acurácia do modelo e na sobreposição entre as regiões destacadas pela IA e as marcações feitas pelos médicos. 

Na etapa seguinte, João Vitor gerou mapas de saliência, que indicam visualmente as regiões de maior interesse na imagem. Utilizando o algoritmo Grad-CAM (Gradient-weighted Class Activation Mapping), uma técnica amplamente usada para explicação de redes neurais, o modelo passou a fornecer não apenas a classificação do tumor (maligno ou benigno), mas também as áreas específicas que contribuíram para a decisão.

Com uma acurácia entre 95% e 96% na classificação das imagens, o modelo demonstrou alta eficiência. Em termos de explicabilidade, a sobreposição entre os mapas de calor gerados pela IA e as marcações médicas foi de 56% para tumores malignos e 45% a 48% para tumores benignos.

“Além dos mapas de calor, estabeleci uma métrica comparativa para avaliar diferentes modelos e conjuntos de dados, o que é importante para validar a ferramenta em diferentes contextos”, destrincha o pesquisador.

Outro destaque foi a capacidade de generalização do modelo. Mesmo ao utilizar outros conjuntos de dados, os resultados mantiveram-se consistentes, um forte indicativo da robustez e adaptabilidade da ferramenta.

“A explicabilidade na classificação de câncer de mama tem uma aplicação prática e relevante de inteligência artificial na área da saúde”, afirma o pesquisador | Foto: Reprodução

Aprendizados e continuidade da pesquisa 

Como qualquer pesquisador, João Vitor enfrentou desafios que precisaram ser superados para que sua pesquisa pudesse ser apresentada à banca no dia 12 de outubro de 2024, garantindo a certificação da USP São Carlos. Diante das inúmeras possibilidades existentes na pesquisa com redes neurais, a necessidade de foco e delimitação do foram essencialmente encontrados com a ajuda de seu orientador, professor Fernando Santos. 

“Ele foi fundamental para guiar a pesquisa pois tinha o conhecimento necessário para indicar as melhores técnicas e metodologias, sabendo o que funcionaria ou não para imagens médicas”, declara o pesquisador. 

O empenho deu certo, o trabalho foi muito bem recebido e deve, em breve, ser publicado em revistas científicas ou em congressos da área. Os pesquisadores, por sua vez, estão dando continuidade à pesquisa, buscando otimizações adicionais que aumentem a precisão dos resultados e expandindo a aplicação para novos conjuntos de dados. 

“O diferencial do nosso trabalho é que, com uma arquitetura mais simples e eficiente, conseguimos atingir resultados comparáveis. Com ajustes e otimizações, acreditamos que podemos alcançar maior precisão com menor custo computacional, tornando o modelo mais viável para aplicação prática”, analisa.

Interesse pelo mundo da IA

Antes mesmo da conclusão da graduação em Engenharia de Software na Universidade Federal de Goiás (UFG), em 2018, João Vitor já se interessava pelos estudos sobre Inteligência Artificial. Dedicado, decidiu buscar no MBA em IA e Big Data da USP os conhecimentos aprofundados para entender os fundamentos e os mecanismos por trás das soluções de Inteligência Artificial.

“Essa necessidade surgiu porque percebi um movimento crescente no mercado: as empresas estavam começando a aplicar cada vez mais a IA em suas operações. Com a popularização do ChatGPT, por exemplo, o assunto ganhou força no senso comum e mostrou a importância de dominar essas tecnologias de maneira crítica e técnica”, diz. 

Enquanto avançava no MBA, seus conhecimentos já lhe foram bastante úteis na empresa onde trabalha que propôs um desafio relacionado ao processamento de linguagem natural.

“Aproveitei a oportunidade para unir o útil ao agradável: apliquei os conhecimentos que estava adquirindo e desenvolvi uma solução bastante eficiente, o que me projetou para a posição de líder de uma equipe de desenvolvimento de IA”, comemora. 

Concluído com sucesso, o MBA agora coloca João Vitor na vanguarda do mercado de trabalho, com uma certificação chancelada pela melhor universidade da América Latina. 

João Vitor celebra os resultados de sua trajetória no MBA em IA e Big Data com as professoras Solange Rezende e Roseli Romero, coordenadora e vice-coordenadora do programa | Foto: Reprodução

Texto: Gabriele Maciel, da Fontes Comunicação Científica