Como a Inteligência Artificial consegue diagnosticar COVID em exames de sangue?
Por Fidel Forato |
Depois a tecnologia evoluiu ao ponto de criar a inteligência artificial (IA), fica difícil imaginar um setor da indústria que não encontre uma boa aplicabilidade do recurso em seus modelos de negócio. Na área da saúde, então, tecnologia e ciência andam juntas, principalmente quando é preciso correr contra o tempo — como acontece agora, durante a pandemia do coronavírus.
O Canaltech conversou com duas empresas que, focadas em combater o vírus SARS-CoV-2, procuram desenvolver algoritmos para identificação da COVID-19 através de alterações em um hemograma, o conhecido exame de sangue. A ideia é que a ferramenta possa auxiliar as equipes médicas na triagem e no apoio ao diagnóstico de casos suspeitos que passam pelas análises dos laboratórios do Grupo Fleury, que, em parceria com a empresa de IA Kunumi, pretendem inovar e trazer resultados mais rápidos.
- Não tem teste? Análise online de tomografias auxilia no diagnóstico de COVID-19
- Manda áudio da sua tosse? Cientistas brasileiros querem detectar COVID-19 no som
- "Bafômetro de COVID-19" pode indicar presença de coronavírus pelo hálito
A principal vantagem do novo método é que o hemograma é um exame barato e acessível, quando comparado as outras formas de se identificar a presença do coronavírus, o que pode alavancar de forma significativa o acesso a testagens da COVID-19, principalmente em áreas mais remotas do país.
Outro ponto positivo da pesquisa, que deve ter os resultados divulgados em até dois meses, é que será possível identificar se o vírus está ativo no corpo do paciente ou se ele desenvolveu anticorpos, a partir da soma de evidências. Para tudo isso, as equipes contam, literalmente, com uma fábrica de exames e resultados que crescem de forma exponencial para alimentar essa IA.
Check-up de rotina
Usado em muitos casos para o diagnóstico geral do paciente, os exames de sangue medem os níveis de hemácias (glóbulos vermelhos), leucócitos (brancos), plaquetas e outras variações dessas células do sangue. "O hemograma sempre foi uma ferramenta para os médicos de apoio ao diagnóstico. As combinações [e as diferentes concentrações] que você verifica no hemograma traz sugestões sobre a doença que está se tratando", explica Maria Carolina Tostes Pintão, coordenadora médica de Pesquisa e Desenvolvimento do Grupo Fleury.
"O hemograma é um exame de baixo custo quando comparado ao RT-PCR e aos exames sorológicos [outros meios que permitem a identificação de casos da COVID-19]. Para casos de triagem e apoio ao diagnóstico, então, faz todo o sentido juntar um exame barato e que traz informação sobre diversas variações que acontecem no organismo, associado a um algoritmo bem treinado com IA", comenta Wesley Prieto, assessor científico da rede sobre as possibilidades favoráveis para o desenvolvimento da ferramenta.
Como funciona?
Normalmente, pacientes com COVID-19 apresentam alterações visíveis em um hemograma, só que entender como o hemograma, em si, pode funcionar de apoio ao diagnóstico é um percurso mais difícil, já que essas alterações podem se confundir com outras doenças. "Olhando o hemograma isoladamente, algumas alterações são bastante características. O grande valor do projeto é conseguir, a partir desses achados ou combinados desses achados, chegar a uma predição diagnóstica" de infecção pelo coronavírus, afirma a médica Maria Carolina sobre os desafios que a IA pode solucionar.
As tecnologias atuais, por exemplo, já dão conta de identificar valores de hemogramas fora de uma faixa de referência e, com bastante facilidade, ferramentas de estatística simples apontam a diferença no número de linfócitos de um grupo com COVID-19 e outro sem, mas sempre de forma separada ou quando as respostas já estão dadas para a máquina.
"Agora, quando você pega problemas complexos, com múltiplas variáveis e relações não lineares entre essas variáveis [como o novo coronavírus], você precisa do aprendizado de máquina para conseguir identificar esses padrões que não são óbvios, que são invisíveis aos olhos humanos", explica Daniella Castro, líder de Pesquisa e Desenvolvimento da Kunumi.
Nesse cenário, um padrão complexo pode ser definir métricas para identificar a infecção pelo coronavírus, a partir do cruzamento de contagens de eritrócitos com basófilos e leucócitos — sendo todos elementos do sangue que oscilam de acordo com a doença que se contrai —, junto da idade e do sexo do paciente. No currículo, a equipe da Kunumi já desenvolveu modelos para predizer o risco de Alzheimer em até cinco anos antes do aparecimento de sintomas, usando apenas biomarcadores presentes nos exames de sangue.
Além das taxas das células, vindo dos exames, a IA é alimentada por informações demográficas dos pacientes, como sexo e idade. Isso porque os valores de referência de um hemograma, normalmente, já são referenciados nessas variáveis. Por outro lado, outros estudos apontam para uma associação direta entre idade, principalmente, para pessoas idosas, associada a um maior número de óbitos em homens com mais 60 anos, por exemplo.
Em outras palavras, sexo e idade são também dados epidemiológicos que podem contribuir para a assertividade do algoritmo. "Pelos dados preliminares, a idade influencia tanto nos dados de referência quanto em relações não-lineares com as variáveis" para o diagnóstico da COVID-19, adianta Castro sobre as evidências encontradas.
De onde vêm os dados?
Agora, a pergunta é: de onde chegam os dados que permitirão diagnosticar ou ao menos facilitar a triagem de casos da COVID-19, através de um único exame de sangue? Para o treinamento da IA, serão utilizados uma base de dados de pessoas que realizaram testes para diagnóstico do coronavírus dentro dos laboratórios do Grupo Fleury.
Mais especificamente, serão usados exames de pacientes que realizaram um hemograma, em um intervalo de 30 dias antes ou depois de realizarem um teste de RT-PCR para o diagnóstico da COVID-19. Para o aprendizado de máquina se tornar mais eficiente e a IA mais assertiva, inclusive, novos exames ainda são coletados. Afinal, os hemogramas são importantes tanto na etapa de treinamento quanto de validação.
“Sabendo que com o aumento expressivo que tivemos nos últimos meses e ainda temos — embora estejamos em queda em alguns estados —, temos entre três e quatro mil exames por dia de RT-PCR, então esse valor aumenta exponencialmente a cada dia. Hoje, se nós fizermos a ingestão de dados a partir dos dados que nós temos na base, comparado ao que a Kunumi tem lá, temos pelo menos 50 mil exames a mais. Essa série de treino pode facilmente completar 150 mil, 200 mil testes. Mais 150 mil exames, por exemplo, na série de validação", detalha o assessor Wesley Prieto.
Mesmo com as vantagens e os ganhos da pesquisa, há um possível risco de exposição de dados dos pacientes, já que a IA é treinada com base em informações de idade e o sexo. Entretanto, o laboratório garante que as informações são compartilhadas de forma anônima. "Usamos esses dados de forma anonimizada, então, não tem nada dentro desses dados que permite a identificação do paciente", garante Maria Carolina.
"Como é uma massa grande de dados, temos esse cuidado para que de nenhuma forma se consiga rastrear o paciente original. Se quisermos fazer uma análise diferente, precisamos fazer uma outra extração do banco de dados", complementa a coordenadora médica de Pesquisa e Desenvolvimento. Por exemplo, a partir de algo que a pesquisa identifique de diferente, não é possível retornar ao banco e extrair mais dados daquele paciente.
Em outra iniciativa com IA, algoritmos e coronavírus, o Grupo Fleury também participa do projeto Radvid19, que é uma plataforma capaz de identificar indícios da doença COVID-19 nos pacientes através de exames de imagens de raios-X e tomografias do tórax. Para isso, a plataforma conta com um algoritmo que analisa as imagens de tomografia coletadas, o que gera um relatório que pode ser acessado por radiologistas. A ideia é que a ferramenta funcione no auxílio da decisão clínica para definir o melhor tratamento para o paciente.