A Microsoft construiu uma ferramenta médica alimentada por inteligência artificial que, segundo a empresa, é quatro vezes mais bem-sucedida que médicos humanos no diagnóstico de doenças complexas, enquanto o gigante da tecnologia revela pesquisas que acredita poderem acelerar o tratamento.
O “Microsoft AI Diagnostic Orchestrator” é a primeira iniciativa a surgir de uma unidade de saúde com IA formada no ano passado por Mustafa Suleyman com funcionários recrutados da DeepMind, o laboratório de pesquisa que ele cofundou e que agora pertence à rival Google.
Em entrevista ao Financial Times, o diretor executivo da Microsoft IA disse que o teste é um passo no caminho para a “superinteligência médica” que poderia ajudar a resolver crises de pessoal e longos tempos de espera em sistemas de saúde sobrecarregados.
O novo sistema da Microsoft é sustentado por um chamado “orquestrador” que cria painéis virtuais de cinco agentes de IA atuando como “médicos” —cada um com um papel distinto, como formular hipóteses ou escolher testes diagnósticos— que interagem e “debatem” juntos para escolher um curso de ação.
Para testar suas capacidades, o “MAI-DxO” foi alimentado com 304 estudos do NEJM (New England Journal of Medicine) que descrevem como alguns dos casos mais complicados foram resolvidos por médicos.
Isso permitiu aos pesquisadores testar se o programa poderia descobrir o diagnóstico correto e transmitir seu processo de tomada de decisão, usando uma nova técnica chamada “cadeia de debate”, que faz com que os modelos de raciocínio de IA forneçam um relato passo a passo de como resolvem problemas.
A Microsoft usou os principais modelos de linguagem de grande escala da OpenAI, Meta, Anthropic, Google, xAI e DeepSeek. O orquestrador melhorou o desempenho de todos os LLMs, mas funcionou melhor com o modelo de raciocínio o3 da OpenAI para resolver corretamente 85,5% dos casos do NEJM.
Isso se compara a cerca de 20% por médicos humanos experientes, mas esses médicos não tiveram permissão para acessar livros didáticos ou consultar colegas no teste, o que poderia ter aumentado sua taxa de sucesso.
Uma versão da tecnologia também poderá ser implementada em breve no chatbot de IA Copilot da Microsoft e no mecanismo de busca Bing, que lidam com 50 milhões de consultas de saúde por dia.
Suleyman disse que a Microsoft está se aproximando de “modelos de IA que não são apenas um pouco melhores, mas dramaticamente melhores que o desempenho humano: mais rápidos, mais baratos e quatro vezes mais precisos”.
“Isso vai ser verdadeiramente transformador”, acrescentou.
O novo esforço de Suleyman surge depois que a DeepMind liderou o caminho em avanços de saúde relacionados à IA. O chefe do laboratório do Google, Sir Demis Hassabis, ganhou conjuntamente um Prêmio Nobel de Química no ano passado por usar IA para desvendar os segredos biológicos das proteínas que sustentam a vida.
A Microsoft investiu quase US$ 14 bilhões (R$ 76,8 bilhões) na OpenAI e tem direitos exclusivos de usar e vender sua tecnologia. No entanto, o gigante da tecnologia está envolvido em um jogo de alto risco com a startup, que está tentando se converter em uma entidade com fins lucrativos, com ambos os lados entrando em conflito sobre os termos futuros de sua parceria.
Suleyman disse que, embora o modelo da OpenAI tenha apresentado o melhor desempenho, a Microsoft era “agnóstica” sobre qual dos quatro “modelos de classe mundial” o MAI-DxO usava.
“Há muito acreditamos que eles se tornarão commodities… é o orquestrador agregado que eu acho que é o diferenciador”, disse ele.
Dominic King, ex-chefe da unidade de saúde da DeepMind que se juntou à Microsoft no final do ano passado, disse que o programa “teve um desempenho melhor do que qualquer coisa que já vimos antes” e que “há uma oportunidade aqui hoje para atuar quase como uma nova porta de entrada para a saúde”.
Os modelos de IA também foram programados para serem conscientes em relação aos custos, o que reduziu significativamente o número de testes necessários para chegar a um diagnóstico correto no teste, economizando centenas de milhares de dólares em alguns casos, disse ele.
No entanto, King enfatizou que a tecnologia ainda está em seus estágios iniciais, não passou por revisão por pares e ainda não está pronta para um ambiente clínico.
“Este é um estudo histórico”, disse Eric Topol, cardiologista e fundador e diretor do Instituto Translacional de Pesquisa Scripps. “Embora este trabalho não tenha sido realizado no contexto da prática médica do mundo real, é o primeiro a fornecer evidências do potencial de eficiência da IA generativa na medicina — precisão e economia de custos”.