Pesquisadores da Universidade de Tsinghua criam um Hospital Agente virtual para treinamento de médicos de IA sem intervenção humana
Pesquisadores da Universidade de Tsinghua no Intelligent Industry Research Institute (AIR) e do Departamento de Ciência e Tecnologia da Computação criaram um Hospital Agente virtual para treinamento de médicos de IA sem intervenção humana. Primeiro, eles criaram uma simulação de um hospital inteiro, com equipe e pacientes. Em seguida, os médicos de IA receberam a responsabilidade de diagnosticar e tratar milhares de pacientes virtuais sem intervenção humana. Os médicos aprenderam rapidamente com seus erros, e suas habilidades em examinar, diagnosticar e tratar aumentaram significativamente.
As simulações virtuais, ou simulacros, reproduzem um ambiente do mundo real para o treinamento rápido e seguro da IA. O computador não precisa esperar que um paciente doente apareça, mas centenas, milhares e até milhões de pacientes doentes podem ser programados para aparecer conforme desejado. O custo de tais simulações também é muito menor do que o treinamento real.
Os pesquisadores da Tsinghua conseguiram treinar rapidamente médicos virtuais de IA em 10.000 pacientes virtuais na simulação do Agent Hospital usando seu processo chamado método MedAgent-Zero. Eles foram criados alimentando modelos de linguagem ampla com informações sobre oito tipos de doenças para criar registros eletrônicos de saúde para 10.000 pacientes virtuais, cada um com gravidade e apresentação diferentes. Essas oito doenças eram nasofaringite aguda, rinite aguda, asma brônquica, bronquite crônica, COVID-19, Influenza A, Influenza B e infecção por micoplasma. Um conjunto separado de 500 registros de pacientes foi criado para testes.
Durante as simulações, o médico virtual equipado com o gpt-3.5-turbo-1106 desenvolveu rapidamente suas habilidades. Depois de atender 10.000 pacientes virtuais, o médico obteve taxas de sucesso no exame, diagnóstico e tratamento de pacientes de 88%, 95,6% e 77,6%, dependendo da doença.
O GPT está melhorando rapidamente, portanto os pesquisadores da Tsinghua também testaram seu método de treinamento MedAgent-Zero usando o mais poderoso gpt-4-1106-preview. Eles compararam o desempenho dos médicos de IA gpt-3 e gpt-4 usando 1.273 perguntas do banco de dados MedQAum grande conjunto de perguntas de múltipla escolha que são semelhantes às perguntas de licenciamento médico encontradas em testes como o USMLE. O desempenho dos médicos virtuais em perguntas sobre doenças respiratórias foi de 93,06% gpt-4 contra 84,72% gpt-3.
O desempenho inovador desses médicos de IA foi obtido com apenas alguns dias de treinamento virtual, e o simulacro do Agent Hospital abre caminho para o desenvolvimento de métodos de treinamento para futuros médicos de IA, bem como para médicos reais, que são significativamente mais rápidos e eficazes.
Os leitores que não sabem quais serão os empregos que restarão em um futuro movido a IA podem apenas dizer aos seus robôs humanoides 1X para fazer o jantar e limpar a casa para eles. Aqueles que desejam desenvolver a IA devem equipar suas plataformas de PC com uma GPU Nvidia rápida(como esta na Amazon) ou comprar um dos laptops mais rápidos do planeta(como este na Amazon) para começar a treinar a IA para assumir muitos trabalhos.
Fonte(s)
Tradução automática pelo navegador Edge:
AIR cria um hospital virtual para realizar a autoevolução dos médicos de IA
Data de lançamento: 2024-05-24
O Instituto de Pesquisa da Indústria Inteligente (AIR) da Universidade de Tsinghua e o Departamento de Ciência da Computação e Tecnologia da Universidade de Tsinghua cooperaram para construir um hospital virtual, o Agent HospitalMedAgent-Zero, um método de autoevolução para agentes médicos, é proposto, o que permite que os agentes médicos melhorem continuamente suas capacidades médicas gerando uma grande quantidade de dados sem anotação manual em hospitais virtuais, e é verificado em conjuntos de dados do mundo real. Todos os pacientes, enfermeiros e médicos no Agent Hospital são interpretados por agentes autônomos orientados por grandes modelos, que simulam o processo de ciclo fechado de "pré-hospitalar-em-hospitalar-pós-hospitalar" de início, triagem, registro, consulta, exame, diagnóstico, medicação, reabilitação e acompanhamento. Com base na base de conhecimento e no modelo básico, o Agent Hospital simula o processo de geração e desenvolvimento de doenças de pacientes virtuais. Os médicos virtuais aprendem (ou seja, leem a literatura médica) e praticam (ou seja, interagem com os pacientes virtuais e tomam decisões de diagnóstico e tratamento) no Agent Hospital, resumem constantemente a experiência de casos de diagnóstico e tratamento bem-sucedidos, refletem sobre as lições de casos de insucesso e melhoram continuamente a precisão de várias tarefas de diagnóstico e tratamento. Depois de tratar quase 10.000 pacientes virtuais (o que leva cerca de 2 anos para médicos humanos), os médicos virtuais conseguiram superar os melhores métodos atuais no subconjunto de doenças respiratórias do conjunto de dados MedQA, alcançando uma taxa de precisão de 93,06%. O estudo, que teve como coautores o professor assistente Ma Weizhi, da AIR, e o professor Yang Liu, reitor executivo da AIR e reitor associado do Departamento de Ciência da Computação, recebeu muita atenção e discussão da comunidade de inteligência artificial e da comunidade médica no país e no exterior depois de ter sido publicado no arXiv.
- Título do artigo: Agent Hospital: A Simulacrum of Hospital with Evolvable Medical Agents (Um simulacro de hospital com agentes médicos evolutivos)
- Link para o artigo: arxiv.org/pdf/2405.02957v1
Nos últimos anos, os modelos de linguagem em larga escala têm se desenvolvido vigorosamente, e a tecnologia de agentes baseada em modelos de linguagem de larga escala tem atraído muita atenção. Estudos anteriores usaram a tecnologia de agentes para realizar simulações do mundo real, incluindo cenários de interação e jogos como "Stanford Town" e "Werewolf Killing Game". Ao mesmo tempo, a tecnologia de agentes também é usada no planejamento de agendamento e no processo de colaboração de várias tarefas, mas esse processo depende principalmente do suporte de dados anotados manualmente e de alta qualidade. Portanto, a questão de pesquisa é se a simulação do mundo real pode ajudar a melhorar a capacidade de processamento de tarefas dos agentes.
A assistência médica inteligente tem atraído grande atenção devido à sua importância e valor de aplicação, e a equipe de pesquisa tem dado grande atenção à aplicação de modelos de linguagem ampla e tecnologia de agentes em cenários médicos. Em resposta às perguntas de pesquisa acima, a equipe acredita que o ambiente de modelo real pode ajudar a melhorar e evoluir a capacidade de tarefa dos agentes, por isso realizou a pesquisa Agent Hospital, que combina simulação do mundo real e melhoria da capacidade médica. Nesse trabalho, a equipe está empenhada em criar um ambiente de simulação de hospital e explorar a evolução autônoma de agentes médicos nesse ambiente. O objetivo é permitir que os agentes acumulem conhecimento médico de forma independente no processo de diagnóstico, tratamento e aprendizado, assim como os médicos humanos, e realizem a evolução contínua das capacidades médicas.
A equipe de pesquisa concentrou-se primeiramente no uso de modelos de agentes em grande escala para simular processos médicos críticos do mundo real. No Agent Hospital, a equipe projetou e cobriu 8 cenários típicos, desde a geração da doença até a recuperação, a saber: início, triagem, registro, consulta, exame, diagnóstico, prescrição e recuperação, e os pacientes participarão ativamente do feedback de acompanhamento. Todos os processos são apoiados por grandes modelos nos quais as funções podem interagir de forma autônoma.
Exemplos de sessões importantes de diagnóstico e tratamento
O diagrama acima ilustra uma abordagem de loop fechado: quando Kenneth Morgan, o agente do paciente, fica doente, ele vai ao hospital pedir ajuda. A enfermeira de triagem Katherine Li entende os sintomas de Morgan, analisa-o e faz a triagem para um departamento específico. Depois que Morgan concluir o registro, a consulta e o exame médico de acordo com as instruções do médico, o médico Robert lhe dará o diagnóstico final e o plano de tratamento, e Morgan irá para casa descansar de acordo com as instruções do médico e dará retorno ao hospital para recuperação, até a próxima vez em que ficar doente e for ao hospital.
Como o senhor pode ver no exemplo acima, a equipe de pesquisa criou dois tipos principais de funções para o hospital: equipe médica e pacientes. Todas as informações dos personagens são geradas por um modelo grande (GPT-3.5), portanto, podem ser facilmente dimensionadas e adicionadas. As informações específicas de alguns dos personagens são mostradas na figura abaixo: o paciente Kenneth Morgan, de 35 anos, atualmente tem rinite aguda, histórico de hipertensão e uma série de sintomas como vômito persistente; Zhao Lei é um radiologista experiente e a médica interna Elise Martin tem excelentes habilidades de comunicação e é especializada no diagnóstico e tratamento de doenças médicas agudas e crônicas. Esses históricos completos de informações sobre os personagens aumentam o realismo da simulação hospitalar.
Uma introdução às informações do personagem virtual
No processo de simulação médica mencionado acima, a geração de doenças é a chave para isso. Especificamente, as informações do registro médico atual são geradas por um grande modelo de linguagem combinado com o conhecimento médico para gerar um registro médico completo para o paciente, incluindo o tipo de doença, os sintomas, a duração e vários resultados de exames (consulte o apêndice do artigo para obter detalhes). Deve-se observar que, para garantir ao máximo a precisão de todo o processo de simulação, o agente paciente só perceberá os sintomas de sua doença, mas não a doença específica, enquanto o agente médico só poderá entender as informações conversando com o agente paciente e prescrevendo exames. O exame que o agente paciente precisa realizar, o tipo de doença e a gravidade da doença serão usados como três tarefas principais para avaliar a capacidade do agente médico de diagnosticar e tratar pacientes virtuais.
A maioria dos métodos tradicionais de treinamento de modelos médicos depende de pré-treinamento, ajuste fino e outras tecnologias, portanto, eles precisam ser apoiados por uma grande quantidade de dados médicos e alguns dados anotados manualmente de alta qualidade. No entanto, a equipe de pesquisa acredita que o processo de aprimoramento da capacidade dos médicos humanos não depende de dados tão massivos e que eles podem acumular experiência com a prática clínica no processo de diagnóstico e tratamento, além de melhorar com a leitura da literatura médica para acumular conhecimentos importantes. Os agentes médicos em hospitais virtuais devem ser capazes de alcançar uma evolução de capacidade semelhante.
Portanto, a equipe projetou um algoritmo de autoevolução de agentes denominado "MedAgent-Zero", que, assim como o AlphaGo-Zero, não depende de dados de anotação manual, mas usa o aprendizado (ou seja, a leitura de literatura médica) e a prática (ou seja, a interação com pacientes virtuais e a tomada de decisões de diagnóstico e tratamento) no hospital virtual para obter o aprimoramento da capacidade. Por outro lado, os agentes médicos também aprenderão de forma autônoma, simulando o processo de aprendizagem de documentos médicos com base nas perguntas médicas geradas pelo LLM.
Diagrama de fluxo da política do MedAgent-Zero
Conforme mostrado na figura acima, a evolução do MedAgent-Zero inclui duas abordagens: 1) Resumir a experiência de casos bem-sucedidos, para problemas de diagnóstico e tratamento que podem ser respondidos corretamente, o corpo inteligente acumulará a experiência do banco de dados de casos como um médico humano; 2) Refletir sobre as lições aprendidas com os fracassos e, ao responder a erros, o agente tomará a iniciativa de refletir sobre os erros e refletir sobre eles. Se as lições da reflexão ajudarem o agente a responder à pergunta, elas serão preservadas e armazenadas no pool de experiências.
Por fim, a equipe de pesquisa realizará a acumulação e a evolução dos dois aspectos acima no processo de treinamento em dados virtuais. Em cada processo de inferência, o agente recupera o conteúdo mais semelhante dos dois bancos de dados e o adiciona ao Prompt para aprendizado no contexto, além de acumular registros médicos ou resumir a experiência de acordo com as respostas corretas e incorretas, de modo a aprimorar continuamente a capacidade do agente.
No hospital virtual, a equipe de pesquisa construiu os registros médicos de dezenas de milhares de pacientes virtuais para os experimentos de evolução autônoma de agentes médicos, incluindo 8 doenças respiratórias relacionadas, como influenza A, influenza B e nova coroa, envolvendo mais de 10 exames médicos diferentes. Com base no cálculo de que os médicos humanos tratam cerca de 100 pacientes por semana, os médicos humanos podem levar dois anos para diagnosticar 10.000 pacientes, mas os médicos inteligentes levam apenas alguns dias para fazer isso.
A equipe avaliou principalmente a capacidade dos agentes médicos em hospitais virtuais sob dois aspectos. O primeiro é a avaliação da competência médica no ambiente virtual: conforme mostrado na figura abaixo, no processo de treinamento do agente médico (à esquerda), com o aumento do número de pacientes diagnosticados e tratados, a precisão do agente médico nas três principais tarefas continua a aumentar e se estabiliza gradualmente. No experimento de 500 registros médicos de teste, verificou-se (à direita) que a precisão do agente flutuou ligeiramente à medida que o número de pacientes aumentou, mas apresentou uma tendência geral de aumento.
A precisão da tarefa do agente médico no conjunto de treinamento (esquerda) e no conjunto de teste (direita).
Posteriormente, a equipe de pesquisa comparou a precisão do diagnóstico de agentes médicos em várias doenças antes e depois de sua evolução e descobriu que todos eles melhoraram muito, comprovando a eficácia de sua evolução autônoma.
Manifestações diagnósticas de diferentes doenças antes e depois da evolução dos agentes
Por outro lado, a equipe usou um subconjunto de doenças respiratórias do conjunto de dados externo MedQA para avaliar a capacidade do agente médico na medicina do mundo real. Surpreendentemente, mesmo sem usar nenhum dado anotado artificialmente no processo de evolução do agente, depois de tratar quase 10.000 pacientes, o agente médico conseguiu superar o melhor método atual no conjunto de dados e atingir a maior taxa de precisão de 93,06%, o que verifica a eficácia da evolução autônoma de agentes médicos no ambiente simulado.
Precisão de diferentes métodos em um subconjunto do MedQA
Além disso, a equipe de pesquisa realizou a verificação experimental da ablação, e os resultados mostraram que tanto os exemplos acumulados com os sucessos quanto as lições aprendidas com as falhas podem ajudar a aprimorar os recursos médicos do modelo.
Desempenho do ensaio de ablação do MedAgent-Zero
Em resumo, este trabalho de pesquisa constrói o primeiro cenário de hospital virtual, o Agent Hospital, e propõe o MedAgent-Zero, um algoritmo de evolução de agente médico que não depende de anotação de dados artificiais. Os resultados experimentais dos dados virtuais e reais verificam preliminarmente a eficácia do ambiente de simulação para o aprimoramento das capacidades dos agentes médicos e propõem novas soluções para a aplicação da inteligência artificial, especialmente modelos de linguagem ampla e tecnologia de agentes em cenários médicos inteligentes. No entanto, ainda há algumas limitações neste trabalho de pesquisa e, no futuro, a equipe continuará a aprimorar e otimizar os tipos de doenças cobertas, a meticulosidade do ambiente de simulação e a seleção e otimização da base do modelo.
Sobre o autor correspondente
Ma Weizhi, pesquisador assistente do Institute of Intelligent Industry (AIR) da Universidade de Tsinghua, foi selecionado como o "Projeto de Elevação de Jovens Talentos" da Associação Chinesa de Ciência e Tecnologia. Seus interesses de pesquisa incluem aquisição inteligente de informações e atendimento médico inteligente. Sua página pessoal: mawz12.github.io.
Liu Yang é professor da GDS, diretor executivo do Institute of Intelligent Industry (AIR), vice-diretor do Department of Computer Science da Universidade de Tsinghua e vencedor do National Fund for Distinguished Young Scholars. Seus interesses de pesquisa incluem inteligência artificial, processamento de linguagem natural e medicina inteligente. Página pessoal: nlp.csai.tsinghua.edu.cn/~ly.
Os Top 10
» Os Top 10 Portáteis Multimídia
» Os Top 10 Portáteis de Jogos
» Os Top 10 Portáteis Leves para Jogos
» Os Top 10 Portáteis Acessíveis de Escritório/Empresariais
» Os Top 10 Portáteis Premium de Escritório/Empresariais
» Os Top 10 dos Portáteis Workstation
» Os Top 10 Subportáteis
» Os Top 10 Ultrabooks
» Os Top 10 Conversíveis
» Os Top 10 Tablets
» Os Top 10 Smartphones
» A melhores Telas de Portáteis Analisadas Pela Notebookcheck
» Top 10 dos portáteis abaixo dos 500 Euros da Notebookcheck
» Top 10 dos Portáteis abaixo dos 300 Euros