哈佛最新研究:AI大型语言模型用于看病时初步诊断错误率达80%
2026年04月15日 19:38
本文共计336个字,预计阅读时长2分钟。
来源/科创板日报
责编/爱力方
财联社4月15日电,美国哈佛医学院的一个研究团队评估了20几种最先进的AI大型语言模型(LLM)的诊断能力,其中包括ChatGPT、DeepSeek、Gemini和Claude。结果显示,基于患者的初步症状和体征进行“鉴别诊断”(识别可能的疾病)的错误率高达80%。这项研究进一步显示,在患者提供更多检测结果后,大模型可以将“最终诊断”的失败率降至40%左右。研究人员表示,这意味着AI聊天机器人需要通过充分的患者信息,才能对疾病作出更为精准的诊断,患者无法提供完整的健康检测信息时,AI提供的结果并不可靠。研究人员还强调:“人工智能尚未达到无需医疗专业人员干预即可为患者做出诊断决策的水平。”
来源:哈佛最新研究:用AI大型语言模型看病 80%的初步诊断都是错的 | 科创板日报
声明:本文来自科创板日报,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。