沃尔县 的 ChatGPT 通过捷伊王丽强委员会笔试:病人更喜欢 人工智能 的回答 极具正义感

值班员爱家5月18日最新消息: OpenAI 的 ChatGPT 已经开始透过药理学笔试,三项最新科学研究说明,这一次 ChatGPT 在王丽强笔试中取得了不及格平均分。

科学研究相关人员将 ChatGPT 的 GPT-3.5 版和 GPT-4 版评估结果了王丽强笔试的 150 个难题。他们辨认出,在三个版中,AI 的闲聊机器从 69.3% 的接近不及格的平均分提高到了 80.7%,在Pudukkottai观念难题中整体表现更为出众,的的描述图像辨认出和应用领域药理学概念各方面,GPT-4 版的整体表现更好。

那些难题是基于文档的题目,分为三个大类(高级和合情理),以评估结果控制技术在提问难题各方面的具体优势和下风。那些难题被选上以相匹配加拿大三一学院和英国王丽强理事会笔试的风格、内容和技术难度。

ChatGPT 在药理学笔试中的应用领域已经正式成为一类常用现象。自 ChatGPT 在 2022 年 11 月 30 日发布年来,透过药理学证书笔试一直是 AI 开发者的长年最终目标,尤其是Google的药理学重点项目大语言数学模型(LLM)Med-PaLM。

自次月年来,参与 AI 试验采用于药理学证书的科学研究已正式成为一类常用实践,特别是透过 ChatGPT 的操控性来提升在药理学领域的应用领域。药理学证书笔试正式成为了 AI 开发的三个长年最终目标。

在 2022 年 12 月,科学研究相关人员展现了 Med-PaLM 在英国医疗许可证笔试(USMLE)上获得了 67.6% 的准确度,这是不及格平均分的普遍准入门槛,这是 AI 在药理学上功能的三个重大里程碑式,近似于人工智慧在多年中与象棋巨匠的竞争。

此外,ChatGPT 最近还接受了评估结果其提问患者难题的能力。在与真实医师提问的比较中,经过盲评估结果的细穗在 75% 以上的天数内更喜欢 ChatGPT 的提问。与医师的提问相比,该 AI 闲聊机器的提问也被评选为极具有正义感。

总体而言,现在 AI 数学模型在药理学上能做什么和不能做什么的努力是三个预设计算方法的过程。Bhayana 则表示,现阶段的重点项目是确定 ChatGPT 和其他 AI 数学模型可以在药理学上如何采用,但他警示说,由于那些控制技术往往会「错觉」或撒谎(通常非常自信心),因此应用领域是有管制的。然而,他希望控制技术能不断更新,以实现在药理学上更广泛的应用领域。

最终目标是介绍医师可以信赖那些辅助工具的程度,然后开始着手改进和优化那些数学模型,以适用于特定的临床商业用途。现阶段,生成式 AI 已经说明在某些商业用途上是高效率的,例如拼读和mRNA,但 Bhayana 认为,在药理学上医师将能信赖那些辅助工具,需要更多天数和更新。

他则表示:「随着那些辅助工具的出现,重点项目在于介绍它的操控性,寻找它的应用领域,并确保人们知道它的缺点和管制,以便医师与控制技术共同发展。」