Apple 研究揭示了人工智能语言模型的重大缺陷:准确率最高下降 65
最近Apple 的一些研究人员最近进行的一项研究颠覆了我们对 ChatGPT 等大型语言模型(LLM)智能的看法。这项由伊曼-米尔扎德(Iman Mirzadeh)领导的研究使用了一种名为 GSM-Symbolic 的新测试,以了解这些人工智能系统处理数学和逻辑思维的能力。
他们发现,人工智能的表现并不理想。当他们在问题中随机加入额外信息时,模型的准确率大幅下降--在某些情况下,降幅高达 65%。主问题甚至都没有改变。这表明,这些人工智能系统对其任务缺乏真正的理解。
这项研究指出了看起来聪明和理解东西之间的本质区别。许多人工智能生成的答案乍一看似乎是对的,但当你深入研究时,它们就会分崩离析。这突出表明,像人一样说话并不意味着机器像人一样思考。
正因为如此,这项研究表明,我们需要重新思考对这些系统的信任和依赖程度。当然,它们可以做一些不可思议的事情,但它们也有一些明显的缺陷,尤其是在处理棘手或复杂的问题时。如果我们想负责任地使用人工智能,认识到这些弱点是关键。
归根结底,这项研究提醒我们,虽然人工智能可以有所帮助,但我们必须对它能做什么和不能做什么保持批判性的眼光。随着这些工具在我们的生活中占据越来越重要的地位,如果我们想明智而负责任地使用它们,了解它们的局限性将是至关重要的。
资料来源
» Notebookcheck多媒体笔记本电脑Top 10排名
» Notebookcheck游戏笔记本电脑Top 10排名
» Notebookcheck低价办公/商务笔记本电脑Top 10排名
» Notebookcheck高端办公/商务笔记本电脑Top 10排名
» Notebookcheck工作站笔记本电脑Top 10排名
» Notebookcheck亚笔记本电脑Top 10排名
» Notebookcheck超级本产品Top 10排名
» Notebookcheck变形本产品Top 10排名
» Notebookcheck平板电脑Top 10排名
» Notebookcheck智能手机Top 10排名
» Notebookcheck评测过最出色的笔记本电脑屏幕
» Notebookcheck售价500欧元以下笔记本电脑Top 10排名
» Notebookcheck售价300欧元以下笔记本电脑Top 10排名