Notebookcheck Logo

Apple 研究揭示了人工智能语言模型的重大缺陷:准确率最高下降 65

Apple 研究揭示了人工智能语言模型的局限性(图片来源:DALL-E 3)
Apple 研究揭示了人工智能语言模型的局限性(图片来源:DALL-E 3)
Apple 的一项新研究揭示了 ChatGPT 等大型语言模型的一个重大缺陷:在面对无关信息时,它们的准确性会急剧下降。这引发了人们对人工智能真正理解能力的质疑,以及在依赖这些系统完成复杂任务时需要谨慎的问题。
AI Apple

最近Apple 的一些研究人员最近进行的一项研究颠覆了我们对 ChatGPT 等大型语言模型(LLM)智能的看法。这项由伊曼-米尔扎德(Iman Mirzadeh)领导的研究使用了一种名为 GSM-Symbolic 的新测试,以了解这些人工智能系统处理数学和逻辑思维的能力。

他们发现,人工智能的表现并不理想。当他们在问题中随机加入额外信息时,模型的准确率大幅下降--在某些情况下,降幅高达 65%。主问题甚至都没有改变。这表明,这些人工智能系统对其任务缺乏真正的理解。

这项研究指出了看起来聪明和理解东西之间的本质区别。许多人工智能生成的答案乍一看似乎是对的,但当你深入研究时,它们就会分崩离析。这突出表明,像人一样说话并不意味着机器像人一样思考。

正因为如此,这项研究表明,我们需要重新思考对这些系统的信任和依赖程度。当然,它们可以做一些不可思议的事情,但它们也有一些明显的缺陷,尤其是在处理棘手或复杂的问题时。如果我们想负责任地使用人工智能,认识到这些弱点是关键。

归根结底,这项研究提醒我们,虽然人工智能可以有所帮助,但我们必须对它能做什么和不能做什么保持批判性的眼光。随着这些工具在我们的生活中占据越来越重要的地位,如果我们想明智而负责任地使用它们,了解它们的局限性将是至关重要的。

资料来源

WinFuture德语

Please share our article, every link counts!
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2024 10 > Apple 研究揭示了人工智能语言模型的重大缺陷:准确率最高下降 65
Nathan Ali, 2024-10-20 (Update: 2024-10-20)