苹果研究人员质疑 AI 的推理能力:简单数学问题稍作改动就会答错
IT之家 10 月 12 日消息,近年来,人工智能(AI)在各个领域取得了显著的进展,其中大型语言模型(LLM)能够生成人类水平的文本,甚至在某些任务上超越人类的表现。然而,研究人员对 LLM 的推理能力提出了质疑,他们发现这些模型在解决简单的数学问题时, 只...
研究人员提出AI评估框架,能衡量视频生成模型在具身智能中的表现
具身智能任务是当前 AI 领域的重要研究方向之一,涉及机器人、自动驾驶等需要与真实世界交互的技术。 视频生成模型的快速发展使得它们在这些任务中发挥着关键作用,但传统评估手段更多侧重于生成视频的视觉质量,而忽略了视频在实际应用场景中的可操作性和物...