OpenAI发布具有推理能力的人工智能模型o1
每经AI快讯,当地时间9月12日,OpenAI在官网发布公告称,开始向全体订阅用户开始推送OpenAI o1预览模型也就是此前被广泛期待的草莓大模型。OpenAI表示,对于复杂推理任务而言,新模型代表着人工智能能力的崭新水平,因此值得将计数重置为1,给它一个有别于GP...
OpenAI o1 模型 PlanBench 规划能力实测:准确率 97.8%
IT之家 9 月 25 日消息,来自亚利桑那州立大学的科研团队利用 PlanBench 基准,测试了 OpenAI o1 模型的规划能力。 研究结果表明 o1 模型取得了长足的进步,但 仍然存在很大的局限性。 PlanBench 基准简介PlanBench 开发于 2022 年,用于评估人工智能系统的...
苹果研究人员质疑 AI 的推理能力:简单数学问题稍作改动就会答错
IT之家 10 月 12 日消息,近年来,人工智能(AI)在各个领域取得了显著的进展,其中大型语言模型(LLM)能够生成人类水平的文本,甚至在某些任务上超越人类的表现。然而,研究人员对 LLM 的推理能力提出了质疑,他们发现这些模型在解决简单的数学问题时, 只...