IT之家 9 月 25 日消息,来自亚利桑那州立大学的科研团队利用 PlanBench 基准,测试了 OpenAI o1 模型的规划能力。 研究结果表明 o1 模型取得了长足的进步,但 仍然存在很大的局限性。 PlanBench 基准简介PlanBench 开发于 2022 年,用于评估人工智能系统的...

社交账号快速登录

微信扫一扫关注
如已关注,请回复“登录”二字获取验证码