论文地址:https://cdn.openai.com/papers/22265bac-3191-44e5-b057-7aaacd8e90cd/paperbench.pdf开源地址:https://github.com/openai/preparednessPaperBench 是一个由 OpenAI 开发的基准测试,旨在评估 AI Agent 复现尖端 AI 研究的能 力。它专注于测试 AI 是否能理 ......

社交账号快速登录

微信扫一扫关注
如已关注,请回复“登录”二字获取验证码