研究称GPT-4.5大模型通过图灵测试
【研究称GPT-4.5大模型通过图灵测试】《科创板日报》3日讯,美国加州大学圣地亚哥分校发布了一项研究成果,宣称首次提供了“人工智能系统能够通过标准三方图灵测试的实证证据”。研究选择了四种 AI 系统:GPT-4.5、LLaMa-3.1-405B、GPT-4o 和 ELIZA。实验设计为每轮对话 ......
OpenAI 刚刚开源了 PaperBench,用于评估 Agent 复现顶尖论文能力!
论文地址:https://cdn.openai.com/papers/22265bac-3191-44e5-b057-7aaacd8e90cd/paperbench.pdf开源地址:https://github.com/openai/preparednessPaperBench 是一个由 OpenAI 开发的基准测试,旨在评估 AI Agent 复现尖端 AI 研究的能 力。它专注于测试 AI 是否能理 ......
谷歌AI笔记应用NotebookLM新增“发现资料”功能
IT之家 4 月 3 日消息,谷歌旗下的人工智能笔记应用 NotebookLM 推出了一项令人眼前一亮的新功能 “发现资料”(Discover sources),这一功能的上线有望极大地提升学生和研究人员在资料收集方面的效率。以往,用户在使用 NotebookLM 时,需要手动添加 PDF 文件、谷歌文 ......
AI的疯狂三月:本地能力再提升,云上掀起动漫风
飞象原创(魏德龄/文)刚刚过去的三月,人工智能的功能升级可谓一个爆款接着又一个爆款,无论是面向本地部署的Gemma,还是ChatGPT在社交媒体平台上掀起的日式动漫风。假如说以前的人工智能领域还是每年春节一爆款的话,这次则是直接开启了“疯狂三月”。本地能力再提升2 ......
江小涓:AI发展方向的评判核心标准是什么
由于技术演进及其对经济社会规则的冲击很可能快于相应强监管能力的提升,仅靠政府力量难以有效行动,强监管可能一时跟不上,各种弱规则很可能是治理主力。人工智能发展与治理的关系是一个全社会关注的问题,几乎所有的学科都在研究,经济学和公共管理学科也不例外。不过 ......
OpenAI o3 模型运行成本估算从 3000 美元涨至 3 万美元
IT之家 4 月 3 日消息,上周,负责维护和管理 ARC-AGI 的 Arc Prize Foundation 对 OpenAI 的 o3 “推理”人工智能模型在 ARC-AGI 基准测试中的成本估算进行了重大修订,现在看起来 o3 的运行成本没有那么低。去年 12 月 OpenAI 推出 o3 模型时,与 ARC-AGI 的开发者合 ......
OpenAI开源,标志着AI应用时代的到来
刚刚过去的三月,大模型开源与免费之风劲吹。而OpenAI决定将发布开放权重的模型,是其中最具代表性的事件。它标志着大模型竞争的重点,将不再是模型本身技术的先进性,大模型已经商品化,没有太大的差异,只有在应用的层面,结合用户的需求、场景和体验,才可能构建出差 ......
「Apple AI」中文版正式上线:还不太好用,但确实很「苹果」
不一样的中文体验,一样的「苹果独家」。作者|张勇毅编辑|靖宇3 月 31 日,随着 iOS18.4 更新,Apple Intelligence 正式支持包括简体中文、法语、德语、意大利语、葡萄牙语(巴西)、西班牙语、日语和韩语在内的多种语言,并提供新加坡和印度版本的本地化英语。中文版 ......