新智元报道编辑:LRST【新智元导读】多模态大模型在听觉上,居然也出现了「9.11>9.8」的现象,音量大小这种简单问题都识别不了!港中文、斯坦福等大学联合发布的AV-Odyssey基准测试,包含26个视听任务,覆盖了7种声音属性,跨越了10个不同领域,确保测试的深度和广度 ......

新智元报道编辑:KingHZ 泽正【新智元导读】本月,OpenAI科学家就当前LLM的scaling方法论能否实现AGI话题展开深入辩论,认为将来AI至少与人类平分秋色;LLM scaling目前的问题可以通过后训练、强化学习、合成数据、智能体协作等方法得到解决;按现在的趋势估计,明年LLM ......

新智元报道编辑:KingHZ 泽正【新智元导读】在与专用国际象棋引擎Stockfish测试中,只因提示词中包含能力「强大」等形容词,o1-preview入侵测试环境,直接修改比赛数据,靠「作弊」拿下胜利。这种现象,表明AI安全任重道远。OpenAI的推理模型o1-preview最近展示了它不按 ......

新智元报道编辑:泽正【新智元导读】Artificial Analysis回顾今年人工智能的重大事件,梳理出了一份关于人工智能领域的年终总结。临近年末,在人们都开始着手于年终总结的时候,Artificial Analysis也给出了关于2024年AI变革式发展的回顾。令人欣喜的是,我国的Qwen2.5 ......

新智元报道编辑:KingHZ 英智【新智元导读】2025年,AI智能体将如何进一步改变个人、商业和数字生活?来自科技和商业领域的专家分享了他们的洞察。随着AI智能体的快速发展,越来越多的工作将被AI取代,就业市场面临颠覆性转变,人类工作即将面临AI挑战。2024年,AI在技 ......

划重点01State of AI发布了2024产业报告,预测人形机器人热度将下降,英伟达维持霸主地位。02报告指出,前沿实验室性能趋同,专有模型优势逐渐消失,GPT-4与其他模型差距缩小。03由于上市公司经历人工智能曝光的牛市,人工智能公司企业价值达到9万亿美元,私营投资也有 ......

新智元报道编辑:LRS【新智元导读】2024年,企业对AI的投资激增至138亿美元,显示了行业从实验到实际应用的转变,AI技术正逐渐渗透到各行业核心,推动效率和创新。同时,企业在AI应用上趋向于采用多模型策略,且越来越重视自主智能体技术。2024即将结束,今年依然是AI发 ......

新智元报道编辑:静音【新智元导读】一家总部位于美国加州的初创公司Tilde,正在构建解释器模型,解读模型的推理过程,并通过引导采样动态调整生成策略,提升大语言模型的推理能力和生成精度。相比直接优化提示的提示工程,这一方法展现出更灵活高效的潜力,有望重塑AI ......

新智元报道编辑:KingHZ 好困【新智元导读】Sakana AI发布了Transformer新方法,通过奇异值微调和权重自适应策略,提高了LLM的泛化和自适应能力。新方法在文本任务上优于LoRA;即便是从未见过的任务,比如MATH、HumanEval和ARC-Challenge等,性能也都取得了提升。从章鱼 ......

新智元报道编辑:英智【新智元导读】在科技飞速发展的当下,AI如汹涌浪潮席卷而来。从认知过载到焦虑情绪,AI催生了一种新型的「疲劳症」。当今时代,AI无处不在,频繁亮相于新闻头条、深度嵌入工作流程,还悄然融入日常生活。这场看似炫酷的科技狂欢,却让不少人开始感 ......

新智元报道编辑:peter东 乔杨【新智元导读】智能体究竟能否应对现实世界的复杂性?The Agent Company近日提出了一项评估基准,让多个智能体尝试自主运营一个软件公司。结果表明,即使是当前最先进的智能体,也无法自主完成大多数任务。如今,基于大模型的智能体,已经 ......

社交账号快速登录

微信扫一扫关注
如已关注,请回复“登录”二字获取验证码