解释器模型首创!Tilde打破提示工程局限,让AI推理更精准
新智元报道编辑:静音【新智元导读】一家总部位于美国加州的初创公司Tilde,正在构建解释器模型,解读模型的推理过程,并通过引导采样动态调整生成策略,提升大语言模型的推理能力和生成精度。相比直接优化提示的提示工程,这一方法展现出更灵活高效的潜力,有望重塑AI ......
打开AI黑箱:DeepMind开发的新工具可揭示大模型内部秘密
来源:MIT Technology Review人工智能已经在药物研发和机器人技术领域取得了突破,同时正在彻底改变我们与机器和网络的互动方式。然而,唯一的问题是我们并不完全知道它是如何运作的,也不清楚它为何如此有效。虽然我们对其有一定的了解,但细节过于复杂,难以理清。这 ......
腾讯混元视频生成大模型对外开放,并全面开源
12月3日,腾讯混元大模型正式上线视频生成能力,这是继文生文、文生图、3D生成之后的又一新举措。腾讯开源该视频生成大模型,参数量130亿,是当前最大的视频开源模型。用户只需要输入一段描述,即可生成视频,生成视频支持中英文双语输入、多种视频尺寸以及多种视频清晰 ......
AI大模型即将陷入数据荒?专家:对空间数据、视频数据的学习利用才刚开始
近年来依托大模型驱动的人工智能(AI)已经渗入现代社会的方方面面,但它的高速发展离不开海量数据的支持,以至于业内将数据形容为推动AI发展的“燃料”和“矿产”。但美国人工智能巨头OpenAI公司联合创始人兼前首席科学家伊利亚苏茨克维尔近日公开警告“AI的训练数据如 ......
2024 大模型年度五问:等不来GPT 5怎么过?
这一年,AI领域经历了翻天覆地的变化,从大模型的分化发展到视频生成技术的突破,再到AI编程和智能助手的兴起,每一项进步都在推动着我们向更智能的未来迈进。在这篇文章中,我们将回顾2024年AI行业的五大核心问题,这些问题不仅定义了今年的技术趋势,也为2025年的发展 ......
冷眼与嘲讽之后,谷歌的AI大模型翻盘之路
“我认为2025年将至关重要。我认为我们必须意识到这一刻的紧迫性,并需要作为一家公司加快步伐。风险很高。这些都是颠覆性的时刻。在2025年,我们需要坚持不懈地专注于释放这项技术的优势并解决真正的用户问题。”12月18日举行的2025年战略会议上,谷歌首席执行官桑达尔 ......
大模型的2024,这可能是最早的一篇年度总结文
从某种意义上说,2024年不仅是技术突破的一年,更是行业走向成熟的重要转折点。这一年,GPT-4级别的模型不再罕见,许多机构都开发出了性能超越GPT-4的模型;这一年,运行效率显著提高,成本急剧下降;这一年,多模态LLM,特别是支持图像、音频和视频处理的模型,变得越 ......
Transformer作者初创重磅发布Transformer²!AI模型活了,动态调整自己权重
新智元报道编辑:KingHZ 好困【新智元导读】Sakana AI发布了Transformer新方法,通过奇异值微调和权重自适应策略,提高了LLM的泛化和自适应能力。新方法在文本任务上优于LoRA;即便是从未见过的任务,比如MATH、HumanEval和ARC-Challenge等,性能也都取得了提升。从章鱼 ......
三问“AI 2025”,五款大模型这样说
当前,以大模型为代表的AI技术正在快速融入我们生活中的每一个角落。2025年,AI技术发展将呈现哪些核心趋势?产业发展呈现怎样的特点?你最看好哪家中国AI企业?中国电子报记者向目前市面上的五款主流AI大模型应用提出了三个问题,让我们一起从大模型视角看看2025年AI发 ......
北京智源发布2025年AI十大趋势:世界模型有望成多模态大模型下一步
1月8日,北京智源人工智能研究院发布2025人工智能十大技术趋势。该预测认为,基于Scaling Law(尺度定律)推动基础模型性能提升的训练模式“性价比”持续下降,后训练与特定场景的Scaling law不断被探索。构建原生多模态大模型成为多模态大模型进化的重要方向,世界模型 ......
面壁智能发布多模态大模型MiniCPM-o 2.6,让AI一直“睁着眼”
AI未来指北特约作者 郝博阳编辑 郑可君在科幻电影《Her》中,主角Theodore爱上了一个能看能听、富有同理心的AI助手Samantha。这个故事上映时看似遥不可及,但在过去的十年里,AI领域的进展让这个未来逐渐清晰。2024年5月,OpenAI的GPT-4o让我们看到了一个能实现类似Sama ......
DeepSeek模型引爆AI应用热潮 智云健康股价飙升近15%
财联社2月6日讯(编辑胡家荣)近期DeepSeek热度居高不下,这引发相关个股的走强。比如智云健康(09955.HK)在昨日发布公告称,DeepSeek-R1模型接入其医疗人工智能系统"智云大脑"。值得注意的是,智云健康此次技术迭代涉及大数据分析架构重构。公司研发团队透露,DeepSee ......