大模型推理无损加速6.5倍!EAGLE-3碾压一切、延续Scaling Law能力
自回归解码已然成为大语言模型的推理标准。大语言模型每次前向计算需要访问它全部的参数,但只能得到一个 token,导致其生成昂贵且缓慢。近日,EAGLE 团队的新作《EAGLE-3: Scaling up Inference Acceleration of Large Language Models via Training-Time Test》通过一 ......
阿里云刘伟光:新一代大模型锁定两大技术演进方向
AI时代,伴随大模型极速迭代,推理效率突破,工具链生态愈发繁荣,一切都在以前所未有的速度进化。4月9日,在2025阿里云AI势能大会上,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示,2025年AI应用爆发没有最快,只有更快,应该推动基础模型、推理服务、开发工 ......
科学家实现大模型动态选取推理,优于静态推理技术等方法
近年来,增强大模型的推理能力引起了广泛关注,比如近期OpenAI 的 o1 作为一个推理增强的大模型就引起了 AI 社区的广泛关注。美国乔治梅森大学岳牧荣博士和所在团队注意到,先前很多研究已经证明了各种提示策略在帮助大模型进行推理方面的有效性,例如让大模型逐步思考 ......
OpenAI 最新研究:当前 AI 模型仍无法媲美人类程序员
IT之家 2 月 24 日消息,尽管 OpenAI 首席执行官萨姆·奥尔特曼(Sam Altman)坚称,到今年年底,人工智能模型将能够超越“低级别”软件工程师,但该公司研究人员的最新研究却表明,即使是目前最先进的 AI 模型,仍无法与人类程序员相媲美。研究人员在一篇新论文中指出 ......
OpenAI推出下一代通用大型语言模型GPT-4.5
OpenAI周四公布了通用大型语言模型GPT-4.5的研究预览版。它最初将对软件开发人员和ChatGPT Pro订阅用户开放。OpenAI在一篇博客文章中表示,该模型呈现不准确信息的频率低于之前的模型。“早期测试表明,与GPT4.5互动感觉更自然。它更广泛的知识基础、更强的遵循用户意图 ......
杨立昆:大语言模型发展接近瓶颈,仅靠文本训练无法实现人类级AI
IT之家 3 月 23 日消息,图灵奖得主、Meta 首席 AI 科学家杨立昆(Yann LeCun)做客 20 日播出的“Big Technology Podcast”科技播客节目,谈到了当前生成式 AI 为何难以做出科学发现以及未来 AI 如何发展等话题。他表示,大语言模型等现有 AI 技术本质上是基于文本训练 ......
数字比你想得更复杂——一文带你了解大模型数字处理能力的方方面面
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyun ......
LeCun最新访谈:距离AGI可能不到10年,下一代AI需要情感和视觉训练
奇月 发自 凹非寺量子位 | 公众号 QbitAI语言模型的发展已很难有大的突破了。这是LeCun最新访谈中给出的断言。头戴Meta爆火智能眼镜,LeCun再次表示人类距离AGI的时间没有那么近,“大约在5-10年”,对语言模型发展的判断更是不乐观。未来在哪?还是得看世界模型。未来A ......
金璐瑶:AI模型已从单线程发展为多线程,这改变了人类和AI的交互过程|Alpha峰会
12月21日,阿里巴巴通义实验室产品负责人金璐瑶做客由华尔街见闻和中欧国际工商学院联合主办的「Alpha峰会」,就AI应用演进和背后的助推力做出分析、展望。以下为演讲精彩观点:上一代AI模型中,大语言模型是一个基座,生成图像、增强搜索都是插件,应用在大模型之上, ......
2025生成式AI平台交互体验观察(大语言模型篇)
过去一年,大模型产品百花齐放,都开始卷价格和应用,对用户来说当然是好事。但就实际上手来说,这些产品的表现怎么样?这篇文章,我们来看看作者的分析。The world is changing,it’s time we change too.2024年是AI应用元年,从2023年ChatGpt爆火到国内百模大战,到现 ......
AI爆火两年,技术飞快跑,大模型突破商业化困局了吗?
自从 ChatGPT 横空出世,AI 的热潮已经席卷了两年。这两年,普通人对大语言模型的能力兴奋,随便一条指令就能生成流畅自然的文本,科幻电影里的场景,如今早已经成为现实。大模型这个赛道也开始进入到一个十字路口,新技术如何转化为新产品,满足真需求,发展成新的商业 ......
研究揭示 AI 对话方面的缺陷:不知道何时该插话
划重点01图夫茨大学的研究人员发现大型语言模型在对话中的插话表现不佳,限制了它们的对话能力。02研究表明,对话中轮流发言最重要的线索是语言内容本身,而停顿和其他线索并不那么重要。03由于大型语言模型的训练数据主要基于互联网上的大量书面内容,缺少大量转录的口 ......
- 1
- 2