Ai设计师学院
让AI赋能设计,让创意更高效
共 19 篇文章

标签:语言模型

EAGLE-3实现大模型推理6.5倍无损加速,持续突破Scaling Law性能-Ai设计师学院

EAGLE-3实现大模型推理6.5倍无损加速,持续突破Scaling Law性能

自回归解码已然成为大语言模型的推理标准。大语言模型每次前向计算需要访问它全部的参数,但只能得到一个 token,导致其生成昂贵且缓慢。近日,EAGLE 团队的新作《EAGLE-3: Scaling up Inference Acceleration of Large Language Models via Training-Time Test》通过一 ......

阿里云刘伟光:新一代大模型聚焦两大技术升级方向-Ai设计师学院

阿里云刘伟光:新一代大模型聚焦两大技术升级方向

AI时代,伴随大模型极速迭代,推理效率突破,工具链生态愈发繁荣,一切都在以前所未有的速度进化。4月9日,在2025阿里云AI势能大会上,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示,2025年AI应用爆发没有最快,只有更快,应该推动基础模型、推理服务、开发工 ......

科学家成功攻克大模型动态推理选取难题,表现超越静态推理技术-Ai设计师学院

科学家成功攻克大模型动态推理选取难题,表现超越静态推理技术

近年来,增强大模型的推理能力引起了广泛关注,比如近期OpenAI 的 o1 作为一个推理增强的大模型就引起了 AI 社区的广泛关注。美国乔治梅森大学岳牧荣博士和所在团队注意到,先前很多研究已经证明了各种提示策略在帮助大模型进行推理方面的有效性,例如让大模型逐步思考 ......

OpenAI新成果:现阶段AI模型,尚难比肩人类程序员-Ai设计师学院

OpenAI新成果:现阶段AI模型,尚难比肩人类程序员

IT之家 2 月 24 日消息,尽管 OpenAI 首席执行官萨姆·奥尔特曼(Sam Altman)坚称,到今年年底,人工智能模型将能够超越“低级别”软件工程师,但该公司研究人员的最新研究却表明,即使是目前最先进的 AI 模型,仍无法与人类程序员相媲美。研究人员在一篇新论文中指出 ......

OpenAI正式发布新一代通用大语言模型GPT-4.5

OpenAI周四公布了通用大型语言模型GPT-4.5的研究预览版。它最初将对软件开发人员和ChatGPT Pro订阅用户开放。OpenAI在一篇博客文章中表示,该模型呈现不准确信息的频率低于之前的模型。“早期测试表明,与GPT4.5互动感觉更自然。它更广泛的知识基础、更强的遵循用户意图 ......

数字远比想象复杂——全面解析大模型的数字处理能力-Ai设计师学院

数字远比想象复杂——全面解析大模型的数字处理能力

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyun ......

金璐瑶:AI模型迈向多线程,重塑人类与智能交互|Alpha峰会-Ai设计师学院

金璐瑶:AI模型迈向多线程,重塑人类与智能交互|Alpha峰会

12月21日,阿里巴巴通义实验室产品负责人金璐瑶做客由华尔街见闻和中欧国际工商学院联合主办的「Alpha峰会」,就AI应用演进和背后的助推力做出分析、展望。以下为演讲精彩观点:上一代AI模型中,大语言模型是一个基座,生成图像、增强搜索都是插件,应用在大模型之上, ......

2025年生成式AI平台交互体验深度解析(大语言模型专题)-Ai设计师学院

2025年生成式AI平台交互体验深度解析(大语言模型专题)

过去一年,大模型产品百花齐放,都开始卷价格和应用,对用户来说当然是好事。但就实际上手来说,这些产品的表现怎么样?这篇文章,我们来看看作者的分析。The world is changing,it’s time we change too.2024年是AI应用元年,从2023年ChatGpt爆火到国内百模大战,到现 ......

AI热潮两年:大模型技术能否破解商业化难题?-Ai设计师学院

AI热潮两年:大模型技术能否破解商业化难题?

自从 ChatGPT 横空出世,AI 的热潮已经席卷了两年。这两年,普通人对大语言模型的能力兴奋,随便一条指令就能生成流畅自然的文本,科幻电影里的场景,如今早已经成为现实。大模型这个赛道也开始进入到一个十字路口,新技术如何转化为新产品,满足真需求,发展成新的商业 ......

研究发现 AI 对话中的关键短板:难以把握插话时机-Ai设计师学院

研究发现 AI 对话中的关键短板:难以把握插话时机

划重点01图夫茨大学的研究人员发现大型语言模型在对话中的插话表现不佳,限制了它们的对话能力。02研究表明,对话中轮流发言最重要的线索是语言内容本身,而停顿和其他线索并不那么重要。03由于大型语言模型的训练数据主要基于互联网上的大量书面内容,缺少大量转录的口 ......

BIM World, A Professional BIM Learning Platform

Stay updated on the latest architecture trends and share new building technologies.

联系我们关于我们

账号登录

注册登录代表您已同意《用户许可协议》

注册