划重点01腾讯开源了两款大模型:混元Large和混元3D生成大模型Hunyuan3D-1.0,支持企业及开发者精调、部署等不同场景的使用需求。02混元Large模型总参数量389B,激活参数量52B,上下文长度高达256K,在多维度评测中全面领先。03除此之外,混元3D-1.0模型是业界首个同时支 ......

划重点01加拿大女王大学研究团队提出AI基础模型评审团方法,旨在提升AI研究效率。02该团队收集了来自17家顶尖科技公司的上千篇行业博客文章,创新性地使用基础模型进行自动分类和标注。03通过分析这些博客,研究团队发现基础模型对软件工程的赋能以及软件工程原则如何应 ......

划重点01科技媒体The Information报道,OpenAI的下一个旗舰模型“Orion”已完成20%的训练,表现接近现有的GPT-4,但进步幅度不如前两代旗舰模型。02Orion在语言任务上表现更好,但在编码等任务上可能不会优于以前的模型。03由于高质量训练数据的减少以及计算成本的增加 ......

划重点01近期,大模型应用广告投放费用不断攀升,其中kimi智能助手、字节跳动豆包、腾讯元宝等AI应用10月全网广告投放支出超过3亿元人民币。02然而,这些大模型应用在应用体验层面难以做出颠覆性创新,竞争激烈。03文小言、讯飞星火和腾讯元宝等大模型应用在月活、功能 ......

西风 发自 凹非寺量子位 | 公众号 QbitAI4-bit量化,能让现有反学习/机器遗忘技术失灵!也就是大模型在人类要求下“假装”忘记了特定知识(版权、私人内容等),但有手段能让它重新“回忆”起来。最近,来自宾夕法尼亚州立大学、哈佛大学、亚马逊团队的一项新研究在redd ......

以生成式AI为代表的新技术浪潮日新月异,正带来一场深刻的技术、商业与社会变革,推动人类社会从信息社会向智能社会转变。全世界热切期待AI到来的同时,也非常关心人工智能将带来哪些新机遇、新挑战。为此,我们发起了一项《AI&Society 百人百问》研讨,广泛邀请AI技术 ......

ChatGPT的出现注定是科技圈的里程碑事件。2022年11月30日,OpenAI正式发布聊天机器人ChatGPT,人们第一次发现,人工智能的对话近似人类了。在这背后,通过大规模预训练和自监督学习技术构建的深度学习模型,提高了计算机对自然语言的理解和生成能力。从2022年底到2024年 ......

作者 | 邓咏仪编辑 | 苏建勋“讲卡伤感情,没卡没感情。”2024年的IDEA大会上,IDEA创院理事长、美国国家工程院外籍院士沈向洋,抛出了一句格外现实又幽默的话。另一方面,这也展现了他对未来AI时代一种鲜明的乐观情绪。大模型的发展已经不如ChatGPT发布后那样,经历陡 ......

近期,北京航空航天大学、AI 初创公司零一万物、清华大学等团队合作,提出了一种 PopAlign 框架。它集成了六种对比响应的引导生成策略,全面覆盖了在响应生成过程中可能出现的各种对比先验。这些对比策略分别包括前缀对比、示例对比、引导对比、参数数量对比、排行榜对 ......

图片系AI生成当前,大模型最显著的特征之一就是参数量呈指数级增长。根据Scaling Law(尺度定律)的规则,人工智能神经网络的参数量越多,模型越大,对于知识的总结归纳和推理泛化能力就越强。因而,从ChatGPT出现验证了“涌现”能力,到如今的两年里,业内首要关注的就 ......

一贯坚持开源的 Meta 也会被业内人士狂喷。开放源代码促进会负责人 Stefano Maffulli 就曾公开斥责 Meta,称用“open”描述Llama模型,是在混淆用户和污染“open”。在大众的认知中,“open”通常意味着透明、共享和合作,尤其是在开源软件领域。然而,在人工智能(AI) ......

尽管大语言模型已经在许多任务中表现出色,但它们在超出训练集分布泛化方面的能力仍然未被充分理解。例如,在自然语言处理中,大语言模型在某些泛化任务中的确表现优异,但在其他任务中可能会产生事实性错误或误导性信息。近日,上海人工智能实验室徐兴成研究员与包括上 ......

社交账号快速登录

微信扫一扫关注
如已关注,请回复“登录”二字获取验证码