模型 - AI创意社|学院

腾讯混元开源两大新模型：3890 亿参数最大 MoE，3D 大模型生成资产仅需 10 秒

划重点01腾讯开源了两款大模型：混元Large和混元3D生成大模型Hunyuan3D-1.0，支持企业及开发者精调、部署等不同场景的使用需求。02混元Large模型总参数量389B，激活参数量52B，上下文长度高达256K，在多维度评测中全面领先。03除此之外，混元3D-1.0模型是业界首个同时支 ......

AI视界

女王大学李豪模型

女王大学团队提出AI基础模型评审团方法，有望大幅提升AI研究效率

划重点01加拿大女王大学研究团队提出AI基础模型评审团方法，旨在提升AI研究效率。02该团队收集了来自17家顶尖科技公司的上千篇行业博客文章，创新性地使用基础模型进行自动分类和标注。03通过分析这些博客，研究团队发现基础模型对软件工程的赋能以及软件工程原则如何应 ......

AI视界

OpenAI orion 模型

媒体爆料：发现新一代大模型”没有那么大飞跃“，OpenAI已经改变策略

划重点01科技媒体The Information报道，OpenAI的下一个旗舰模型“Orion”已完成20%的训练，表现接近现有的GPT-4，但进步幅度不如前两代旗舰模型。02Orion在语言任务上表现更好，但在编码等任务上可能不会优于以前的模型。03由于高质量训练数据的减少以及计算成本的增加 ......

AI视界

kimi 字节跳动模型

疯狂卷投流的大模型应用们，到底哪款最好用？

划重点01近期，大模型应用广告投放费用不断攀升，其中kimi智能助手、字节跳动豆包、腾讯元宝等AI应用10月全网广告投放支出超过3亿元人民币。02然而，这些大模型应用在应用体验层面难以做出颠覆性创新，竞争激烈。03文小言、讯飞星火和腾讯元宝等大模型应用在月活、功能 ......

AI视界

模型著作权记忆

量化能让大模型“恢复记忆”，删掉的隐私版权内容全回来了

西风发自凹非寺量子位 | 公众号 QbitAI4-bit量化，能让现有反学习/机器遗忘技术失灵！也就是大模型在人类要求下“假装”忘记了特定知识（版权、私人内容等），但有手段能让它重新“回忆”起来。最近，来自宾夕法尼亚州立大学、哈佛大学、亚马逊团队的一项新研究在redd ......

AI视界

刘嘉教授模型

清华刘嘉教授：大模型是一个生命新物种｜AI&Society百人百问

以生成式AI为代表的新技术浪潮日新月异，正带来一场深刻的技术、商业与社会变革，推动人类社会从信息社会向智能社会转变。全世界热切期待AI到来的同时，也非常关心人工智能将带来哪些新机遇、新挑战。为此，我们发起了一项《AI&Society 百人百问》研讨，广泛邀请AI技术 ......

AI视界

GPT OpenAI 中国追赶openai

中国追赶OpenAI这波新浪潮还有多远？

ChatGPT的出现注定是科技圈的里程碑事件。2022年11月30日，OpenAI正式发布聊天机器人ChatGPT，人们第一次发现，人工智能的对话近似人类了。在这背后，通过大规模预训练和自监督学习技术构建的深度学习模型，提高了计算机对自然语言的理解和生成能力。从2022年底到2024年 ......

AI视界

idea 模型沈向洋

沈向洋，发了一个可以识别万物的大模型

作者 | 邓咏仪编辑 | 苏建勋“讲卡伤感情，没卡没感情。”2024年的IDEA大会上，IDEA创院理事长、美国国家工程院外籍院士沈向洋，抛出了一句格外现实又幽默的话。另一方面，这也展现了他对未来AI时代一种鲜明的乐观情绪。大模型的发展已经不如ChatGPT发布后那样，经历陡 ......

AI视界

align 北京航空航天大学北航

北航团队提出全新偏好数据构建框架，助力大模型实现更全面的对齐效果

近期，北京航空航天大学、AI 初创公司零一万物、清华大学等团队合作，提出了一种 PopAlign 框架。它集成了六种对比响应的引导生成策略，全面覆盖了在响应生成过程中可能出现的各种对比先验。这些对比策略分别包括前缀对比、示例对比、引导对比、参数数量对比、排行榜对 ......

AI视界

万卡存储模型

万卡算力和万亿参数大模型时代，AI存储何时爆发？| ToB产业观察

图片系AI生成当前，大模型最显著的特征之一就是参数量呈指数级增长。根据Scaling Law（尺度定律）的规则，人工智能神经网络的参数量越多，模型越大，对于知识的总结归纳和推理泛化能力就越强。因而，从ChatGPT出现验证了“涌现”能力，到如今的两年里，业内首要关注的就 ......

AI视界

ai系统 nature open

Nature刊文：“open”AI的实际作用非常有限

一贯坚持开源的 Meta 也会被业内人士狂喷。开放源代码促进会负责人 Stefano Maffulli 就曾公开斥责 Meta，称用“open”描述Llama模型，是在混淆用户和污染“open”。在大众的认知中，“open”通常意味着透明、共享和合作，尤其是在开源软件领域。然而，在人工智能（AI） ......

AI视界

张海鹏徐兴成模型

研究人员阐明语言模型在不同算术场景中的泛化机制，可指导大模型训练优化

尽管大语言模型已经在许多任务中表现出色，但它们在超出训练集分布泛化方面的能力仍然未被充分理解。例如，在自然语言处理中，大语言模型在某些泛化任务中的确表现优异，但在其他任务中可能会产生事实性错误或误导性信息。近日，上海人工智能实验室徐兴成研究员与包括上 ......

模型

返回顶部

社交账号快速登录

社交账号快速登录

社交账号快速登录