AI创意社|学院
首页
绘画教程
Midjourney 案例
Midjourney 技巧
Midjourney 入门
AI视界
AI 绘画+创作
登录
注册
搜索
肖朝军
AI视界
deepseek
kimi
傅天予
大模型“注意力简史”:与两位AI研究者从DeepSeek、Kimi最新改进聊起
o1、R1 等推理模型的出现,给了长文本新课题。嘉宾丨肖朝军、傅天予整理丨程曼祺上周,DeepSeek、Kimi 都放出了新的大模型架构改进和优化成果,分别是 NSA、MoBA。二者都聚焦对大模型中 “注意力机制” 的改进。注意力机制是当前大语言模型(LLM)的核心机制。2017 年 6 ......
返回顶部
没有账号?
注册
忘记密码?
手机号登录
社交账号快速登录
已有账号?
登录
手机号登录
社交账号快速登录
获取验证码
手机不在身边?
账号登录
社交账号快速登录
微信扫一扫关注
验证登录
如已关注,请回复“登录”二字获取验证码
使用其他方式登录/注册