新智元报道编辑:LRST【新智元导读】多模态大模型在听觉上,居然也出现了「9.11>9.8」的现象,音量大小这种简单问题都识别不了!港中文、斯坦福等大学联合发布的AV-Odyssey基准测试,包含26个视听任务,覆盖了7种声音属性,跨越了10个不同领域,确保测试的深度和广度 ......

华泰证券5月16日研报指出,OpenAI发布其首个端到端多模态模型GPT-4o。本次发布的主要亮点是大幅缩短的大模型响应时延。根据公司披露,GPT-4o语音模式平均时延320毫秒,与人类在对话中的响应时间相似,而GPT-3.5及GPT-4的时延分别为2.8秒和5.4秒,这为大模型...

梦晨 西风 发自 凹非寺 量子位 | 公众号 QbitAI 今天,微软重新定义了个人电脑。 刚刚发布新一代Copilot+PC,让上市还没几天的第一批AI PC直接过时了。 在新一代PC里,打游戏时可与AI实时对话,提供吐槽陪玩或攻略指导,由GPT-4o提供支持。 任何文件或网页浏...

在Google I/O 2024开发者大会上,一款神秘智能眼镜出现,配合新一代Gemini模型后,它能够实现实时识别生活中的场景、物品,并通过AI识别、搜索、信息整合后反馈给用户,给出智能化的建议。 (图源:Google) 当然,在整场开发者大会中,Google并没有透露关于...

(图片来源:unsplash) 就在刚刚,ChatGPT再度上新。 北京时间7月19日凌晨,美国OpenAI公司推出一款新的 AI 模型GPT-4o mini,即GPT-4o的更小参数量、简化版本。 OpenAI表示,GPT-4o mini是目前功能最强大、性价比最高的小参数模型,性能逼近原版GPT-4,成...

社交账号快速登录

微信扫一扫关注
如已关注,请回复“登录”二字获取验证码