标签：odyssey

GPT-4o再现明显短板，港中文等发布视觉听觉基准AV-Odyssey，揭示大模型26项关键挑战

新智元报道编辑：LRST【新智元导读】多模态大模型在听觉上，居然也出现了「9.11>9.8」的现象，音量大小这种简单问题都识别不了！港中文、斯坦福等大学联合发布的AV-Odyssey基准测试，包含26个视听任务，覆盖了7种声音属性，跨越了10个不同领域，确保测试的深度和广度 ......