从数据到芯片,开发AI越来越昂贵,只有科技巨头能“玩得起”?
更多的训练数据、更大的模型、更多的芯片和数据中心,这些推动人工智能(AI)进步的基础设施,正推高科技公司的成本。 5月,OpenAI与美国新闻集团(News Corp)签订了一项五年内金额超过2.5亿美元的内容授权协议,允许前者使用后者的新闻出版物内容来回答用...
曝英伟达违规抓取数据训练AI模型!包括YouTube视频等,官方回应了
智东西(公众号:zhidxcom) 编译 | 黄心如 编辑 | 李水青 智东西8月7日消息,外媒404 Media发布的报告表明,英伟达自2024年3月开始从YouTube和Netflix等热门网站和平台上尽可能地抓取数据来训练其AI产品,在报告中,一位英伟达发言人邮件回应404 Media,申...
科学家揭示数据驱动型大模型的三大问题,并指出发展多语言AI的紧迫性
近年来,以 ChatGPT 为代表的大模型飞速发展,在自然语言处理上展现出惊人的效果,俨然成为新一轮科技革命的重要驱动力量,深刻改变着人类的生产方式、生活方式和学习方式。 虽然大模型取得了突破性的进展,但其在多语言能力上的探索仍然十分滞后,并存在着...
数据“投喂”大模型训练 AI时代如何划定版权边界
划重点 01随着AI大模型训练数据的增多,版权问题日益凸显,如何划定版权边界成为关注焦点。 02专家表示,合理使用制度可以解决AI训练过程中数据来源的版权问题,避免阻碍AI技术发展。 03以音乐为例,AI音乐生成大模型可能需要学习几十亿首曲子,要求事先获得...
AI数据告急,大厂盯上廉价年轻人
为了拿到新数据、训练AI大模型,字节等互联网大厂正在亲自下场,以单次300元不等的价格招募AI录音员,定制语料库。 坐落于北京大钟寺的字节办公楼,集中了字节的抖音业务团队和火山引擎业务团队,从年初便开始招募素人为豆包大模型录音。两人结组、单次3小时...
梁彦:人工智能数据要素的产业化还处于探索期
新京报贝壳财经讯(记者阎侠)近年来,随着新一代人工智能技术的创新突破,数据要素与人工智能大模型融合创新步伐加快,数字化浪潮迈入了新阶段,为传统产业的转型升级提供了更为广阔的赋能空间。 9月10日,2024年中国500强企业高峰论坛在天津梅江会展中心召...