IT之家 8 月 28 日消息,Cerebras Systems 今日宣布推出 Cerebras Inference,官方称这是全球最快的 AI 推理解决方案。该新解决方案为 Llama 3.1 8B 提供每秒 1800 个 token,为 Llama 3.1 70B 提供每秒 450 个 token,速度是微软 Azure 等超大规模云中提供...

社交账号快速登录

微信扫一扫关注
如已关注,请回复“登录”二字获取验证码