Ai设计师学院
让AI赋能设计,让创意更高效

微软OmniParser新版上线:DeepSeek等模型轻松升级为计算机智能体

导读:2月17日,根据微软官网,微软日前发布视觉Agent解析框架OmniParser最新版本V2.0,可将OpenAI(4o/o1/o3-mini)、DeepSeek(R1)、Qwen(2.5VL)、Anthropic(Sonnet)等大模型,转化为“计算机使用智能体”(Computer Use Agent)。相比前代版本,OmniParser V2在检测更微小可交互元素时精度更高、推理速度更快。具体而言,V2通过使用更大规模的交互元素检测数据集和图标功能描 ……

2月17日,根据微软官网,微软日前发布视觉Agent解析框架OmniParser最新版本V2.0,可将OpenAI(4o/o1/o3-mini)、DeepSeek(R1)、Qwen(2.5VL)、Anthropic(Sonnet)等大模型,转化为“计算机使用智能体”(Computer Use Agent)。相比前代版本,OmniParser V2在检测更微小可交互元素时精度更高、推理速度更快。具体而言,V2通过使用更大规模的交互元素检测数据集和图标功能描述数据进行训练,并通过缩小图标描述模型的输入图像尺寸,推理延迟较前代降低60%。

未经允许不得转载:Ai设计师学院 » 微软OmniParser新版上线:DeepSeek等模型轻松升级为计算机智能体

评论 抢沙发

评论前必须登录!

 

BIM World, A Professional BIM Learning Platform

Stay updated on the latest architecture trends and share new building technologies.

联系我们关于我们

账号登录

注册登录代表您已同意《用户许可协议》

注册