AgentCPM-GUI 是清华大学和面壁智能团队联合推出的开源端侧 GUI Agent ,针对中文应用优化。模型基于 MiniCPM-V(80 亿参数)构建,能接受智能手机截图作为输入,自主执行用户指定的任务。模型基于大规模中文安卓应用界面数据预训练,显著提升对 GUI 元素的理解和定位能力。AgentCPM-GUI 在中文 Grounding Benchmark 和 Agent Benchmark 上均取得 SOTA 性能,是首个针对中文应用精细优化的开源 GUI Agent。

AgentCPM-GUI 是清华大学和面壁智能团队联合推出的开源端侧 GUI Agent ,针对中文应用优化。模型基于 MiniCPM-V(80 亿参数)构建,能接受智能手机截图作为输入,自主执行用户指定的任务。模型基于大规模中文安卓应用界面数据预训练,显著提升对 GUI 元素的理解和定位能力。AgentCPM-GUI 在中文 Grounding Benchmark 和 Agent Benchmark 上均取得 SOTA 性能,是首个针对中文应用精细优化的开源 GUI Agent。
全部评论
留言在赶来的路上...
发表评论