Agent Q – MultiOn公司推出的AI智能体，可以自我学习进化

baidu09_com 2025-08-27 5 0

Agent Q是MultiOn公司联合斯坦福大学推出的自监督代理推理和搜索框架。Agent Q融合了引导式蒙特卡洛树搜索（MCTS）、AI自我批评和直接偏好优化（DPO）等技术，使AI模型能通过迭代微调和基于人类反馈的强化学习进行自我改进。Agent Q在网页导航和多步任务执行中展现出色性能，在OpenTable真实预订任务中，将成功率从18.6%提升至95.4%，标志着AI在自主性和复杂决策能力上的重大突破。

（图片来源网络，侵删）

（图片来源网络，侵删）

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://baidu09.com/news/13176.html

baidu09亚虹医药宣布与 ReviR 共同开发基于 AI+RNA 技术路线的肿瘤创新疗法

全部评论

留言在赶来的路上...

Agent Q – MultiOn公司推出的AI智能体，可以自我学习进化

baidu09亚虹医药宣布与 ReviR 共同开发基于 AI+RNA 技术路线的肿瘤创新疗法

阿维塔5月销量12767辆同比增长179%

全部评论

发表评论取消回复

Agent Q – MultiOn公司推出的AI智能体，可以自我学习进化

baidu09亚虹医药宣布与 ReviR 共同开发基于 AI+RNA 技术路线的肿瘤创新疗法

阿维塔5月销量12767辆 同比增长179%

全部评论

发表评论取消回复

猜你喜欢

阿维塔5月销量12767辆同比增长179%