月之暗面Kimi发布首个Agent产品Kimi-Researcher(深度研究),并开始小范围灰度测试。据介绍,Kimi-Researcher是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,在HLE测试中,超过Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research,与Gemini-Pro的Deep Research Agent打平。月之暗面表示, Kimi-Researcher 基础预训练模型及强化学习后的模型将逐步开源,以推动Agent强化学习方向的探索。
原创文章,作者:狐呼网,如若转载,请注明出处:https://www.ihuho.com/9067.html