清华姚班大牛,OpenAI姚顺雨:AI的下半场要像产品经理一样思考,RL算法取决于环境 姚顺雨(OpenAI)4月撰文指出,GPT出现让AI研发进入“下半场”:重心从“训练模型”转向“定义问题+评估”。强化学习因大模型提供的“通用先验”终于具备泛化能力,将不止做游戏,而是接管所有任务。作者提出“配方”概念——大模型即先验,环境/基准成为稀缺资源;算法工程师需像产品经理一样思考用户期待,把隐性的真实世界知识电子化,构建可度量的长链条评估体系。视频结合从业者经验,肯定方向也提醒落地难点:目标远近取舍、经验文档
www.bilibili.com