聚合搜索引擎 - 壹搜网为您找到"

强化学习rl

"相关结果 70条

利用强化学习训练人工智能（AI）智能体– AnyLogic仿真软件

这最好通过使用功能强大的通用仿真软件来实现，该软件与强化学习(RL)算法之间具有快速、一致和优化的连接。从训练中学习到的策略最终可以部署到构建仿真模型的真实系统中。

www.anylogic.cn

强化学习RL训练“活”的游戏与虚拟伙伴(AI产品经理智能NPC笔记S1E03)

RL方案：通过RL，可以训练基于物理模拟的角色控制器，让角色学会如何控制“肌肉”（关节力矩）来完成各种动作，并自然地适应环境变化。这能生成更逼真、更具适应性的程序化动画。

www.woshipm.com

AGI最后拼图，一文看懂什么是强化学习？其护城河是什么？

Jun 9, 2025 ... 报告表示，强化学习（RL）或成为AGI前最后关键范式，其理密集型特性带来了算力挑战。此外，高质量数据是强化学习护城河，AI设计AI的循环加速技术迭代。以下是 ...

wallstreetcn.com

强化学习算法分类（Kinds of RL Algorithms） - 穷酸秀才大草包- 博客园

Feb 24, 2022 ... 强化学习算法： · RL算法中最重要的分支点之一是智能体是否能够访问(或学习)环境模型的问题。 · 拥有一个模型的主要好处是，它允许智能体通过提前思考、看到 ...

www.cnblogs.com

[译][论文] DeepSeek-R1：通过强化学习激励大模型的推理能力 ...

Feb 15, 2025 ... 2.2.1 强化学习算法：Group Relative Policy Optimization ( GRPO ). 为了降低RL 训练成本，我们采用了 GRPO （组相对策略优化）算法（Shao 等，2024）， ...

arthurchiao.art

强化学习遭遇瓶颈！分层RL将成为突破的希望 - InfoQ

Mar 22, 2019 ... 本文中对分层强化学习（HRL）的研究进行了总结，文章首先回顾了强化学习（RL）的基本原理，并阐述了其目前所面对的局限性。随后介绍了HRL如何解决RL的局限， ...

www.infoq.cn

LLM 与强化学习的新范式：Agentic RL 研究综述 - 火山引擎开发者社区

Oct 13, 2025 ... Agentic RL 是一种将LLM 视为可学习的策略，通过强化学习提升其作为智能体与环境交互并实现长期目标的能力的框架。

developer.volcengine.com

强化学习（Reinforcement Learning, RL）** 是一种机器学习技术

Jul 13, 2024 ... 强化学习（Reinforcement Learning, RL）是一种机器学习技术，其中智能体（Agent）通过与环境（Environment）交互来学习如何执行决策以最大化累积奖励。在强化 ...

developer.aliyun.com

强化学习（RL）在机器人抓取任务中的稀疏奖励与课程学习策略

May 28, 2025 ... 机器人抓取任务因环境动态性、物体多样性及动作连续性，成为强化学习（RL）的典型挑战场景。其中，**稀疏奖励（Sparse Reward）和课程学习（Curriculum Learning） ...

m.hqyj.com

什么是人类反馈的强化学习(RLHF)？ - IBM

人类反馈强化学习(RLHF) 是一种机器学习技术，利用人类的直接反馈来训练“奖励 ... 从概念上讲，强化学习(RL) 旨在模仿人类的学习方式：人工智能代理在强烈的成功 ...

www.ibm.com

上一页 2 3 4 5 6 7 8 9 10 11 下一页

强化学习rl

利用强化学习训练人工智能（AI）智能体– AnyLogic仿真软件

强化学习RL训练“活”的游戏与虚拟伙伴(AI产品经理智能NPC笔记S1E03)

AGI最后拼图，一文看懂什么是强化学习？其护城河是什么？

强化学习算法分类（Kinds of RL Algorithms） - 穷酸秀才大草包- 博客园

[译][论文] DeepSeek-R1：通过强化学习激励大模型的推理能力 ...

强化学习遭遇瓶颈！分层RL将成为突破的希望 - InfoQ

LLM 与强化学习的新范式：Agentic RL 研究综述 - 火山引擎开发者社区

强化学习（Reinforcement Learning, RL）** 是一种机器学习技术

强化学习（RL）在机器人抓取任务中的稀疏奖励与课程学习策略

什么是人类反馈的强化学习(RLHF)？ - IBM

百度热搜

抖音热搜

知乎热搜

小红书热搜

时间筛选

所有网页和文件

站点检索

强化学习rl

百度热搜

抖音热搜

知乎热搜

小红书热搜