XelandOne/llm-journaling -壹搜网视频聚合搜索

翁家翌：OpenAI，GPT，强化学习，Infra，后训练，天授，tuixue，开源，CMU，清华｜WhynotTV Podcast #4

本期嘉宾翁家翌。他在 2022 年加入 OpenAI，并且是 OpenAI 一系列核心模型背后的核心贡献者之一——从 GPT-3.5、GPT-4、再到 GPT-5，你能看到的那些关键跃迁里，都有他的身影；而他最主要的贡献，你可以先记住三个词：强化学习、post-training、infra。但对我来说，翁家翌不只是“把模型做得更强的人”。在成为 OpenAI 研究员之前，他就已经用开源和产品影响过无数人：把知识与资料公开、试图打破信息差；把做工具称作一种“慈善”——在他的价值观里，开源不是履历装饰，

www.bilibili.com

GoogleCloudNext'18_腾讯视频}

腾讯视频

v.sogou.com

41:59

ICLR 2026 oral工作思路分享：LoongRL

这篇视频主要介绍了：Wang S, Zhang G, Zhang L L, et al. Loongrl: Reinforcement learning for advanced reasoning over long contexts[J]. arXiv preprint arXiv:2510.19363, 2025. 这一长上下文LLM推理领域的工作 slides：https://gamma.app/docs/LoongRL-efb44m2qoum4m28 代码：https://github.com

www.bilibili.com

02:02

强制 Agent 自检：Harness 提升表现的关键-langchain《Improving Deep Agents with harness 》②

强制 Agent 自检：Harness 提升表现的关键-langchain《Improving Deep Agents with harness engineering》② https://blog.langchain.com/improving-deep-agents-with-harness-engineering/

www.bilibili.com

04:54

《All Agent》项目效果演示视频

《All Agent》项目的效果演示视频项目地址：rexrex9/all_agent: 通用agent项目 https://github.com/rexrex9/all_agent

www.bilibili.com

（已离职）花3W买的最系统的AI大模型教程，（LLM+RAG+LlamaIndex+langGraph）存下吧，比啃书好太多了！拿走不谢，允许白嫖！

【视频配套籽料+问题解答请看”平论区置顶”自取哦】视频制作不易，如果视频对你有用的话请一键三连【长按点赞】支持一下up哦，拜托，这对我真的很重要！

www.bilibili.com

自主通用AI agent实战: 从文本到万物

github: https://github.com/myshell-ai/AIlice

www.bilibili.com

这应该是2025全网AI Agent讲解得最透彻的教程了，手把手带你从0到1实现AI Agent！一次搞懂！大模型/LLM

这应该是2025全网AI Agent讲解得最透彻的教程了，手把手带你从0到1实现AI Agent！

www.bilibili.com

08:10

AI 大模型周报 2024年1月 a（附论文链接）

[M²UGen] https://arxiv.org/abs/2311.11255 [Dual-Pivot Tuning] https://arxiv.org/abs/2312.17234 [LoRAMoE] https://arxiv.org/abs/2312.09979 [Hyper-VolTran] https://arxiv.org/abs/2312.16218 [MathPile] https://arxiv.org/abs/2312.17120 [WaveCoder] https://arxi

www.bilibili.com

XelandOne/llm-journaling

翁家翌：OpenAI，GPT，强化学习，Infra，后训练，天授，tuixue，开源，CMU，清华｜WhynotTV Podcast #4

GoogleCloudNext'18_腾讯视频}

ICLR 2026 oral工作思路分享：LoongRL

强制 Agent 自检：Harness 提升表现的关键-langchain《Improving Deep Agents with harness 》②

《All Agent》项目效果演示视频

（已离职）花3W买的最系统的AI大模型教程，（LLM+RAG+LlamaIndex+langGraph）存下吧，比啃书好太多了！拿走不谢，允许白嫖！

最新版的LangGraph+MCP实战开发Agent智能体,手把手教你使用LangGraph构建多智能体工作流，少走99%弯路！

自主通用AI agent实战: 从文本到万物

这应该是2025全网AI Agent讲解得最透彻的教程了，手把手带你从0到1实现AI Agent！一次搞懂！大模型/LLM

AI 大模型周报 2024年1月 a（附论文链接）

百度热搜

抖音热搜

小红书热搜