大家好!接下来我会推出一系列视频,带大家从零开始构建一个大语言模型(LLM),跟着我,一起带你实现GPT-2。整个系列会以纯代码实操为主,完全基于 PyTorch,不依赖高级封装库,力求做到通俗易懂,小白也能轻松上手。 在学习基础实现的过程中,我还会穿插讲解一些当下最先进的大模型,例如 Qwen3、Gemma 等,帮助大家建立起从经典模型到前沿模型的整体理解框架。 👉 如果你对 LLM 的底层原理感兴趣,或者想要亲手实现一个完整的 GPT 系列模型,那么这个系列一定能帮到你!
www.bilibili.com