本视频是爆火全网的大模型教程,由Github 38k Star项目LLMs from scratch作者Sebastian Raschka创作。全视频概述了大模型开发的三个阶段:搭建、训练和微调,重点通过解析每个步骤的运作方式来解释大模型的工作原理。对于刚开始学习大模型的人来说这个视频十分有价值,作者语言清晰易懂,可以帮助大家理顺大模型的底层原理以及如何利用好大模型。不管是新手小白还是进阶大模型开发的学习者,这个教程都值得学习! 另外Sebastian Raschka也是一个高产的作者,著作有:Build a Large Language Model (From Scratch);Machine Learning Q and AI;Machine Learning with PyTorch and Scikit-Learn等畅销著作! 如果你觉得视频内容对你有用的话,请一键三连【长按点赞】支持一下UP呦~拜托拜托,我会努力更新哒! 下面是这个视频的时间线,初级读者建议从头开始观看,中高级可以根据自己需求对应前往: 00:00 – 大模型的使用 02:50 – 大模型开发的阶段 05:26 – 数据集 10:15 – 生成多词输出 12:30 – 分词(Tokenization) 15:35 – 预训练数据集 21:53 – 大模型架构 27:20 – 预训练 35:21 – 分类微调 39:48 – 指令微调 43:06 – 偏好微调 46:04 – 大模型评估 53:59 – 预训练与微调的经验法则
www.bilibili.com