DeepSeek-R1与Deep Research复现之旅
前沿速递,直击微调复现技术核心

你将获得
- 增强大模型推理能力的四大范式
- 蒸馏 DeepSeek-R1 进行微调复现的思路
- DeepSeek-R1-zero 核心原理详解
- DeepSeek-R1 与 Deep Research开源复现项目解读
讲师介绍
主要研究方向为大模型训练及落地应用、知识图谱构建与 RAG 增强问答、多模态文档理解,目前申请发明专利十余项、论文数篇,近年来在 0GB-Wikikg2、CCKS 多模态实体对齐、ICPR 等国内外评测中获得多项冠亚军。开源项目 70 余项,具有广泛影响力。
课程介绍
DeepSeek-R1 的成功不仅为大模型的发展提供了新的方向,也为未来人工智能的研究和应用奠定了坚实基础。近期围绕 DeepSeek-R1 的讨论也越来越多,于是我们开设了这门前沿课程,希望能帮你拨开迷雾,更深入地了解大模型前沿知识,学习到 DeepSeek-R1 的核心技术,以及众多 DeepSeek-R1 开源项目的复现思路。
课程涵盖以下话题:
- 推理类模型是如何炼成的?
- DeepSeek-R1 类模型擅长做哪些事?
- 蒸馏 DeepSeek-R1 进行微调复现的思路是怎样的?
- 如何理解 DeepSeek-R1-zero中的核心技术(GRPO、奖励策略)?
- OpenAI 推出的 Deep Research 如何应用?
- DeepSeek-R1、Deep Research有哪些值得关注学习的开源项目?
PS:课程形式为视频课,不提供课件。
课程目录
