北京大学 FEXINGUNIVERSITY DeepSeek内部研讨系列 DeepSeek原理与落地应用 AI肖睿团队 (孙萍、吴寒、周嵘、李娜、张惠军、刘誉) 2025年03月01日 厦门大学大数据百家讲坛 北大青鸟人工智能研究院 北大计算机学院元宇宙技术研究所 北大教育学院学习科学实验室
北京大学 PEKING UNIVERSITY 目录 CONTENTS 01 人工智能概念辨析 02 DeepSeekR1 03 大模型原理 04 落地应用
北京大学 PEKING UNTVERSITY 人工智能概念辨析 PART 01
大模型相关术语 北京大学 PHKINHUSVERSITY 多模态 文e-言 通文平间 工天工 MiLM 东太机 FS2E K KinLa MINMAX 8 bpelbayes Transnve 文本、图片、音频、视频 AndesGPT ZTER HSX 天A 五时品 AI工具(国内) HRAS O2.5 Baichuan2 RWKV-LM TeltChat2-358 书通语 GWQ-318- K K0-math Skywork o1 350gpt2-01 lloVA-CoT >DeepSeek、豆包、Kimi、腾讯元宝、智谱清言、 通义干问、秘塔搜索、搜索 A XAPP KKimi PlxVerse RA Ii HDreom.oi 通文万相 ERTTS 通用模型 量元 RA G万 大语言模型(LLM,Large Language Model) 文生册 元-DT 快手可E mertu xe- 1042eedt 视觉模型(图片、视频) RE IE SRRE EEM-EGPT MaICPT 业路大模型 时航全社大领型 电书NSAInro-158 音频模型 营国: ResdsGPT > 行业 大 业 发线: 29: Ssvaegwrod R2NS 海大迎 阿子园 大硬型 "Rr" SMore LMo E Chet Law > 多模态模型 ..... NthiskOPT ANS:DF9F大型 .... "...* 行业模型(垂直模型、垂类模型) 教育、医疗、金融等
大模型的前世今生 北京大学 PEKINGUNIVERSITY Oupt 人工智能:让机器具备动物智能,人类智能,非人类智能(超人类智能) 运算推理:规则核心:自动化 知识工程:知识核心:知识库推理机 机器学习:学习核心:数据智能(统计学习方法,数据建模) 常规机器学习方法:逻辑回归,决策森林,支持向量机,马尔科夫链, 人工神经网络:与人脑最大的共同点是名字,机制和架构并不一样 传统神经网络:霍普菲尔德网络,玻尔兹曼机, 深度神经网络:深度学习 Encoding Enooding 传统网络架构:DBN,CNN,RNN,ResNet,Inception, Transformer架构:可以并行矩阵计算(GPU),核心是注意力机制(Attention) rputs dhited sg4) OAputs 编码器(BERT):多数embedding模型,Ernie早期版本, 三大核心组件 混合网络:T5、GLM (工田) 文本码器 我像优息生经器 解码器(GPT):大语言模型(LLM),也是传统的多模态模型的核心 生成式人工智能(GenAI):AIGC DeepSeek、Qwen、GLM、Step、MiniMax、hunyuan、kimi、 Diffusion OpenAI GPT (ChatGPT)、Claude、Llama、Grok、. Diffusion架构:主要用于视觉模型(比如StableDiffusion、DALLE),现在也开始尝试用于语言模型 DiffusionTransformer架构:例如Sora的DiT(加入Diffusion的视觉模型),部分新的多模态模型架构
DS指南:DeepSeek原理与落地应用(北京大学).pdf
