DS指南:DeepSeek原理与落地应用(北京大学).pdf

DeepSeek,pdf,指南,电视,落地,计算机与AI
文档页数:58
文档大小:10.79MB
文档格式:pdf
文档分类:计算机与AI
上传会员:
上传日期:
最后更新:

北京大学 FEXINGUNIVERSITY DeepSeek内部研讨系列 DeepSeek原理与落地应用 AI肖睿团队 (孙萍、吴寒、周嵘、李娜、张惠军、刘誉) 2025年03月01日 厦门大学大数据百家讲坛 北大青鸟人工智能研究院 北大计算机学院元宇宙技术研究所 北大教育学院学习科学实验室
北京大学 PEKING UNIVERSITY 目录 CONTENTS 01 人工智能概念辨析 02 DeepSeekR1 03 大模型原理 04 落地应用
北京大学 PEKING UNTVERSITY 人工智能概念辨析 PART 01
大模型相关术语 北京大学 PHKINHUSVERSITY 多模态 文e-言 通文平间 工天工 MiLM 东太机 FS2E K KinLa MINMAX 8 bpelbayes Transnve 文本、图片、音频、视频 AndesGPT ZTER HSX 天A 五时品 AI工具(国内) HRAS O2.5 Baichuan2 RWKV-LM TeltChat2-358 书通语 GWQ-318- K K0-math Skywork o1 350gpt2-01 lloVA-CoT >DeepSeek、豆包、Kimi、腾讯元宝、智谱清言、 通义干问、秘塔搜索、搜索 A XAPP KKimi PlxVerse RA Ii HDreom.oi 通文万相 ERTTS 通用模型 量元 RA G万 大语言模型(LLM,Large Language Model) 文生册 元-DT 快手可E mertu xe- 1042eedt 视觉模型(图片、视频) RE IE SRRE EEM-EGPT MaICPT 业路大模型 时航全社大领型 电书NSAInro-158 音频模型 营国: ResdsGPT > 行业 大 业 发线: 29: Ssvaegwrod R2NS 海大迎 阿子园 大硬型 "Rr" SMore LMo E Chet Law > 多模态模型 ..... NthiskOPT ANS:DF9F大型 .... "...* 行业模型(垂直模型、垂类模型) 教育、医疗、金融等
大模型的前世今生 北京大学 PEKINGUNIVERSITY Oupt 人工智能:让机器具备动物智能,人类智能,非人类智能(超人类智能) 运算推理:规则核心:自动化 知识工程:知识核心:知识库推理机 机器学习:学习核心:数据智能(统计学习方法,数据建模) 常规机器学习方法:逻辑回归,决策森林,支持向量机,马尔科夫链, 人工神经网络:与人脑最大的共同点是名字,机制和架构并不一样 传统神经网络:霍普菲尔德网络,玻尔兹曼机, 深度神经网络:深度学习 Encoding Enooding 传统网络架构:DBN,CNN,RNN,ResNet,Inception, Transformer架构:可以并行矩阵计算(GPU),核心是注意力机制(Attention) rputs dhited sg4) OAputs 编码器(BERT):多数embedding模型,Ernie早期版本, 三大核心组件 混合网络:T5、GLM (工田) 文本码器 我像优息生经器 解码器(GPT):大语言模型(LLM),也是传统的多模态模型的核心 生成式人工智能(GenAI):AIGC DeepSeek、Qwen、GLM、Step、MiniMax、hunyuan、kimi、 Diffusion OpenAI GPT (ChatGPT)、Claude、Llama、Grok、. Diffusion架构:主要用于视觉模型(比如StableDiffusion、DALLE),现在也开始尝试用于语言模型 DiffusionTransformer架构:例如Sora的DiT(加入Diffusion的视觉模型),部分新的多模态模型架构

资源链接请先登录(扫码可直接登录、免注册)
①本文档内容版权归属内容提供方。如果您对本资料有版权申诉,请及时联系我方进行处理(联系方式详见页脚)。
②由于网络或浏览器兼容性等问题导致下载失败,请加客服微信处理(详见下载弹窗提示),感谢理解。
③本资料由其他用户上传,本站不保证质量、数量等令人满意,若存在资料虚假不完整,请及时联系客服投诉处理。

投稿会员:匿名用户
我的头像

您必须才能评论!

手机扫码、免注册、直接登录

 注意:QQ登录支持手机端浏览器一键登录及扫码登录
微信仅支持手机扫码一键登录

账号密码登录(仅适用于原老用户)