🎯 深度学习、大模型与智能体——从神经网络基础到深度强化学习的系统性进阶
秦曾昌教授深度学习与智能体实战课程,涵盖深度学习基础、大模型与智能体两大模块。通过神经网络基础结构、激活函数、反向传播算法、卷积神经网络(CNN)、梯度下降与优化方法、大模型定义与特点、GPT/BERT/DeepSeek/CLIP等大模型架构、强化学习基本概念、Q-learning与深度Q网络(DQN)、深度强化学习算法(DQN、A3C)、自然语言处理与智能体结合等核心内容,结合LeNet、VGG、ResNet等经典架构,帮助学员建立从深度学习基础到大模型应用再到智能体开发的全面理解,掌握前沿技术在自适应学习与自主决策系统中的应用。
秦曾昌
深度学习、大模型与智能体
第一部分:深度学习基础(3小时)
深度学习简介 (30分钟)
1. 什么是深度学习?
2. 深度学习的历史背景和发展
3. 深度学习与传统机器学习的区别
神经网络基础 (1小时)
1. 神经网络的基本结构(感知机、多层感知机)
2. 激活函数(ReLU、Sigmoid等)
3. 反向传播算法
卷积神经网络(CNN) (1小时)
1. CNN的基本概念与原理
2. 卷积层、池化层、全连接层
3. 常见CNN架构(如LeNet、VGG、ResNet)
训练与优化 (30分钟)
1. 梯度下降与优化方法(SGD、Adam等)
2. 正则化与避免过拟合
第二部分:大模型与智能体(3小时)
大模型的挑战与应用 (1小时)
1. 大模型的定义与特点
2. GPT、BERT等大型预训练模型的架构与应用
3. DeepSeek 的推理模型
4. CLIP跨模态大模型
5. 训练大模型的技术挑战(计算资源、数据等)
智能体与强化学习 (1小时)
1. 强化学习基本概念:奖励、策略、值函数
2. Q-learning与深度Q网络(DQN)
3. 训练智能体的环境与算法
两天 12 小时(第二版课程大纲)
第一天:深度学习基础与大模型概念(6小时)
深度学习与神经网络基础 (2小时)
1. 神经网络基础概念及其工作原理
2. 反向传播算法详解
3. 常用激活函数与优化算法
卷积神经网络(CNN)深入探讨 (2小时)
1. CNN的层次结构与工作机制
2. 各种CNN架构解析(ResNet、Inception等)
3. CNN在图像处理中的应用案例
大模型的背景与发展 (2小时)
1. 从传统模型到大模型的过渡
2. Transformer模型、MOE模型
3. BERT、GPT、DeepSeek等大模型的架构
4. 预训练与微调技术
第二天(6小时):智能体与深度强化学习
强化学习基础 (2小时)
1. 强化学习的核心概念(奖励、策略、值函数)
2. 常见算法:Q-learning、Policy Gradient等
3. 案例分析:如何使用强化学习解决实际问题
深度强化学习 (2小时)
1. DQN、A3C等深度强化学习算法
2. 深度学习与强化学习的结合
3. 实际应用:自适应学习与自主决策系统
前沿技术与大模型在智能体中的应用 (2小时)
1. 大模型如何支持智能体的复杂任务
2. 自然语言处理与智能体的结合
3. 前沿案例:如OpenAI、DeepMind的成功应用
这个大纲覆盖了深度学习、强化学习和大模型的基本概念,并从理论到应用逐步展开,旨在帮助学生建立全面的理解。
授课老师
秦曾昌 北京航空航天大学自动化科学与电气工程学院教授
常驻地:北京
邀请老师授课:13911448898 谷老师

