Skip to content
"The best way to predict the future is to invent it."— Alan Kay

深度学习平台与应用

基本信息

课程名称:深度学习平台与应用

课程介绍:这门课主要介绍了深度学习训练与计算以及各类经典模型框架。课程从分类任务切入,覆盖线性分类器、正则化与优化以及计算图与反向传播;随后重点讲解 CNN 核心算子与网络结构,并扩展到序列与注意力模型,以及目标检测与分割。还简要介绍了视频理解、可视化方法、自监督学习与视觉-语言模型的入门脉络。

课程画像:

  • 课程类型:平台
  • 学分:2 学分
  • 考核方式:平时作业 · 期末考试

课程资料区

课程资料库(slides / 作业要求 / 复习材料等):

参考资料:

  • 《模式识别》[第一版],吴建鑫 著,机械工业出版社,2020.03
  • 《计算机视觉:算法与应用》,[美] Richard Szeliski 著,清华大学出版社,2011.12

提示

本门课程学习内容更偏向理论,几乎没有涉及到实际应用与代码,若想增强代码与动手能力,推荐关注以下课程:

经验分享区

课程定位评价:综合难度中等偏上。主要原因是考点覆盖面广、计算题细碎,且对 计算熟练度结构理解 都有要求。

作业反馈:

2025秋学期作业情况

  • 作业 1:训练基础与分类器相关内容为主(如损失函数、优化与学习率策略、计算图/反向传播等)。
  • 作业 2:CNN 结构与算子计算为主(卷积输出尺寸、参数量/计算量、显存估算、感受野等)。
  • 作业 3:序列/注意力与检测分割为主(RNN/LSTM/Transformer、R-CNN 系列到 Mask R-CNN 等)。

三次作业基本贯穿“训练基础 → CNN 工程计算 → 序列/注意力/检测分割”的主线,做完作业本身就是一轮高质量复习,大部分考察重点都在作业中有对应的题目。

考试情报:

  • 覆盖内容(以 2025 秋为参考):线性分类器与损失、正则化与优化算法、学习率策略、计算图反向传播、CNN 架构与 BN、感受野/参数量/显存估算、RNN/LSTM、Transformer(PE/MHA/FFN/Add&Norm/Mask)、检测与分割(R-CNN 系)等。
  • 题型倾向:题量很大,会出现大量小问的计算/解答题,结构理解题可能要求画 LSTM/Transformer。

高分策略:

  • 把一些考试重点牢牢掌握:卷积输出尺寸/参数量/计算量、BN(训练/测试)、感受野递推、feature map 显存估算、计算图求导、常见学习率调度公式等,详情可以参考期末复习重点
  • 掌握重要模型的结构图:如LSTM 门控、Transformer,建议能默画并解释每一块的作用。
  • 从视频理解章节起的内容只考察选择题,了解基础概念即可。