Skip to content
"A year spent in artificial intelligence is enough to make one believe in God."— Alan Perlis

数据挖掘

基本信息

课程名称:数据挖掘

课程介绍:本课程旨在教授如何从海量且有噪声的数据中,利用算法自动提取隐含的、潜在有用的信息与知识

课程画像:

  • 课程类型:选修(保研必修)
  • 学分:2 学分
  • 考核方式:平时作业 · 期末考试

课程资料区

课程教材:

  • 《数据挖掘:原理与应用》,丁兆云,周鋆,杜振国 编著,机械工业出版社,2022

课程资料库(往年课件):repo

经验分享区

课程定位评价:课程大部分内容在 机器学习导论 课程中有所涉及,整体课程难度不是很高

作业反馈:

作业参考(2025秋学期):

课程作业多依托 Kaggle 平台,在网上也有很多不同的解法和优化的思路,建议自己做完后可以进行参考学习,但不要机械化照抄。

  1. 贝叶斯分类编程实践(slide 分类-Naive Bayes)
  2. 泰坦尼克号幸存者预测(slide 神经网络分类器)
  3. 欧图集团产品分类(slide 集成学习)

考试情报:

  • 2025秋学期的期末考试题型为:单选 + 判断 + 解答
  • 考点分析:复习ppt上的内容都是考试重点
  • 备注:期末考试允许携带无通信功能的计算器(要能够熟练使用)

高分策略:

  • 考前要把ppt都过一遍,熟练掌握重要知识点
  • 考前把书后的试题都刷一刷,考试卷中会出现一些教材的原题(Tip:找到的参考答案可能有不少问题,建议讨论斟酌一下)