大数据算法(2024年春季)


助教:王运韬 wangyuntao@mail.ustc.edu.cn ,黄震 huangzhen@mail.ustc.edu.cn ,沈俊杰 jun233@mail.ustc.edu.cn


课程简介


       算法与理论是计算机科学的核心领域之一。随着大数据时代的来临,传统的算法理论已经不能很好地解决人工智能、 物联网、工业制造等领域所遇到的实际问题。本门课程主要介绍基于大数据的新型算法技术,如随机采样、数据降维、数据压缩、分布式计算、 流数据计算、聚类、分类、随机优化等,以及相关的理论和数学技巧,如概率计算方法、vc维、通信复杂度、机器学习、深度学习理论等。 作为一门理论方向课程,帮助学生掌握解决大数据问题所需的理论和算法工具,为相关领域的工程实践打好基础。


  1. 基础数学和统计工具 (pdf)
  2. 集中不等式、Chaining (pdf)
  3. 随机算法——Maxcut (pdf)
  4. Balls and Bins (pdf)
  5. K-means 聚类 (pdf)
  6. 主成分分析 (pdf)
  7. JL 变换 (pdf)
  8. JL 变换的应用 (pdf)
  9. JL 变换的应用(线性变换) (pdf)
Top