Học máy và Khai phá dữ liệu

Thông tin chung
Mã học phần: 
MAT6209
Chuyên ngành: 
Khoa học dữ liệu
Tóm tắt môn học

Khai phá dữ liệu là ngành khoa học quan trọng trong thời đại dữ liệu lớn do nhu cầu phát hiện các mẫu dữ liệu và mối quan hệ hữu ích từ dữ liệu. Học phần có có mục tiêu trang bị kiến thức cơ bản về khai phá dữ liệu, tập trung vào các kĩ thuật học tự động và mô hình thống kê ứng dụng hiện đại. Sau khi học xong học phần, học viên nắm được những mô hình học máy cốt lõi được sử dụng thường xuyên trong khai phá dữ liệu, bao gồm một số mô hình phân loại và hồi quy tuyến tính, một số mô hình phân loại và hồi quy phi tuyến, các mô hình cộng tính; các mô hình trộn và phân cụm; các phương pháp giảm số chiều dữ liệu.

Tài liệu tham khảo

  • Tài liệu bắt buộc
    • Bài giảng của giảng viên
    • Hastie, Tibshirani and Friedman (2008), Elements of Statistical Learning , Springer, NY.
    • Murphy K.P. (2013). Machine Learning: A Probablistic Perspective, MIT Press
  • Tài liệu tham khảo
    • Writen I.H., Frank E. (2005), Data Mining: Practical Machine Learning Tools and Techniques (Second Edition). Elsevier Inc
    • Bishop C.M (2006), Pattern Recognition and Machine Learning, Springer