Thông tin chung Mã học phần: MAT6209Học phần tiên quyết: Phương pháp số cho đại số tuyến tính Chuyên ngành: Khoa học dữ liệu Tóm tắt môn học Khai phá dữ liệu là ngành khoa học quan trọng trong thời đại dữ liệu lớn do nhu cầu phát hiện các mẫu dữ liệu và mối quan hệ hữu ích từ dữ liệu. Học phần có có mục tiêu trang bị kiến thức cơ bản về khai phá dữ liệu, tập trung vào các kĩ thuật học tự động và mô hình thống kê ứng dụng hiện đại. Sau khi học xong học phần, học viên nắm được những mô hình học máy cốt lõi được sử dụng thường xuyên trong khai phá dữ liệu, bao gồm một số mô hình phân loại và hồi quy tuyến tính, một số mô hình phân loại và hồi quy phi tuyến, các mô hình cộng tính; các mô hình trộn và phân cụm; các phương pháp giảm số chiều dữ liệu. Tài liệu tham khảo Tài liệu bắt buộc Bài giảng của giảng viên Hastie, Tibshirani and Friedman (2008), Elements of Statistical Learning , Springer, NY. Murphy K.P. (2013). Machine Learning: A Probablistic Perspective, MIT Press Tài liệu tham khảo Writen I.H., Frank E. (2005), Data Mining: Practical Machine Learning Tools and Techniques (Second Edition). Elsevier Inc Bishop C.M (2006), Pattern Recognition and Machine Learning, Springer