BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CẦN THƠ CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập Tự do Hạnh Phúc ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN 1. Tên học phần : Máy học nâng cao (Advanced machine learning) - Mã số học phần : CT214 - Số tín chỉ học phần : 3 tín chỉ - Số tiết học phần : 30 tiết lý thuyết, 30 tiết thực hành 2. Đơn vị phụ trách học phần: - Bộ môn : Khoa học máy tính - Khoa/Viện/Trung tâm/bộ môn: Công nghệ thông tin và truyền thông 3. Điều kiện tiên quyết: Nguyên lý máy học (CT202) 4. Mục tiêu của học phần: 4.1. Kiến thức: 4.1.1. Trình bày được các nguyên lý cơ bản của học thống kê 4.1.2. Phân biệt được các phương pháp máy học 4.1.3. Mô tả, giải thích được mô hình máy học véc-tơ hỗ trợ 4.1.4. Mô tả, giải thích được giải thuật k-means 4.1.5. Mô tả, giải thích được phương pháp cực đại hoá kỳ vọng 4.1.6. Mô tả, giải thích được các phương pháp phân tích thừa số 4.1.7. Biết quy trình xây dựng một ứng dụng máy học 4.2. Kỹ năng: 4.2.1. So sánh đánh giá các phương pháp máy học 4.2.2. Phân tích, thiết kế cách giải quyết bài toán 4.2.3. Lập trình với ngôn ngữ R 4.2.4. Viết báo cáo khoa học. Thái độ:.1. Nghiêm túc trong học tập.2. Có thái độ tích cực và chủ động trong việc tìm kiếm tài liệu, cập nhật thông tin chuyên ngành..3. Trách nhiệm: hoàn thành tốt các nhiệm vụ được giao đúng kỳ hạn.4. Tự trọng, trung thực trong thi cử, đánh giá 5. Mô tả tóm tắt nội dung học phần: Học phần cung các kiến thức nâng cao trong lĩnh vực máy học bao gồm học thống kê, mô hình máy học véc-tơ hỗ trợ, học không giám sát, bài toán gom nhóm, phương
pháp cực đại hoá kỳ vọng, các phương pháp giảm chiều dữ liệu bằng phân tích thừa số và ứng dụng của máy học trong nhận dạng chữ viết tay, xử lý dữ liệu văn bản. 6. Cấu trúc nội dung học phần: 6.1. Lý thuyết Nội dung Số tiết Mục tiêu Chương 1. Giới thiệu 3 1.1. Giới thiệu 3 1.3. Nguyên lý học thống kê 4.1.1; 4.1.2; Chương 2. Máy học véc-tơ hỗ trợ 9 4.1.3; 2.1. Mô hình SVM cho bài toán phân lớp 3 2.2. Giải thuật máy học SVM 3 2.3. Máy học SVM cho bài toán đa lớp 2.4. Máy học SVM cho bài toán hồi quy 3 2.5. Máy học SVM cho bài toán phát hiện phần tử cá biệt Chương 3. Học không giám sát 6 4.1.2; 4.1.4; 4.1.5; 3.1. Bài toán gom nhóm dữ liệu 3 3.2. Giải thuật k-means 3.3. Ước lượng mật độ xác suất và phương pháp cực 3 đại hoá kỳ vọng 3.4. Gom nhóm dữ liệu bằng phương pháp cực đại hoá kỳ vọng Chương 4. Phân tích thừa số 6 4.1.6; 4.1. Phân tích thành phần chính 3 4.2. Phân tích tương ứng 3. Phân tích thành phần độc lập Chương 5. Ứng dụng 6 4.1.(2-7); 5.1. Nhận dạng chữ viết tay 3 5.2. Phân lớp dữ liệu văn bản 3 5.3. Gom nhóm dữ liệu văn bản 6.2. Thực hành Nội dung Số tiết Mục tiêu Bài 1. Máy học véc-tơ hỗ trợ 5 4.1.3; 4.2.2; 1.1. Tìm hiểu và sử dụng libsvm 2 1.2. Sử dụng libsvm trong ứng dụng của bạn 3 Bài 2. Giải thuật k-means 5 4.1.4; 4.2.2;
2.1. Sử dụng k-means trong R 3 2.3. Cài đặt giải thuật k-means 2 Bài 3. Gom nhóm dữ liệu bằng phương pháp cực đại hoá kỳ vọng 5 4.1.5; 4.2.2; Bài 4. Phân tích thừa số 5 4.1.6; 4.2.2; 4.1. Cài đặt giải thuật phân tích thành phần chính 1 4.2. Cài đặt giải thuật phân tích tương ứng 2. Cài đặt giải thuật phân tích thành phần độc lập 2 Bài 5. Nhận dạng chữ viết tay 4.1.(2-7); 4.2; 5.1. Biểu diễn dữ liệu chữ viết tay 1 5.2. Tính đặc trưng GIST cho tập dữ liệu chữ viết tay 1 5.3. Sử dụng libsvm để xây dựng hệ thống nhận dạng 3 chữ viết tay Bài 6. Xử lý dữ liệu văn bản 4.1.(2-7); 4.2; 6.1. Phân lớp dữ liệu văn bản 2 6.2. Gom nhóm dữ liệu văn bản 3 7. Phương pháp giảng dạy: - Nêu tình huống và đặt câu hỏi tìm hiểu kiến thức của sinh viên trước khi học bài mới. - Giải thích tình huống theo kiến thức mới. - Kiểm tra ngẫu nhiên về kiến thức mới tiếp thu của sinh viên. 8. Nhiệm vụ của sinh viên: Sinh viên phải thực hiện các nhiệm vụ như sau: - Tham dự tối thiểu 80% số tiết học lý thuyết. - Tham gia đầy đủ 100% giờ thực hành/thí nghiệm/thực tập và có báo cáo kết quả. - Thực hiện đầy đủ các bài tập nhóm/ bài tập và được đánh giá kết quả thực hiện. - Tham dự kiểm tra giữa học kỳ. - Tham dự thi kết thúc học phần. - Chủ động tổ chức thực hiện giờ tự học. 9. Đánh giá kết quả học tập của sinh viên: 9.1. Cách đánh giá Sinh viên được đánh giá tích lũy học phần như sau: TT Điểm thành phần Quy định Trọng số Mục tiêu 1 Điểm chuyên cần Số tiết tham dự học/tổng số tiết 10% 2 Điểm thực hành - Báo cáo/kỹ năng, kỹ xảo thực hành/... 20% 4.2
3 Điểm kiểm tra giữa kỳ 4 Điểm thi kết thúc học phần 9.2. Cách tính điểm - Tham gia 100% số giờ - Thi viết (45 phút) 20% 4.1.1 đến 4.1.4; 4.2.1; 4.2.2; - Thi viết (90 phút) 50% 4.1; - Tham dự đủ 80% tiết lý thuyết và 100% giờ thực hành - Bắt buộc dự thi - Điểm đánh giá thành phần và điểm thi kết thúc học phần được chấm theo thang điểm 10 (từ 0 đến 10), làm tròn đến một chữ số thập phân. - Điểm học phần là tổng điểm của tất cả các điểm đánh giá thành phần của học phần nhân với trọng số tương ứng. Điểm học phần theo thang điểm 10 làm tròn đến một chữ số thập phân, sau đó được quy đổi sang điểm chữ và điểm số theo thang điểm 4 theo quy định về công tác học vụ của Trường. 10. Tài liệu học tập: Thông tin về tài liệu Số đăng ký cá biệt [1] Đỗ Thanh Nghị, Phạm Nguyên Khang, Giáo trình Nguyên lý máy học, NXB Đại học Cần Thơ, 2012 [2] Đỗ Thanh Nghị, Khai mỏ dữ liệu (Minh hoạ bằng ngôn ngữ R), NXB Đại học Cần Thơ, 2011 [3] Tom Mitchell, Machine Learning, McGraw Hill, 1997. [4] Ethem Alpaydin, Introduction to Machine Learning, The MIT Press, October 2004 11. Hướng dẫn sinh viên tự học: Tuần Nội dung 1 Chương 1: Giới thiệu 1.1. Giới thiệu 1.2. Nguyên lý học thống kê 2 Chương 2: Máy học véctơ hỗ trợ 2.1. Mô hình SVM cho bài toán phân lớp 3 2.2. Giải thuật máy học SVM 2.3. Mô hình SVM cho bài toán phân lớp 4 2.4. Máy học SVM cho bài toán hồi quy Lý thuyết (tiết) Thực hành (tiết) Nhiệm vụ của sinh viên +Tài liệu [1]: Chương 1 + Tra cứu các nội dung: học máy là gì, nguyên lý học thống kê, các phương pháp đánh giá máy học +Tài liệu [1]: Chương 3 +Tra cứu nội dung về mô hình SVM +Tài liệu [1]: Chương 3 +Tra cứu nội dung về giải thuật SVM +Tài liệu [1]: Chương 3
2.5. Máy học SVM cho bài toán phát hiện phần tử cá biệt 5 Chương 3: Học không giám sát 3.1. Bài toán gom nhóm dữ liệu 3.2. Giải thuật k-means 6 3.3. Ước lượng mật độ xác suất và phương pháp cực đại hoá kỳ vọng 3.4. Gom nhóm dữ liệu bằng phương pháp cực đại hoá kỳ vọng 7 Chương 4: Phân tích thừa số 4.1. Phân tích thành phần chính 8 4.2. Phân tích tương ứng. Phân tích thành phần độc lập 9 Chương 5: Ứng dụng 5.1. Nhận dạng chữ viết tay +Tra cứu nội dung về giải thuật SVM +Tài liệu [1]: Chương 5 +Tra cứu nội dung về giải thuật k-means +Tài liệu [1]: Chương 5 +Tra cứu nội dung về ước lượng hàm mật độ xác suất, phương pháp cực đại hoá kỳ vọng +Tài liệu [3]: Phân tích thành phần chính +Tài liệu [3]: Phân tích tương ứng, phân tích thành phần độc lập +Tài liệu [1]: Chương 6 +Tra cứu nội dung về trích đặc trưng cho chữ viết tay 10 5.2. Phân lớp dữ liệu văn bản 5.3. Gom nhóm dữ liệu văn bản Bài thực hành số 1 3 5 -Nghiên cứu trước: +Tài liệu [1]: Chương 6 +Tra cứu nội dung về biểu diễn văn bản bằng phương pháp túi từ. thực hành số 1 11 Bài 0 5 -Viết báo cáo bài thực hành số 1 12 Bài thực hành số 3 0 5 -Viết báo cáo bài 13 Bài thực hành số 4 0 5 -Viết báo cáo bài thực hành số 3 14 Bài thực hành số 5 0 5 -Viết báo cáo bài thực hành số 4 15 Bài thực hành số 6 0 5 -Viết báo cáo bài thực hành số 5
TL. HIỆU TRƯỞNG TRƯỞNG KHOA/GIÁM ĐỐC VIỆN/ GIÁM ĐỐC TRUNG TÂM Cần Thơ, ngày tháng năm 20 TRƯỞNG BỘ MÔN