LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC:

Tài liệu tương tự
ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN LÝ LỊCH KHOA HỌC (Thông tin trong 5 năm gần nhất và có liên quan trực tiếp đến đề

1 Überschrift 1

ỨNG DỤNG HỆ TƯ VẤN TRONG ĐỌC TIN TỨC TRỰC TUYẾN Bùi Thị Hồng Nhung Khoa Hệ thống thông tin Quản lý Học viện Ngân hàng Điện

Microsoft PowerPoint - L1-Gioi_thieu_khai_pha_du_lieu.ppt [Compatibility Mode]

Tạp chí Khoa học công nghệ và Thực phẩm số 11 (2017) NGHIÊN CỨU ỨNG DỤNG MÃ NGUỒN MỞ JOOMLA XÂY DỰNG WEBSITE HỖ TRỢ DẠY HỌC VẬT LÝ ĐẠI CƢƠNG Ngu

TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH KHOA HÓA HỌC KHÓA LUẬN TỐT NGHIỆP Tên đề tài: SỬ DỤNG MOODLE THIẾT KẾ WEBSITE HỖ TRỢ VIỆC TỰ HỌC CHƯƠNG HIDROCA

TRƯỜNG ĐẠI HỌC NHA TRANG KHOA CÔNG NGHỆ THÔNG TIN KỶ YẾU HỘI NGHỊ ĐỔI MỚI PPGD VÀ TÌM BIỆN PHÁP NÂNG CAO NĂNG LỰC NCKH NHA TRANG 14/06/2013

Microsoft Word - Co so du lieu phan tan - cap nhat

BM01.QT02/ĐNT-ĐT TRƯỜNG ĐH NGOẠI NGỮ - TIN HỌC TP.HCM KHOA CÔNG NGHỆ THÔNG TIN CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập Tự do Hạnh Phúc 1. Thông tin

UBND TỈNH LONG AN TRƯỜNG CĐN LONG AN CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự do -Hạnh phúc CHƯƠNG TRÌNH DẠY NGHỀ TRÌNH ĐỘ TRUNG CẤP (Ban hành

BỘ GIÁO DỤC VÀ ĐÀO TẠO

454 Trịnh Xuân Giang KHAI THÁC NGUỒN HỌC LIỆU MỞ TỪ CÁC THƯ VIỆN TRÊN THẾ GIỚI VỚI GIẢI PHÁP SỬ DỤNG DỊCH VỤ TÌM KIẾM VÀ CHUYỂN GIAO TÀI NGUYÊN THÔNG

TRA CỨU TÀI LIỆU TRỰC TUYẾN

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH ĐỀ CƯƠNG MÔN HỌC 1. THÔNG TIN VỀ MÔN HỌC 1.1. Tên môn học: QUẢN TRỊ HỆ CƠ SỞ DỮ LIỆU 1.

PHẦN III. NỘI DUNG CHƯƠNG TRÌNH ĐÀO TẠO 1. Tóm tắt yêu cầu chương trình đào tạo Tổng số tín chỉ của chương trình đào tạo: Khối kiến thức chung 158 tín

ĐỀ CƯƠNG MÔN HỌC NHẬP MÔN TIN HỌC

90 CÔNG BÁO/Số ngày THỦ TƯỚNG CHÍNH PHỦ Số: 2147/QĐ-TTg CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự do - Hạnh phúc Hà Nội, ng

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LÝ LỊCH KHOA HỌC 1. THÔNG TIN CÁ NHÂN Họ và tên: Nguyễn Văn Tảo Ngày sinh: 05/1

ThemeGallery PowerTemplate

UBND TỈNH LONG AN TRƯỜNG CAO ĐẲNG NGHỀ LONG AN CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự do - Hạnh phúc CHƯƠNG TRÌNH ĐÀO TẠO TRÌNH ĐỘ CAO ĐẲNG (

Co s? d? li?u (Database)

KIỂM TOÁN NHÀ NƯỚC CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự do - Hạnh phúc Số: 1173/QĐ-KTNN Hà Nội, ngày 27 tháng 7 nă

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LÝ LỊCH KHOA HỌC 1. THÔNG TIN CÁ NHÂN Họ và tên: Nguyễn Văn Huân Ngày sinh: 10/

BỘ TƯ PHÁP CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự do - Hạnh phúc Số: 03/2018/TT-BTP Hà Nội, ngày 10 tháng 03 năm 2018

Chuyên đề

TCVN 11391:2016 MỤC LỤC 1 Phạm vi áp dụng Tài liệu viện dẫn Thuật ngữ, định nghĩa và các từ viết tắt Thuật ngữ và định nghĩa...


ĐẠI HỌC QUỐC GIA TPHCM TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN KẾT QUẢ THẨM ĐỊNH ĐỀ TÀI LUẬN VĂN THẠC SĨ NGÀNH KHOA HỌC MÁY TÍNH ĐỢT 2/2018 STT MÃ HV HỌ VÀ

Microsoft Word - Co so du lieu - cap nhat

Chương trình dịch

Trường Đại học Dân lập Văn Lang - Nội san Khoa học & Đào tạo, số 5, 11/2005 NHÓM HỌC TẬP SÁNG TẠO THS. NGUYỄN HỮU TRÍ Trong bài viết này tôi muốn chia

PowerPoint Template

ĐẠI HỌC QUỐC GIA HÀ NỘICỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Độc lập - Tự do - Hạnh phúc DANH SÁCH SINH VIÊN ĐẠI HỌC HỆ CHÍNH QU

Phụ lục 1: Mẫu văn bản quản lý:

TRƯỜNG Đ CK Joel Murach lay Harris TÜ SACH BẢN QUYỄN FPT Polytechnic P H P v ä MySQL Murach's PHP and MySQL Khởi động nhanh với PHP & MySQL

ĐỀ CƯƠNG MÔN HỌC NHẬP MÔN TIN HỌC

Microsoft Word - Chương trình ĂÀo tạo - Website

CHƯƠNG TRÌNH ĐÀO TẠO BẬC ĐẠI HỌC NGÀNH VIỆT NAM HỌC - Tên chương trình: Chương trình đào tạo ngành Việt Nam học - Trình độ đào tạo: Đại học - Ngành đà

Đánh giá kết quả học tập ĐÁNH GIÁ KẾT QUẢ HỌC TẬP (CUNG CẤP THÔNG TIN VỀ SỰ TIẾN BỘ) Giới thiệu tóm tắt Đánh giá kết quả học tập là một quá trình ghi

Tool 1 Google Docs

000.Bia

MỞ ĐẦU

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ BÙI TRUNG HIẾU NGHIÊN CỨU MỘT SỐ VẤN ĐỀ VỀ CƠ SỞ DỮ LIỆU VÀ ỨNG DỤNG TRONG BÀI TOÁN QUẢN LÝ DÂN CƯ LU

HỌC VIỆN NÔNG NGHIỆP VIỆT NAM SỔ TAY SINH VIÊN (Dùng cho sinh viên khóa 63) Sinh viên : Mã sinh viên :..

ÑAÏI HOÏC QUOÁC GIA TP

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN PHÒNG THANH TRA PHÁP CHẾ - SỞ HỮU TRÍ TUỆ BẢNG SO SÁNH NỘI DUNG LUẬT GIÁO DỤC ĐẠI HỌC NĂM 2012 VÀ LUẬT SỬA ĐỔI, BỔ SU

(Microsoft Word - 8. Nguy?n Th? Phuong Hoa T\320_chu?n.doc)

0.00 Trang bia

Slide 1

BỘ CÔNG THƯƠNG TRƯỜNG CAO ĐẲNG CÔNG THƯƠNG THÀNH PHỐ HỒ CHÍ MINH SỔ TAY SINH VIÊN KHOA CÔNG NGHỆ THÔNG TIN NĂM 2016 Địa chỉ: 20 Tăng Nhơn Phú Phường P

TRUNG TÂM ĐÀO TẠO LẬP TRÌNH VIÊN QUỐC TẾ

HỘI NGHỊ NCKH KHOA SP TOÁN-TIN THÁNG 05/2015 GIẢI THUẬT DI TRUYỀN (GAs) VÀ CÁC ỨNG DỤNG ThS. Trần Kim Hương Khoa Sư phạm Toán-Tin, Trường Đại học Đồng

QUY CHẾ CÔNG BỐ THÔNG TIN CÔNG TY CỔ PHẦN ĐẠI LÝ GNVT XẾP DỠ TÂN CẢNG (Ban hành kèm theo Quyết định số: 192A/QĐ-HĐQT ngày 23 tháng 3 năm 2016 của Chủ

TRƯỜNG ĐẠI HỌC NGÂN HÀNG TP. HCM KHOA TÀI CHÍNH Mã môn học: FIN306 CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập Tự do Hạnh phúc TP. Hồ Chí Minh, ngày 18

Điện toán đám mây của Google và ứng dụng xây dựng hệ thống quản lý dịch vụ Đỗ Thị Phương Trường Đại học Quốc gia Hà Nội; Trường Đại học Công nghệ Chuy

Chào Khóa 22! Thay mặt cộng đồng Văn Lang, chào mừng các bạn đến với mái nhà Văn Lang. Các bạn đang cầm trên tay cuốn Cẩm nang Sinh viên Đâ

Chương trình dịch

BÁO CÁO ĐỊNH GIÁ DOANH NGHIỆP

CHƯƠNG TRÌNH ĐÀO TẠO

BAN TỔ CHỨC GS.TS. Nguyễn Đông Phong - Hiệu trưởng, Trưởng ban GS.TS. Nguyễn Trọng Hoài - Phó Hiệu trưởng, Phó Trưởng ban TS.Trần Mai Đông - Trưởng ph

Mẫu PL1a: TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH KHOA CÔNG NGHỆ ĐIỆN TỬ Bộ môn ĐIỆN TỬ-MÁY TÍNH DANH MỤC ĐỀ TÀI KHOÁ LUẬN TỐT NGHIỆP TT Họ v

TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP. HỒ CHÍ MINH KHOA NGOẠI NGỮ Ngành đào tạo: Sư phạm Anh văn Trình độ đào tạo: Đại học Chương trình đào tạo: Sư phạm

Microsoft Word - bai2.doc

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC MỞ TP. HỒ CHÍ MINH ĐỀ CƯƠNG MÔN HỌC 1. THÔNG TIN VỀ MÔN HỌC 1.1. Tên môn học: CÔNG NGHỆ PHẦN MỀM Mã MH: ITEC4409

Trường Đại học Văn Hiến TÀI LIỆU MÔN HỌC KỸ NĂNG MỀM (Lưu hành nội bộ) KỸ NĂNG GIẢI QUYẾT VẤN ĐỀ VÀ RA QUYẾT ĐỊNH Biên soạn: ThS. Nguyễn Đông Triều

Biên dịch & Hiệu đính: Phạm Trang Nhung #231 10/12/2014 LÝ QUANG DIỆU VIẾT VỀ CHIẾN LƯỢC THAO QUANG DƯỠNG HỐI CỦA TRUNG QUỐC Nguồn: Lee Kuan Yew (2013

Dien toan dam may.docx

PHẦN I

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LÝ LỊCH KHOA HỌC 1. THÔNG TIN CÁ NHÂN Họ và tên: Nguyễn Thị Hằng Ngày sinh: 10/

1 HƯỚNG DẪN TÌM VÀ ĐÁNH GIÁ THÔNG TIN TRÊN INTERNET I. Công cụ tìm tin trên Internet Công cụ tìm tin trên Internet được thiết kế để hỗ trợ người sử dụ

So tay luat su_Tap 3_ _file in.indd

ỨNG DỤNG INTERNET OF THINGS XÂY DỰNG NGÔI NHÀ THÔNG MINH APPLICATION OF INTERNET OF THINGS TO SMARTHOME NGUYỄN VĂN THẮNG (1), PHẠM TRUNG MINH (1), NGU

Microsoft Word - QCHV 2013_ChinhThuc_2.doc

Mau ban thao TCKHDHDL

TRƢỜNG ĐẠI HỌC NHA TRANG Khoa: Kinh tế Bộ môn: Quản trị Du lịch 1. Thông tin về học phần: ĐỀ CƢƠNG HỌC PHẦN Tên học phần: QUẢN TRỊ KINH DOANH HÃNG LỮ

Microsoft Word - SGV-Q4.doc

TRƯỜNG ĐẠI HỌC NGÂN HÀNG TP. HCM KHOA TÀI CHÍNH Mã môn học: BAF305 CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập Tự do Hạnh phúc TP. Hồ Chí Minh, ngày 16

UBND THÀNH PHỐ HÀ NỘI TRƯỜNG CAO ĐẲNG NGHỀ CÔNG NGHỆ CAO HÀ NỘI CỘNG HÕA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập- Tự do- Hạnh phúc CHƯƠNG TRÌNH DẠY NGHỀ (Ba

HỌC VIỆN KỸ THUẬT QUÂN SỰ

Microsoft Word - vietnam_vn.doc

LOVE

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LÝ LỊCH KHOA HỌC 1. THÔNG TIN CÁ NHÂN Họ và tên: Vũ Vinh Quang Ngày sinh: 26/09

Microsoft Word - CPJ_VNHRD.doc

Output file

Mẫu trình bày chương trình đào tạo theo tín chỉ

TRUNG TÂM KHUYẾT TẬT VÀ PHÁT TRIỂN Bản tin Tháng 05 năm 2018 LỜI NÓI ĐẦU Được thành lập vào 03/12/2005, dưới sự hỗ trợ ban đầu của Quỹ Ford, Trung tâm

ĐỀ CƯƠNG BÀI LUẬN VẦ DỰ ĐỊNH NGHIÊN CỨU

Microsoft Word - Done_reformatted_4C Communication Guidelines_v2.2_VIE.docx

Đại Học Y Dược Thành Phố Hồ Chí Minh Khoa Y Trung Tâm Huấn Luyện Nâng Cao Mô Phỏng Lâm Sàng SỔ TAY SINH VIÊN Tháng

HO C VIÊÊN CÔNG NGHÊÊ BƯU CHI NH VIÊ N THÔNG CƠ SƠ TA I TP HÔ CHI MINH KHOA CÔNG NGHÊÊ THÔNG TIN 2 CÔÊNG HO A XA HÔÊI CHU NGHI A VIÊÊT NAM Đô Êc lâ Êp

CHƯƠNG 1 : MỞ ĐẦU

Phong cách học tập BÁO CÁO CỦA Sample Report Phong cách học tập Bản đánh giá Phong cách học tập Của: Sample Report Ngày: 09/07/2019 Copyright

Nghiên cứu ứng dụng mạng nơtron nhân tạo hỗ trợ công tác chọn thầu thi công ở Việt Nam

ĐỀ CƯƠNG MÔN HỌC

000.FF50VI. Trang bia 1 - bia ngoai

BỘ VĂN HÓA, THỂ THAO VÀ DU LỊCH TRƯỜNG ĐẠI HỌC VĂN HÓA TP. HỒ CHÍ MINH & QUY CHẾ HỌC VỤ Tài liệu dành cho sinh viê

MỤC LỤC

Whitepaper | Gron Digital

SAIGON INSTITUTE OF TECHNOLOGY NĂM HỌC

Bản ghi:

KHOA CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG BỘ MÔN CÔNG NGHỆ PHẦN MỀM LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC K29 TIN HỌC Năm học 2007-2008 Mã số đề tài Tên đề tài Cán bộ hướng dẫn Số SV LVCNPM_2901 LVCNPM_2902 LVCNPM_2903 LVCNPM_2904 LVCNPM_2905 LVCNPM_2906 LVCNPM_2907 LVCNPM_2908 LVCNPM_2909 LVCNPM_2910 LVCNPM_2911 LVCNPM_2912 LVCNPM_2913 LVCNPM_2914 LVCNPM_2915 LVCNPM_2916 Xây dựng công cụ sinh ra các luật kết hợp với các ràng buộc Nâng cao hiệu quả của việc phân lớp các độ đo lợi ích với boosting và bagging Nghiên cứu các phương pháp kiểm thử phần mềm - Ứng dụng phần mềm Bugzilla để kiểm thử Xây dựng dịch vụ trao đổi tin nhắn tự động Đề nghị một giải thuật tìm cục bộ cho vấn đề xếp thời khóa biểu Phát triển một Search Engine Web trên tiếng Việt Xây dựng website cấp giấy chứng nhận sinh viên Hệ thống hỗ trợ bán hàng trên thiết bị di động Xây dựng hệ thống tự động thông báo trạm dừng xe buýt trong thành phố Cần Thơ Hệ thống GIS trợ giúp cho người dùng xe buýt trong phạm vi thành phố Cần Thơ Phát hiện sao chép tài liệu văn bản (tiếng Việt) với phương pháp Ferret Phát hiện sao chép tài liệu văn bản (tiếng Pháp) với phương pháp Ferret Phát hiện sao chép tài liệu văn bản (tiếng Việt) với kỹ thuật LSI Phát hiện sao chép tài liệu văn bản (tiếng Pháp) với kỹ thuật LSI Quản lí công tác tuyển sinh Đại học với DB2 Quản lí thư viện Khoa CNTT-ĐHCT với DB2 TS. Huỳnh Xuân Hiệp TS. Trần Cao Đệ KS. Nguyễn Thanh Bình TS. Huỳnh Xuân Hiệp TS. Phạm Thị Xuân Lộc TS. Nguyễn Thị Minh Luân Ths. Nguyễn Công Danh 1 Ths. Nguyễn Công Danh 1 Ths. Nguyễn Công Danh 1 Ths. Phan Phương Lan 1 Ths. Nguyễn Văn Linh KS. trần Minh Tân KS. Lâm Hoài Bảo 1 TS. Trần Cao Đệ 2 TS. Trần Cao Đệ 1 TS. Trần Cao Đệ 1 TS. Trần Cao Đệ 1 TS. Trần Cao Đệ 1 TS. Trần Cao Đệ 1 TS. Trần Cao Đệ 1 TS. Trần Cao Đệ 1 2 2 1 1

LVCNPM_2901 1. Tên đề tài: XÂY DỰNG CÔNG CỤ SINH RA CÁC LUẬT KẾT HỢP VỚI CÁC RÀNG BUỘC. 2. Loại đề tài: Khai phá dữ liệu, làm việc theo nhóm. 3. Giáo viên hướng dẫn: TS. Huỳnh Xuân Hiệp, TS. Trần Cao Đệ, KS. Nguyễn Thanh Bình. 4. Số lượng sinh viên tham gia: 2 sinh viên. 5. Yêu cầu của đề tài: Tóm tắt bài toán, khả năng ứng dụng. Apriori là giải thuật thông dụng trong chuyên ngành khai phá dữ liệu (data mining hay còn được gọi là knowledge discovery from databases) [7][6][2] để tạo ra các luật kết hợp (association rules) [1][3][4]. Việc tạo ra các luật được tiến hành thông qua hai giai đoạn: xây dựng các tập ứng viên và sinh luật. Trong quá trình sinh luật thì một số ràng buộc [5] có thể được định nghĩa theo một số tiêu chí để tập trung vào một số luật được quan tâm [5][10]. Ngoài ra đề tài cũng tiến hành khảo sát phương pháp FP-tree [8] để sinh ra trực tiếp các luật mà không cần xây dựng tập các ứng viên. Mục tiêu của đề tài là nhằm xây dựng hai phân hệ sinh luật theo các hướng xây dựng các tập ứng viên và không xây dựng các tập ứng viên. Sau đó sẽ tiến hành xây dựng một số ràng buộc cài đặt trực tiếp vào quá trình sinh luật. Các phân hệ này sẽ được tích hợp vào công cụ ARQAT [9]. Về lí thuyết cần nghiên cứu: Khai phá dữ liệu Ngôn ngữ cài đặt: Java. 6. Tài liệu tham khảo: [1] R. Agrawal, T. Imielinski and A. Swami. Mining association rules between sets of items in large databases. Proceedings of 1993 ACM-SIGMOD International Conference on Management of Data. 207-216, 1993. [2] R. Agrawal, T. Imielinski and A. Swami. Database Mining: A Performance Perspective. IEEE Transactions on Knowledge and Data Engineering 5(6). 914-925, 1993. [3] R. Agrawal and R. Srikant. Fast algorithms for mining association rules. VLDB'94, Proceedings of 20th International Conference on Very Large Data Bases. 487-499.1994. [4] R. Agrawal, H. Mannila, R. Srikant, H. Toivonen and A. I. Verkamo. Fast discovery of association rules. Advances in Knowledge Discovery and Data Mining. 307-328, 1996. [5] R. J. Jr. Bayardo and Rakesh Agrawal. Mining the most interestingness rules. KDD'99, Proceedings of the 5th ACM SIGKDD International Confeference on Knowledge Discovery and Data Mining. 145-154, 1999. [6] U. M. Fayyad, G. Piatetsky-Shapiro and P. Smyth. From data mining to knowledge discovery. Advances in Knowledge Discovery and Data Mining. 1-34, 1996. [7] W. J. Frawley, G. Piatetsky-Shapiro and C. J. Matheus. Knowledge discovery in databases: an overview. Knowledge Discovery in Databases. 1-27, 1991. [8] J. Han, J. Pei, Y. Yin and R. Mao. Mining frequent patterns without candidate generation: a frequent-pattern tree approach. Data Mining and Knowledge Discovery (8). 53-87, 2004. [9] H. X. Huynh, F. Guillet and H. Briand. ARQAT: an exploratory analysis tool for interestingness measures. ASMDA'05, Proceedings of the 11th International Symposium on Applied Stochastic Models and Data Analysis. 334-344, 2005. 2

[10] G. Piatetsky-Shapiro. Discovery, analysis, and presentation of strong rules. Knowledge Discovery in Databases (In G. Piatesky-Shapiro and W. Frawley editors). 229-248, 1991. 3

LVCNPM_2902 1. Tên đề tài: NÂNG CAO HIỆU QUẢ CỦA VIỆC PHÂN LỚP CÁC ĐỘ ĐO LỢI ÍCH VỚI BOOSTING VÀ BAGGING. 2. Loại đề tài: Khai phá dữ liệu, làm việc theo nhóm. 3. Giáo viên hướng dẫn: TS. Huỳnh Xuân Hiệp, TS. Phạm Thị Xuân Lộc, TS. Nguyễn Thị Minh Luân. 4. Số lượng sinh viên tham gia: 2 sinh viên. 5. Yêu cầu của đề tài: Tóm tắt bài toán, khả năng ứng dụng. Phân lớp (clustering) [8] các độ đo lợi ích (interestingness measures) [9][10] là một vấn đề thu hút được sự quan tâm của nhiều nhà nghiên cứu trong lĩnh vực khai phá dữ liệu [4][3] trong thời gian gần đây. Việc phân lớp được tiến hành thông qua việc phân tích các tính chất của các độ đo hoặc thông qua việc tiến hành tính toán hệ số tương quan giữa các độ đo lợi ích [10][9][7]. Kết quả của các nghiên cứu này phụ thuộc nhiều vào bản chất của dữ liệu và độ đo lợi ích. Boosting [5] và bagging [2] là hai trong số những tiếp cận gần đây cho phép nâng cao độ chính xác của các giải thuật mang tính chất dự đoán. Vì thế, mục tiêu của đề tài xây dựng hai phân hệ nhằm nâng cao tính chính xác của tiếp cận phân lớp các độ đo lợi ích bằng kỹ thuật đồ thị, với các khảo sát trên các tập luật kết hợp [1] có kích thước lớn. Các phân hệ này sẽ được tích hợp vào công cụ ARQAT [6]. Về lí thuyết cần nghiên cứu: Khai phá dữ liệu Ngôn ngữ cài đặt: Java. 6. Tài liệu tham khảo: [1] R. Agrawal, H. Mannila, R. Srikant, H. Toivonen and A. I. Verkamo. Fast discovery of association rules. Advances in Knowledge Discovery and Data Mining. 307-328, 1996. [2] L. Breiman. Bagging predictors. Machine Learning (24). 123-140, 1996. [3] U. M. Fayyad, G. Piatetsky-Shapiro and P. Smyth. From data mining to knowledge discovery. Advances in Knowledge Discovery and Data Mining. 1-34, 1996. [4] W. J. Frawley, G. Piatetsky-Shapiro and C. J. Matheus. Knowledge discovery in databases: an overview. Knowledge Discovery in Databases. 1-27, 1991. [5] Y. Freund and R. E. Schapire. A short introduction to boosting. Journal of Japanese Society for Artificial Intelligence, 14(5). 771-780, 1999. (In Japanese, translation by Naoki Abe.). [6] H. X. Huynh, F. Guillet and H. Briand. ARQAT: an exploratory analysis tool for interestingness measures. ASMDA'05, Proceedings of the 11th International Symposium on Applied Stochastic Models and Data Analysis. 334-344, 2005. [7] H. X. Huynh, F. Guillet and H. Briand. A graph-based approach for comparing interestingness measures. IEEE ICEIS'06, Proceedings of the First IEEE International Conference on Engineering of Intelligent Systems. 375-380, 2006. [8] K. Jain, M. N. Murty and P.J. Flyn. Data clustering: a review. ACM Computing Surveys 31(3). 264-323, 1999. [9] G. Piatetsky-Shapiro. Discovery, analysis, and presentation of strong rules. Knowledge Discovery in Databases, In G. Piatesky-Shapiro and W. Frawley (editors). 229-248, 1991. [10] Silberschatz and A. Tuzhilin. What makes patterns interesting in knowledge discovery systems. IEEE Transactions on Knowledge and Data Engineering 5(6). 970-974, 1996. 4

LVCNPM_2903 1. Tên đề tài: NGHIÊN CỨU CÁC PHƯƠNG PHÁP KIỂM THỬ PHẦN MỀM - ỨNG DỤNG PHẦN MỀM BUGZILLA ĐỂ KIỂM THỬ. 2. Loại đề tài: Công nghệ phần mềm. 3. Giáo viên hướng dẫn: Ths. Nguyễn Công Danh. 4. Số lượng sinh viên tham gia: 1 sinh viên. Tóm tắt bài toán, khả năng ứng dụng. Xây dựng một hệ thống trao đổi tin nhắn tự động cho những người liên quan, cụ thể là cho hệ thống quản lý việc dạy học, ra đề, và xem thi. Dữ liệu về giảng dạy, ra đề, và xem thi của các cán bộ được lưu trong một cơ sở dữ liệu (được cập nhật bởi người quản lý). Chương trình Message Server lấy dữ liệu từ cơ sở dữ liệu trên và tự động gởi tin nhắn có liên quan tới Message Client của mỗi cán bộ. Chú ý là mỗi cán bộ chỉ nhận được các tin nhắn liên quan đến mình. Về lí thuyết cần nghiên cứu: Kiến thức về công nghệ phần mềm, kiểm thử. Ngôn ngữ cài đặt: Một ứng dụng trên nền web hay application được viết theo ngôn ngữ tùy ý trên nền Windows hoặc Linux. Cài đặt và sử dụng Bugzilla trên nền Linux. 6. Tài liệu tham khảo. [1] The Bugzialla Team. The Bugzilla Guide 3.0 Release. Tham khao khảo tại địa chỉ: http:// www.bugzilla.org/docs/ vào ngày 20/07/2007. [2] Manfred Ratzmann và Clinton De Young, Software Testing and Internationalization, Galileo Computing, 2003. 5

LVCNPM_2904 1. Tên đề tài: XÂY DỰNG DỊCH VỤ TRAO ĐỔI TIN NHẮN TỰ ĐỘNG. 2. Loại đề tài: Lập trình mạng, cơ sở dữ liệu. 3. Giáo viên hướng dẫn: Ths. Nguyễn Công Danh. 4. Số lượng sinh viên tham gia: 1 sinh viên. Tóm tắt bài toán, khả năng ứng dụng. Xây dựng một hệ thống trao đổi tin nhắn tự động cho những người liên quan, cụ thể là cho hệ thống quản lý việc dạy học, ra đề, và xem thi. Dữ liệu về giảng dạy, ra đề, và xem thi của các cán bộ được lưu trong một cơ sở dữ liệu (được cập nhật bởi người quản lý). Chương trình Message Server lấy dữ liệu từ cơ sở dữ liệu trên và tự động gởi tin nhắn có liên quan tới Message Client của mỗi cán bộ. Chú ý là mỗi cán bộ chỉ nhận được các tin nhắn liên quan đến mình. Về lí thuyết cần nghiên cứu: Kiến thức về thiết kế hệ thống và xây dựng cở sở dữ liệu, chiến lược gởi tin nhắn được hỗ trợ trong Java. Ngôn ngữ cài đặt: Lập trình Java. Cơ sở dữ liệu tùy ý, nên dùng một Open Source Database. 6. Tài liệu tham khảo. [1] Richard Monson-Haefel & David Chappell, Java Message Service, O reilly. 2/2000. [2] Eric Armstrong et al. The J2EE 1.4 Tutorial, Sun Microsystems, 7/2005. [3] Developing EAServer messaging service applications. Tham khao khảo tại địa chỉ: https://ssa.usyd.edu.au/docs/easpg/easpg183.htm vào ngày ngày 20/07/2007. 6

LVCNPM_2905 1. Tên đề tài: ĐỀ NGHỊ MỘT GIẢI THUẬT TÌM CỤC BỘ CHO VẤN ĐỀ XẾP THỜI KHÓA BIỂU. 2. Loại đề tài: Nghiên cứu giải thuật, cơ sở dữ liệu và phân tích hệ thống. 3. Giáo viên hướng dẫn: Ths. Nguyễn Công Danh. 4. Số lượng sinh viên tham gia: 1 sinh viên. Tóm tắt bài toán, khả năng ứng dụng. Đề nghị một giải thuật tìm cục bộ cho vấn đề xếp thời khóa biểu cho một khoa của đại học Dựa trên dữ liệu về giảng dạy của giảng viên, đăng ký học của sinh viên, và cơ sở vật chất của 1 khoa để xếp thời khóa biểu học kỳ. Thời khóa biểu kết quả tránh đụng độ về thời gian dạy và học. Tránh đụng độ về thời gian cho các phòng học (hoặc hạn chế đến mức thấp nhất). Về lí thuyết cần nghiên cứu: Tìm hiểu các nghiên cứu khác về vấn đề xếp thời khóa biểu, đề nghị một giải thuật xếp lịch có thể là Tabu Search hay Simulated Annealing, hay một giải thuật khác, thiết kế hệ thống và cơ sở dữ liệu Ngôn ngữ cài đặt: Tùy ý Cơ sở dữ liệu tùy ý, nên dùng một Open Source Database. 6. Tài liệu tham khảo. [1] Hakan Yildiz at al, Simulated Annealing & Applications to Scheduling Problems, Bilkent Universit y, 1/2000. [2] Graham Kendall, Simulated Annealing, được truy tìm ở trang http://www.cs.nott.ac.uk/~gxk/aim/notes/simulatedannealing.doc vào ngày 31/07/2007 7

LVCNPM_2906 1. Tên đề tài: PHÁT TRIỂN MỘT SEARCH ENGINE WEB TRÊN TIẾNG VIỆT 2. Loại đề tài: Truy vấn thông tin. 3. Giáo viên hướng dẫn: Ths. Phan Phương Lan. 4. Số lượng sinh viên tham gia: 1 sinh viên. Tóm tắt bài toán, khả năng ứng dụng. Mục tiêu của đề tài là phát triển một search engine có khả năng tìm kiếm các tài liệu web được viết bằng tiếng Việt. Các search engine đều có các hoạt động: thu thập thông tin, lập chỉ mục trên thông tin, truy tìm và sắp xếp kết quả trả về cho người truy vấn. Giao diện cho phép người sử dụng truy vấn thông tin là một giao diện web gồm hai phần: đơn giản và nâng cao. Người sử dụng có thể tìm kiếm có thể tìm kiếm thông tin ở dạng in hoa, in thường hay không phân biệt; có thể tìm kiếm: một cụm từ, nhiều cụm từ bằng cách sử dụng các toán tử AND, OR, v.v, sử dụng từ khóa để lọc tìm kiếm, v.v. Hiện nay, các tài liệu tiếng Việt ở rất nhiều dạng bảng mã khác nhau. Đây cũng là một vấn đề mà đề tài cần quan tâm để kết quả tìm kiếm phong phú. Sinh viên không cần tự viết từ đầu tất cả các phần của một search engine; có thể sử dụng các giải pháp có sẵn nhưng cần phải giải thích tại sao chọn giải pháp đó bằng cách so sánh, đánh giá các khả năng. Về lí thuyết cần nghiên cứu: Kiến thức về truy vấn thông tin. Ngôn ngữ cài đặt: Ngôn ngữ lập trình tùy ý (khuyến khích sử dụng Java). 6. Tài liệu tham khảo. [1] Google, www. google.com [2] AltaVista, www.altavista.com [3] Yahoo, www.yahoo.com [4] VinaSeek, www.vinaseek.com [5] NetNam, www.pan.vietnam.com [6] Paolo Boldi and Sebastiano Vigna. The WebGraph framework I: Compression techniques. In Proc. of the Thirteenth International World Wide Web Conference, pages 595 601, Manhattan, USA, 2004. ACM Press. [7] Taher Haveliwala. Efficient computation of PageRank. Technical report, Stanford University Technical Report, October 1999. [8] T. Westerveld, W. Kraaij, and D. Hiemstra. Retrieving web pages using content, links, URLs and anchors. In Proceedings of the Tenth Text Retrieval Conference (TREC-10), 2001. 8

LVCNPM_2907 1. Tên đề tài: XÂY DỰNG WEBSITE CẤP GIẤY CHỨNG NHẬN SINH VIÊN. 2. Loại đề tài: Lập trình web 3. Giáo viên hướng dẫn: Ths. Nguyễn Văn Linh; KS. Trần Minh Tân. 4. Số lượng sinh viên tham gia: 1 sinh viên. Tóm tắt bài toán, khả năng ứng dụng. Hiện nay sinh viên thường phải đến văn phòng khoa để xin các loại giấy chứng nhận như: Giấy xác nhận là sinh viên của trường, giấy xác nhận đã hoàn thành chương trình đào tạo, giấy chứng nhận tốt nghiệp tạm thời,... Các hồ sơ này phải được kiểm tra bởi trợ lí quản lí sinh viên, thư kí trình Trưởng khoa kí và sau đó sinh viên mang tới phòng Kế hoạch tổng hợp để được đóng dấu. Do thầy Trưởng khoa bận công tác nên không phải lúc nào cũng có mặt ở khoa để đáp ứng kịp thời yêu cầu của sinh viên. Điều này có thể gây phiền hà cho sinh viên vì phải đi lại văn phòng khoa nhiều lần. Để giải quyết vấn đề nói trên, chúng ta xây dựng một website chứa các mẫu giấy tờ, cơ sở dữ liệu sinh viên. Khi sinh viên có yêu cầu về một giấy chứng nhận nào đó, sinh viên tự điền thông tin vào mẫu giấy tờ và gửi cho hệ thống, hệ thống sẽ kiểm tra và nếu hợp lệ sẽ báo cho trợ lí để in giấy chứng nhận này và trình trưởng khoa kí. Sau khi trưởng khoa kí xong, trợ lí sử dụng hệ thống để thông báo cho sinh viên đến văn phòng khoa nhận. Với quy trình mới này thì sinh viên chỉ phải đến văn phòng khoa một lần duy nhất. Về lí thuyết cần nghiên cứu: MySQL, PHP hoặc các công nghệ tương đương. Về thực tiễn cần tìm hiểu tất cả các loại giấy tờ mà sinh viên cần xác nhận, quy trình hiện hành thực hiện công việc này. Về công nghệ cần sử dụng: MySQL, PHP hoặc các công nghệ tương đương. Về yêu cầu bổ sung: Tái sử dụng được cơ sở dữ liệu sinh viên hiện có của trường. 6. Tài liệu tham khảo. [1] Các tài liệu liên quan đến các yêu cầu nói trên 9

LVCNPM_2908 1. Tên đề tài: HỆ THỐNG HỖ TRỢ BÁN HÀNG TRÊN THIẾT BỊ DI ĐỘNG. 2. Loại đề tài: Lập trình trên thiết bị di động 3. Giáo viên hướng dẫn: KS. Lâm Hoài Bảo. 4. Số lượng sinh viên tham gia: 1 sinh viên. Tóm tắt bài toán, khả năng ứng dụng. Ngày nay, thiết bị di động (PDA, Pocket PC ) ngày càng phổ biến; chúng được ứng dụng trong nhiều mặt của đời sống xã hội. Một trong những ứng dụng của chúng là hỗ trợ cho việc bán hàng ở các đại lý của một công ty cụ thể. Thị trường bán hàng của một công ty được chia thành một số khu vực (chẳng hạn: miền Trung, miền Nam, miền Bắc ); mỗi khu vực do một người quản lý. Mỗi khu vực lại có một số đại lý thuộc khu vực đó. Vấn đề là: mỗi đại lý có đội ngũ bán hàng riêng; hằng ngày đội ngũ bán hàng này cần phải giao hàng cho các điểm bán hàng của mình. Mỗi lần giao hàng như vậy, người bán hàng cần ghi nhận lại mỗi mặt hàng đã giao có số lượng là bao nhiêu? Giả sử mỗi người bán hàng có một thiết bị di động (PDA, Pocket PC ); khi giao hàng cho một điểm bán hàng, anh (chị) ta chỉ cần cập nhật lên CSDL chung nhờ thiết bị di động của mình. Cuối ngày, cuối tháng hay cuối quý; người ta có thể: thống kê doanh số theo từng người bán hàng, doanh số theo khu vực, doanh số của toàn công ty Về lí thuyết cần nghiên cứu: Phân tích, thiết kế hệ thống. Ngôn ngữ lập trình: Lập trình.net hoặc Java trên các thiết bị di động; Hệ quản trị cơ sở dữ liệu: MySQL hoặc SQL Server, v.v. 6. Tài liệu tham khảo. [1] Giáo trình phân tích hệ thống hướng đối tượng. [2] MSDN. [3] Các tài liệu về lập trình trên các thiết bị di động. 10

LVCNPM_2909 1. Tên đề tài: XÂY DỰNG HỆ THỐNG TỰ ĐỘNG THÔNG BÁO TRẠM DỪNG XE BUÝT TRONG THÀNH PHỐ CẦN THƠ. 2. Loại đề tài: Công nghệ phần mềm 3. Giáo viên hướng dẫn: TS. Trần Cao Đệ. 4. Số lượng sinh viên tham gia: Thực hiện theo nhóm 2 sinh viên (Trần Văn Thành, Tăng Phú Khoa). Mục tiêu: Dùng thiết bị GPS để xác định tọa độ hiện tại của xe buýt. Khi xe buýt chạy gần tới một trạm dừng thì máy sẽ tự động phát một message ghi sẳn. Ví dụ Trạm kế tiếp là trạm cầu số 2, hành khách xuống trạm này có thể ghé vào Khu II-ĐHCT hoặc các tòa soạn báo trên đường Trần Văn Hoài Cách tiếp cận giải quyết vấn đề: Xây dựng bản đồ hệ thống xe buýt của thành phố có độ chính xác theo GPS. Dùng thiết bị GPS thu tọa độ thực của xe buýt. Tùy theo tọa độ và hướng di chuyển, lựa chọn Message và phát ra loa. Yêu cầu của đề tài Hoàn tất Demo chương trình trước 15/10 để tham gia thi TTVN. Hoàn chỉnh về mặt khoa học cho LVTN. 6. Tài liệu tham khảo: liên hệ GVHD. 11

LVCNPM_2910 1. Tên đề tài: HỆ THỐNG GIS TRỢ GIÚP CHO NGƯỜI DÙNG XE BUÝT TRONG PHẠM VI THÀNH PHỐ CẦN THƠ. 2. Loại đề tài: Công nghệ phần mềm 3. Giáo viên hướng dẫn: TS. Trần Cao Đệ. 4. Số lượng sinh viên tham gia: 1 sinh viên (Nguyễn Chí Cường). Mục tiêu: Xây dựng một hệ thống thông tin địa lý (GIS) trợ giúp cho người dùng xe buýt trong phạm vi thành phố. Một người muốn đi từ điểm A đến điểm B trong thành phố đều được chỉ dẫn 1 cách đi xe buýt hiệu quả nhất (chuyển ít tuyến nhất). Hiện tại hệ thống xe buýt của thành phố Cần Thơ chưa phủ khắp thành phố, vì vậy các điểm A và B có thể không nằm trên một tuyến xe buýt nào. Nếu một vị trí nằm quá xa tuyến xe buýt thì hệ thống không trợ giúp. Nếu vị trí nằm trong phạm vi khoảng 10 phút đi bộ (<=1km) thì hệ thống sẽ chỉ dẫn cho hành khách cách đi đến trạm xe buýt thích hợp, tuyến xe và hướng đi, nơi xuống (chuyển xe buýt), để đến đích. Cách tiếp cận giải quyết vấn đề: Xây dựng bản đồ giao thông (tất cả các đường có tên) & bản đồ hệ thống xe buýt của thành phố. Xây dựng ứng dụng dẫn đường đi: tìm điểm truy cập vào tuyến xe buýt (trạm lên), hướng đi, các trạm chuyển, nơi đổi tuyến, giá tiền xe, Yêu cầu Xây dựng ứng dụng Web: hiển thị bản đồ, tìm đường đi. Cài đặt ứng dụng lên PDA, Tích hợp ứng dụng vào đề tài LVCNPM_2909. 6. Tài liệu tham khảo: liên hệ GVHD. 12

LVCNPM_2911 1. Tên đề tài: PHÁT HIỆN SAO CHÉP TÀI LIỆU VĂN BẢN (TIẾNG VIỆT) VỚI PHƯƠNG PHÁP FERRET. 2. Loại đề tài: Công nghệ phần mềm 3. Giáo viên hướng dẫn: TS. Trần Cao Đệ. 4. Số lượng sinh viên tham gia: 1 sinh viên. Mục tiêu: Kiểm tra và phát hiện việc sao chép (copy) tài liệu trong một tập hợp tài liệu thu thập trước (ví dụ thư viện các luận văn, đồ án). Một tài liệu kiểm tra (ví dụ một luận văn) được đưa vào hệ thống, hệ thống sẽ rà soát tài liệu này trong thư viện để xác định có sao chép hay không và mức độ sao chép là bao nhiêu. Cách tiếp cận: Mô hình hóa thư viện: Thư viện là một tập các tài liệu (documents); mỗi tài liệu được chia thành đoạn (paragraph), mỗi đoạn có nhiều câu (sentence); mỗi câu được chia thành cụm 3 từ (trigram). Mô hình hóa tài liệu kiểm tra: tương tự như trên. Đo độ tương tự của hai văn bản: dựa trên đo độ tương tự của hai đoạn. Giả sử đoạn văn bản A là của tài liệu kiểm tra, B là đoạn văn bản của một tài liệu trong thư viện. S(A) và S(B) là tập hợp các trigram của A và B tương ứng. Độ tương tự là S(A) S(B)/S(A) U S(B). Nếu độ tương tự của hai đoạn vượt ngưỡng α nào đó thì kết luận là đoạn văn bản được sao chép. Nếu tỉ lệ các đoạn văn bản được sao chép vượt một ngưỡng β nào đó thì kết luận là văn bản có sao chép. Yêu cầu của đề tài Viết module hỗ trợ sưu tập các tài liệu làm thư viện (khoảng 100 tài liệu, 10000 đoạn). Mô hình hóa thư viện CSDL. Đo độ tương tự để kết luận sao chép với thời gian xử lí là chấp nhận được. 6. Tài liệu tham khảo: liên hệ GVHD. 13

LVCNPM_2912 1. Tên đề tài: PHÁT HIỆN SAO CHÉP TÀI LIỆU VĂN BẢN (TIẾNG PHÁP) VỚI PHƯƠNG PHÁP FERRET. 2. Loại đề tài: Công nghệ phần mềm 3. Giáo viên hướng dẫn: TS. Trần Cao Đệ. 4. Số lượng sinh viên tham gia: 1 sinh viên francophone. Mục tiêu: Kiểm tra và phát hiện việc sao chép (copy) tài liệu trong một tập hợp tài liệu thu thập trước (ví dụ thư viện các luận văn, đồ án). Một tài liệu kiểm tra (ví dụ một luận văn) được đưa vào hệ thống, hệ thống sẽ rà soát tài liệu này trong thư viện để xác định có sao chép hay không và mức độ sao chép là bao nhiêu. Cách tiếp cận: Mô hình hóa thư viện: Thư viện là một tập các tài liệu (documents); mỗi tài liệu được chia thành đoạn (paragraph), mỗi đoạn có nhiều câu (sentence); mỗi câu được chia thành cụm 3 từ (trigram). Mô hình hóa tài liệu kiểm tra: tương tự như trên. Đo độ tương tự của hai văn bản: dựa trên đo độ tương tự của hai đoạn. Giả sử đoạn văn bản A là của tài liệu kiểm tra, B là đoạn văn bản của một tài liệu trong thư viện. S(A) và S(B) là tập hợp các trigram của A và B tương ứng. Độ tương tự là S(A) S(B)/S(A) U S(B). Nếu độ tương tự của hai đoạn vượt ngưỡng α nào đó thì kết luận là đoạn văn bản được sao chép. Nếu tỉ lệ các đoạn văn bản được sao chép vượt một ngưỡng β nào đó thì kết luận là văn bản có sao chép. Yêu cầu của đề tài Viết module hỗ trợ sưu tập các tài liệu làm thư viện (khoảng 100 tài liệu, 10000 đoạn). Mô hình hóa thư viện CSDL. Đo độ tương tự để kết luận sao chép với thời gian xử lí là chấp nhận được. 6. Tài liệu tham khảo: liên hệ GVHD. 14

LVCNPM_2913 1. Tên đề tài: PHÁT HIỆN SAO CHÉP TÀI LIỆU VĂN BẢN VỚI KỸ THUẬT LSI. 2. Loại đề tài: Công nghệ phần mềm 3. Giáo viên hướng dẫn: TS. Trần Cao Đệ. 4. Số lượng sinh viên tham gia: 1 sinh viên (giỏi giải thuật & thống kê). Mục tiêu: Kiểm tra và phát hiện việc sao chép (copy) tài liệu trong một tập hợp tài liệu thu thập trước (ví dụ thư viện các luận văn, đồ án). Một tài liệu kiểm tra (ví dụ một luận văn) được đưa vào hệ thống, hệ thống sẽ rà soát tài liệu này trong thư viện để xác định có sao chép hay không và mức độ sao chép là bao nhiêu. Việc rà soát là dựa trên ngữ nghĩa chứ không phải Text như trong đề tài 3. Cách tiếp cận: Mô hình hóa thư viện: Thư viện là một tập các tài liệu (documents); mỗi tài liệu được chia thành đoạn (paragraph), mỗi đoạn có nhiều câu (sentence). Mô hình hóa có thể đến câ hoặc đoạn. Mỗi câu/đoạn là một vector theo từ, cả thư viện là một không gian vector. Ví dụ thư viện có 3 văn bản D1, D2, D3 D1: a b c. c b d. D2: a c e f. e b. D3: e c b d. a d c. e f Mô hình hóa theo câu, thì không gian vector gồm 7 vector: s1 s2 s3 s4 s5 s6 s7 A 1 0 1 0 0 1 0 B 1 1 0 1 1 0 0 C 1 1 1 0 1 1 0 D 0 1 0 0 1 1 0 E 0 0 1 1 1 0 1 F 0 0 1 0 0 0 1 Mô hình hóa tài liệu kiểm tra: tương tự như trên, tài liệu kiểm tra chia thành các câu/đoạn, mỗi câu đoạn là một vector theo từ. Kỹ thuật LSI cho phép phân tích ma trận (của Không gian vector) Amxn = U VT Đo độ tương tự của hai văn bản: dựa trên đo độ tương tự của hai đoạn theo kỹ thuật LSI: o Cắt theo kỹ thuật LSI: A k = U k k V k T o Đo độ tương tự ngữ nghĩa của hai câu/đoạn bằng cách tính cosin của hai vector trong không gian xác định bởi A k. Yêu cầu của đề tài Viết module hỗ trợ sưu tập các tài liệu làm thư viện (khoảng 100 tài liệu, 10000 đoạn) Mô hình hóa thư viện CSDL Đo độ tương tự để kết luận sao chép với thời gian xử lí là chấp nhận được Kết quả đạt được: o Cài đặt một phần mềm xác định sao chép với kỹ thuật LSI o Phân tích độ chính xác của phần mềm. 6. Tài liệu tham khảo: liên hệ GVHD. 15

LVCNPM_2914 1. Tên đề tài: PHÁT HIỆN SAO CHÉP TÀI LIỆU VĂN BẢN (TIẾNG PHÁP) VỚI KỸ THUẬT LSI. 2. Loại đề tài: Công nghệ phần mềm 3. Giáo viên hướng dẫn: TS. Trần Cao Đệ. 4. Số lượng sinh viên tham gia: 1 sinh viên francophone (giỏi giải thuật & thống kê). Mục tiêu: Kiểm tra và phát hiện việc sao chép (copy) tài liệu trong một tập hợp tài liệu thu thập trước (ví dụ thư viện các luận văn, đồ án). Một tài liệu kiểm tra (ví dụ một luận văn) được đưa vào hệ thống, hệ thống sẽ rà soát tài liệu này trong thư viện để xác định có sao chép hay không và mức độ sao chép là bao nhiêu. Việc rà soát là dựa trên ngữ nghĩa chứ không phải Text như trong đề tài 3. Cách tiếp cận: Mô hình hóa thư viện: Thư viện là một tập các tài liệu (documents); mỗi tài liệu được chia thành đoạn (paragraph), mỗi đoạn có nhiều câu (sentence). Mô hình hóa có thể đến câ hoặc đoạn. Mỗi câu/đoạn là một vector theo từ, cả thư viện là một không gian vector. Ví dụ thư viện có 3 văn bản D1, D2, D3 D1: a b c. c b d. D2: a c e f. e b. D3: e c b d. a d c. e f Mô hình hóa theo câu, thì không gian vector gồm 7 vector: s1 s2 s3 s4 s5 s6 s7 A 1 0 1 0 0 1 0 B 1 1 0 1 1 0 0 C 1 1 1 0 1 1 0 D 0 1 0 0 1 1 0 E 0 0 1 1 1 0 1 F 0 0 1 0 0 0 1 Mô hình hóa tài liệu kiểm tra: tương tự như trên, tài liệu kiểm tra chia thành các câu/đoạn, mỗi câu đoạn là một vector theo từ. Kỹ thuật LSI cho phép phân tích ma trận (của Không gian vector) Amxn = U VT Đo độ tương tự của hai văn bản: dựa trên đo độ tương tự của hai đoạn theo kỹ thuật LSI: o Cắt theo kỹ thuật LSI: A k = U k k V k T o Đo độ tương tự ngữ nghĩa của hai câu/đoạn bằng cách tính cosin của hai vector trong không gian xác định bởi A k. Yêu cầu của đề tài Viết module hỗ trợ sưu tập các tài liệu làm thư viện (khoảng 100 tài liệu, 10000 đoạn). Mô hình hóa thư viện CSDL. Đo độ tương tự để kết luận sao chép với thời gian xử lí là chấp nhận được. Kết quả đạt được: o Cài đặt một phần mềm xác định sao chép với kỹ thuật LSI. o Phân tích độ chính xác của phần mềm. 6. Tài liệu tham khảo: liên hệ GVHD. 16

LVCNPM_2915 1. Tên đề tài: QUẢN LÝ CÔNG TÁC TUYỂN SINH ĐẠI HỌC VỚI DB2. 2. Loại đề tài: Công nghệ phần mềm 3. Giáo viên hướng dẫn: TS. Trần Cao Đệ. 4. Số lượng sinh viên tham gia: 1 sinh viên khá giỏi tiếng Anh. Mục tiêu: Mục đích chính của đề tài là tìm hiểu công nghệ DB2 của IBM. Áp dụng công nghệ vào bài toán quản lí công tác tuyển sinh Đại học. Yêu cầu của đề tài Tìm hiểu DB2, trình bày báo cáo kỹ thuật về DB2 (cùng kết hợp với SV trong đề tài LVCNPM_2916). Tìm hiểu công tác quản lí tuyển sinh ĐH, phân tích hệ thống. Viết ứng dụng quản li tuyển sinh trong đó CSDL được quản lí với DB2. Ứng dụng được phát triển trong môi trường của công nghệ IBM (DB2, Eclipse, ) o Quản lí từ xa trên mạng, môi trường nhiều người dùng (ứng dụng web). o Web tra cứu thông tin tuyển sinh (ngành, khối, điểm chuẩn, chỉ tiêu, tỉ lệ chọi ), tra cứu điểm thi. Quyền lợi đặc biệt: Có thể có hỗ trợ tài chính của IBM-VN là cơ hội làm việc cho IBM- VN. 6. Tài liệu tham khảo: liên hệ GVHD. 17

LVCNPM_2916 1. Tên đề tài: QUẢN LÝ THƯ VIỆN KHOA CNTT-ĐHCT với DB2. 2. Loại đề tài: Công nghệ phần mềm 3. Giáo viên hướng dẫn: TS. Trần Cao Đệ. 4. Số lượng sinh viên tham gia: 1 sinh viên khá giỏi tiếng Anh. Mục tiêu: Mục đích chính của đề tài là tìm hiểu công nghệ DB2 của IBM. Áp dụng công nghệ vào bài toán quản lí thư viện khoa. Yêu cầu của đề tài: Tìm hiểu DB2, trình bày báo cáo kỹ thuật về DB2 (cùng kết hợp với SV trong đề tài LVCNPM_2915). Tìm hiểu công tác quản lí thư viện, phân tích hệ thống. Viết ứng dụng quản li thư viện trong đó CSDL được quản lí với DB2. Ứng dụng được phát triển trong môi trường của công nghệ IBM (DB2, Eclipse, ) o Quản lí từ xa trên mạng, môi trường nhiều người dùng (ứng dụng web). o Web tra cứu/tìm kiếm tài liệu, đặt mượn, gia hạn. Quyền lợi đặc biệt: Có thể có hỗ trợ tài chính của IBM-VN là cơ hội làm việc cho IBM- VN. 6. Tài liệu tham khảo: liên hệ GVHD. 18