Luận văn ThS: Nghiên cứu và áp dụng kỹ thuật khai phá dữ liệu trên bộ dữ liệu sinh viên đại học phục vụ công tác cố vấn học tập

Luận văn Nghiên cứu và áp dụng kỹ thuật khai phá dữ liệu trên bộ dữ liệu sinh viên đại học phục vụ công tác cố vấn học tập đề xuất quy trình xử lý dữ liệu cho các bài toán cố vấn học tập tại trường Đại học kinh tế quốc dân; thực nghiệm với bộ dữ liệu thực tế và đánh giá các kết quả đã tìm được từ các kỹ thuật khai phá dữ liệu cho các bài toán cố vấn học tập đã nêu.

Luận văn ThS: Nghiên cứu và áp dụng kỹ thuật khai phá dữ liệu trên bộ dữ liệu sinh viên đại học phục vụ công tác cố vấn học tập

1. Mở đầu

1.1 Mục tiêu nghiên cứu

Mục tiêu nghiên cứu của luận văn là để hiểu các kỹ thuật khai phá dữ liệu và phát hiện tri thức cơ bản, tập trung chủ yếu vào hai kỹ thuật chính là kỹ thuật khai phá luật kết hợp và cây quyết định. Đây là kỹ thuật đã có nhiều nhà khoa học nghiên cứu và có nhiều đóng góp vào thực tiễn.

1.2 Đối tượng, phạm vi nghiên cứu

Nghiên cứu các vấn đề cơ bản của khai phá dữ liệu và phát hiện tri thức; kỹ thuật khai phá luật kết hợp, cây quyết định trong phát hiện tri thức và khai phá dữ liệu; bài toán cố vấn học tập tại trường Đại học Kinh tế quốc dân. Các nội dung nghiên cứu sẽ được thực nghiệm trên bộ dữ liệu sinh viên đại học chính quy của trường Đại học Kinh tế quốc dân.

1.3 Phương pháp nghiên cứu

Tổng hợp các vấn đề lý thuyết liên quan từ các nguồn là giáo trình, bài giảng, chuyên đề, luận văn, luận án, internet và tìm hiểu văn bản quy định tại trường Đại học Kinh tế Quốc dân về các vấn đề liên quan đến luận văn. Cùng với đó là phương pháp nghiên cứu thực nghiệm. Sử dụng bộ dữ liệu thực tế về thông tin và quá trình học của một khóa sinh viên chính quy đã ra trường, xử lý dữ liệu trên những công cụ quản trị cơ sở dữ liệu và công cụ khai phá dữ liệu của Microsoft SQL Server. So sánh các kết quả thu được từ các mô hình khai phá để rút ra các kết luận và quy trình sử dụng kỹ thuật khai phá dữ liệu cho bài toán cố vấn học tập.

2. Nội dung

2.1 Tổng quan 

Giới thiệu chương

Tổng quan về phát hiện tri thức và khai phá dữ liệu

Quá trình phát hiện tri thức và khai phá dữ liệu 

Các phương pháp khai phá dữ liệu

Các vấn đề cần nghiên cứu của phát hiện tri thức và khai phá dữ liệu

Các lĩnh vực ứng dụng của phát hiện tri thức và khai phá dữ liệu

Kỹ thuật khai phá luật kết hợp

  • Lý thuyết về luật kết hợp
  • Định nghĩa luật kết hợp
  • Một số hướng tiếp cận trong khai phá luật kết hợp 

Cây quyết định

  • Sơ lược về cây quyết định
  • Định nghĩa cây quyết định
  • Xây dựng cây quyết định
  • Một số thuật toán xây dựng cây quyết định
  • Ưu điểm của cây quyết định

2.2 Bài toán cố vấn học tập

Giới thiệu chương

Những vấn đề về cố vấn học tập theo hình thức đào tạo tín chỉ tại trường Đại học Kinh tế Quốc dân

  • Tổ chức hệ thống cố vấn học tập 
  • Chức năng của cố vấn học tập
  • Nhiệm vụ của cố vấn học tập

Bài toán cố vấn học tập tại trường Đại học kinh tế quốc dân

  • Vấn đề thực tế xung quanh bài toán
  • Phát biểu bài toán 
  • Mục tiêu và ý nghĩa của bài toán
  • Quy trình giải quyết bài toán

Đặc trưng dữ liệu sinh viên trường Đại học kinh tế quốc dân

  • Hệ thống quản lý đào tạo, quản lý sinh viên
  • Mô tả một phần cơ sở dữ liệu quản lý sinh viên dựa trên những thông tin đã thu thập

2.3 Ứng dụng thử nghiệm

Giới thiệu chương

Giới thiệu một số công cụ khai phá dữ liệu và phát hiện tri thức

  • Weka
  • Ngôn ngữ R
  • SQL Datamining

Quy trình thực hiện khai phá dữ liệu sinh viên và phát hiện tri thức với bài toán cố vấn học tập tại Trường Đại học

Kinh tế Quốc dân

Khai phá dữ liệu bằng luật kết hợp giải bài toán 1

  • Từ dữ liệu thô thu thập được
  • Tiến hành biến đổi dữ liệu theo bài toán 1 
  • Thực hiện thử nghiệm trên công cụ BIDS

Khai phá dữ liệu bằng cây quyết định giải bài toán 2

  • Từ dữ liệu thô thu thập được
  • Tiến hành biến đổi dữ liệu theo bài toán 2
  • Thực hiện thử nghiệm trên công cụ BIDS

Một số đề xuất, kiến nghị

3. Kết luận

Sau một thời gian nghiên cứu và thực hiện đề tài dưới sự hướng dẫn của thầy TS. Nguyễn Trung Tuấn, luận văn đã đạt được mục tiêu đã đề ra, thu được những kết quả ý nghĩa với thực tiễn:

  • Đã tóm tắt được lý thuyết liên quan đến phát hiện tri thức và khai phá dữ liệu, đặt biệt nhấn mạnh vào hai phương pháp khai phá dữ liệu cơ bản là luật kết hợp và cây quyết định.
  • Đã hiểu được quy định chung trong đào tạo theo học chế tín chỉ, những vấn đề còn tồn tại trong công tác cố vấn học tập, thu thập và tìm hiểu về dữ liệu quản lý đào tạo sinh viên đại học.
  • Đã đề xuất được bài toán mà mục tiêu là trợ giúp cho các hoạt động cố vấn học tập. Có thêm cơ sở thông tin cho cán bộ cố vấn học tập hoàn thành nhiệm vụ. 

Sau khi áp dụng thử nghiệm trên công cụ BIDS để khai thác dữ liệu giải bài toán dựa vào kỹ thuật thuật cây quyết định và luật kết hợp đã thu được các kết quả có ý nghĩa với mục tiêu bài toán đã phát biểu.

4. Tài liệu tham khảo

Bài giảng “Kho dữ liệu và khai phá dữ liệu”, Hà Quang Thụy, Đại học Công Nghệ, 2015.

Phần V Mục 13 Quy định về cố vấn học tập (Trích Quyết định số: 1808/QĐ-KTQD-TTr&KT ngày 25/11/2010 của Hiệu trưởng Trường Đại học Kinh tế Quốc dân)

Khóa luận tốt nhiệp, Nghiên cứu các thuật toán phân lớp dữ liệu dựa trên cây quyết định, Nguyễn Thị Thùy Linh, Đại học Công nghệ, 2005.

Bao H.T, Introduction to Knowledge Discovery and Data Mining, Lecture note, Institute of Information Technology, VietNam, 2008....

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn Thạc sĩ trên ---

Ngày:31/08/2020 Chia sẻ bởi:

CÓ THỂ BẠN QUAN TÂM