Luận văn ThS: Phân tích dữ liệu tạo cảnh báo học tập bằng mô hình hồi quy Logistic

Luận văn Phân tích dữ liệu tạo cảnh báo học tập bằng mô hình hồi quy Logistic trình bày lý thuyết về học máy, ứng dụng học máy, hồi quy Logistic và công cụ R; trình bày tổng quan về đào đạo Trung cấp chuyên nghiệp và các nghiên cứu trước đây liên quan trên đó là cơ sở hình thành hình thành mô hình nghiên cứu sơ bộ và giả thuyết nghiên cứu cho tạo cảnh báo học tập; tìm hiểu nghiên cứu, tìm hiểu dữ liệu, chuẩn bị dữ liệu, áp dụng hồi quy Logistic sử lý bài toán và đánh giá mô hình.

Luận văn ThS: Phân tích dữ liệu tạo cảnh báo học tập bằng mô hình hồi quy Logistic

1. Mở đầu

1.1 Mục tiêu nghiên cứu

Xác định các yếu tố quyết định và ảnh hưởng đến kết quả học tập học sinh Trung cấp chuyên nghiệp hệ THCS trường Trung cấp Kỹ thuật và Nghiệp vụ Nam Sài Gòn.

Áp dụng mô hình hồi quy Logistic dự báo kết quả học sinh Trung cấp chuyên nghiệp hệ THCS trường Trung cấp Kỹ thuật và Nghiệp vụ Nam Sài Gòn.

1.2 Đối tượng phạm vi nghiên cứu

Đối tượng: các em học sinh Trung cấp chuyên nghiệp hệ THCS đã học năm 2, năm 3 tại trường Trung cấp Kỹ thuật và Nghiệp vụ Nam Sài Gòn. Với đối tượng này, các em đã được học tại trường từ 2 năm trở lên, nên kết quả học tập và các yếu tố khác là cơ sở để dự đoán kết quả học tập của học sinh Trung cấp chuyên nghiệp hệ THCS.

Phạm vi: Đề tài chỉ nghiên cứu các yếu tố ảnh hưởng kết quả học tập của học sinh Trung cấp chuyên nghiệp hệ THCS tại trường Trung cấp Kỹ thuật và Nghiệp vụ Nam Sài Gòn chứ chưa khảo sát trên đối tượng đang theo học ở những trường khác

1.3 Phương pháp nghiên cứu

Nghiên cứu giúp phân tích các yếu tố ảnh hưởng đến kết quả học tập của học sinh Trung cấp chuyên nghiệp hệ THCS tại trường Trung cấp Kỹ thuật & Nghiệp vụ Nam Sài Gòn.

Kết quả nghiên cứu cung cấp thông tin dự đoán kết quả học tập từ đó học sinh điều chỉnh và lập kế hoạch để học tập đạt kết quả cao hơn.

Kết quả nghiên cứu sẽ là cơ sở cho việc nhà quản lý, giáo viên chủ nhiệm nắm bắt tình hình kết quả học tập của học sinh từ đó có những kế hoạch kích thích cần thiết để làm tăng hiệu quả học tập của học sinh

2. Nội dung

2.1 Cơ sở lí thuyết

Mô hình khai thác dữ liệu Crisp - DM

Tổng quan về học máy

  • Phân loại học máy
  • Các ngành khoa học liên quan
  • Các ứng dụng của học máy

Mô hình hồi quy Logistic

Phương pháp đánh giá độ chính xác của mô hình

  • Phương pháp phân chia ngẫu nhiên (Holdout Splitting)
  • Phương pháp kiểm tra chéo k - fold (K - Fold cross validation)
  • Phương pháp kiểm tra từng phần (Leave - one - out cross validation)

Tổng quan về R 

Các nghiên cứu có liên quan

  • Nghiên cứu quốc tế
  • Nghiên cứu Việt Nam

2.2 Triển khai giải pháp

Tìm hiểu cảnh báo kết quả học sinh

  • Thực trạng nghiên cứu
  • Xác đinh mục tiêu nghiên cứu

Tìm hiểu dữ liệu

  • Nguồn thông tin
  • Nghiên cứu định tính
  • Nghiên cứu định lượng
  • Phương pháp xử lý và phân tích dữ liệu

Chuẩn bị dữ liệu

  • Thống kê mô tả mẫu nghiên cứu
  • Phân tích thống kê
  • Kiểm định mô hình và ý nghĩa hệ số
  • Phân tích tương quan
  • Kiểm định giả thuyết

Mô hình hồi quy Logistic ảnh hưởng đến kết quả học tập

  • Phân tích hồi quy Logistic
  • Mô hình hồi quy Logistic
  • Vận dụng mô hình hồi quy Logistic cho mô hình dự báo kết quả học tập 

Đánh giá mô hình hồi quy Logistic

  • Đánh giá mô hình bằng ROC Curve 
  • Đánh giá mô hình bằng phương pháp k - fold

2.3 Đánh giá bài toán

Đánh giá quy trình Crisp - DM

Đánh giá hồi quy Logistic

Đánh giá dữ liệu

Đánh giá công cụ R

3. Kết luận

Nghiên cứu đã xây dựng và kiểm chứng mô hình các yếu tố ảnh hưởng đến kết quả học tập của học sinh Trung cấp chuyên nghiệp hệ THCS với 9 nhân tố: Tuổi học sinh, tinh thần học tập, sức khỏe, kết quả học tập trước , tình hình lên lớp, vi phạm nội quy, sử dụng chất kích thích, Số đơn vị học trình nợ, làm ngoài giờ. Trong đó, các yếu tốt tinh thần học tập, tình hình lên lớp, số nợ đơn vị học trình ảnh hưởng rất lớn đến kết quả dự đoán kết quả học tập của học sinh Trung cấp chuyên nghiệp hệ THCS. Kết quả dự đoán có xác suất khoảng 83%, độ chính các thực nghiệm AUC = 0.9932 và điểm cắt tối ưu phân định giá trị đậu hay rớt là 0.742.

4. Tài liệu tham khảo

P. Baepler and C.J. Murdoch (2010) “Academic Analytics and Data Mining in Higher Education” International Journal for the Scholarship of Teaching and Learning: Vol. 4: No. 2, Article 17

E.J.M. Lauría, J.D. Baron, M. Devireddy, V. Sundararaju and S.M. Jayaprakash “Mining academic data to improve college student retention: An open source perspective” Proceedings of the 2nd International Conference on Learning Analytics and Knowledge ACM New York, NY, USA ©2012, ISBN: 978-1-4503-1111 - 3.

B.K.Baradwaj and S. Pal “Mining Educational Data to Analyze StudentsPerformance” International Journal of Advanced Computer Science and Applications: Vol. 2, No. 6, 2011....

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn trên ---

Ngày:04/09/2020 Chia sẻ bởi:

CÓ THỂ BẠN QUAN TÂM