Luận văn ThS: Cụm dữ liệu và ứng dụng trong phân tích lương của cán bộ trường Cao đẳng Nghề Hà Nam

Luận văn Cụm dữ liệu và ứng dụng trong phân tích lương của cán bộ trường Cao đẳng Nghề Hà Nam giới thiệu tổng quan về khai phá dữ liệu, kĩ thuật phân cụm ctỏng khai phá dữ liệu; một số thuật toán phân cụm dữ liệu điểm hình và ứng dụng phương pháp phân nhóm dữ liệu.

Luận văn ThS: Cụm dữ liệu và ứng dụng trong phân tích lương của cán bộ trường Cao đẳng Nghề Hà Nam

1. Mở đầu

Việc áp dụng phân cụm dữ liệu để phân tích trong ngành kế toán hiện nay là rất cần thiết, bởi lượng dữ liệu lưu trữ lương khá lớn, việc phân tích đánh giá lương để đưa ra các chiến lược cân đối nguồn chi phí của đơn vị, dự báo quỹ lương và có kế hoạch cân đối tài chính cho phù hợp cũng gặp nhiều khó khăn. Ngoài ra việc phân tích lương còn phục vụ công tác quản lý nhân sự, giúp nắm được tình hình sử dụng con người của đơn vị từ đó đưa ra các chính sách tuyển dụng phù hợp, có các giải pháp tạo động lực cho người lao động bằng các chính sách tài chính. Việc phân cụm dữ liệu để phân tích lương cho kết quả thu được sẽ phân loại theo giá trị lương của mỗi cán bộ, phân loại ra các mức thu nhập cao thấp khác nhau từ đó đưa ra các chính sách cân đối thu chi để có những chính sách ưu đãi phù hợp mà vẫn đảm bảo tài chính của đơn vị.

2. Nội dung

2.1 Tổng quan

Khai phá dữ liệu 

  • Giới thiệu về khai phá dữ liệu 
  • Quá trình khai phá dữ liệu
  • Các kỹ thuật khai phá dữ liệu
  • Ứng dụng của Khai phá dữ liệu
  • Các xu thế và vấn đề cần giải quyết trong khai phá dữ liệu

Kỹ thuật phân cụm trong Khai phá dữ liệu

  • Tổng quan về kỹ thuật phân cụm 
  • Một số khái niệm cần thiết khi tiếp cận phân cụm dữ liệu
  • Các yêu cầu đối với kĩ thuật phân cụm dữ liệu
  • Các hướng tiếp cận trong phân cụm dữ liệu

2.2 Một số thuật toán phân cụm dữ liệu điển hình

Thuật toán K-Means

Thuật toán DBSCAN

Thuật toán BIRCH

Thuật toán INCREMENTAL DBSCAN

  • Các đối tượng bị ảnh hưởng 
  • Trường hợp thêm
  • Trường hợp xóa 

Thuật toán phân nhóm cây hậu tố 

  • Cây hậu tố
  • Cây hậu tố - Cây hậu tố tổng quát
  • Thuật toán STC 

Thuật toán dựa vào phân loại véc-tơ hỗ trợ 

  • Phương pháp SVM 
  • Phương pháp FSVM

2.3 Ứng dụng phương pháp phân nhóm dữ liệu

Đặt vấn đề

Giải quyết vấn đề

  • Công cụ lựa chọn xây dựng chương trình phần mềm
  • Biểu đồ phân cấp chức năng
  • Mô hình tổng quan hệ thống 
  • Thiết kế giao diện chương trình
  • Chạy chương trình 
  • Giao diện quản lý người dùng
  • Giao diện quản lý Khoa/Viện
  • Giao diện quản lý giảng viên 
  • Giao diện quản lý lương

3. Kết luận

Luận văn nghiên cứu, tìm hiểu, tổng hợp những nét đặc trưng nhất trong lĩnh vực Khai phá dữ liệu nói chung và phương pháp Phân cụm dữ liệu nói riêng. Luận văn đã trình bày được một số kỹ thuật và thuật toán phân cụm dữ liệu điển hình, dựa trên các phương pháp đã có, cài đặt thử nghiệm thuật toán Incremental DBSCAN trong bài toán phân tích lương của cán bộ giáo viên trường Cao đẳng Nghề Hà Nam theo từng yêu cầu cụ thể. Thuật toán thử nghiệm có ưu điểm vượt trội hơn so với các thuật toán phân cụm dữ liệu tĩnh đó là khi dữ liệu thay đổi ta không phải phân cụm dữ liệu lại từ đầu mà kết quả tự cập nhật theo dữ liệu được thêm mới. Điều này rút giảm thiểu thời gian, chi phí, giúp chúng ta đánh giá kết quả một cách đa chiều hơn.

4. Tài liệu tham khảo

Lê Văn Phùng, Quách Xuân Trường (2012), Khai phá dữ liệu (Data Mining), NXB Thông tin và Truyền thông.

Phạm Đình Hồng, Nghiên cứu phương pháp phân nhóm dữ liệu áp dụng vào hệ thống truy vấn thông tin, Luận văn thạc sỹ khoa học máy tính – ĐH Đà Nẵng, 2013

Anil K.Jain (2010), “Data Clustering: 50 Year Beyond K-Means”, Pattenrn Recognition Letters, Volume 31 Issue 8

Beckmann N., Kriegel H.-P., Schneider R., Seeger B (1990), “The R*- tree: An Efficient and Robust Access Method for Points and Rectangles”, Proc. ACM SIGMOD Int. Conf.on Management of Data, Atlantic City, NJ, pp. 322- 331.....

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn Thạc sĩ trên ---

Ngày:28/08/2020 Chia sẻ bởi:

CÓ THỂ BẠN QUAN TÂM