Luận văn ThS: Phương pháp xây dựng cây quyết định dựa trên tập phụ thuộc hàm xấp xỉ

Luận văn Phương pháp xây dựng cây quyết định dựa trên tập phụ thuộc hàm xấp xỉ nghiên cứu tổng quan về khai phá dữ liệu và khai phá dữ liệu bằng cây quyết định, tập trung vào các phương pháp xây dựng cây quyết định; nghiên cứu về phụ thuộc hàm, phụ thuộc hàm xấp xỉ trong cơ sở dữ liệu quan hệ; nghiên cứu sâu về phương pháp xây dựng cây quyết định dựa vào phụ thuộc hàm xấp xỉ; xây dựng chương trình mô phỏng Phương pháp xây dựng cây quyết định dựa trên tập phụ thuộc hàm xấp xỉ.

Luận văn ThS: Phương pháp xây dựng cây quyết định dựa trên tập phụ thuộc hàm xấp xỉ

1. Mở đầu

Một trong những lĩnh vực nghiên cứu các phương pháp ứng dụng khai phá dữ liệu, tìm kiếm chi thức, kết xuất tri thức… từ dữ liệu là cây quyết định (decision tree) cũng được nghiên cứu từ nhiều năm trước đây và đã có những kết quả khả quan và mang lại hướng ứng dụng có hiệu quả cao. Ngày nay, kỹ thuật khai phá dữ liệu dựa trên cây quyết định đã được áp dụng và mang lại hiệu quả cho nhiều ngành, nhiều lĩnh vực như: Kinh tế, tài chính, khoa học - kỹ thuật, ngân hang, thương mại, giáo dục, y tế… các kỹ thuật khai phá dự liệu bằng cây quyết định rất đa dạng và phong phú như các kỹ thuật dựa trên các thuật toán Hunt, ID3, C4.5,…và kỹ thuật xây dựng cây quyết định dựa trên các phụ thuộc hàm trong cơ sở dữ liệu quan hệ.

2. Nội dung

2.1 Tổng quan về cây quyết định và phụ thuộc hàm xấp xỉ

Tổng quan về khai phá dữ liệu và cây quyết định 

  • Khái niệm về khai phá dữ liệu, quá trình phát triển và ứng dụng trong việc phát hiện tri thức 
  • Khái quát về các phương pháp khai phá dữ liệu phổ biến

Phụ thuộc hàm xấp xỉ

  • Khái niệm về phụ thuộc hàm trong mô hình cơ sở dữ liệu quan hệ
  • Khái niệm về phụ thuộc hàm xấp xỉ và các đặc trưng của chúng

2.2 Một số thuật toán 

Thuật toán TANE xác định phụ thuộc hàm xấp xỉ từ quan hệ

  • Khái niệm lớp tương đương và phân hoạch
  • Phân hoạch mịn hơn
  • Thuật toán TANE cải tiến 
  • Chiến lược tìm kiếm

Thuật toán xác định phụ thuộc hàm xấp xỉ dựa trên luật kết hợp

  • Luật kết hợp 
  • Biểu diễn phụ thuộc hàm xấp xỉ qua LKH
  • Đô ̣hỗ trợ của phụ thuộc hàm xấp xỉ và tính không tầm thường
  • Định nghĩa phụ thuộc hàm xấp xỉ mạnh 
  • Biểu diễn độ đo, độ hỗ trợ, độ chính xác qua lý thuyết phụ thuộc hàm xấp xỉ
  • Thuât toán xác định phụ thuộc hàm xấp xỉ dựa trên LKH ̣ 

Thuật toán xác định phụ thuộc hàm xấp xỉ dựa trên phủ tối thiểu và lớp tương đương

  • Khái niệm về Phủ tối thiểu và các mệnh đề liên quan
  • Thuật toán tìm Phủ tối thiểu
  • Thuật toán khai phá phụ thuộc hàm xấp xỉ nhờ phủ tối thiểu và lớp tương đương 
  • Độ phức tạp của thuật toán khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương 

Thuật toán xây dựng cây quyết định dựa trên phụ thuộc hàm xấp xỉ

  • Giải thuật chung xây dựng cây quyết định
  • Giải thuật xây dựng cây quyết định dựa trên tập phụ thuộc hàm xấp xỉ phân lớp

2.3 Chương trình thử nghiệm

Mô tả Bài toán chẩn đoán bệnh cúm tại bệnh viện đa khoa Trung ương Thái Nguyên và yêu cầu chương trình

  • Giới thiệu về bệnh Cúm 
  • Quy trình chẩn đoán xác định bệnh cúm 

Tập dữ liệu huấn luyện (input)

Ứng dụng hai thuật toán 2.3 và 2.4 để xác định tập phụ thuộc hàm xấp xỉ và xây dựng cây quyết định chẩn đoán bệnh

Thiết kế chương trình

Các giao diện chính của chương trình

Đánh giá kết quả thử nghiệm

3. Kết luận

Kết quả đạt được trong luận văn:

  • Tổng quan được các kiến thức cơ bản về quá trình phát hiện tri thức, khai phá dữ liệu.
  • Sưu tập và tổng hợp các thuật toán xác định phụ thuộc hàm xấp xỉ và xây dựng cây quyết định tương ứng.
  • Thử nghiệm thành công chương trình chẩn đoán bệnh cúm dựa vào các triệu chứng lâm sàng bằng ngôn ngữ lập trình Visual Studio trên cơ sở thuật toán xác định phụ thuộc hàm xấp xỉ bằng phương pháp Phủ tối thiểu và lớp tương đương

Hướng phát triển:

  • Trên cơ sở những nghiên cứu đã được trình bày trong luận văn, tiếp tục nghiên cứu rộng hơn một số thuật toán liên quan đến việc xác định phụ thuộc hàm xấp xỉ và xây dựng cây quyết định.
  • Hoàn thiện chương trình để có thể ứng dụng tốt tại Bệnh viện Đa khoa Trung ương Thái Nguyên, nơi mà tác giả đang công tác.
  • Mở rộng cho nhiều lĩnh vực khác ở Bệnh viện đa khoa Trung ương Thái Nguyên để hỗ trợ chẩn đoán nhiều bệnh khác trên cơ sở sưu tập đầy đủ và chính xác các tập huấn luyện chuyên sâu trong từng lĩnh vực khám và điều trị bệnh.

4. Tài liệu tham khảo

Trần Khánh (2015), Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương, Luận văn Thạc sỹ, ĐH CNTT&TT-Thái Nguyên.

Lê Thị Hoàng Liên (2007), Khai phá dữ liệu với cây quyết định, Luận văn thạc sỹ, Đại học Công nghệ, Đại học quốc gia Hà Nội.

Phạm Thị Thanh Nga (2015), Khai phá phụ thuộc hàm xấp xỉ sử dụng luật kết hợp và ứng dụng, Luận văn Thạc sỹ, ĐH CNTT&TT-Thái Nguyên.

Lê Văn Phùng, Quách Xuân Trưởng (2012), Khai phá dữ liệu, Nhà xuất bản Thông tin và truyền thông.....

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn Thạc sĩ trên ---

Ngày:27/08/2020 Chia sẻ bởi:

CÓ THỂ BẠN QUAN TÂM