Đồ án: Tìm hiểu và cài đặt một số thuật toán phân cụm dữ liệu cơ bản
Đồ án Tìm hiểu và cài đặt một số thuật toán phân cụm dữ liệu cơ bản trình bày tổng quan về phân cụm dữ liệu, phân tích chi tiết các vấn đề cơ bản trong phân cụm dữ liệu và ý nghĩa của phân cụm dữ liệu, đặc điểm của các kiểu dữ liệu cơ bản thường sử dụng trong phân cụm dữ liệu; trình bày các thuật toán trong phân cụm dữ liệu phân hoạch, trong đó đi sâu vào tìm hiểu về 2 thuật toán phân cụm dữ liệu phân hoạch điển hình: K-MEANS, PAM; lựa chọn và cài đặt các thuật toán K-MEANS, PAM.
Mục lục nội dung
1. Mở đầu
Data Mining là một lĩnh vực mới xuất hiện, nhằm tự động khai thác những thông tin, những tri thức có tính tiềm ẩn, hữu ích từ những cơ sở dữ liệu lớn cho các đơn vị, tổ chức, doanh nghiệp, …từ đó làm thúc đẩy khả năng sản xuất, kinh doanh, cạnh tranh cho các đơn vị, tổ chức này. Từ những ứng dụng thành công trong khám phá tri thức, cho thấy Data Mining là một lĩnh vực phát triển bền vững mang lại nhiều lợi ích và có nhiều triển vọng, đồng thời có ưu thế hơn hẳn so với các công cụ phân tích dữ liệu truỳên thống. Hiện nay, Data Mining đã ứng dụng ngày càng rộng rãi trong các lĩnh vực như: thương mại, tài chính, điều trị y học, viễn thông, tin-sinh, …
2. Nội dung
2.1 Phân cụm dữ liệu - Data Clustering
Vấn đề phân cụm dữ liệu
Bài toán phân cụm dữ liệu
Kiểu dữ liệu và độ đo tương tự sử dụng trong bài toán phân cụm dữ liệu
Khái niệm về tương tự và phi tương tự
Ứng dụng của phân cụm dữ liệu
2.2 Phân cụm dữ liệu phân hoạch
Giới thiệu
Thuật toán K-means
Thuật toán PAM
Thuật toán CLARA
Thuật toán CLARANS
Nhận xét chung về họ các thuật toán phân hoạch
2.3 Cài đặt chương trình
Bài toán
Giới thiệu chương trình ứng dụng
Nhận xét chương trình
3. Kết luận
Phân cụm dữ liệu trong lĩnh vực Data Mining là một hướng nghiên cứu rất quan trọng. Hiện nay, tuy có ít các kết quả khoa học mới trong phân cụm dữ liệu, nhưng do các hệ thống cơ sở dữ liệu ngày càng đa dạng, và tăng trưởng nhanh cả về chất lẫn về lượng. Hơn nữa, nhu cầu về khai thác các tri thức từ các cơ sở dữ liệu này ngày càng lớn. Vì vậy, việc nghiên cứu các mô hình dữ liệu mới và hoàn thiện và áp dụng các phương pháp và kỹ thuật phân cụm dữ liệu là việc làm rất cần thiết và có nhiều ý nghĩa trong khoa học cũng như trong thực tiễn. Phân cụm dữ liệu trong lĩnh vực Data Mining là một hướng nghiên cứu rất quan trọng. Hiện nay, tuy có ít các kết quả khoa học mới trong phân cụm dữ liệu, nhưng do các hệ thống cơ sở dữ liệu ngày càng đa dạng, và tăng trưởng nhanh cả về chất lẫn về lượng. Hơn nữa, nhu cầu về khai thác các tri thức từ các cơ sở dữ liệu này ngày càng lớn. Vì vậy, việc nghiên cứu các mô hình dữ liệu mới và hoàn thiện và áp dụng các phương pháp và kỹ thuật phân cụm dữ liệu là việc làm rất cần thiết và có nhiều ý nghĩa trong khoa học cũng như trong thực tiễn.
4. Tài liệu tham khảo
Nguyễn Thị Ngọc, Phân cụm dữ liệu dựa trên mật độ, Đồ án tốt nghiệp đại học Ngành công nghệ Thông tin – ĐHDL Hải Phòng, 2008.
Trần Thị Quỳnh, Thuật toán phân cụm dữ liệu nửa giám sát và giải thuật di truyền, Đồ án tốt nghiệp đại học Ngành công nghệ Thông tin – ĐHDL Hải Phòng, 2008.
Nguyễn. . Lâm, Thuật toán phân cụm dữ liệu nửa giám sát,- Đồ án tốt nghiệp đại học Ngành công nghệ Thông tin – ĐHDL Hải Phòng, 2007.
Charles Elkan, Department of Comput er Science and Engineering, University of California, San Diego La jolla, CA 92093...
--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Đồ án trên ---
Tham khảo thêm
- pdf Đồ án: Tìm hiểu phép toán hình thái và ứng dụng
- pdf Đồ án: Giao tiếp vi điều khiển và máy tính
- pdf Đồ án: Nghiên cứu, tìm hiểu chữ ký số và ứng dụng của nó để kiểm soát, xác thực và bảo vệ thông tin trong hộ chiếu điện tử
- pdf Đồ án: Kỹ thuật giấu tin trong ảnh dựa trên KBNS - Multiple base notational system
- pdf Đồ án: Tìm hiểu về một số thuật toán giấu tin và phát hiện ảnh có giấu tin
- pdf Đồ án: Hiệu chỉnh ánh sáng trong ảnh
- pdf Đồ án: Tìm hiểu phương pháp cực tiểu năng lượng dựa trên độ đồng nhất và độ không ổn định cho phân đoạn ảnh
- pdf Đồ án: Kỹ thuật giấu tin trong ảnh SES - Steganography Evading Statistical Analyses
- pdf Đồ án: Nghiên cứu một giải pháp giấu văn bản trong ảnh
- pdf Đồ án: Tìm hiểu một số kĩ thuật khảm ảnh
- pdf Đồ án: Tìm hiểu một số phương pháp trích chọn đặc trưng và ứng dụng cho tra cứu ảnh theo nội dung
- pdf Đồ án: Lập trình quản lý thư mục trong HDD bằng ngôn ngữ Assembly
- pdf Đồ án: Phương pháp tìm dạng phổ biến đóng 2 chiều, 3 chiều và ứng dụng
- pdf Đồ án: Tìm hiểu kỹ thuật thủy vân số thuận nghịch cho ảnh nhị phân
- pdf Đồ án: Tìm hiểu về phương pháp trích và sắp xếp các đặc trưng sản phẩm trong tài liệu chứa quan điểm
- pdf Đồ án: Tính toán phân tán và ứng dụng
- pdf Đồ án: Tìm hiểu kỹ thuật truyền File Multicast
- pdf Đồ án: Tìm hiểu về Maximum Entropy cho bài toán phân lớp quan điểm
- pdf Đồ án: Tìm hiểu kỹ thuật lập trình Network Service cho Window
- pdf Đồ án: Kỹ thuật giấu tin thuận nghịch trong ảnh bằng hiệu chỉnh hệ số Wavelet
- pdf Đồ án: Tìm hiểu phương pháp tra cứu ảnh y tế
- pdf Đồ án: Tìm hiểu bộ kiểm chứng mô hình spin
- pdf Đồ án: Tìm hiểu phương pháp phân đoạn tách các nét của chữ viết tay hạn chế