Luận văn ThS: Một thuật toán cải tiến trong khai thác luật kết hợp bảo toàn tính riêng tư
Luận văn Một thuật toán cải tiến trong khai thác luật kết hợp bảo toàn tính riêng tư trình bày lí thuyết tổng quan; khai thác luật kết hợp bảo toàn tính riêng tư và thực nghiệm.
Mục lục nội dung
1. Mở đầu
Đến thời điểm hiện tại, số lượng dữ liệu trong thế giới của chúng ta đang ngày càng bùng nổ. Thu thập thông tin có giá trị từ vô vàng dữ liệu khổng lồ là một công việc vô cùng quan trọng. Khai thác dữ liệu là một công cụ phân tích dữ liệu vô cùng mạnh mẽ, bởi trong đó quy định mô hình và các kiến thức được trích xuất từ các tập dữ liệu lớn. Tuy nhiên, có một vấn đề phát sinh đó là sự riêng tư của người dùng và thông tin của họ không thể được bảo vệ một cách hiệu quả trong quá trình khai thác dữ liệu. Ví dụ, thông qua việc khai thác dữ liệu bệnh lý của bệnh nhân, các quy tắc liên quan đến các bệnh khác nhau, có thể được kết nối từ nhiều hồ sơ của nhiều bệnh nhân (một bệnh nhân mắc bệnh tiểu đường, tại cùng một thời điểm đó có thể mắc các bệnh liên quan đến tim mạch như huyết áp cao, tai biến mạch máu não,…). Trong quá trình khai thác dữ liệu bệnh lý bệnh nhân đó chắc chắn sẽ gây ra sự tiếp xúc của các dữ liệu, trường hợp này dẫn đến sự rò rỉ thông tin riêng tư của các bệnh nhân.
2. Nội dung
2.1 Lý thuyết tổng quan
Các khái niệm
- Khai thác dữ liệu
- Tính riêng tư
- Khai thác dữ liệu bảo toàn tính riêng tư
Phân loại các phương pháp PPDM
- Phương pháp 1
- Phương pháp 2
- Phương pháp 3
Các phương pháp giấu dữ liệu nhạy cảm
- Làm xáo trộn (Perturbation)
- Ngăn chặn (Blocking)
- Gom hoặc trộn (Aggregation/ Merging)
- Đổi chổ (Swapping)
- Lấy mẫu
Luật kết hợp
- Định nghĩa
- Định nghĩa “Độ hỗ trợ”
- Định nghĩa “Độ tin cậy”
- Định nghĩa “Tập hợp”
Thuật toán Apriori
- Nguyên lý Apriori
- Thuật toán Apriori
- Ví dụ minh họa thuật toán Apriori
2.2 Khai thác luật kết hợp bảo toàn tính riêng tư
Bài toán
Các kỹ thuật khai thác luật kết hợp bảo toàn tính riêng tư
- Kỹ thuật chỉnh sửa dữ liệu nhị phân
- Kỹ thuật thay giá trị dữ liệu bằng giá trị unknown
- Phương pháp tái tạo
Thuật toán MASK
- Tình hình nghiên cứu
- Thuật toán MASK
- Một số biến thể của thuật toán MASK và hạn chế
Lý thuyết giàn và ứng dụng trong thuật toán ẩn tập mục nhạy cảm
- Phát biểu bài toán
- Lý thuyết giàn giao
- Các tính chất của tập mục thường xuyên
- Thuật toán ẩn tập mục nhạy cảm
2.3 Thuật toán bảo toàn tính riêng tư
Giới thiệu
Thuật toán
- Mô tả bài toán
- Thuật toán
- Mã giã thuật toán.
- Ví dụ
- Chương trình minh hoạ cho thuật toán
3. Kết luận
Luận văn đã đạt được một số kết quả:
- Giới thiệu tổng quan về Khai thác dữ liệu, qua đó giúp hiểu rõ hơn về các khái niệm cũng, tầm quan trọng của Khai thác dữ liệu trong thời đại bùng nỗ thông tin hiện nay.
- Các phương pháp Khai thác dữ liệu, Khai thác dữ liệu bảo toàn tính riêng tư, từ đó nắm được các kỹ thuật khai thác dữ liệu, cũng như sự cần thiết đảm báo tính riêng tư trong quá trình khai thác dữ liệu.
- Khái niệm về luật kết hợp, các thuật toán khai thác luật kết hợp. Nắm được vai trò của khai thác luật kết hợp trong khai thác dữ liệu, và tầm quan trọng của khai thác luật kết hợp bảo toàn tính riêng tư.
- Nghiên cứu giới thiệu thuật toán nâng cao hiệu quả thực thi trong khai thác luật kết hợp bảo toàn tín riêng tư. Cụ thể thông qua việc mã hoá nhiễu loạn dữ liệu và giấu các luật nhậy cảm, tăng hiệu quả thực thi trong khai thác luật kết hợp bảo toàn tính riêng tư.
- Xây dựng chương demo minh hoạ cho việc nâng hiệu quả thực thi trong khai thác luật kết hợp bảo toàn tín riêng tư.
4. Tài liệu tham khảo
Cao Tùng Anh (2014), Khai Thác Dữ Liệu Phân Tán Bảo Toàn Tính Riêng Tư, Luận Án Tiến Sĩ Toán Học, Viện Hàn Lâm Khoa Học Và Công Nghệ Việt Nam - Viện Công Nghệ Thông Tin
Nguyễn Xuân Huy, Lê Quốc Hải, Nguyễn Gia Như, Cao Tùng Anh, Bùi Đức Minh(2009), Lý thuyết giàn và ứng dụng trong thuật toán ẩn tập mục nhạy cảm, Báo cáo tại Hội thảo Quốc gia " Một số vấn đề chọn lọc của CNTT và truyền thông, Đồng Nai.
Nguyễn Thị Thuỳ (2014 ), Một số kỹ thuật khai thác luật kết hợp có đảm bảo tính riêng tư trong các tập giao dịch phân tán ngang, Luận văn Thạc sĩ, Trường Đại học Thái Nguyên – Trường Đại học CNTT và Truyền thông....
--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn trên ---
Tham khảo thêm
- pdf Luận văn ThS: Khai thác Top - rank k cho tập đánh trọng trên cơ sở dữ liệu có trọng số
- pdf Luận văn ThS: Theo dõi đối tượng chuyển động bằng phương pháp lọc tích hợp
- pdf Luận văn ThS: Xây dựng tính năng cảnh báo tấn công trên mã nguồn mở
- pdf Luận văn ThS: Phương pháp phân vùng phân cấp trong khai thác tập phổ biến
- pdf Luận văn ThS: Nhận biết chủ đề của tài liệu dựa trên Wikipedia
- pdf Luận văn ThS: Nén Fractal cho bài toán ẩn dữ liệu
- pdf Luận văn ThS: Khai thác mẫu tuần tự nén
- pdf Luận văn ThS: Sử dụng cây quyết định để phân loại dữ liệu nhiễu
- pdf Luận văn ThS: Kỹ thuật Matrix Factorization trong xây dựng hệ tư vấn
- pdf Luận văn ThS: Khai thác tập mục lợi ích cao
- pdf Luận văn ThS: Khảo sát ảnh hưởng của các độ đo lợi ích lên độ chính xác trong bài toán phân lớp dựa trên luật kết hợp
- pdf Luận văn ThS: Một số kỹ thuật kiểm thử an toàn hệ thống
- pdf Luận văn ThS: Khai thác quan điểm của các bình luận tiếng Anh trên mạng xã hội sử dụng phương pháp xử lý ngôn ngữ tự nhiên
- pdf Luận văn ThS: Phát hiện tự động một số lỗi phát âm tiếng Anh của người học
- pdf Luận văn ThS: Ứng dụng khai thác mẫu chuỗi để khai thác hành vi sử dụng web
- pdf Luận văn ThS: Khai thác mẫu phổ biến cực đại trong đồ thị đơn bằng phương pháp so sánh gần đúng
- pdf Luận văn ThS: Khai thác mẫu trọng số phổ biến tối đại trong cơ sở dữ liệu giao dịch
- pdf Luận văn ThS: Một phương pháp bảo toàn tính riêng tư trong khai thác luật kết hợp trên cơ sở dữ liệu phân tán ngang
- pdf Luận văn ThS: Phân tích dữ liệu tạo cảnh báo học tập bằng mô hình hồi quy Logistic
- pdf Luận văn ThS: Sử dụng hồi quy tuyến tính trong dự đoán mức lương công việc trên quảng cáo tuyển dụng
- pdf Luận văn ThS: Khai thác song song tập phổ biến dựa trên mảng Systolic
- pdf Luận văn ThS: Nghiên cứu phương án tỉa ứng viên trong khai thác tập hữu ích cao
- pdf Luận văn ThS: Phân đoạn đối tượng trong ảnh MRI