Luận văn ThS: Kỹ thuật Matrix Factorization trong xây dựng hệ tư vấn
Luận văn Kỹ thuật Matrix Factorization trong xây dựng hệ tư vấn giới thiệu tổng quan về các nghiên cứu liên quan; tìm hiểu cơ sở lí thuyết và đưa ra hệ thống.
Mục lục nội dung
1. Mở đầu
1.1 Lí do chọn đề tài
Có thể nói rằng hiện nay có đủ mọi loại thông tin trên mạng internet; và với sự giúp sức của các công cụ tìm kiếm thông tin hiện hữu, người ta có thể dễ dàng tìm thấy những gì mà họ quan tâm. Mặt khác, do có quá nhiều thông tin, nên đã gây không ít khó khăn, lúng túng cho việc định hướng chọn lựa hoặc ra quyết định từ phía người sử dụng các thông tin trên. Các hệ tư vấn (recommendation systems) ra đời không nằm ngoài mục đích hỗ trợ cho người dùng trong các lựa chọn và/ hoặc ra quyết định. Có nhiều hướng tiếp cận để xây dựng một hệ tư vấn. Tùy thuộc vào nguồn thông tin có được, nhu cầu tư vấn thực tế, đặc thù riêng của dịch vụ tư vấn cần cung cấp, v.v… mà mỗi hệ tư vấn sẽ có phương pháp và thuật toán phù hợp cho riêng mình. Kỹ thuật phân rã ma trận (Matrix Factorization) là một trong số các kỹ thuật được sử dụng để xây dựng một hệ tư vấn dựa trên các dữ liệu đánh giá. Kỹ thuật này được đánh giá cao nhờ khả năng cải thiện độ chính xác của các thuật toán tư vấn khác, tính linh hoạt, thời gian thực thi thấp, v.v...
1.2 Mục tiêu nghiên cứu
Tìm hiểu các hệ tư vấn (recommendation systems).
Tìm hiểu các khái niệm, phương pháp xây dựng 1 hệ tư vấn.
Tìm hiểu kỹ thuật phân rã ma trận.
Áp dụng phương pháp phân rã ma trận để xây dựng 1 hệ tư vấn về phim
2. Nội dung
2.1 Các nghiên cứu liên quan
Tổng quan về hệ tư vấn
- Giới thiệu hệ tư vấn
Kiến trúc cơ bản một hệ tư vấn
Mô tả bài toán tư vấn
Phân loại hệ tư vấn
- Phương pháp dựa trên nội dung (content - based)
- Phương pháp chọn lọc cộng tác (collaborative filtering)
- Phương pháp dựa trên nhân khẩu học (demographicbased)
- Phương pháp dựa trên tri thức (knowledge - based
- Phương pháp dựa trên cộng đồng (community - based)
- Phương pháp lai (hybrid)
- Vấn đề ramp-up
2.2 Cơ sở lí thuyết
Mô hình phân rã ma trận
Các thuật toán học (learning algorithms)
- Phương pháp giảm gradient ngẫu nhiên (stochastic gradient descent)
- Phương pháp alternating least square (ASL)
Hệ số bias
Regularization
Phân rã ma trận không âm (NMF)
2.3 Hệ thống đề nghị
Mô hình hệ thống
Giải thuật chương trình
- Đầu vào
- Đầu ra
- Lưu đồ thuật toán
2.4 Hiện thực và thí nghiệm
Hiện thực
Một số thử nghiệm và nhận xét về thuật toán
- Tập dữ liệu: 10 Người dùng, 712 Hạng mục
- Tập dữ liệu: 50 Người dùng, 1084 Hạng mục
- Tập dữ liệu: 100 Người dùng, 1238 Hạng mục
3. Kết luận
Kỹ thuật phân rã ma trận đã đóng góp đáng kể về mặt phương pháp luận trong việc phát triển các hệ thống tư vấn CF. Các thử nghiệm của nhiều nghiên cứu đều đánh giá kỹ thuật phân rã ma trận cho độ chính xác cao hơn so với các phương pháp đã được áp dụng trước đó như kỹ thuật k-nearest neighbor, v.v… Kỹ thuật phân rã ma trận tương đối dễ cài đặt. Quá trình thử nghiệm trên chương trình kiểm thử cho thấy để kỹ thuật cho được kết quả tốt cần có các hệ số thích hợp. Dù đã cố gắng tìm tòi nhiều nhưng chắc hẳn luận văn này không tránh khỏi những khiếm khuyết. Qua thực hiện đề tài này, tác giả đã thu được những kết quả sau:
- Tìm hiểu một cách cơ bản về các hệ tư vấn.
- Kỹ thuật phân rã ma trận và các vấn đề liên quan.
- Rút ra một số nhận xét cơ bản liên quan đến các hệ số trong kỹ thuật phân rã ma trận thông qua chạy thử nghiệm chương trình cài đặt.
4. Tài liệu tham khảo
Sebastian Riedel, Limin Yao, Andrew McCallum, Benjamin M Marlin . (2014), Relation extraction with matrix factorization and universal schemas [online], viewed 17 july 2015, from < https://people.cs.umass.edu/~lmyao/papers/univ-schema-tacl.pdf>
Nicolas Gillis, Stephen A Vavasis. (2014), Fast and robust recursive algorithmsfor separable nonnegative matrix factorization [online], viewed 4 July 2015, from < http://arxiv.org/pdf/1208.1237.pdf>
Hoàng Kiếm. (2012). Các hệ thống thông tin tri thức hỗ trợ sáng tạo. Đại Học Quốc Gia TP.HCM
F. Ricci. (2012). Content-Based Filtering and Hybrid Systems [online], viewed 3 February 2015, from
--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn trên ---
Tham khảo thêm
- pdf Luận văn ThS: Khai thác Top - rank k cho tập đánh trọng trên cơ sở dữ liệu có trọng số
- pdf Luận văn ThS: Theo dõi đối tượng chuyển động bằng phương pháp lọc tích hợp
- pdf Luận văn ThS: Xây dựng tính năng cảnh báo tấn công trên mã nguồn mở
- pdf Luận văn ThS: Phương pháp phân vùng phân cấp trong khai thác tập phổ biến
- pdf Luận văn ThS: Nhận biết chủ đề của tài liệu dựa trên Wikipedia
- pdf Luận văn ThS: Nén Fractal cho bài toán ẩn dữ liệu
- pdf Luận văn ThS: Khai thác mẫu tuần tự nén
- pdf Luận văn ThS: Sử dụng cây quyết định để phân loại dữ liệu nhiễu
- pdf Luận văn ThS: Khai thác tập mục lợi ích cao
- pdf Luận văn ThS: Khảo sát ảnh hưởng của các độ đo lợi ích lên độ chính xác trong bài toán phân lớp dựa trên luật kết hợp
- pdf Luận văn ThS: Một số kỹ thuật kiểm thử an toàn hệ thống
- pdf Luận văn ThS: Khai thác quan điểm của các bình luận tiếng Anh trên mạng xã hội sử dụng phương pháp xử lý ngôn ngữ tự nhiên
- pdf Luận văn ThS: Phát hiện tự động một số lỗi phát âm tiếng Anh của người học
- pdf Luận văn ThS: Ứng dụng khai thác mẫu chuỗi để khai thác hành vi sử dụng web
- pdf Luận văn ThS: Khai thác mẫu phổ biến cực đại trong đồ thị đơn bằng phương pháp so sánh gần đúng
- pdf Luận văn ThS: Khai thác mẫu trọng số phổ biến tối đại trong cơ sở dữ liệu giao dịch
- pdf Luận văn ThS: Một phương pháp bảo toàn tính riêng tư trong khai thác luật kết hợp trên cơ sở dữ liệu phân tán ngang
- pdf Luận văn ThS: Một thuật toán cải tiến trong khai thác luật kết hợp bảo toàn tính riêng tư
- pdf Luận văn ThS: Phân tích dữ liệu tạo cảnh báo học tập bằng mô hình hồi quy Logistic
- pdf Luận văn ThS: Sử dụng hồi quy tuyến tính trong dự đoán mức lương công việc trên quảng cáo tuyển dụng
- pdf Luận văn ThS: Khai thác song song tập phổ biến dựa trên mảng Systolic
- pdf Luận văn ThS: Nghiên cứu phương án tỉa ứng viên trong khai thác tập hữu ích cao
- pdf Luận văn ThS: Phân đoạn đối tượng trong ảnh MRI