Luận văn ThS: Khai thác quan điểm của các bình luận tiếng Anh trên mạng xã hội sử dụng phương pháp xử lý ngôn ngữ tự nhiên
Luận văn Khai thác quan điểm của các bình luận tiếng Anh trên mạng xã hội sử dụng phương pháp xử lý ngôn ngữ tự nhiên khái quát về ngôn ngữ tự nhiên và kỹ thuật xử lý ngôn ngữ tự nhiên Pos tangger; trình bày các công trình liên quan như Xử lý ngôn ngữ tự nhiên, Máy học và Ontology; đề xuất mô hình, thực nghiệm cho quá trình nghiên cứu.
Mục lục nội dung
1. Mở đầu
1.1 Tính cấp thiết
Hầu hết các ứng dụng của phân tích ý kiến là nằm trong nhận xét của khách hàng về sản phẩm và dịch vụ. Vì thế trong công trình này, chúng tôi sẽ khảo sát các ý kiến trên các website mạng xã hội. Mạng xã hội là một bước đột phá so với kinh doanh theo truyền thống (người bán và người mua trao đổi trực tiếp với nhau) và đang trở nên rất phổ biến. Số lượng khách hàng sử dụng dịch vụ mua bán qua mạng càng nhiều và sự quan tâm của họ với loại hình kinh doanh này cũng ngày càng tăng lên. Do đó, sẽ có rất nhiều thậm chí hàng trăm, hàng nghìn những lời bình luận, nhận xét cho những sản phẩm hoặc dịch vụ mà họ quan tâm hoặc những sản phẩm, dịch vụ đang phổ biến trên thị trường như máy ảnh, điện thoại di động, máy tính xách tay, phim điện ảnh chiếu rạp, sách, khách sạn và du lịch. Chính vì vậy, thật khó để cho những khách hàng tiềm năng có thể tìm đọc hết những lời bình luận, nhận xét của những khách hàng trước đó đã sử dụng để có thể đưa ra được những quyết định hợp lý. Và cũng thật khó để các nhà sản xuất sản phẩm đó có thể theo dõi và quản lý những ý kiến của khách hàng để làm thỏa mãn khách hàng.
1.2 Mục tiêu nghiên cứu
Đề xuất khai thác quan điểm của các bình luận tiếng Anh trên mạng xã hội bằng phương pháp xử lý ngôn ngữ tự nhiên.
Xây dựng hệ thống phân loại các bình luận.
1.3 Phương pháp nghiên cứu
Trích xuất và phân tích các appraisal groups (cụm đánh giá, ví dụ: rất đẹp, không quá mắc...) để phân loại tình cảm. Mỗi cụm đánh giá gồm một tính từ chính và các từ bổ nghĩa. Các đặc điểm lấy từ việc phân tích appraisal group được kết hợp với bag - of - words giúp tăng độ chính xác của classifier. Tự động phát hiện các biểu hiện cảm xúc ẩn, dựa trên ngữ cảnh và những tri thức thông thường.
Xây dựng một cơ sở tri thức, gọi là EmotiNet. Xử lý ngôn ngữ tự nhiên (natural language processing - NLP) để cải thiện phân loại tình cảm, ý kiến.
Ba kỹ thuật chính được sử dụng trong báo cáo này là:
- Gắn nhãn từ loại (POS tagging)
- Phân tích tính phụ thuộc bằng cách phân tách cấu trúc cây của câu.
- Xử lý các phép phủ định trong câu.
2. Nội dung
2.1 Cơ sở lí thuyết
Khái quát về ngôn ngữ NLP
- Khái niệm
- Khái quát chung
Khái quát về POS Tagger NLP
- Khái niệm
- Khái quát chung
Phân lớp quan điểm
- Giới thiệu phân lớp quan điểm
- Thuật toán tính tần suất mẫu
2.2 Các công trình liên quan
Khái quát chung
Các công trình liên quan
- Các công trình sử dụng NLP
- Sử dụng máy học
- Sử dụng Ontology
2.3 Mô hình đề xuất
Mô hình hệ thống
- Giới thiệu
- Mô hình hệ thống
Thử nghiệm và đánh giá kết quả
3. Kết luận
Chúng tôi đã xây dựng được mô hình và giải thuật đánh giá được một số câu đơn giản như câu đơn, câu so sánh và câu ghép là đáng tin cây. Luận văn đã xây dựng được mô hình đánh giá tự động về khai thác quan điểm với giao diện thân thiện, rõ ràng và các chức năng giúp người sử dụng thao tác thuận tiện. Ngoài ra, chúng tôi đã nghiên cứu các công trình liên quan để giải quyết bài toán phân tích mức độ tình cảm thể hiện trong câu nhận xét, ý kiến. Hệ thống của chúng tôi chủ yếu tập trung vào xác định các ý kiến đánh giá của khách hàng chủ yếu là về máy tính, đây là mặt hàng phổ biến hiện nay. Trong tương lai nếu có điều kiện chúng tôi sẽ mở rộng hơn, với nhiều chủ đề khác nhau trên mạng xã hội. Hệ thống của chúng tôi mới chỉ xác định được mốt số loại câu cơ đơn giản như phủ định, khẳng định, so sánh. Trong tương lai chúng tôi muốn mở rộng thêm các loại câu phức tạp hơn trong tiếng Anh.
4. Tài liệu tham khảo
Feldman, R. - Techniques and Applications for Sentiment Analysis. In Communications of the ACM, pp.82-89, 2013.
Huifeng Tang, Songbo Tan, Xueqi Cheng, A survey on sentiment detection of reviews, Journal Expert Systems with Applications: An International Journal archive, pp.10760- 10773, 2009
Peter Turney, Thumbs up or thumbs down, semantic orientation applied to unsupervised classification of reviews, Proc. of the 40th ACL, pp.417-424, 2002....
--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn trên ---
Tham khảo thêm
- pdf Luận văn ThS: Khai thác Top - rank k cho tập đánh trọng trên cơ sở dữ liệu có trọng số
- pdf Luận văn ThS: Theo dõi đối tượng chuyển động bằng phương pháp lọc tích hợp
- pdf Luận văn ThS: Xây dựng tính năng cảnh báo tấn công trên mã nguồn mở
- pdf Luận văn ThS: Phương pháp phân vùng phân cấp trong khai thác tập phổ biến
- pdf Luận văn ThS: Nhận biết chủ đề của tài liệu dựa trên Wikipedia
- pdf Luận văn ThS: Nén Fractal cho bài toán ẩn dữ liệu
- pdf Luận văn ThS: Khai thác mẫu tuần tự nén
- pdf Luận văn ThS: Sử dụng cây quyết định để phân loại dữ liệu nhiễu
- pdf Luận văn ThS: Kỹ thuật Matrix Factorization trong xây dựng hệ tư vấn
- pdf Luận văn ThS: Khai thác tập mục lợi ích cao
- pdf Luận văn ThS: Khảo sát ảnh hưởng của các độ đo lợi ích lên độ chính xác trong bài toán phân lớp dựa trên luật kết hợp
- pdf Luận văn ThS: Một số kỹ thuật kiểm thử an toàn hệ thống
- pdf Luận văn ThS: Phát hiện tự động một số lỗi phát âm tiếng Anh của người học
- pdf Luận văn ThS: Ứng dụng khai thác mẫu chuỗi để khai thác hành vi sử dụng web
- pdf Luận văn ThS: Khai thác mẫu phổ biến cực đại trong đồ thị đơn bằng phương pháp so sánh gần đúng
- pdf Luận văn ThS: Khai thác mẫu trọng số phổ biến tối đại trong cơ sở dữ liệu giao dịch
- pdf Luận văn ThS: Một phương pháp bảo toàn tính riêng tư trong khai thác luật kết hợp trên cơ sở dữ liệu phân tán ngang
- pdf Luận văn ThS: Một thuật toán cải tiến trong khai thác luật kết hợp bảo toàn tính riêng tư
- pdf Luận văn ThS: Phân tích dữ liệu tạo cảnh báo học tập bằng mô hình hồi quy Logistic
- pdf Luận văn ThS: Sử dụng hồi quy tuyến tính trong dự đoán mức lương công việc trên quảng cáo tuyển dụng
- pdf Luận văn ThS: Khai thác song song tập phổ biến dựa trên mảng Systolic
- pdf Luận văn ThS: Nghiên cứu phương án tỉa ứng viên trong khai thác tập hữu ích cao
- pdf Luận văn ThS: Phân đoạn đối tượng trong ảnh MRI