Luận văn ThS: Phát hiện tự động một số lỗi phát âm tiếng Anh của người học

Luận văn Phát hiện tự động một số lỗi phát âm tiếng Anh của người học giới thiệu tổng quan về đề tài; trình bày cơ sở lí thuyết; tiến hành thí nghiệm và đánh giá kết quả.

Luận văn ThS: Phát hiện tự động một số lỗi phát âm tiếng Anh của người học

1. Mở đầu

1.1 Tính cấp thiết

Việc phát âm đúng tiếng Anh sẽ giúp người học giao tiếp hiệu quả và tự tin hơn.  Tuy nhiên, do bị ảnh hưởng bởi ngôn ngữ mẹ đẻ và các thói quen hình thành khi phát âm tiếng Việt, chúng ta thường có khuynh hướng rơi vào một số lỗi chung khiphát âm tiếng Anh. Chẳng hạn bỏ sót âm vị cuối (ví dụ bỏ âm vị /t/ trong từ ‘mount’), phát âm sai âm vị /r/ trong từ ‘right’ (vì tiếng Việt không có âm vị này), v.v…Để có thể khắc phục các lỗi này, cần phải có người phát âm đúng thường xuyên chỉ ra các lỗi phát âm sai của người học, từ đó người học có thể rèn luyện và bỏ các thói quen dẫn đến phát âm sai. Việc này đòi hỏi nhiều thời gian, đặc biệt là khi người học không có điều kiện để giao tiếp với người phát âm đúng và không sống trong môi trường nói tiếng Anh. Đặc biệt, đối với những người tự học, không có điều kiện để nhận được sự chỉ dẫn từ giáo viên, việc khắc phục các lỗi phát âm sẽ trở nên khó khăn hơn rất nhiều.

1.2 Mục tiêu nghiên cứu

Mục tiêu tổng quát của đề tài là thực nghiệm để khảo sát việc tự động phát hiện các lỗi phát âm tiếng Anh thường gặp của người học trên các kho dữ liệu Buckeye và TIMIT.

Mục tiêu cụ thể của đề tài gồm:

  • Tìm hiểu các kiến thức nền tảng về ngữ âm học, âm vị học, và các kỹ
  • thuật xử lý tiếng nói.
  • Tìm hiểu mô hình xử lý âm thanh phù hợp để có thể phát hiện được các lỗi trong phạm vi nghiên cứu.
  • Tiến hành thử nghiệm mô hình xử lý trên các tập dữ liệu lớn đáng tin cậy.

1.3 Đối tượng phạm vi nghiên cứu

Nghiên cứu sẽ được tiến hành trên một tập xác định các lỗi phát âm tiếng Anh của người học, xét trên trường hợp cụ thể là người Việt và người Tây Ban Nha học tiếng Anh. Cụ thể là lỗi phát âm khi phát âm các âm vị:[ae], [p], [aa], [sh], [iy] trong tiếng Anh.

2. Nội dung

2.1 Tổng quan

Các nghiên cứu liên quan 

  • Phát hiện lỗi dựa trên xác suất (likelihood-based scoring)
  • Phương pháp độc lập ngôn ngữ thứ nhất (L1-independent)
  • Phương pháp phụ thuộc ngôn ngữ thứ nhất (L1-dependency)
  • Phát hiện lỗi dựa trên bộ phân loại (classifier-based scoring)
  • Mô hình tiếng nói do người nước ngoài phát âm (non-native acoustic modeling)
  • Phát hiện lỗi phát âm độc lập với văn bản(text independence)
  • Phát hiện và phản hồi lỗi về nhịp điệu phát âm(prosodic pronunciation error)
  • Thiết kế hệ thống CAPT có tính tương tác (Interactive CAPT system design)

Các vấn đề còn tồn tại 

Phương hướng giải quyết của nghiên cứu này

2.2 Cơ sở lí thuyết

Cơ bản về ngữ âm học và âm vị học 

  • Ngữ âm học và âm vị học
  • Âm vị (phoneme) và âm tố (phone hay speech sound) 
  • Phụ âm (consonant) và nguyên âm (vowel)
  • Ví trí phát âm (place of articulation)
  • Cách thức phát âm (manner of articulation)
  • Hình thang nguyên âm
  • Âm hữu thanh (voice) và âm vô thanh (voiceless)
  • Tha âm vị (allophone)
  • Hệ thống âm vị tiếng Việt
  • Hệ thống âm vị tiếng Anh

Xác định một số lỗi sai thường gặp của người Việt học tiếng Anh 

Cơ bản về xử lý tiếng nói

  • Spectrogram
  • Formant
  • Đặc trưng ngữ âm (Acoustic feature)

Support Vector Machine

  • Các khái niệm cơ bản
  • Cực đại hóa bộ phân loại hậu nghiệm (classifier posterior) 
  • Cực tiểu hóa rủi ro về mặt cấu trúc

2.3 Thí nghiệm và đánh giá

Mô tả các kho dữ liệu được sử dụng trong thí nghiệm

  • Kho dữ liệu TIMIT 
  • Mô tả bộ dữ liệu mẫu của TIMIT
  • Kho dữ liệu Buckeye

Các thư viện và công cụ dùng trong thí nghiệm

  • Thư viện HTK và công cụ HCopy
  • Thư viện SVM 
  • Praat

Huấn luyện các SVM

3. Kết luận

Trong luận văn này, tác giả đã thực hiện các công việc sau:

  • Tổng hợp và hệ thống hoá các kiến thức nền tảng làm cơ sở cho việc phát hiện tự động các lỗi phát âm tiếng Anh của người học.
  • Tìm hiểu các nghiên cứu liên quan đến lĩnh vực này để có cơ sở chọn được phương pháp xử lý phù hợp áp dụng cho mục đích của luận văn.
  • Chọn lựa phương pháp xử lý, tiến hành thử nghiệm phương pháp đã chọn trên hai tập dữ liệu Buckeye và TIMIT, đánh giá kết quả.
  • Để minh hoạ cho phương pháp này tác giả đã áp dụng để phát hiện một số lỗi phát âm thường gặp của người Việt. Các lỗi phát âm này được tác giả chọn lựa dựa trên giả thuyết rằng thói quen phát âm mẹ đẻ của các âm vị gần giống các âm vị tương ứng trong tiếng Anh (nhưng không tồn tại trong tiếng Anh) sẽ gây ra các lỗi phát âm.

4. Tài liệu tham khảo

Âm vị và các hệ thống âm vị tiếng Việt [online] . Available from:<http://ngonngu.net?p=64>.[Accessed 5 Jun 2015]

Boersma, P. and Weenink, D., 2010. Praat: doing phonetics by computer. [online]. Available from: http://www.citeulike.org/group/14233/article/8146799 [Accessed 5 Jun 2015].

Burges, C. J., 1998. A tutorial on support vector machines for pattern recognition. Data mining and knowledge discovery, 2 (2), 121–167

Chang, C.-C. and Lin, C.-J., 2011. LIBSVM: a library for support vector machines. ACM Transactions on Intelligent Systems and Technology (TIST), 2 (3), 27.....

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn trên ---

Ngày:04/09/2020 Chia sẻ bởi:

CÓ THỂ BẠN QUAN TÂM