Luận văn ThS: Trích chọn đặc trưng kết cấu màu cục bộ cho bài toán nhận dạng ảnh màu mặt người

Luận văn Trích chọn đặc trưng kết cấu màu cục bộ cho bài toán nhận dạng ảnh màu mặt người trình bày các kiến thức nền tảng, kỹ thuật trích chọn kết cấu đặc trưng màu cục bộ; đề xuất mô hình và thực nghiệm.

Luận văn ThS: Trích chọn đặc trưng kết cấu màu cục bộ cho bài toán nhận dạng ảnh màu mặt người

1. Mở đầu

1.1 Tính cấp thiết

Nhận dạng ảnh mặt người (FR) có rất nhiều ứng dụng thực tế hiện nay, chẳng hạn như: Giám sát qua camera (Bowyer, 2004), Nhận dạng bằng đặc điểm sinh trắc (Jain et al., 2004), Đánh chỉ mục nội dung multimedia, v..v. Ngoài ra, các hệ thống tương tác người máy (HCI) thông minh cũng rất cần đến kết quả của bài toán nhận dạng mặt người để có thể hỗ trợ người dùng bảo quản được các thông tin nhạy cảm mà không cần phải lo lắng về việc đánh mất hoặc mất cắp thông tin xác thực (như số PIN để truy cập ATM, password để truy cập máy tính và các hệ thống trên mạng Internet). Ưu điểm của việc sử dụng FR trong an ninh là nó cho phép xác thực người dùng mà không cần sự hợp tác của đối tượng. So với các phương pháp xác thực dựa trên sinh trắc học khác như: Nhận dạng dấu vân tay, tròng mắt, v.v… (mặc dù rất đáng tin cậy và chính xác, nhưng lại đòi hỏi sự hợp tác của người dùng), đây là một lợi thế lớn. Vì vậy, trong khoảng 10 năm trở lại đây, bài toán nhận dạng mặt người thu hút nhiều sự quan tâm của các nhà nghiên cứu trong các lĩnh vực nhận dạng, xử lý ảnh, thị giác máy tính. Việc tìm ra các phương pháp làm tăng độ chính xác nhận dạng mặt không những có giá trị khoa học, mà còn có giá trị thực tiễn rất lớn.

1.2 Mục tiêu nghiên cứu

Đề xuất được phương pháp trích chọn đặc trưng kết cấu màu cục bộ cho bài toán nhận dạng ảnh màu mặt người, trên cơ sở cải tiến phương pháp của Choi và các đồng sự, sao cho tăng độ chính xác nhận dạng (so với phương pháp của Choi và các đồng sự ).

2. Nội dung

2.1 Các kiến thức nền tảng

Các không gian màu

  • Không gian màu RGB
  • Không gian màu CMYK
  • Không gian màu HSV 
  • Các không gian màu CIE

Bài toán nhận dạng ảnh mặt ngƣời

  • Các độ đo khoảng cách giữa các đối tượng
  • Độ đo khoảng cách giữa các dãy
  • Độ đo theo lý thuyết thông tin

2.2 Kỹ thuật trích chọn

Mẫu nhị phân cục bộ (Local Binary Pattern – LBP)

  • Thuật toán LBP
  • Thuật toán Opponent color LBP (OCLBP)
  • Mẫu nhị phân đồng dạng – Uniform Pattern

Các bước xử lý trong phương pháp trích trọn đặc trưng

  • Mô hình trích chọn đặc trưng của Choi và các đồng sự
  • Trích chọn đặc trưng LBP màu (CLBP)
  • Kết hợp

2.3 Mô hình đề xuất và thực nghiệm

Mô hình đề xuất

Các không gian màu lựa chọn

  • Không gian màu YIQ
  • Không gian màu ZRG
  • Không gian màu RCrQ
  • Kết hợp các không gian màu

Cơ sở dữ liệu ảnh màu Color Feret

  • Giới thiệu
  • Quy tắc đặt tên hình ảnh
  • Ground Truth File

Cơ sở lý thuyết PCA

  • Giới thiệu
  • Thuật toán PCA

Khoảng cách Mahalanobis

  • Giới thiệu
  • Định nghĩa và tính chất

Mô tả thí nghiệm

Kết quả thực nghiệm

Đánh giá thực nghiệm

3. Kết luận

Thuật toán nhận dạng khuôn mặt bằng phương pháp trích chọn đặc trưng kết cấu màu cục bộ của (Choi et al., 2012) đã cho kết quả nhận dạng khuôn mặt rất tốt trong các điều kiện cụ thể (ví dụ như thiếu sáng hay các hình ảnh có độ phân giải thấp). Tuy nhiên thuật toán cũng có mặt hạn chế khi sử dụng một cấu hình có thành phần màu sắc cố định như YCbCr và ZRG (Choi et al., 2012). Nhằm cải tiến các hạn chế trên, qua quá trình thực nghiệm, báo cáo của tác giả đã đóng góp một phần nhỏ vào việc nâng cao hiệu suất nhận dạng khuôn mặt bằng việc kết hợp các không gian màu và tìm kiếm một vài không gian màu cho kết quả nhận diện khuôn mặt khá tốt với độ chính xác cao, cụ thể như RIQ, RQCb. Có thể thấy các không gian màu khác nhau sẽ cho độ chính xác nhận diện khuôn mặt khác nhau.

4. Tài liệu tham khảo

Ahonen, T., Hadid, A., Pietikainen, M., (2006). Face Description with Local Binary Patterns: Application to Face Recognition. IEEE Trans. Pattern Anal. Mach. Intell. 28, 2037–2041. doi:10.1109/TPAMI.2006.244

Bowyer, K.W., (2004). Face recognition technology: security versus privacy. IEEE Technol. Soc. Mag. 23, 9–19. doi:10.1109/MTAS.2004.1273467

Chaudhuri, B.B., Rosenfeld, A., (1999). A modified Hausdorff distance between fuzzy sets. Inf. Sci. 118, 159–171. doi:10.1016/S0020-0255(99)00037-7

Choi, J.Y., De Neve, W., Ro, Y.M., Plataniotis, K.N., (2010). Automatic Face Annotation in Personal Photo Collections Using Context-Based Unsupervised Clustering and Face Information Fusion. IEEE Trans. Circuits Syst. Video Technol. 20, 1292–1309. doi:10.1109/TCSVT.2010.2058470.....

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn trên ---

Ngày:04/09/2020 Chia sẻ bởi:

CÓ THỂ BẠN QUAN TÂM