Tiểu luận: Nhận dạng kí tự viết tay tiếng Việt

Tiểu luận Nhận dạng kí tự viết tay tiếng Việt giới thiệu, mô tả bài toán; đề xuất phương pháp giải quyết và giưới thiệu phần mềm sapphireOCR.

Tiểu luận: Nhận dạng kí tự viết tay tiếng Việt

1. Giới thiệu

Nhận dạng kí tự quang học (Optical Character Recognition – OCR) là lĩnh vực nghiên cứu cách chuyển đổi ảnh số được chụp hay quét từ tài liệu viết tay, đánh máy hay in thành dạng văn bản máy tính có thể hiểu được. Trên thế giới, công nghệ OCR đã có những tác động sâu sắc đến nhiều lĩnh vực trong sản xuất và đời sống. Việc chuyển các văn bản in trên giấy thành dạng điện tử nhỏ gọn và dễ tìm kiếm giúp hàng triệu trang sách báo đến được với bạn đọc khắp nơi trên thế giới. Ở Việt Nam, công nghệ OCR mới chỉ phát triển ở giai đoạn đầu với một vài bộ phần mềm nhận dạng kí tự in như VnDOCR, VietOCR, ABBYY trong khi đó lĩnh vực nhận dạng chữ viết tay vẫn còn bỏ ngỏ. Với số lượng lớn tài liệu viết tay cần được xử lí cũng như sự phát triển của công nghệ di động và PDA đây là một hướng nghiên cứu đầy triển vọng.  

2. Nội dung

2.1 Mô tả bài toán

Giả thiết rằng ở bước xử lí trước kí tự đã được phân lập, kết quả là các ảnh nhị phân kích thước 60x80 mỗi ảnh chứa một kí tự tiếng Việt (có dấu) trong đó các kí tự có độ nghiêng không quá lớn và kích thước hợp chuẩn với sai số chấp nhận được, cần chuyển kí tự thành dạng mã hoá Unicode.  

2.2 Phương pháp giải quyết bài toán

Cơ sở lí thuyết

  • Mạng neuron
  • Perceptron
  • Mạng neuron nhiều lớp và giải thuật lan truyền ngược 

Giải quyết bài toán

  • Chương trình
  • Khởi tạo mạng neuron
  • Chuẩn bị dữ liệu
  • Các kết quả thực nghiệm

2.3 Giới thiệu về phần mềm sapphireOCR 

Hướng dẫn cài đặt 

Hướng dẫn sử dụng

2.4 Các vấn đề phát sinh và đề xuất

Kết quả nhận dạng thấp: Nguyên nhân có thể là do khâu tiền xử lí thực hiện chưa tốt. Để giải quyết vấn đề này cần cải thiện thuật toán tiền xử lí và khi kết hợp với chương trình nhận dạng tài liệu có thể đưa thêm một số thuật toán “đoán” dựa vào từ điển.  

Tốc độ huấn luyện chậm: Khi thử nghiệm bộ dữ liệu đầy đủ, chương trình cần  112 phút để hoàn tất huấn luyện. Giải pháp: song song hoá thuật toán huấn luyện. 

3. Tài liệu tham khảo

Thầy Nguyễn Nhật Quang, Slide bài giảng môn Trí tuệ nhân tạo, 2010  

Jeff Heaton – Introduction to Neural Networks with Java, 1st Ed  

Tom M. Mitchell, Machine learning, 1997  

Tinku Acharya, Image processing Principles and Applications  

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Tiểu luận trên ---

Ngày:24/08/2020 Chia sẻ bởi:

CÓ THỂ BẠN QUAN TÂM