Hướng dẫn ocr php example - ví dụ php ocr

How to extract text from images ?

Chào mọi người, hôm nay mình sẽ giới thiệu cách làm thế nào để có thể đọc được text từ hình ảnh có sẵn. Trước tiên đi vào thực hiện [code] mình sẽ trình bày sơ qua về cái mà mình sẽ sử dụng đó là công nghệ nhận dạng ký tự quang học OCR. Vậy thì OCR là gì ???

1. Khái niệm

OCR là một thuật ngữ viết tắt từ cụm từ Optical Character Recognition có thể dịch nôm na nó là Nhận dạng ký tự bằng quang học. Đây là công nghệ được áp dụng để đọc text trên một file ảnh thành định dạng text.

2. Ứng dụng

Chắc hẳn các bạn đã một lần sử dụng đến công nghệ nhưng không để ý, vì chúng ta chỉ sử dụng nó một cách gián tiếp đó là máy Scanner. OCR được ứng dụng như một phần mềm được tích hợp trên máy tính hoặc trực tiếp vào một phần cứng nào đó. Một số phần mềm khá nổi tiếng như:

  • ABBYY FineReader
  • PDF OCR
  • //www.onlineocr.net
  • ...

Trong số những phần mềm đó thì mình nghĩ ABBYY FineReader là phần mềm tốt nhất, đơn giản vì thời sinh viên mình rất hay dùng phần mềm này để convert những file PDF sang word để copy cho nhanh đỡ phải gõ lại [haha]ABBYY FineReader là phần mềm tốt nhất, đơn giản vì thời sinh viên mình rất hay dùng phần mềm này để convert những file PDF sang word để copy cho nhanh đỡ phải gõ lại [haha]

3. Hạn chế của OCR

Bên cạnh đó thì OCR cũng còn khá nhiều những hạn chế như:

  • Hầu hết các phần mềm sử dụng OCR chỉ nhận dạng được khoảng 80 - 90% trên hình ảnh rõ nét.
  • Đối với những hình ảnh có màu nền mà màu chữ không có nhiều chênh lệch, hay các hình chụp chữ viết tay thì kết quả nhận dạng không khả quan cho lắm
  • Đến thời điểm hiện tại thì OCR chưa support tất cả các ngôn ngữ.

4. Xây dựng demo chức năng Extract text from Image sử dụng OCR

Mình sẽ code demo chắc năng này với CakePHP và sử dụng IDOL OCR API [A.hihi]

IDOL OCR API là gì thì mình xin giới thiệu nhanh, nó là một web-service và bạn có thể dử dụng service này ở nhiều ngôn ngữ như PHP , Java , .NET , Python,…etc. Còn trong khuôn khổ bài viết này thì mình sẽ sử dụng ngôn ngữ PHP =]] IDOL OCR API support những format sau: là gì thì mình xin giới thiệu nhanh, nó là một web-service và bạn có thể dử dụng service này ở nhiều ngôn ngữ như PHP , Java , .NET , Python,…etc. Còn trong khuôn khổ bài viết này thì mình sẽ sử dụng ngôn ngữ PHP =]] IDOL OCR API support những format sau:

- Image Formats
  • TIFF
  • JPEG
  • PNG
  • GIF
  • BMP and ICO
  • PBM, PGM, and PPM
- Document Formats
  • Adobe PDF [PDF]
  • Microsoft Word Documnent [DOC and DOCX]
  • Microsoft Excel Sheet [XLS and XLSX]
  • Microsoft Powerpoint Presentation [PPT and PPTX]
  • OpenDocument Text [ODT]
  • Rich Text [RTF]

Để sử dụng service này thì việc cần làm những bước sau

Bước 1

Đăng ký một tài khoản tại đây

Bước 2

Đăng nhập và copy API Key tại đây

Xong 2 bước trên bạn đã có thể sử dụng service này rồi, bạn có thể sử dụng web service này với cả phương thức POST và GET, còn trong demo này mình sẽ sử dụng phương thức POST thôi nhóe!

Lý thuyết nhiều rồi, nào! bây giờ là lúc các bạn bắt tay vào thực hiện một chức năng để hiểu được những gì mình đã giới thiệu bên trên. Tất cả những thứ bạn cần làm là 1 action và một view thể hiện giao diện của action đó.

View: TopPages/extract_text_from_images.ctp



    
        
            
                
                
                Extracted text from Image
                    
                        

Bài Viết Liên Quan

Chủ Đề