5 Dịch vụ OCR trực tuyến miễn phí được kiểm tra và đánh giá


Bạn có tài liệu PDF hoặc hình ảnh mà bạn muốn chuyển đổi thành văn bản không? Gần đây, ai đó đã gửi cho tôi một tài liệu trong thư mà tôi cần chỉnh sửa và gửi lại với các chỉnh sửa. Người đó không thể tìm được một bản sao kỹ thuật số, vì vậy tôi được giao nhiệm vụ đưa tất cả văn bản đó vào định dạng kỹ thuật số.

Không có cách nào tôi dành hàng giờ để nhập mọi thứ vào, vì vậy tôi đã kết thúc một bức ảnh đẹp chất lượng cao của tài liệu và sau đó đốt cháy thông qua một loạt các dịch vụ OCR trực tuyến để xem một dịch vụ nào sẽ cho tôi kết quả tốt nhất.

Trong bài viết này, tôi sẽ giới thiệu cho các bạn một số các trang web yêu thích của tôi cho OCR miễn phí. Cần lưu ý rằng hầu hết các trang web này cung cấp dịch vụ miễn phí cơ bản và sau đó có các tùy chọn trả phí nếu bạn muốn thêm các tính năng như hình ảnh lớn hơn, tài liệu PDF nhiều trang, ngôn ngữ nhập khác nhau, v.v.

biết trước rằng hầu hết các dịch vụ này sẽ không thể khớp với định dạng của tài liệu gốc của bạn. Đây là chủ yếu để trích xuất văn bản và đó là nó. Nếu bạn cần mọi thứ để ở trong một bố trí hoặc định dạng cụ thể, bạn sẽ phải tự làm điều đó một khi bạn nhận được tất cả văn bản từ OCR.

Ngoài ra, kết quả tốt nhất để nhận được văn bản sẽ đến từ các tài liệu có độ phân giải DPI 200 đến 400. Nếu bạn có hình ảnh DPI thấp, kết quả sẽ không tốt.

Cuối cùng, có rất nhiều trang web tôi đã thử nghiệm không hoạt động. Nếu bạn Google OCR trực tuyến miễn phí, bạn sẽ thấy một loạt các trang web nhưng một số trang web trong 10 kết quả hàng đầu thậm chí không hoàn tất chuyển đổi. Một số sẽ hết thời gian, các lỗi khác sẽ gây ra lỗi và một số chỉ bị kẹt trên trang "chuyển đổi", vì vậy tôi thậm chí không bận tâm đến các trang web đó.

Đối với mỗi trang web, tôi đã thử nghiệm hai tài liệu để xem đầu ra sẽ tốt như thế nào. Đối với các thử nghiệm của tôi, tôi chỉ đơn giản sử dụng iPhone 5S để chụp ảnh cả hai tài liệu và sau đó tải chúng trực tiếp lên trang web để chuyển đổi.

Trong trường hợp bạn muốn xem hình ảnh trông như thế nào thử nghiệm của tôi, tôi đã đính kèm chúng ở đây: Test1Test2. Lưu ý rằng đây không phải là phiên bản có độ phân giải đầy đủ của hình ảnh được chụp từ điện thoại. Tôi đã sử dụng hình ảnh có độ phân giải đầy đủ khi tải lên trang web.

OnlineOCR

OnlineOCR.net là một trang web đơn giản và sạch sẽ cung cấp kết quả rất tốt trong thử nghiệm của tôi. Điều chính tôi thích về nó là nó không có nhiều quảng cáo trên khắp nơi, thường là trường hợp với các loại trang web dịch vụ thích hợp này.

free online ocr

Để bắt đầu, hãy chọn tệp của bạn và đợi cho đến khi quá trình tải lên hoàn tất. Kích thước tải lên tối đa cho trang web này là 100 MB. Nếu bạn đăng ký tài khoản miễn phí, bạn sẽ có thêm một số tính năng như kích thước tải lên lớn hơn, nhiều trang PDF, các ngôn ngữ nhập khác nhau, nhiều chuyển đổi hơn mỗi giờ, v.v.

Tiếp theo, chọn ngôn ngữ nhập liệu của bạn và sau đó chọn định dạng đầu ra. Bạn có thể chọn từ Word, Excel hoặc Plain Text. Nhấp vào nút Chuyển đổivà bạn sẽ thấy văn bản được hiển thị ở dưới cùng trong hộp cùng với liên kết tải xuống.

ocr output

Nếu tất cả những gì bạn muốn là văn bản, chỉ cần sao chép và dán nó từ hộp. Tuy nhiên, tôi đề nghị bạn tải xuống tài liệu Word vì nó thực hiện một công việc tuyệt vời để giữ bố cục của tài liệu gốc.

Ví dụ, khi tôi mở tài liệu Word cho bài kiểm tra thứ hai, tôi đã rất ngạc nhiên thấy rằng tài liệu bao gồm một bảng có ba cột, giống như trong hình ảnh.

online ocr output

Trong số tất cả các trang web, tài liệu này là tốt nhất cho đến nay. Nó hoàn toàn đáng để đăng ký nếu bạn cần thực hiện nhiều chuyển đổi.

Để hoàn tất, tôi cũng sẽ liên kết đến các tệp đầu ra được tạo bởi từng dịch vụ để bạn có thể xem kết quả cho chính mình. Đây là kết quả từ OnlineOCR: Tài liệu Test1Tài liệu Test2.

Lưu ý rằng khi mở các tài liệu Word này trên máy tính, bạn sẽ nhận được một tin nhắn Từ nói rằng nó từ Internet và chỉnh sửa đã bị vô hiệu hóa. Điều đó hoàn toàn OK vì Word không tin tưởng tài liệu từ Internet và bạn thực sự không phải bật chỉnh sửa nếu bạn chỉ muốn xem tài liệu.

i2OCR

Một trang web khác cho kết quả khá tốt là i2OCR. Quá trình này rất giống nhau: chọn ngôn ngữ, tệp của bạn và sau đó nhấn Trích xuất văn bản.

i2ocr

Bạn sẽ phải chờ một hoặc hai phút tại đây vì trang web này mất nhiều thời gian hơn một chút. Ngoài ra, trong Bước 2, hãy đảm bảo rằng hình ảnh của bạn đang hiển thị bên phải trong bản xem trước, nếu không bạn sẽ nhận được một loạt các sai ngữ pháp như đầu ra. Vì lý do nào đó, các hình ảnh từ iPhone của tôi được hiển thị ở chế độ dọc trên máy tính của tôi, nhưng phong cảnh khi tôi tải lên trang này.

i2ocr output

I đã phải mở thủ công hình ảnh trong ứng dụng chỉnh sửa ảnh, xoay 90 độ, sau đó xoay nó về chân dung và sau đó lưu lại. Sau khi hoàn tất, cuộn xuống và nó sẽ hiển thị cho bạn bản xem trước của văn bản cùng với nút tải xuống.

Trang web này khá tốt với kết quả đầu tiên cho thử nghiệm đầu tiên, nhưng không hoạt động tốt với bài kiểm tra thứ hai có bố cục cột. Dưới đây là kết quả từ i2OCR: Tài liệu Test1Tài liệu Test2.

FreeOCR

Free-OCR.com sẽ mất hình ảnh của bạn và chuyển đổi chúng thành văn bản thuần túy. Nó không có tùy chọn để xuất sang định dạng Word. Chọn tệp của bạn, chọn ngôn ngữ rồi nhấp Bắt đầu.

Trang web nhanh và bạn sẽ nhận được kết quả khá nhanh. Chỉ cần nhấp vào liên kết để tải tệp văn bản xuống máy tính của bạn.

freeocr

Như với NewOCR được đề cập bên dưới, trang web này tận dụng tất cả T của tài liệu. Tôi không có ý tưởng tại sao nó sẽ làm điều đó, nhưng đối với một số lý do lẻ trang web này và NewOCR cả hai đã làm điều này. Nó không phải là một việc lớn để thay đổi nó, nhưng nó là một quá trình tẻ nhạt bạn thực sự không cần phải làm.

Đây là kết quả từ FreeOCR: Tài liệu Test1Tài liệu Test2.

ABBYY FineReader Trực tuyến

Để sử dụng FineReader trực tuyến, bạn phải đăng ký tài khoản, tài khoản này sẽ giúp bạn sau 15 ngày dùng thử miễn phí lên tới 10 trang miễn phí. Nếu bạn chỉ cần làm một OCR một lần cho một vài trang, thì bạn có thể sử dụng dịch vụ này. Đảm bảo rằng bạn nhấp vào liên kết xác minh trong email xác nhận sau khi bạn đăng ký.

finereader online

Nhấp vào Nhận raở trên cùng rồi nhấp Tải lênđể chọn tệp của bạn. Chọn ngôn ngữ, định dạng đầu ra của bạn và sau đó nhấp vào Nhận dạngở dưới cùng. Trang web này có giao diện sạch và không có quảng cáo.

Trong các thử nghiệm của tôi, trang web này có thể lấy văn bản từ tài liệu thử nghiệm đầu tiên, nhưng nó hoàn toàn rất lớn khi tôi mở tài liệu Word, vì vậy tôi kết thúc lên làm lại và chọn Plain Text làm định dạng đầu ra.

Đối với thử nghiệm thứ hai với các cột, tài liệu Word trống và tôi thậm chí không thể tìm thấy văn bản. Không chắc điều gì đã xảy ra ở đó, nhưng dường như không thể xử lý bất kỳ điều gì ngoài các đoạn văn đơn giản. Đây là kết quả từ FineReader: Tài liệu Test1Tài liệu Test2.

NewOCR

Trang tiếp theo, NewOCR.com, đã được OK, nhưng không gần như tốt như trang web đầu tiên. Thứ nhất, nó có quảng cáo, nhưng may mắn không phải là một tấn. Trước tiên, bạn chọn tệp của mình và sau đó nhấp vào nút Xem trước.

upload image

Sau đó, bạn có thể xoay hình ảnh và điều chỉnh khu vực nơi bạn muốn quét văn bản. Nó khá giống với quá trình quét hoạt động trên máy tính với máy quét được đính kèm.

ocr image

Nếu tài liệu có nhiều cột, bạn có thể kiểm tra nút Phân tích bố cục trangvà nó sẽ cố gắng chia văn bản thành các cột. Nhấp vào nút OCR, đợi vài giây để hoàn thành và sau đó cuộn xuống dưới cùng khi trang làm mới.

Trong thử nghiệm đầu tiên, nó có tất cả văn bản chính xác, nhưng vì một số lý do viết hoa tất cả T trong tài liệu! Không có ý tưởng tại sao nó sẽ làm điều đó, nhưng nó đã làm. Trong thử nghiệm thứ hai với phân tích trang được kích hoạt, nó có phần lớn văn bản, nhưng bố cục đã hoàn toàn tắt.

Đây là kết quả từ NewOCR: Tài liệu Test1Tài liệu Test2.

Kết luận

Như bạn có thể thấy, miễn phí không thực sự cung cấp cho bạn kết quả rất tốt trong hầu hết thời gian. Trang web đầu tiên được đề cập là tốt nhất cho đến nay bởi vì nó không chỉ làm một công việc tuyệt vời để nhận ra tất cả văn bản, nó cũng quản lý để giữ lại định dạng của tài liệu gốc.

Nếu bạn chỉ cần văn bản, mặc dù , hầu hết các trang web ở trên đều có thể làm điều đó cho bạn. Nếu bạn có bất kỳ câu hỏi nào, hãy bình luận. Hãy tận hưởng!

The Cold War in Asia: Crash Course US History #38

bài viết liên quan:


2.12.2015