5 Dịch vụ OCR Trực tuyến Miễn phí Đã được Kiểm tra và Đánh giá

Bạn có tài liệu PDF(PDF document) hoặc hình ảnh mà bạn muốn chuyển đổi thành văn bản? Gần đây, ai đó đã gửi cho tôi một tài liệu qua thư mà tôi cần chỉnh sửa và gửi lại kèm theo những sửa chữa. Người đó không thể tìm thấy bản sao kỹ thuật số, vì vậy tôi được giao nhiệm vụ chuyển tất cả văn bản đó sang định dạng kỹ thuật số.

Không đời nào tôi lại mất hàng giờ để gõ lại mọi thứ, vì vậy tôi đã kết thúc việc chụp một bức ảnh chất lượng cao đẹp đẽ của tài liệu và sau đó lướt qua một loạt các dịch vụ OCR trực tuyến để xem cái nào sẽ cho tôi cái tốt nhất các kết quả.

Trong bài viết này, tôi sẽ điểm qua một số trang web yêu thích của tôi cho OCR miễn phí. Điều đáng chú ý là hầu hết các trang web này đều cung cấp dịch vụ miễn phí cơ bản và sau đó có các tùy chọn trả phí nếu bạn muốn các tính năng bổ sung như hình ảnh lớn hơn, tài liệu PDF nhiều trang , ngôn ngữ đầu vào khác nhau, v.v.

Cũng nên biết trước rằng hầu hết các dịch vụ này sẽ không thể khớp với định dạng của tài liệu gốc của bạn. Chúng chủ yếu là để trích xuất văn bản và thế là xong. Nếu bạn cần mọi thứ ở một bố cục hoặc định dạng(layout or format) cụ thể , bạn sẽ phải làm điều đó theo cách thủ công sau khi nhận được tất cả văn bản từ OCR .

Ngoài ra, kết quả tốt nhất để lấy văn bản sẽ đến từ các tài liệu có độ phân giải 200 đến 400 DPI(DPI resolution) . Nếu bạn có hình ảnh DPI(DPI image) thấp , kết quả sẽ không tốt.

Cuối cùng, có rất nhiều trang web tôi đã thử nghiệm không hoạt động(t work) . Nếu bạn Google OCR trực tuyến miễn phí , bạn sẽ thấy một loạt các trang web nhưng một số trang web trong 10 kết quả hàng đầu thậm chí không hoàn thành chuyển đổi. Một số sẽ hết thời gian, một số khác sẽ xuất hiện lỗi và một số chỉ bị mắc kẹt trên trang “chuyển đổi”, vì vậy tôi thậm chí không buồn đề cập đến những trang web đó.

Đối với mỗi trang web, tôi đã kiểm tra hai tài liệu để xem kết quả đầu ra sẽ tốt như thế nào. Đối với các bài kiểm tra của mình, tôi chỉ cần sử dụng iPhone 5S của mình để chụp ảnh cả hai tài liệu và sau đó tải chúng trực tiếp lên các trang web để chuyển đổi.

Trong trường hợp bạn muốn xem những hình ảnh mà tôi đã sử dụng cho bài kiểm tra của mình, tôi đã đính kèm chúng ở đây: Test1Test2 . Lưu ý rằng đây không phải là phiên bản độ phân giải đầy đủ của hình ảnh được chụp từ điện thoại. Tôi đã sử dụng hình ảnh có độ phân giải(resolution image) đầy đủ khi tải lên các trang web.

OnlineOCR

OnlineOCR.net là một trang web sạch sẽ và đơn giản mang lại kết quả rất tốt trong bài kiểm tra của tôi. Điều chính tôi thích ở nó là nó không có hàng tấn quảng cáo khắp nơi, điều này thường xảy ra với những loại trang web dịch vụ thích hợp(niche service) này.

ocr trực tuyến miễn phí

Để bắt đầu, hãy chọn tệp của bạn và đợi cho đến khi(file and wait till) tải lên xong. Kích thước tải lên tối đa cho trang web này là 100 MB. Nếu đăng ký tài khoản miễn phí, bạn sẽ nhận được một số tính năng bổ sung như kích thước tải lên lớn hơn, tệp PDF(PDFs) nhiều trang , ngôn ngữ đầu vào khác nhau, nhiều chuyển đổi hơn mỗi giờ, v.v.

Tiếp theo, chọn ngôn ngữ đầu vào(input language) của bạn và sau đó chọn định dạng đầu ra(output format) . Bạn có thể chọn từ Word , Excel hoặc Văn bản thuần túy(Plain Text) . Nhấp vào(Click) nút Chuyển đổi(Convert) và bạn sẽ thấy văn bản được hiển thị ở dưới cùng trong một hộp cùng với liên kết tải xuống(download link) .

đầu ra ocr

Nếu tất cả những gì bạn muốn là văn bản, chỉ cần sao chép và dán(copy and paste) nó từ hộp. Tuy nhiên, tôi khuyên bạn nên tải xuống tài liệu Word(Word document) vì nó thực hiện một công việc tuyệt vời đáng ngạc nhiên là giữ nguyên bố cục của tài liệu gốc.

Ví dụ, khi tôi mở tài liệu Word(Word document) để làm bài kiểm tra thứ hai, tôi đã rất ngạc nhiên khi thấy rằng tài liệu này bao gồm một bảng có ba cột, giống như trong hình.

đầu ra ocr trực tuyến

Trong số tất cả các trang web, trang này là tốt nhất cho đến nay. Nó hoàn toàn đáng để đăng ký nếu bạn cần thực hiện nhiều chuyển đổi.

Để hoàn chỉnh, tôi cũng sẽ liên kết đến các tệp đầu ra được tạo bởi từng dịch vụ để bạn có thể tự xem kết quả. Đây là kết quả từ OnlineOCR : Test1 Doc và Test2 Doc(Test1 Doc and Test2 Doc) .

Lưu ý rằng khi mở các tài liệu Word này trên máy tính của bạn, bạn sẽ nhận được thông báo trong Word cho biết rằng nó từ Internet và tính năng chỉnh sửa(Internet and editing) đã bị tắt. Điều đó hoàn toàn ổn vì Word không(Word doesn) tin tưởng các tài liệu từ Internet và bạn thực sự không cần phải kích hoạt tính năng chỉnh sửa nếu chỉ muốn xem tài liệu.

i2OCR

Một trang khác cũng cho kết quả khá tốt là i2OCR . Quá trình này rất tương tự: chọn ngôn ngữ, tệp của bạn, sau đó nhấn Trích xuất văn bản(Extract Text) .

i2ocr

Bạn sẽ phải đợi một hoặc hai phút ở đây vì trang web này mất nhiều thời gian hơn một chút. Ngoài ra, trong Bước 2(Step 2) , hãy đảm bảo rằng hình ảnh của bạn hiển thị ở phía bên phải trong bản xem trước, nếu không, bạn sẽ nhận được một loạt các chữ vô nghĩa khi xuất ra. Vì một số lý do, hình ảnh từ iPhone của tôi hiển thị ở chế độ(portrait mode) dọc trên máy tính của tôi, nhưng nằm ngang khi tôi tải lên trang web này.

đầu ra i2ocr

Tôi đã phải mở hình ảnh theo cách thủ công trong một ứng dụng chỉnh sửa ảnh, xoay nó 90 độ, sau đó xoay nó trở lại chân dung và sau đó lưu lại. Sau khi(Once) hoàn tất, hãy cuộn xuống và nó sẽ hiển thị cho bạn bản xem trước của văn bản cùng với nút tải xuống(download button) .

Trang web này hoạt động khá tốt với kết quả đầu ra cho thử nghiệm đầu tiên, nhưng lại không hoạt động tốt với thử nghiệm thứ hai có bố cục cột(column layout) . Đây là kết quả từ i2OCR: Test1 Doc và Test2 Doc(Test1 Doc and Test2 Doc) .

FreeOCR

Free-OCR.com sẽ lấy hình ảnh của bạn và chuyển chúng thành văn bản thuần túy(plain text) . Nó không có tùy chọn để xuất sang định dạng Word(Word format) . Chọn tệp của bạn, chọn một ngôn ngữ và sau đó nhấp vào Bắt đầu(Start) .

Trang web nhanh và bạn sẽ nhận được đầu ra khá nhanh chóng. Chỉ cần nhấp(Just click) vào liên kết để tải tệp văn bản(text file) về máy tính của bạn.

freeocr

Như với NewOCR được đề cập bên dưới, trang web này viết hoa tất cả các chữ T trong tài liệu. Tôi không biết tại sao nó lại làm như vậy, nhưng vì một số lý do kỳ lạ mà trang web này và NewOCR(site and NewOCR) đều đã làm điều này. Thay đổi nó không phải là một vấn đề lớn, nhưng đó là một quá trình tẻ nhạt mà bạn thực sự không nên làm.

Đây là kết quả từ FreeOCR : Test1 Doc và Test2 Doc(Test1 Doc and Test2 Doc) .

ABBYY FineReader Trực tuyến

Để sử dụng FineReader Online , bạn phải đăng ký tài khoản, tài khoản này sẽ giúp bạn có 15 ngày dùng thử miễn phí OCR lên đến 10 trang miễn phí. Nếu bạn chỉ cần thực hiện OCR một lần cho một vài trang, thì bạn có thể sử dụng dịch vụ này. Đảm(Make) bảo rằng bạn nhấp vào liên kết xác minh(verify link) trong email xác nhận(confirmation email) sau khi đăng ký.

máy đọc sách trực tuyến

Nhấp vào Nhận dạng(Recognize) ở trên cùng và sau đó nhấp vào Tải lên(Upload) để chọn tệp của bạn. Chọn ngôn ngữ, định dạng đầu ra của bạn và sau đó nhấp vào Nhận dạng(Recognize) ở dưới cùng. Trang web này có giao diện sạch sẽ và không có quảng cáo.

Trong các thử nghiệm của tôi, trang web này có thể lấy văn bản từ tài liệu thử nghiệm(test document) đầu tiên , nhưng nó hoàn toàn rất lớn khi tôi mở tài liệu Word(Word doc) , vì vậy tôi đã thực hiện lại và chọn Văn(Plain Text) bản thuần túy làm định dạng đầu ra(output format) .

Đối với thử nghiệm thứ hai với các cột, tài liệu Word(Word document) trống và tôi thậm chí không thể tìm thấy văn bản. Không chắc chắn những gì đã xảy ra ở đó, nhưng nó dường như không thể xử lý bất cứ điều gì khác ngoài các đoạn văn đơn giản. Đây là kết quả từ FineReader : Test1 Doc và Test2 Doc.

NewOCR

Trang tiếp theo, NewOCR.com , khá ổn, nhưng gần như không tốt bằng trang đầu tiên. Thứ nhất, nó có quảng cáo, nhưng may mắn thay, nó không phải là một tấn. Trước tiên, bạn chọn tệp của mình và sau đó nhấp vào nút Xem trước(Preview) .

tải lên hình ảnh

Sau đó, bạn có thể xoay hình ảnh và điều chỉnh khu vực bạn muốn quét văn bản. Nó khá giống cách quá trình quét(scanning process) hoạt động trên một máy tính có máy quét đi kèm.

hình ảnh ocr

Nếu tài liệu có nhiều cột, bạn có thể kiểm tra nút Phân tích bố cục trang( Page layout analysis) và nó sẽ cố gắng chia văn bản thành các cột. Nhấp vào(Click) nút OCR(OCR button) , đợi một vài giây để hoàn thành và sau đó cuộn xuống cuối khi trang làm mới.

Trong lần kiểm tra đầu tiên, nó nhận được tất cả các văn bản một cách chính xác, nhưng vì một số lý do mà viết hoa mọi chữ T trong tài liệu! Không hiểu tại sao nó sẽ làm như vậy, nhưng nó đã làm. Trong thử nghiệm thứ hai với tính năng phân tích trang(page analysis) được bật, nó có phần lớn văn bản, nhưng bố cục hoàn toàn bị tắt.

Đây là kết quả từ NewOCR : Test1 Doc và Test2 Doc.

Phần kết luận

Như bạn có thể thấy, phần lớn thời gian miễn phí không thực sự mang lại cho bạn kết quả tốt. Trang web đầu tiên được đề cập là tốt nhất cho đến nay vì nó không chỉ làm rất tốt việc nhận dạng tất cả văn bản mà còn quản lý để giữ lại định dạng của tài liệu gốc.

Tuy nhiên, nếu bạn chỉ cần văn bản, hầu hết các trang web ở trên sẽ có thể làm điều đó cho bạn. Nếu bạn có bất kỳ câu hỏi nào, hãy bình luận. Vui thích!



About the author

Tôi là nhà tư vấn công nghệ với hơn 10 năm kinh nghiệm trong lĩnh vực phần mềm. Tôi chuyên về Microsoft Office, Edge và các công nghệ liên quan khác. Tôi đã làm việc trong nhiều dự án khác nhau cho cả các công ty lớn và nhỏ, và tôi cực kỳ am hiểu về các nền tảng và công cụ khác nhau hiện nay.



Related posts