Cách sao chép văn bản từ tệp PDF

Nếu bạn muốn sao chép văn bản từ tệp PDF để thêm vào tài liệu Word , dán công thức vào bảng tính Excel hoặc chèn vào trang chiếu PowerPoint để trình bày, việc này có thể dễ dàng như sử dụng chức năng Sao chép(Copy)Dán(Paste) .

Tuy nhiên, điều đó có thể không nhất thiết hoạt động đối với tất cả các tệp PDF do bảo mật và các quyền khác, nhưng có những cách khác để bạn có thể hoàn thành nhiệm vụ tương tự.

Cách sao chép văn bản từ PDF(How to Copy Text From a PDF)

Trước khi có thể sao chép văn bản từ PDF sang ứng dụng khác, bạn cần xác nhận rằng ứng dụng đó không có cài đặt bảo mật không cho phép sao chép, nếu không bạn sẽ không thể sao chép bất cứ thứ gì. Điều này có thể được biểu thị bằng tính năng sao chép màu xám hoặc mờ trong Reader .

Nếu tệp PDF bạn nhận được được bảo vệ bằng mật khẩu(protected by a password) , hãy sử dụng tổ hợp mật khẩu được chỉ định để mở tệp, sau đó kiểm tra cài đặt bảo mật để xác nhận rằng việc sao chép nội dung được phép.

  • Để thực hiện việc này, hãy bấm chuột phải vào tài liệu và chọn Thuộc tính Tài liệu(Document Properties) .

  • Nhấp vào tab Bảo mật(Security ) và xem Tóm tắt Hạn chế Tài liệu(Document Restrictions Summary) để xem liệu việc sao chép nội dung có được phép hay không.

Lưu ý(Note) : Một tệp PDF(PDF) có giới hạn nội dung thường có từ "Bảo mật" bên cạnh tên tệp ở trên cùng. 

  • Mở PDF trong bất kỳ trình đọc nào và sau đó sao chép văn bản bạn muốn bằng bất kỳ phương pháp nào bên dưới.

Có một số cách sao chép văn bản từ tệp PDF mà chúng tôi sẽ trình bày trong hướng dẫn này. 

Chức năng Sao chép & Dán(Copy & Paste Function)

Đây là phương pháp phi thực tế để sao chép văn bản từ hầu hết các tài liệu hoặc tệp, không chỉ PDF(PDFs) . Bạn có thể sử dụng phím tắt CTRL+C để sao chép văn bản bạn muốn và sau đó sử dụng CTRL+V để dán nó vào tài liệu khác(paste it onto the other document)

Nếu bạn đang sử dụng máy Mac, hãy nhấn Command-C để sao chép văn bản và Command-V để dán nội dung của Bảng tạm(Clipboard) vào tài liệu hoặc ứng dụng hiện tại.

Ngoài ra, bạn có thể sử dụng nút nhấp chuột phải của chuột hoặc bàn di chuột và nhấp vào Chọn công cụ(Select tool)

Chọn văn bản bạn muốn sao chép trên tài liệu PDF bằng cách kéo chuột để đánh dấu phần bạn muốn sao chép, nhấp chuột phải vào văn bản đã chọn và chọn Sao chép(Copy) .

Bạn cũng có thể chuyển đến tab menu và nhấp vào Edit>Copy . Sau khi nó được sao chép, hãy chuyển đến tài liệu mà bạn muốn dán văn bản đã sao chép vào, nhấp chuột phải vào khoảng trống bạn muốn đặt nó và chọn Dán(Paste) hoặc nhấp vào Edit>Paste .

 Công cụ chụp nhanh hoặc chụp màn hình(Snapshot Or Screenshot Tool)

Công cụ Ảnh chụp nhanh trong trình đọc PDF(PDF reader) của bạn giúp bạn chọn văn bản bạn muốn làm ảnh chụp màn hình hoặc đồ họa, sau đó dán nó vào tài liệu khác mà không ảnh hưởng đến định dạng. Nếu bạn chọn phương pháp này, bạn sẽ nhận được chính xác phần văn bản bạn muốn, nhưng nó sẽ không thể chỉnh sửa được.

Để thực hiện việc này, hãy mở tài liệu PDF , nhấp vào Edit > Take a snapshot .

Ngoài ra, chọn thanh tiêu đề của cửa sổ PDF và nhấn Alt+PrtScn trên bàn phím của bạn để chụp màn hình(capture the screen) , sau đó cắt dựa trên phần bạn muốn.

Nếu bạn đang sử dụng máy Mac, hãy nhấn Command+Shift+4 và sử dụng con trỏ trên màn hình để kéo và chọn văn bản bạn muốn chụp.

Trình đọc PDF trực tuyến(Online PDF Reader)

Bạn có thể sao chép văn bản từ tài liệu PDF trong trình duyệt hoặc trình đọc trực tuyến của mình.

Để thực hiện việc này, hãy mở PDF trong trình duyệt của bạn bằng cách nhấp chuột phải vào tệp và chọn Open With > (choose browser) hoặc kéo tệp vào cửa sổ đang mở trên trình duyệt của bạn. 

Chọn văn bản bạn muốn. Nhấn CTRL+C để sao chép văn bản và dán vào tài liệu khác bằng cách sử dụng CTRL + CTRL+VBạn cũng có thể bấm chuột phải vào chuột hoặc bàn di chuột và chọn Sao chép(Copy) , sau đó bấm chuột phải lần nữa vào tài liệu khác và chọn Dán(Paste) .

Phần mềm trích xuất PDF

Công cụ trích xuất PDF(PDF) của bên thứ ba cũng có thể giúp bạn trích xuất văn bản để sử dụng trong một ứng dụng khác như Word , bản trình bày PowerPoint hoặc phần mềm xuất bản trên máy tính để bàn.  

Bạn có thể sử dụng một công cụ như ExtractPDF , tải lên tệp PDF của bạn và nhấp vào Bắt đầu(Start) . Công cụ sẽ trích xuất hình ảnh, văn bản hoặc thậm chí là phông chữ nếu bạn muốn, sau đó bạn có thể sao chép những gì bạn muốn từ nội dung đã trích xuất và dán nó vào một ứng dụng khác.

Có nhiều công cụ trích xuất của bên thứ ba(third-party extraction tools) cho các tệp PDF để chuyển đổi chúng sang HTML , trong khi vẫn giữ nguyên bố cục của trang. Họ cũng trích xuất và chuyển đổi nội dung trong tài liệu PDF sang định dạng đồ họa vector mà bạn có thể sử dụng trong các ứng dụng khác.

bộ chuyển đổi PDF(PDF Converter)

Công cụ chuyển đổi PDF cho phép bạn chuyển đổi tài liệu PDF thành tài liệu có thể chỉnh sửa(convert a PDF document into an editable document) , sau đó bạn có thể sao chép văn bản của mình và sử dụng nó trong một ứng dụng khác.

Một trong những trình chuyển đổi PDF phổ biến là SmallPDF , vì đây là một công cụ trực tuyến nên nó không yêu cầu bất kỳ cài đặt nào và rất dễ sử dụng. Để sử dụng nó, hãy mở SmallPDF trên trình duyệt của bạn, chọn định dạng đầu ra, ví dụ PDF sang Word(PDF to Word) .

Nhấp vào Chọn tệp(Choose file) để tải lên tệp PDF bạn muốn chuyển đổi.

Nhấp vào Tải xuống(Download) để lưu tệp đã chuyển đổi trên thiết bị của bạn. Tiếp theo, mở tài liệu Word đã chuyển đổi và sao chép văn bản bạn muốn.

Công cụ OCR(OCR Tool)

Công cụ Nhận dạng Ký tự Quang học (OCR)(Optical Character Recognition (OCR) tool) cho phép bạn chuyển đổi tệp PDF của mình sang tài liệu (PDF)Word có thể chỉnh sửa , sao chép văn bản từ tệp PDF(PDF) và hình ảnh được quét sang các định dạng văn bản có thể chỉnh sửa.

Nó đặc biệt hữu ích nếu bạn nhận được một tài liệu được quét ở định dạng PDF vì nó biến những tệp đó thành tệp PDF(PDFs) có thể chỉnh sửa ngay lập tức, với phông chữ tùy chỉnh và văn bản có thể chỉnh sửa trông giống như trong tài liệu gốc.

Adobe Acrobat hoạt động như một công cụ chuyển đổi văn bản với OCR vì nó trích xuất văn bản tự động từ hình ảnh được quét hoặc tài liệu giấy và chuyển đổi chúng thành PDF(PDFs) .

Phần tốt nhất là PDF của bạn sẽ khớp với bản in gốc nhờ tính năng tạo phông chữ tùy chỉnh(custom font generation) tự động và bạn có thể sử dụng nó với các ứng dụng Office khác bằng cách cắt và dán hoặc xuất sang MS-Office . Nó cũng cho phép bạn duy trì giao diện chính xác của tài liệu và hạn chế chỉnh sửa nội dung.

Lưu ý(Note) : Để sử dụng các bước này, bạn cần Adobe Acrobat , không phải Adobe Reader , vì phần sau chỉ để xem PDF(PDFs) và không có công cụ  OCR .

Để sử dụng công cụ OCR gốc trong (OCR)Adobe Acrobat , hãy mở tệp PDF(PDF) có chứa văn bản hoặc hình ảnh được quét trong Acrobat dành cho PC hoặc Mac và nhấp vào Chỉnh sửa PDF(Edit PDF) .

Acrobat sẽ tự động áp dụng OCR cho PDF và chuyển nó thành một bản sao hoàn toàn có thể chỉnh sửa. Chọn văn bản bạn muốn sao chép và nhấp vào Edit>Copy , sau đó dán nó vào một ứng dụng khác.

Bạn có thể nhấp vào File > Save As để lưu tài liệu có thể chỉnh sửa để sử dụng sau này.

Ngoài ra, hãy mở tài liệu hoặc hình ảnh đã quét mà bạn muốn sử dụng trình đọc OCR , nhấp vào Công cụ(Tools ) ở trên cùng bên phải của thanh công cụ và chọn Recognize Text > In This File .

Bạn sẽ thấy một cửa sổ bật lên hiển thị Cài đặt chung hiện tại của mình, chẳng hạn như ngôn ngữ OCR , kiểu xuất PDF và độ phân giải. Bấm (Click) OK để nhận dạng văn bản.

Nếu bạn muốn thay đổi cài đặt, hãy bấm Chỉnh sửa(Edit) , sau đó bấm OK sau khi bạn hoàn tất.

Khi văn bản được nhận dạng từ trang được quét, bạn có thể chọn và sao chép văn bản bạn muốn với định dạng được phát hiện, mặc dù nó không chính xác như nhận dạng văn bản.

Nếu tất cả những gì bạn có là Adobe Reader và bạn không muốn nhận bản sao của Acrobat , thì có các công cụ OCR miễn phí như OCR của OneNote(OneNote’s OCR) cho PC, miễn phí để sử dụng hoặc thư viện Tesseract OCR(Tesseract OCR library) cho Mac. 

Lưu ý:(Note:) Nếu bạn có Adobe Acrobat , bạn có thể OCR nhiều tài liệu cùng một lúc. Chỉ cần(Just) mở bất kỳ tài liệu nào trong Acrobat , nhấp vào Nhận dạng Văn bản(Recognize Text) trong thanh bên Công cụ(Tools ) và chọn Trong Nhiều Tệp(In Multiple Files) . Kéo các tệp PDF(PDF) bạn muốn OCR   và Acrobat sẽ nhận dạng văn bản cho bạn.

Bạn có bất kỳ thủ thuật nào khác mà bạn sử dụng để sao chép văn bản từ tệp PDF không? Hãy cho(Tell) chúng tôi biết về nó trong một bình luận bên dưới.



About the author

Tôi là một chuyên gia máy tính với hơn 10 năm kinh nghiệm. Khi rảnh rỗi, tôi thích giúp việc tại bàn văn phòng và dạy bọn trẻ cách sử dụng Internet. Kỹ năng của tôi bao gồm nhiều thứ, nhưng điều quan trọng nhất là tôi biết cách giúp mọi người giải quyết vấn đề. Nếu bạn cần ai đó có thể giúp bạn trong việc khẩn cấp hoặc chỉ muốn một số mẹo cơ bản, vui lòng liên hệ với tôi!



Related posts