Không thể sao chép văn bản từ tệp PDF?


Vì vậy, tôi đã gặp phải sự cố vào một ngày khác khi tôi phải sao chép một số văn bản từ một tệp PDF và dán nó vào bản trình bày mà tôi đang thực hiện. Vấn đề là tôi không thể sao chép văn bản! Hmm, tôi nghĩ, phải có điều gì đó ngu ngốc tôi đang làm vì tôi khá chắc chắn rằng tôi đã sao chép văn bản từ một tập tin PDF trước.

May mắn thay, tôi đã không phải là ngu ngốc, vì nó đã kết thúc được rằng tệp PDF có một số trang được quét các tệp bitmap đã được chèn vào tệp PDF. Vì vậy, nó không phải là văn bản thực tế ở nơi đầu tiên. Thứ hai, nơi có văn bản thực tế mà bình thường có thể được sao chép, PDF này có một số loại quyền bảo mật được thiết lập trên nó để sao chép nội dung không được phép! Grrrr!

Tôi vẫn cần văn bản đó và tôi sẽ tìm ra cách để lấy nó. Trong bài viết này, tôi sẽ giới thiệu một cách đơn giản để sao chép văn bản hoạt động nếu tài liệu không được bảo vệ và văn bản không phải là hình ảnh được quét. Tôi cũng sẽ xem xét những việc cần làm trong kịch bản lừa đảo nơi bạn không được phép sao chép văn bản. Nó không phải là một giải pháp lý tưởng, nhưng nó tốt hơn là không có gì, đặc biệt là nếu bạn phải sao chép rất nhiều văn bản. Ngay cả khi bạn có thể tiết kiệm cho mình bằng cách nhập 80% thủ công, thật tuyệt!

Chọn văn bản trong PDF

Trong Adobe Reader, nếu văn bản có thể sao chép, thì tất cả các bạn phải làm là chọn nó và nhấp chuột phải và chọn Sao chép.

sao chép văn bản pdf

Trong các chương trình trình xem PDF khác như Foxit , bạn phải nhấp vào Công cụrồi chọn Chọn văn bản.

chọn văn bản

Rõ ràng, nếu bạn có thể làm điều này, bạn sẽ không đọc bài đăng này! Nhưng chỉ trong trường hợp, đó là cách bạn chọn văn bản. Bây giờ, về vấn đề sao chép văn bản từ hình ảnh hoặc tệp PDF được bảo mật khó hơn.

Sử dụng OCR để Sao chép Văn bản PDF

Bạn có thể nhanh chóng kiểm tra xem tệp PDF có được bảo mật trong Adobe hay không Đọc bằng cách tra cứu trong thanh tiêu đề và tìm kiếm từ SECURED.

bảo đảm pdf

Bạn có thể xem các quyền cụ thể theo nhấp vào Chỉnh sửarồi nhấp vào Bảo vệrồi đến Thuộc tính bảo mật.

tính chất bảo mật

Trong các phiên bản Adobe Reader và Acrobat mới hơn, bạn phải nhấp vào Bảo vệtrong ngăn bên phải để hiển thị các tùy chọn bảo vệ.

Sau đó, nhấp vào Tùy chọn khácvà bạn sẽ thấy Thuộc tính bảo mật.

Như bạn có thể thấy bên dưới, không cho phép sao chép nội dung và bảo mật được bảo vệ bằng mật khẩu. Nếu bạn biết mật khẩu, bạn có thể xóa bảo mật và sao chép tất cả những gì bạn muốn.

Trừ khi bạn là một hacker, việc phá mật khẩu không phải là một tùy chọn. Vì vậy, điều duy nhất bạn có thể làm là chụp ảnh màn hình của văn bản và sau đó chạy nó thông qua một chương trình OCR. Âm thanh như quá nhiều công việc, nhưng nó thực sự là không. Bạn có thể chụp ảnh màn hình trên máy Mac hoặc PC mà không cần phần mềm bổ sung.

Mac- Chỉ cần nhấn Command + Shift + 4 trên bàn phím

Windows- Chỉ cần sử dụng Công cụ Snipping của Windows

sao chép nội dung

Ngoài ra, nếu bạn tình cờ sở hữu Adobe Acrobat, bạn có thể sử dụng nó để tự động chuyển đổi văn bản hình ảnh thành văn bản có thể chỉnh sửa. Tất cả những gì bạn phải làm là mở tệp PDF và nhấp vào công cụ Chỉnh sửa PDF ở ngăn bên tay phải. Nó sẽ tự động quét toàn bộ tài liệu bằng OCR và chuyển đổi nó thành tài liệu có thể chỉnh sửa hoàn toàn.

Nếu bạn có hình ảnh có văn bản, hãy sao chép nó vào khay nhớ tạm và sau đó mở Adobe Acrobat và chọn Tệp - Tạo - PDF từ Clipboard.

Chỉ cần nhấp vào Chỉnh sửa PDF ở khung bên phải và nó sẽ chuyển đổi hình ảnh thành có thể chỉnh sửa văn bản.

Đây là ảnh chụp màn hình Tôi chụp một số văn bản mà tôi không thể sao chép từ tệp PDF được bảo mật:

TestOCR

Lưu ý rằng khi bạn chụp ảnh màn hình, hãy đảm bảo thu phóng tài liệu được đặt thành 100% sao cho văn bản sắc nét và rõ ràng. Sau khi bạn có ảnh chụp màn hình, sau đó tải xuống chương trình OCR miễn phí. Có rất nhiều lựa chọn và kết quả sẽ thay đổi một cách dữ dội giữa các chương trình, vì vậy bạn sẽ phải thử một vài. Dưới đây là hai điều tôi đã sử dụng trong quá khứ:

http://download.cnet.com/FreeOCR/3000-10743_4-10717191.html

https://www.simpleocr.com/OCR-Freeware

Lưu ý rằng bạn cũng có thể sử dụng Microsoft OneNote vì nó có chức năng OCR tích hợp sẵn. Rõ ràng, nếu bạn đã có phần mềm OCR, sau đó chỉ cần sử dụng chương trình đó.

Chương trình FreeOCR hoạt động tốt, bạn chỉ cần đảm bảo khi bạn cài đặt phần mềm mà bạn không chấp nhận bất kỳ phần mềm nào khác “Phiếu mua hàng” sẽ chỉ cài đặt rác trên máy tính của bạn. Nhưng miễn là bạn làm điều đó, phần mềm không có phần mềm gián điệp hoặc bất cứ điều gì như thế. Nó cũng được CNET thử nghiệm để đảm bảo điều này.

Dù sao, khi bạn đã cài đặt chương trình, hãy nhấp vào nút Mởlớn và chọn hình ảnh của bạn.

ocr hình ảnh

Nó sẽ hiển thị cho bạn bản xem trước của hình ảnh trong ngăn bên tay trái. Sau đó nhấp vào OCRBắt đầu quá trình OCR.

bắt đầu quá trình ocr

Chính xác! Bây giờ văn bản sẽ hiển thị ở phía bên tay phải và bạn có thể sao chép nó vào khay nhớ tạm hoặc xuất nó sang Microsoft Word.

chuyển đổi hình ảnh thành văn bản

Nhìn chung, chương trình đã làm một công việc rất tốt với một vài lỗi nhỏ ở đây và ở đó. Nó tiết kiệm cho tôi rất nhiều thời gian mặc dù không phải tự gõ tất cả các văn bản đó. Hy vọng rằng, điều này sẽ giúp bạn sao chép văn bản bạn cần từ một tài liệu PDF. Đăng bất kỳ nhận xét hoặc câu hỏi nào và tôi sẽ trả lời. Hãy tận hưởng!

Hướng dẫn cách chuyển file PDF sang WORD online miễn phí

bài viết liên quan:


14.08.2012