Cách trích xuất bảng từ tệp PDF
Sử dụng Tệp PDF là một cách dễ dàng và an toàn để gửi và chia sẻ tài liệu. Khi bạn muốn giữ lại định dạng và thông tin chi tiết của bảng, bạn nên chuyển tài liệu thành tệp PDF. Tuy nhiên, trích xuất các bảng từ một bảng là một việc khá khó khăn nếu bạn đang nhận tệp PDF.

Tất nhiên, bạn sẽ muốn tiết kiệm thời gian và không muốn tạo một bảng mới từ đầu. Vì vậy, làm thế nào để bạn trích xuất bảng từ PDF mà không dựa vào sao chép và dán? Dưới đây là một số cách bạn có thể đạt được điều đó.
Mục Lục
Sử dụng Trình chuyển đổi Trực tuyến
Cách nhanh nhất là sử dụng trình chuyển đổi tệp trực tuyến để thay đổi tệp PDF sang bất kỳ định dạng tài liệu nào khác mà bạn muốn. Một số công cụ trực tuyến miễn phí chuyển đổi PDF sang Excel để trích xuất dữ liệu dạng bảng. Các ví dụ phổ biến là cometdocs và Smallpdf. Tuy nhiên, hầu hết các công cụ này chỉ cung cấp khả năng trích xuất cơ bản.
Tuyên bố từ chối trách nhiệm: Chúng tôi đặc biệt khuyên bạn nên tránh sử dụng các trình chuyển đổi trực tuyến khi xử lý các tệp PDF chứa thông tin bí mật và nhạy cảm.
Đây là cách trích xuất bảng từ tệp PDF bằng Smallpdf:

Bước 2: Chọn chuyển đổi được thực hiện.

Bước 3: Kéo tệp PDF cần chuyển đổi sang trình chuyển đổi PDF.

Bước 4: Sau khi tải tệp lên xong, hãy nhấp vào Chuyển đổi sang Excel.

Bước 5: Nhấp vào Tải xuống để lưu tệp PDF vào thiết bị của bạn.

Bước 6: Khởi chạy excel đã tải xuống để xác nhận xem bảng của bạn đã được chuyển đổi chính xác chưa.

Giải nén bảng bằng Microsoft Power BI
Microsoft BI là một công cụ hữu ích khác để trích xuất dữ liệu bảng từ các tệp PDF. Đặc biệt, tính năng Power Query trên Power BI giúp người dùng dễ dàng nhập tệp PDF và trích xuất dữ liệu bảng bên trong tài liệu.
Tuy nhiên, điều này chỉ hoạt động đối với những người có đăng ký Office 365. Ngoài ra, bạn sẽ phải mua gói Power BI riêng.
Tính năng Power Query cũng có sẵn trong bản dùng thử miễn phí Power BI. Đây là cách sử dụng nó để trích xuất dữ liệu dạng bảng:

Bước 2: Chọn Lấy dữ liệu trong phần Trang chủ trên màn hình của ứng dụng.

Bước 3: Nhấp vào Tệp rồi chọn PDF.

Bước 4: Nhấp vào Kết nối để duyệt vị trí của tệp PDF trên máy tính của bạn.

Bước 5: Chọn vị trí của tệp PDF để nhập tệp đó vào Power BI.

Bước 6: Khi tệp đã được nhập vào Power BI, bạn sẽ thấy Bộ điều hướng với số bảng và số trang. Chọn Số bảng sẽ được tải.

Bước 7: Chọn Tải để tạo Bảng trên Power BI.

Sử dụng Microsoft Excel
Microsoft Excel như Power BI có tính năng Power Query có thể được sử dụng để tải tệp PDF và trích xuất dữ liệu dạng bảng. Tuy nhiên, tính năng này chỉ khả dụng trên Excel 2016 hoặc các phiên bản mới hơn. Đây là cách nó hoạt động:
Bước 1: Khởi chạy Microsoft Excel.
Cũng trên smartreviewaz

Bước 2: Chọn Dữ liệu trên Ruy-băng.

Bước 3: Chọn Lấy dữ liệu để khởi chạy menu thả xuống.

Bước 4: Chọn Từ tệp và Từ PDF.

Bước 5: Chọn vị trí của tệp PDF để nhập tệp đó vào Excel.

Bước 6: Khi tệp đã được nhập vào Excel, bạn sẽ thấy Bộ điều hướng với số bảng, số trang hoặc bản xem trước dữ liệu trong PDF. Chọn Số bảng sẽ được tải.

Bước 7: Chọn Load để tạo bảng trên Excel.

Nếu bạn đang sử dụng Microsoft Office 2016 hoặc gói mới hơn và bạn thấy rằng tab dữ liệu của mình không chứa tính năng Power Query. Đây là cách cài đặt nó.
Bước 1: Truy cập Trang web của Microsoft.
Bước 2: Chọn Ngôn ngữ của tiện ích bổ sung.


Bước 4: Chọn phiên bản bổ trợ bạn muốn tải xuống.

Bước 5: Chọn Tiếp theo để bắt đầu tải xuống.

Bước 6: Khi tệp đã hoàn tất tải xuống, Chạy tệp để cài đặt bổ trợ.

Sử dụng Adobe Acrobat Pro DC
Adobe Acrobat Pro DC là một công cụ khác có thể được sử dụng để trích xuất dữ liệu dạng bảng từ tệp PDF hoặc chuyển đổi tệp PDF thành các loại tệp khác như excel để phân tích dữ liệu. Công cụ có phiên bản dùng thử 7 ngày và phiên bản chuyên nghiệp và có thể được sử dụng trực tuyến hoặc tải xuống thiết bị.
Phiên bản web Adobe Acrobat
Đây là cách sử dụng phiên bản web để trích xuất dữ liệu dạng bảng:

Bước 3: Cuộn xuống trang web và định vị PDF sang Excel.

Bước 4: Trên menu bật lên mới, hãy kéo và thả tệp PDF bạn muốn chuyển đổi.

Bước 5: Sau khi tải tệp lên xong, hãy chọn Xuất sang XLSX.

Bước 6: Chọn biểu tượng Tải xuống ở đầu trang để lưu tệp đã chuyển đổi vào thiết bị của bạn.

Adobe Acrobat trên PC
Dưới đây là cách sử dụng phiên bản PC để trích xuất dữ liệu dạng bảng:
Bước 1: Khởi chạy ứng dụng Adobe Acrobat Pro DC.

Bước 2: Trên ứng dụng, chọn Mở tệp.

Bước 3: Sử dụng thư viện tệp, chọn tệp PDF sẽ được nhập vào ứng dụng.

Bước 4: Khi tệp mở ra, hãy sử dụng con trỏ để đánh dấu dữ liệu bảng.

Bước 5: Nhấp chuột phải vào vùng được đánh dấu và chọn Export Selection As.

Bước 6: Trên thư viện tệp chi tiết đầu vào của Tên tệp và chọn Loại tệp.

So sánh hai tệp PDF
Trích xuất bảng từ tệp PDF không phải là một nhiệm vụ bất khả thi. Sử dụng Power Query trên Excel và Power BI, bạn có thể nhập các loại tệp khác ngoài PDF. Mặt khác, sử dụng Adobe Acrobat Pro DC, bạn có thể so sánh hai tệp PDF cạnh nhau.
Cập nhật lần cuối vào ngày 18 tháng 6 năm 2021
Bài viết trên có thể chứa các liên kết liên kết giúp hỗ trợ smartreviewaz. Tuy nhiên, nó không ảnh hưởng đến tính toàn vẹn biên tập của chúng tôi. Nội dung vẫn không thiên vị và xác thực.