Cách tải xuống toàn bộ trang web để đọc ngoại tuyến
Mặc dù Wi-Fi có sẵn ở khắp mọi nơi ngày nay, tuy nhiên, đôi khi bạn có thể thấy mình mà không có Wi-Fi. Và khi bạn làm vậy, có thể có những trang web mà bạn muốn lưu lại để bạn có thể truy cập vào chúng khi ngoại tuyến — có thể là để nghiên cứu, giải trí hoặc thậm chí là để hậu thế.
Việc lưu các trang web riêng lẻ để đọc ngoại tuyến là khá cơ bản, nhưng nếu bạn muốn tải xuống toàn bộ trang web thì sao? Đừng lo lắng, nó dễ dàng hơn bạn nghĩ. Nhưng đừng lấy lời của chúng tôi cho nó. Dưới đây là một số công cụ tiện lợi mà bạn có thể sử dụng để tải xuống bất kỳ trang web nào để đọc ngoại tuyến — mà không gặp bất kỳ phức tạp nào.
Mục Lục
1. WebCopy
WebCopy của Cyotek lấy một URL của trang web và quét nó để tìm các liên kết, trang và phương tiện. Khi nó tìm thấy các trang, nó sẽ tìm kiếm một cách đệ quy các liên kết, trang và phương tiện khác cho đến khi toàn bộ trang web được phát hiện. Sau đó, bạn có thể sử dụng các tùy chọn cấu hình để quyết định tải xuống các phần ngoại tuyến.
Điều thú vị về WebCopy là bạn có thể thiết lập nhiều dự án mà mỗi dự án có cài đặt và cấu hình riêng. Điều này giúp bạn dễ dàng tải lại nhiều trang web bất cứ khi nào bạn muốn; mỗi người, theo cùng một cách mọi lúc.
Một dự án có thể sao chép nhiều trang web, vì vậy hãy sử dụng chúng với một kế hoạch có tổ chức (ví dụ: dự án “Công nghệ” để sao chép các trang web công nghệ).
Cách tải toàn bộ trang web bằng WebCopy
- Cài đặt và khởi chạy ứng dụng.
- Hướng đến Tệp> Mới để tạo một dự án mới.
- Nhập URL vào Trang mạng đồng ruộng.
- Thay đổi Lưu thư mục trường mà bạn muốn lưu trang web.
- Chơi xung quanh với Dự án> Quy tắc… (tìm hiểu thêm về Quy tắc sao chép web).
- Hướng đến Tệp> Lưu dưới dạng… để lưu dự án.
- Nhấp chuột Sao chép trong thanh công cụ để bắt đầu quá trình.
Sau khi sao chép xong, bạn có thể sử dụng Các kết quả để xem trạng thái của từng trang riêng lẻ và / hoặc tệp phương tiện. Các Lỗi tab hiển thị bất kỳ sự cố nào có thể đã xảy ra và Đã bỏ qua tab hiển thị các tệp chưa được tải xuống. Nhưng quan trọng nhất là Sơ đồ trang webhiển thị cấu trúc thư mục đầy đủ của trang web do WebCopy phát hiện.
Để xem trang web ngoại tuyến, hãy mở File Explorer và điều hướng đến thư mục đã lưu mà bạn đã chỉ định trước đó. Mở index.html (Hoặc đôi khi index.htm) trong trình duyệt bạn chọn để bắt đầu duyệt. Như bạn có thể thấy, điều này rất khác với việc lưu các trang web riêng lẻ thông qua các ứng dụng, một phương pháp khác cũng quá phổ biến hiện nay.
Tải xuống: WebCopy dành cho Windows (Miễn phí)
2. HTTrack
HTTrack được biết đến nhiều hơn WebCopy và được cho là tốt hơn vì nó là mã nguồn mở và có sẵn trên các nền tảng khác ngoài Windows. Giao diện hơi rườm rà và không có nhiều thứ để mong muốn, tuy nhiên, nó hoạt động tốt, vì vậy đừng để điều đó khiến bạn bỏ đi.
Giống như WebCopy, nó sử dụng phương pháp dựa trên dự án cho phép bạn sao chép nhiều trang web và giữ cho tất cả chúng được ngăn nắp. Bạn có thể tạm dừng và tiếp tục tải xuống, đồng thời có thể cập nhật các trang web đã sao chép bằng cách tải xuống lại các tệp cũ và mới.
Cách tải xuống trang web hoàn chỉnh với HTTrack
- Cài đặt và khởi chạy ứng dụng.
- Nhấp chuột Kế tiếp để bắt đầu tạo một dự án mới.
- Đặt tên, danh mục, đường dẫn cơ sở cho dự án, sau đó nhấp vào Kế tiếp.
- Lựa chọn Tải xuống (các) trang web cho Hành động, sau đó nhập URL của từng trang web trong Địa chỉ web hộp, một URL trên mỗi dòng. Bạn cũng có thể lưu trữ URL trong tệp TXT và nhập nó, điều này rất tiện lợi khi bạn muốn tải xuống lại các trang web tương tự sau này. Nhấp chuột Kế tiếp.
- Điều chỉnh các thông số nếu bạn muốn, sau đó nhấp vào Hoàn thành.
Sau khi mọi thứ được tải xuống, bạn có thể duyệt trang web một cách bình thường, đơn giản bằng cách truy cập nơi các tệp đã được tải xuống và mở index.html hoặc index.htm trong một trình duyệt.
Cách sử dụng HTTrack với Linux
Nếu bạn là người dùng Ubuntu, đây là cách bạn có thể sử dụng HTTrack để lưu toàn bộ trang web:
- Khởi chạy Thiết bị đầu cuối và gõ lệnh sau:
sudo apt-get install httrack - Nó sẽ yêu cầu mật khẩu Ubuntu của bạn (nếu bạn đã đặt). Nhập nó vào và nhấn đi vào. Terminal sẽ tải xuống công cụ sau vài phút.
- Cuối cùng, nhập lệnh này và nhấn đi vào. Đối với ví dụ này, chúng tôi đã tải xuống trang web phổ biến, Brain Pickings.
httrack https://www.brainpickings.org/ - Điều này sẽ tải xuống toàn bộ trang web để đọc ngoại tuyến.
Bạn có thể thay thế URL của trang web tại đây bằng URL của bất kỳ trang web nào bạn muốn tải xuống. Ví dụ: nếu bạn muốn tải xuống toàn bộ Bách khoa toàn thư Britannica, bạn sẽ phải điều chỉnh lệnh của mình thành:
httrack https://www.britannica.com/
Tải xuống: HTTrack dành cho Windows và Linux | Android (Miễn phí)
3. SiteSucker
Nếu bạn đang sử dụng máy Mac, lựa chọn tốt nhất của bạn là SiteSucker. Công cụ đơn giản này sao chép toàn bộ trang web, duy trì cùng một cấu trúc và cũng bao gồm tất cả các tệp phương tiện có liên quan (ví dụ: hình ảnh, PDF, biểu định kiểu).
Nó có giao diện rõ ràng và dễ sử dụng — bạn thực sự dán vào URL của trang web và nhấn đi vào.
Một trong những tính năng tiện lợi của nó là khả năng lưu tải xuống đang tiến hành vào một tệp, sau đó sử dụng tệp đó để tải xuống các tệp tương tự và cấu trúc lại trong tương lai (hoặc trên một máy khác). Tính năng này cũng cho phép SiteSucker tạm dừng và tiếp tục tải xuống.
SiteSucker có giá khoảng $ 5 và không đi kèm với phiên bản miễn phí hoặc bản dùng thử miễn phí, đó là nhược điểm lớn nhất của nó. Phiên bản mới nhất yêu cầu macOS 11 Big Sur trở lên. Phiên bản cũ của SiteSucker có sẵn cho các hệ thống Mac cũ hơn, nhưng một số tính năng có thể bị thiếu.
Tải xuống: SiteSucker dành cho iOS | Mac ($ 4,99)
4. Quên
Wget là một tiện ích dòng lệnh có thể truy xuất tất cả các loại tệp qua giao thức HTTP và FTP. Vì các trang web được cung cấp thông qua HTTP và hầu hết các tệp phương tiện web đều có thể truy cập thông qua HTTP hoặc FTP, điều này làm cho Wget trở thành một công cụ tuyệt vời để tải xuống toàn bộ trang web.
Wget đi kèm với hầu hết các hệ thống dựa trên Unix. Mặc dù Wget thường được sử dụng để tải xuống các tệp đơn lẻ, nhưng nó cũng có thể được sử dụng để tải xuống đệ quy tất cả các trang và tệp được tìm thấy thông qua một trang ban đầu:
wget -r -p https://www.smartreviewaz.com
Tùy thuộc vào kích thước, có thể mất một lúc để tải trang web hoàn chỉnh.
Tuy nhiên, một số trang web có thể phát hiện và ngăn chặn những gì bạn đang cố gắng thực hiện vì việc trích xuất trang web có thể khiến chúng tốn rất nhiều băng thông. Để giải quyết vấn đề này, bạn có thể ngụy trang thành một trình duyệt web với chuỗi tác nhân người dùng:
wget -r -p -U Mozilla https://www.thegeekstuff.com
Nếu muốn lịch sự, bạn cũng nên giới hạn tốc độ tải xuống của mình (để không làm tiêu tốn băng thông của máy chủ web) và tạm dừng giữa mỗi lần tải xuống (để bạn không làm máy chủ web bị choáng ngợp với quá nhiều yêu cầu):
wget -r -p -U Mozilla --wait=10 --limit-rate=35K https://www.thegeekstuff.com
Cách sử dụng Wget trên máy Mac
Trên máy Mac, bạn có thể cài đặt Wget bằng một lệnh Homebrew: pha cài đặt wget.
- Nếu bạn chưa cài đặt Homebrew, hãy tải xuống bằng lệnh sau:
/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)" - Tiếp theo, cài đặt Wget bằng lệnh này:
brew install wget - Sau khi cài đặt xong Wget, bạn có thể tải xuống trang web bằng lệnh sau:
wget path/to/local.copy http://www.brainpickings.org/
Trên Windows, bạn sẽ cần sử dụng phiên bản đã chuyển này. Tải xuống và cài đặt ứng dụng, đồng thời làm theo hướng dẫn để hoàn tất quá trình tải xuống trang web.
5. Dịch chuyển chuyên nghiệp
Nhận Dịch chuyển Pro. Nghiêm túc. Mặc dù phiên bản cuối cùng của ứng dụng đã được phát hành vào năm 2015, nhưng ứng dụng vẫn hoạt động tốt như hồi đó.
Ngoài việc tải xuống toàn bộ một trang web, ứng dụng còn có một loạt các tính năng và sự phức tạp khác. Ví dụ: khi bạn tải xuống và cài đặt ứng dụng, trong menu chính của ứng dụng, bạn sẽ thấy các tùy chọn sau để chọn:
- Tạo một bản sao của trang web trên ổ cứng.
- Nhân bản toàn bộ trang web cùng với cấu trúc thư mục của nó.
- Tìm kiếm một trang web cho các loại tệp cụ thể.
- Tìm kiếm một trang web cho các từ khóa nhất định.
- Điều hướng tất cả các trang được liên kết từ một trang trung tâm.
Những điều này và một loạt các tính năng tương tự khác làm cho ứng dụng này trở thành một chương trình hữu ích cho bộ công cụ của bạn. Nhược điểm duy nhất mà chúng tôi tìm thấy là giới hạn trên phiên bản miễn phí. Sử dụng phiên bản chưa đăng ký, bạn chỉ có thể sao chép 500 trang trong một dự án duy nhất. Hơn nữa, bạn chỉ có thể sử dụng nó tổng cộng 40 lần, sau đó bạn sẽ phải mua phiên bản cao cấp.
Tải xuống: Teleport Pro dành cho Windows (Bản dùng thử miễn phí, có sẵn phiên bản trả phí)
Dễ dàng tải xuống toàn bộ trang web
Bây giờ bạn đã biết cách tải xuống toàn bộ trang web, bạn sẽ không bao giờ bị bắt mà không có thứ gì đó để đọc, ngay cả khi bạn không có truy cập internet.
Nhưng hãy nhớ rằng: trang web càng lớn thì lượt tải xuống càng lớn. Do đó, chúng tôi khuyên bạn không nên tải xuống các trang web lớn như MUO vì bạn sẽ cần hàng nghìn MB để lưu trữ tất cả các tệp phương tiện mà các trang web đó sử dụng.
Đọc tiếp
Thông tin về các Tác giả