Cách trích xuất văn bản từ hình ảnh trên Linux với TextSnatcher
Có thể sao chép văn bản từ hình ảnh là một thủ thuật nhỏ gọn gàng cho phép bạn trích xuất một phần thông tin từ hình ảnh, có thể để sao chép một đoạn văn bản trong đó hoặc ghi lại thông báo lỗi xuất hiện trên màn hình.
Vì Linux không có tiện ích OCR tích hợp sẵn, bạn phải sử dụng trình đọc OCR của bên thứ ba. Nhưng vì hầu hết đây là các công cụ dựa trên CLI, chúng không thân thiện với người dùng.
Đây là điểm xuất hiện của TextSnatcher. Đây là một chương trình đơn giản và trực quan giúp sao chép văn bản từ hình ảnh trên Linux thực sự dễ dàng. Hãy đi sâu vào để tìm hiểu thêm.
Mục Lục
TextSnatcher là gì?
TextSnatcher về cơ bản là giao diện người dùng cho công cụ Tesseract OCR: một trong những công cụ OCR phổ biến được sử dụng bởi các hệ điều hành khác nhau. Do đó, ngoài việc dễ sử dụng, công cụ này cũng nhanh chóng và chính xác trong việc nhận dạng các ký tự.
TextSnatcher hỗ trợ nhiều ngôn ngữ: tiếng Anh, tiếng Trung, tiếng Nhật, tiếng Tây Ban Nha, tiếng Pháp, tiếng Đức và tiếng Ả Rập. Vì vậy, bạn có thể dễ dàng trích xuất văn bản từ các hình ảnh có chứa các ngôn ngữ này.
Cách cài đặt TextSnatcher trên Linux
TextSnatcher tương thích với tất cả các bản phân phối Linux chính và bạn có thể cài đặt nó theo một số cách. Làm theo hướng dẫn bên dưới để cài đặt nó trên hệ thống của bạn.
Nếu bạn đang sử dụng Ubuntu, Linux Mint hoặc bất kỳ bản phân phối nào khác trên máy của mình, bạn có thể cài đặt TextSnatcher từ Flathub. Để làm điều này, trước tiên, hãy đảm bảo hệ thống của bạn có Flatpak. Bạn có thể thực hiện việc này bằng cách mở một thiết bị đầu cuối và chạy lệnh sau:
flatpak --version
Nếu điều này trả về một phiên bản, bạn đã cài đặt Flatpak trên hệ thống của mình. Nếu không, bạn sẽ cần cài đặt nó trước, bạn có thể thực hiện điều này bằng cách sử dụng hướng dẫn Flatpak chi tiết của chúng tôi.
Tiếp theo, nhập lệnh sau để cài đặt TextSnatcher:
flatpak install flathub com.github.rajsolai.textsnatcher
Mặt khác, nếu bạn đang sử dụng hệ điều hành cơ bản, bạn có thể tải xuống TextSnatcher từ AppCenter bằng liên kết bên dưới.
Tải xuống: TextSnatcher
Ngoài ra, nếu bạn muốn xây dựng TextSnatcher từ nguồn — có lẽ vì bạn muốn có một phiên bản cụ thể — bạn cũng có thể làm điều đó. Tuy nhiên, bạn cũng sẽ cần cài đặt các phần phụ thuộc sau nếu bạn quyết định đi theo con đường này:
- đá hoa cương
- gtk + -3.0
- gobject-2.0
- gdk-pixbuf-2.0
- libhandy-1
- libportal-0,5
Sau khi bạn đã cài đặt những thứ này, hãy chạy lệnh sau trong terminal để sao chép kho lưu trữ TextSnatcher:
git clone https://github.com/RajSolai/TextSnatcher.git TextSnatcher
Sau đó, điều hướng đến thư mục TextSnatcher bằng:
cd TextSnatcher
Bây giờ xây dựng chương trình với Meson:
meson build --prefix=/usr
Thay đổi thư mục để tạo bằng lệnh cd:
cd build
Và cuối cùng, cài đặt nó bằng cách chạy:
sudo ninja install && com.github.rajsolai.textsnatcher
Cách sử dụng TextSnatcher
Sau khi bạn đã cài đặt TextSnatcher, việc sử dụng nó khá dễ dàng.
Bắt đầu bằng cách mở menu ứng dụng. Sau đó, tìm kiếm TextSnatcher và khởi chạy nó. Bạn sẽ được chào đón bằng một cửa sổ TextSnatcher nhỏ. Thay đổi kích thước cửa sổ này theo sở thích của bạn để bạn thực hiện các thao tác trên đó dễ dàng hơn.
Tiếp theo, chọn ngôn ngữ bạn muốn trích xuất từ hình ảnh. Để thực hiện việc này, hãy nhấn vào biểu tượng lá cờ ở góc bên trái của cửa sổ và chọn một ngôn ngữ từ các ngôn ngữ có sẵn.
Với ngôn ngữ đã chọn, điều tiếp theo bạn cần làm là cung cấp hình ảnh mà bạn muốn trích xuất văn bản sang TextSnatcher. Có ba cách khác nhau để làm điều này:
- Chụp màn hình: Nó cho phép bạn chụp ảnh màn hình với văn bản mà bạn muốn trích xuất
- Chọn tập tin: Nó cho phép bạn chọn một tệp trên máy tính của mình và trích xuất văn bản từ nó
- Lấy từ Clipboard: Nó cung cấp cho bạn khả năng sao chép hình ảnh vào khay nhớ tạm và trích xuất văn bản của nó
Để truy cập các tùy chọn này, hãy nhấn vào Chộp ngay trên màn hình chính của TextSnatcher và nó sẽ hiển thị cho bạn ba tùy chọn sau trên màn hình sau:
Tùy chọn 1: Chụp ảnh màn hình
Nếu bạn muốn trích xuất văn bản từ màn hình của mình, cách dễ nhất để thực hiện là chụp ảnh màn hình và sau đó chuyển nó đến TextSnatcher để trích xuất văn bản.
Đối với điều này, hãy nhấp vào Chụp màn hình cái nút.
TextSnatcher bây giờ sẽ khởi động tiện ích ảnh chụp màn hình scrot và hiển thị cho bạn một con trỏ hình chữ thập. Sử dụng nó để vẽ khu vực xung quanh văn bản bạn muốn trích xuất để chụp ảnh màn hình của nó.
Chờ trong vài giây. TextSnatcher sẽ xử lý văn bản và thêm nó vào khay nhớ tạm của bạn. Mở bất kỳ chương trình ghi chú nào trên máy tính của bạn và sử dụng Ctrl + V phím tắt hoặc nhấp chuột phải vào không gian trống và chọn Dán để dán và xem văn bản đã sao chép từ hình ảnh.
Tùy chọn 2: Chọn tệp
Một cách khác để cung cấp hình ảnh vào TextSnatcher là tải nó lên. Điều này hữu ích khi bạn đã chụp ảnh màn hình của nội dung bạn muốn trong văn bản hoặc đã có hình ảnh chứa văn bản bạn muốn trên máy tính của mình.
Để sử dụng phương pháp này, hãy nhấp vào Chọn tập tin cái nút.
Khi TextSnatcher mở trình quản lý tệp, hãy chọn tệp bạn muốn tải lên và nhấn Mở hoặc Được để tải nó lên.
Sau khi hình ảnh được tải lên, TextSnatcher sẽ đọc nó và lưu văn bản của nó vào khay nhớ tạm của bạn, bạn có thể thấy điều này như đã làm trong tùy chọn trước đó.
Tùy chọn 3: Lấy từ Clipboard
Tương tự, bạn cũng có thể sử dụng Lấy từ Clipboard tùy chọn để đưa hình ảnh vào TextSnatcher để trích xuất văn bản từ đó. Tuy nhiên, hãy nhớ rằng chức năng này hiện tại là một thứ có thể bỏ qua, đặc biệt là trên các hệ thống sử dụng trình quản lý cửa sổ X11. Chúng tôi có thể làm cho nó hoạt động trong một số trường hợp, trong khi những lần khác, nó chỉ gặp lỗi.
Nhưng ở đây, ý tưởng cũng đơn giản. Bạn cần sao chép hình ảnh mà bạn muốn trích xuất văn bản vào khay nhớ tạm. Sau đó, TextSnatcher sẽ kiểm tra khay nhớ tạm của bạn để tìm hình ảnh và trích xuất văn bản từ đó.
TextSnatcher giúp việc trích xuất văn bản từ hình ảnh trên Linux thực sự dễ dàng. Nó hoạt động rất nhanh, đúng như những gì nó hứa hẹn và khá dễ sử dụng. Ngoài ra, hỗ trợ đa ngôn ngữ cho phép bạn sử dụng chương trình để trích xuất văn bản bằng các ngôn ngữ khác, đó là một liên lạc gọn gàng.
Vì vậy, giờ đây, mỗi khi có văn bản trên trang web, tệp PDF, ghi chú bài giảng hoặc video, bạn có thể kéo TextSnatcher lên để trích xuất văn bản từ đó một cách dễ dàng và lưu vào chương trình ghi chú trên máy tính của bạn.
Ngược lại, nếu bạn thích các công cụ trực tuyến, có một số trang web cho phép bạn chuyển đổi hình ảnh sang văn bản miễn phí mà bạn có thể xem thay thế.
Đọc tiếp
Giới thiệu về tác giả