/ / Cách sử dụng lệnh split để tách tệp văn bản trong Linux

Cách sử dụng lệnh split để tách tệp văn bản trong Linux

Linux cung cấp nhiều loại lệnh để thao tác và xử lý văn bản, trong đó có lệnh split. Với tính năng tách, bạn có thể dễ dàng chia các tệp lớn thành các tệp nhỏ hơn hoặc trích xuất các phần cụ thể của tệp dựa trên các tiêu chí nhất định.


Hãy khám phá cách sử dụng lệnh split để chia nhỏ tệp trong Linux. Cho dù bạn cần trích xuất các phần cụ thể của một tệp lớn hay chia tệp thành các phần nhỏ hơn, lệnh split có thể giúp bạn đạt được mục tiêu của mình một cách dễ dàng.


Lệnh tách là gì?

Lệnh split là một công cụ dòng lệnh phổ biến của Linux do Torbjorn Granlund và Richard M. Stallman tạo ra. Đúng như tên gọi, lệnh split được sử dụng để chia một tệp thành các tệp con nhỏ hơn.

Lệnh này rất hữu ích để quản lý các tệp lớn hoặc khi truyền tệp qua mạng có băng thông hạn chế. Bằng cách chia một tệp lớn thành các phần nhỏ hơn, bạn có thể giảm lượng dữ liệu cần truyền hoặc lưu trữ tại bất kỳ thời điểm nào. Bạn cũng có thể đảo ngược lệnh tách để kết hợp nhiều tệp thành một.

Cú pháp lệnh tách

Cú pháp cơ bản của lệnh split là:

 split [OPTION]... [FILE] [PREFIX] 
  • [OPTION]: Lệnh split có các tùy chọn khác nhau để quyết định cách bạn muốn tệp được chia và các tính năng cụ thể khác mà bạn có thể muốn thêm vào.
  • [FILE]: Đây là đường dẫn đến tập tin mà bạn muốn tách.
  • [PREFIX]: Điều này đề cập đến tiền tố của các tập tin con.

Cách sử dụng lệnh tách

Bạn có thể sử dụng lệnh split để chia một tệp lớn thành các tệp nhỏ hơn theo kích thước hoặc độ dài. Bạn thậm chí có thể chọn số lượng tệp nhỏ hơn cụ thể mà bạn muốn.

Để trình diễn, chúng tôi sẽ sử dụng một tệp văn bản có tên bigfile.txt. Vui lòng chọn một tệp văn bản có nhiều dòng và kích thước khá lớn cho hướng dẫn này. Nếu không có, bạn có thể sử dụng trình soạn thảo văn bản Linux hoặc lệnh cat để dán vào một văn bản lớn và lưu nó.

Tách các tệp lớn dựa trên số lượng dòng

Bạn có thể sử dụng lệnh split để chia một tệp lớn thành các tệp nhỏ hơn dựa trên số dòng cụ thể trên mỗi tệp. Đây là cú pháp:

 split -l [number of lines] [input file] [output file prefix] 

Ví dụ: bạn có thể muốn chia một tệp có 210 dòng thành các tệp có 50 dòng mỗi tệp; bạn sẽ nhận được năm tệp nhỏ hơn. Bốn tệp đầu tiên sẽ có 50 dòng mỗi tệp và tệp thứ năm sẽ chỉ chứa 10 dòng.

Để chia một tệp có tên “largefile.txt” thành các tệp nhỏ hơn, mỗi tệp có 100 dòng, hãy chạy lệnh này:

 split -l 100 largefile.txt smallfile 

Liệt kê nội dung của thư mục bằng lệnh ls và bạn sẽ thấy các tệp được chia.

Kết quả của việc chia nhỏ các tệp lớn theo dòng

Tách các tệp lớn dựa trên kích thước

Bạn cũng có thể sử dụng lệnh split để chia một tệp lớn thành các tệp nhỏ hơn dựa trên kích thước tệp cụ thể. Đây là cú pháp cơ bản:

 split -b [size in bytes] [input file] [output file prefix] 

Chia largefile.txt thành các tệp nhỏ hơn 300 byte mỗi tệp bằng cách chạy lệnh này:

 split -b 300 largefile.txt smallfile 

Đây là kết quả:

Kết quả của việc chia nhỏ một tệp lớn theo kích thước

Tách một tệp lớn thành một số tệp cụ thể

Bạn cũng có thể chia tệp thành một số tệp cố định bất kể số lượng tệp và byte trong đó. Bạn làm điều này bằng cách sử dụng -N lựa chọn. Đây là cú pháp:

 split -n [number of files] [input file] [output file prefix] 

Để chia một tệp lớn thành năm phần, hãy thực hiện lệnh này:

 split -n 5 largefile.txt smallfile 

Kết quả sẽ giống như thế này:

Tách một tệp lớn theo số lượng tệp

Thay đổi độ dài hậu tố của tệp được chia

Như bạn có thể nhận thấy, độ dài mặc định của các hậu tố được đính kèm với tên tệp đầu ra là hai. Ví dụ, tệp nhỏaatập tin nhỏabtập tin nhỏACvân vân.

Để thay đổi độ dài của hậu tố, bạn sử dụng -Một lựa chọn. Đây là cú pháp để thay đổi độ dài hậu tố:

 split -a [length of suffix] [input file] [output file prefix] 

Bạn có thể sử dụng tùy chọn độ dài hậu tố này cùng với các lệnh tách khác. Để chia tệp largefile.txt thành 10 phần với độ dài hậu tố là 4, hãy thực hiện lệnh này:

 split -a 4 -n 10 largefile.txt smallfile 

Khi bạn liệt kê nội dung của thư mục, đầu ra sẽ như thế này:

Tách một tệp lớn thành các tệp nhỏ hơn với hậu tố dài hơn

Hợp nhất nhiều tệp với con mèo

Tin vui là bạn luôn có thể hợp nhất các tệp đã tách lại với nhau để tạo tệp gốc. Để hợp nhất các tệp đã tách thành tệp gốc, hãy sử dụng lệnh cat. Đây là cú pháp để làm điều đó:

 cat [split files] > [output file] 

Khi sử dụng lệnh cat để hợp nhất các tệp đã tách, điều quan trọng là phải chỉ định đúng thứ tự của các tệp đã tách.

Lệnh cat chỉ nối các tệp theo thứ tự đã chỉ định, vì vậy nếu các tệp không theo đúng thứ tự, tệp được hợp nhất sẽ bị hỏng.

Trong trường hợp bạn có nhiều tệp được chia, chẳng hạn như hàng trăm tệp được chia, sẽ rất khó để nhập từng tệp một và theo đúng thứ tự.

Đây là nơi tiền tố xuất hiện. Chỉ cần thêm dấu hoa thị

 cat prefix* > [output file] 

cho phép bạn hợp nhất tất cả các tệp bắt đầu bằng tiền tố đó. Đây là một lệnh ví dụ hợp nhất các tệp được chiasmallfileaa ,tập tin nhỏ ,con bọ nhỏ filead nhỏ thành một tệp duy nhất có tênbigfile.txt

 cat smallfile* > bigfile.txt 

: Lệnh này sẽ nối nội dung của tất cả các tệp đã tách khớp với mẫutập tin nhỏ

* và chuyển hướng đầu ra sang một tệp mới có tên bigfile.txt. Nó cũng sẽ liệt kê các tệp được chia theo thứ tự tự nhiên dựa trên tên của chúng, đây phải là thứ tự chính xác để hợp nhất.

Lệnh split chỉ là một trong nhiều công cụ mà Linux cung cấp để giúp bạn quản lý các tệp lớn một cách hiệu quả bằng cách chia chúng thành các phần nhỏ hơn, dễ quản lý hơn.

Bằng cách thành thạo các lệnh xử lý văn bản Linux, bạn có thể tiết kiệm thời gian, tài nguyên và trở nên hiệu quả hơn.

Similar Posts

Leave a Reply

Your email address will not be published. Required fields are marked *