/ / 5 yếu tố chính của URL là gì và chúng làm gì?

5 yếu tố chính của URL là gì và chúng làm gì?

Tất cả chúng ta đã ở đó: Bạn nhập tên trang web vào thanh địa chỉ của trình duyệt yêu thích của mình hoặc có thể bạn nhấp vào kết quả tìm kiếm của Google. Sau đó, đột nhiên, một chuỗi các từ và ký hiệu dường như ngẫu nhiên xuất hiện ở cuối URL của trang web. Tất nhiên, bạn không biết tại sao nó lại ở đó, nhưng bạn rất vui khi được xem danh sách Amazon, kết quả tìm kiếm của Google hoặc bất kỳ trang web nào bạn chọn một cách an toàn.


Nó có thể trông giống như vô nghĩa đối với người chưa được đào tạo, nhưng mọi ký tự trong URL đều phục vụ một mục đích. Hãy phân tích cấu trúc của một URL trang web, từ giao thức đến chuỗi truy vấn.


5 thành phần chính của một URL

Một URL có thể được chia thành ba phần chính: giao thức, tên miền và đường dẫn. Sau đó, bạn có thể giải quyết một chuỗi truy vấn hoặc ưa thích với một thẻ neo.

1. Giao thức

Thành phần đầu tiên của một URL là giao thức. Nó là phương pháp được sử dụng để truy cập một tài nguyên trên internet. Giao thức phổ biến nhất để duyệt web là HTTP (Giao thức truyền siêu văn bản). Nó gửi một yêu cầu từ trình duyệt của người dùng đến máy chủ lưu trữ trang web và sau đó máy chủ sẽ gửi lại tài nguyên được yêu cầu dưới dạng phản hồi.

Ảnh chụp màn hình giao thức URL của Google

HTTP có một phiên bản bảo mật được gọi là HTTPS (HTTP Secure), sử dụng mã hóa để thêm một lớp bảo mật bổ sung. HTTPS được sử dụng khi dữ liệu nhạy cảm, chẳng hạn như mật khẩu hoặc thông tin thẻ tín dụng, được truyền qua internet. Trang web của bạn cần có chứng chỉ SSL để sử dụng giao thức HTTPS trong các URL của nó.

2. Tên miền

Tên miền là định danh duy nhất cho một trang web trên internet. Nó bao gồm hai phần: miền cấp cao nhất (TLD) và miền cấp hai. TLD cho biết danh mục trang web, chẳng hạn như .com cho các trang web thương mại, .edu cho các tổ chức giáo dục và .org cho các tổ chức phi lợi nhuận. Tên miền cấp hai là tên duy nhất được chọn bởi chủ sở hữu trang web.

Ví dụ: trong tên miền www.smartreviewaz.com, “smartreviewaz” là tên miền cấp hai và ‘”.com” là TLD. Tên miền được đăng ký với công ty đăng ký tên miền và có thể được mua trong một khoảng thời gian nhất định, thường là một năm, nhưng đôi khi lâu hơn.

3. Con đường

Đường dẫn URL chỉ định vị trí của tài nguyên trên trang web. Nó thường xuất hiện sau tên miền và bắt đầu bằng dấu gạch chéo (/). Đường dẫn được sử dụng để tổ chức nội dung trên trang web và giúp người dùng dễ dàng điều hướng.

Ảnh chụp màn hình MakeUseOf với phân tích URL-1

Ví dụ: trong URL www.example.com/blog/post1, “blog” là thư mục chứa các bài đăng trên blog và “post1” là bài đăng trên blog cụ thể. Đường dẫn cũng có thể được sử dụng để tối ưu hóa công cụ tìm kiếm (SEO) bằng cách bao gồm các từ khóa có liên quan.

4. Chuỗi truy vấn

Chuỗi truy vấn là một phần của URL bắt đầu bằng dấu chấm hỏi (?) và chứa các cặp khóa-giá trị được phân tách bằng dấu và (&). Nó được sử dụng để truyền dữ liệu giữa các trang web và có thể chứa thông tin như cụm từ tìm kiếm hoặc sở thích của người dùng.

Ảnh chụp màn hình kết quả tìm kiếm của Google về thanh địa chỉ

Ví dụ: trong URL www.example.com/search?q=example&category=books, chuỗi truy vấn chứa hai cặp khóa-giá trị: “q=example” cho biết cụm từ tìm kiếm là “example” và “category=books” cho biết tìm kiếm là dành cho sách. Bạn sẽ thường thấy các chuỗi truy vấn chứa một chồng tham số tìm kiếm khi duyệt các trang web cho phép bạn lọc kết quả tìm kiếm của mình hoặc các trang web muốn thu thập dữ liệu theo dõi.

5. Thẻ neo

Thẻ neo là một mã định danh phân đoạn xuất hiện sau URL và bắt đầu bằng ký hiệu băm (#). Nó liên kết đến một phần cụ thể của trang web và có thể được sử dụng để tạo mục lục hoặc để liên kết đến một phần cụ thể của một bài báo dài.

Ví dụ: trong hướng dẫn 5.000 từ, tác giả có thể bao gồm menu điều hướng để chia nhỏ nội dung:

  • Các định nghĩa
  • Lịch sử
  • Thách thức ngành
  • câu hỏi thường gặp

Nếu bạn di chuột qua một trong các liên kết đó, URL có thể chứa thẻ liên kết, chẳng hạn như “#definitions”, thẻ này báo hiệu trình duyệt cuộn xuống phần có ID đó trong HTML.

Mã hóa URL là gì?

URL bao gồm các ký tự từ bộ ký tự ASCII, một tập hợp con của bộ ký tự Unicode. Unicode là một tiêu chuẩn mã hóa quốc tế cho các ký tự trong các ngôn ngữ và bảng chữ cái khác nhau. Khi một ký tự bên ngoài bộ ký tự ASCII được sử dụng trong một URL, ký tự đó phải được mã hóa để đảm bảo trình duyệt hiểu chính xác ký tự đó.

Mã hóa URL là quá trình chuyển đổi các ký tự bên ngoài bộ ký tự ASCII thành ASCII tương đương của chúng. Ví dụ: ký tự Unicode ‘é’ sẽ được mã hóa thành ‘%e9’. Mã hóa URL cũng được sử dụng cho các ký tự đặc biệt như dấu cách, được mã hóa thành ‘+’ hoặc ‘%20’.

Đừng lo lắng về việc ghi nhớ mọi kết hợp mã hóa có thể. Hướng dẫn tham khảo mã hóa URL của W3Schools là một tài nguyên hữu ích cho chủ đề này.

Chuyển hướng URL là gì?

Đôi khi, khi bạn nhập một URL vào thanh địa chỉ của trình duyệt, trang web sẽ chuyển hướng đến một trang web khác. Điều này là do có một số cách mà URL có thể được cấu trúc và một số trong số chúng có thể không hoạt động như mong đợi. Khi điều này xảy ra, máy chủ sẽ phản hồi bằng mã trạng thái HTTP cho biết nó sẽ chuyển hướng đến một URL khác (thường là 301 hoặc 302). Sau đó, vị trí mới có thể được chỉ định trong tiêu đề phản hồi.

Các mã trạng thái và ý nghĩa của chúng bao gồm:

  • 200 – Được: Yêu cầu đã thành công.
  • 301- Đã chuyển đi vĩnh viễn: Tài nguyên được yêu cầu đã được di chuyển vĩnh viễn đến một vị trí mới và sẽ được truy xuất từ ​​đó trong các yêu cầu trong tương lai.
  • 302 – Đã tìm thấy (chuyển hướng tạm thời): Điều này cho biết rằng trang này tạm thời nằm ở một URL khác và không được lưu vào bộ nhớ đệm bởi các công cụ tìm kiếm hoặc được sử dụng làm nguồn thông tin có thẩm quyền về nội dung của nó. Nó cũng có thể cho biết máy chủ đang bảo trì, trong đó các trang được chuyển hướng trong khi cập nhật đang được thực hiện hoặc khi các trang đích cần cung cấp các URL thay thế cho các mục đích theo dõi, chẳng hạn như thử nghiệm A/B hoặc thử nghiệm phân tách.

Các mã trạng thái trên dành riêng cho tính hợp lệ của chính URL và bạn có thể thậm chí sẽ không biết chúng tồn tại khi tình cờ xem một trang web đang hoạt động.

Ảnh chụp màn hình ví dụ về trang web 404 của Amazon

Tuy nhiên, khi xảy ra sự cố với URL, trang web hoặc dịch vụ lưu trữ web cơ bản, bạn sẽ thấy một trong các bộ mã khác:

  • 403 – Cấm: Điều này chỉ ra rằng bạn không được phép xem trang web. Điều này có thể là do quyền không chính xác hoặc thiếu thông tin đăng nhập xác thực.
  • 404 không tìm thấy: Điều này cho biết rằng tài nguyên được yêu cầu không tồn tại trên máy chủ và phải được xóa khỏi mọi dấu trang hoặc trang kết quả của công cụ tìm kiếm (SERP).
  • Hơn 500 – Lỗi máy chủ: Những dấu hiệu này cho biết đã xảy ra lỗi trong khi xử lý yêu cầu của bạn và thường do sự cố với cấu hình máy chủ, chẳng hạn như lỗi mã hóa trong tập lệnh, sự cố cơ sở dữ liệu, v.v.

Lỗi trang web có thể gây khó chịu nhưng không phải là ngày tận thế. Trước tiên, hãy thử làm mới trang web. Tiếp theo, hãy kiểm tra thanh địa chỉ của bạn để tìm lỗi do con người tạo ra. Bạn đã thêm một chữ cái? Thương hiệu có đánh vần một trong những từ khác thường không? Con mèo của bạn có đi ngang qua bàn phím không? Nếu không có cách nào ở trên hoạt động và đó là trang web của bạn, hãy liên hệ với máy chủ của bạn. Thật không may, nếu trang web thuộc về người khác, bạn sẽ phải chờ đợi.

Hiểu URL Từ Giao thức đến Đường dẫn

Một URL được tạo thành từ nhiều thành phần mà mỗi thành phần phục vụ một mục đích. Bằng cách hiểu cấu trúc của một URL, bạn có thể dễ dàng điều hướng các trang web hơn và tận dụng tối đa các tính năng có sẵn. Cho dù tìm kiếm thông tin hay mua sắm trực tuyến, việc hiểu các URL có thể giúp bạn tận dụng tối đa trang web.

Similar Posts

Leave a Reply

Your email address will not be published. Required fields are marked *