Thẻ noindex là gì? Cách sử dụng như thế nào cho đúng?
Nếu bạn là một người chuyên quản trị nội dung website hoặc thường xuyên làm các công việc có liên quan đến SEO thì "Noindex" là một thuật ngữ khá quen thuộc, nó quy định việc công cụ tìm kiếm có lập chỉ mục cho website của bạn hay không.
Vậy định nghĩa và cách sử dụng noindex như thế nào? Hãy cùng tìm hiểu nhé!
1. Noindex là gì?
Thẻ noindex là một ngôn ngữ HTML quy định cho các công cụ tìm kiếm như Google, Bing hay Yahoo không lập chỉ mục một trang web cụ thể, từ đó không lưu trữ và đề xuất nó ở kết quả tìm kiếm.
Các trang chứa thẻ noindex vẫn tồn tại khi người dùng gõ đúng địa chỉ của nó trên thanh địa chỉ, hoặc nhấp vào chính liên kết đó. Tuy nhiên, họ sẽ không thể tìm ra nó trên công cụ tìm kiếm.
2. Tại sao noindex quan trọng trong SEO?
Thông qua noindex các quản trị viên website có thể ngăn chặn Google lập chỉ mục những trang không cần thiết (như trang liên hệ, đăng ký thông tin, chính sách...) hoặc những trang có nội dung ít giá trị, thậm chí là sao chép.
Một số trang web có số lượng trang lớn làm giảm hiệu suất đọc dữ liệu của Goolge. Các thẻ noindex giúp tập trung sự chú ý vào những trang khác quan trọng hơn và làm tăng tốc độ index dữ liệu.
Mẹo: Bạn có thể kiểm tra một trang web có thẻ noindex hay không bằng cách kiểm tra nguồn (tại trang đó nhấp Ctrl + U) sau đó tìm đến đoạn mã: 'meta name="robots" content="noindex', nếu không có, trang này rất có thể được lập chỉ mục trên công cụ tìm kiếm.
Hoặc bạn có thể dùng Sermrush để kiểm tra, như hình:
3. Khi nào sử dụng noindex
Khi có nhiều nội dung không cần thiết, bạn sẽ cần sử dụng thẻ noindex:
- Trang nội dung sao chép
Đối với những website mới, một số người dùng cách sao chép để tạo độ phủ nội dung trước khi đưa vào sử dụng cho cho bất kỳ mục đích nào khác. Quy tắc noindex giúp bạn chặn những nội dung sao chép này đối với công cụ tìm kiếm, nhằm tránh các hình phạt do sao chép thông tin, trong khi người truy cập vẫn có thể xem bình thường.
- Trang không có giá trị tìm kiếm
Các trang như trang đăng ký, trang cảm ơn, thông báo đơn hàng... không có giá trị trong việc tìm kiếm thông tin, các website cũng không muốn hiển thị những trang này trên kết quả tìm kiếm. Nên sử dụng noindex cho các trang này để giảm tải trọng cho website của bạn.
- Trang tài nguyên
Những trang tài nguyên như file PDF hay tài liệu nội bộ cũng không cần thiết phải xuất hiện trên Google.
4. Cách dùng thẻ noindex
Bạn đã biết những trang nào không cần phải lập chỉ mục, hãy tiến hành vào việc chèn thẻ noindex ngay nhé. Có 2 cách để làm:
Cách 1: Có thể sử dụng tệp .htaccess để thêm tiêu đề HTTP X-Robots-Tag.
Ngăn chặn lập chỉ mục 1 trang cụ thể:
'
Header set X-Robots-Tag "noindex"
Ngăn chặn lập chỉ mục một thư mục cụ thể:
Header set X-Robots-Tag "noindex"
'
Header set X-Robots-Tag "noindex"
Hoặc chặn 1 trang có chứa file PDF
Header set X-Robots-Tag "noindex"
Cách này khá phức tạp bởi nó liên quan nhiều đến cấu trúc máy chủ. Thông thường nó được sử dụng để không lập chỉ mục các file PDF trên toàn bộ trang web. Nếu bạn muốn chặn một link nào đó, thì cách thứ 2 sẽ dễ dàng hơn.
Cách 2: Chặn trong HTML
Rất đơn giản chỉ cần thêm: meta name="robots" content="noindex" vào thẻ head của trang đó là được. Đầy đủ của nó sẽ trông như thế này:
Đối với một số giao diện quản lý nội dung website hiện nay, người dùng có thể linh hoạt bật/tắt noindex một cách dễ dàng thông qua các nút bấm mà không cần phải can thiệp đến code.
5. Quy tắc khi sử dụng noindex
Bạn đã biết noindex là để dùng cho những trang mình không muốn công cụ tìm kiếm lập chỉ mục, do đó hãy dùng nó thật chính xác. Dưới đây là một số quy tắc:
5.1. Không dùng noindex cho các trang muốn xuất hiện trong Google
Quy tắc noindex ngăn không cho một trang được lập chỉ mục và hiển thị trong kết quả tìm kiếm. Vì vậy, nếu bạn muốn một trang được tìm thấy thông qua tìm kiếm, đừng noindex trang đó. Nếu nghi ngờ một trang nào đó, hãy truy cập và kiểm tra bằng cách kiểm tra nguồn (tại trang đó nhấp Ctrl + U), tìm dòng code: 'meta name="robots" content="noindex', nếu có, hãy loại bỏ nó ngay lập tức.
Hoặc bạn cũng có thể sử dụng các công cụ SEO như Search Console hoặc Sermrush để kiểm tra noindex.
5.2. Không chặn lập chỉ mục bằng robots.txt
Tệp robots.txt cho công cụ tìm kiếm biết những trang nào cần thu thập dữ liệu chứ không phải những trang nào cần lập chỉ mục.
Ngay cả khi bạn chặn một trang trong robots.txt, công cụ tìm kiếm vẫn có thể lập chỉ mục trang đó nếu tìm thấy liên kết đến trang đó từ các trang khác.
5.3. Hạn chế sử dụng liên kết từ các trang noindex
Noindexing có thể gây hại cho SEO của bạn nếu các trang web bạn chặn không cho xuất hiện trong kết quả tìm kiếm lại liên kết đến một số trang khác của bạn.
Các công cụ tìm kiếm sẽ chỉ theo dõi các liên kết trên một trang không được lập chỉ mục trong một thời gian. Và cuối cùng coi các liên kết đó là nofollow (tức là chúng không nên được theo dõi hoặc vượt qua sức mạnh xếp hạng).
Nếu có những trang khác trên trang web của bạn có ít liên kết nội bộ và một số liên kết đó đến từ nội dung không được lập chỉ mục, thì các công cụ tìm kiếm sẽ khó tìm thấy những trang khác đó hơn.
Vì vậy, chúng có thể không xuất hiện trong kết quả tìm kiếm. Ngay cả khi bạn muốn chúng xuất hiện. Cố gắng đưa thêm nhiều liên kết đến các trang này trên trang web của bạn.
5.4. Không dùng noindex cho nội dung trùng lặp
Nội dung trùng lặp là khi bạn có hai hoặc nhiều trang có nội dung giống hệt nhau hoặc rất giống nhau. Điều này thường xảy ra đối với các trang sản phẩm có tên, chức năng, công dụng... gần giống nhau, làm cho công cụ tìm kiếm khó phân biệt và quyết định nội dung nào sẽ được lập chỉ mục.
Lúc này, sử dụng noindex trên các trang trùng lặp nội dung không phải là một ý tưởng hay. Thay vào đó, hãy cân nhắc sử dụng thẻ "Canonical". Chúng cho các công cụ tìm kiếm biết phiên bản nào của trang là phiên bản chính và nên được lập chỉ mục. Quan trọng nhất, chúng cũng hợp nhất sức mạnh xếp hạng từ tất cả các phiên bản vào trang chính.
Nhìn chung noindex là một thẻ HTML cơ bản, dễ sử dụng, tuy nhiên cần sử dụng cần thận. Sự nhầm lẫn có thể khiến công sức tạo nội dung và các chiến lược SEO của bạn trở nên vô nghĩa, khi mà toàn bộ nội dung đều không được công cụ tìm kiếm lập chỉ mục và đề xuất trên kết quả tìm kiếm.
Nguồn Mrweb