List Backlink from 11 to 20

phamtriu.com phamtriu.com phamtriu.com phamtriu.com phamtriu.com phamtriu.com phamtriu.com phamtriu.com phamtriu.com phamtriu.com


Hãy để tôi bắt đầu từ những điều cơ bản, tất cả các công cụ tìm kiếm có bot, mà thu thập dữ liệu và chỉ mục trang web của bạn. Thu thập dữ liệu và lập chỉ mục là hai thuật ngữ khác nhau, và nếu bạn muốn để có được chiều sâu về nó, bạn có thể đọc:   Google Crawling và lập chỉ mục . Khi một công cụ tìm kiếm bot (bot Google, Bing bot, 3 trình thu thập công cụ tìm kiếm bên), đến với trang web của bạn theo một liên kết, họ làm theo tất cả các liên kết trên blog của bạn, chỉ số sâu trang web của bạn. Đây là nơi tập tin sitemap của bạn, cũng giúp họ tìm thấy các liên kết từ blog của bạn.
Bây giờ, hai tập tin Sơ đồ và Robots.txt, cư trú tại thư mục gốc của tên miền của bạn. Như tôi đã nói, chương trình theo quy định robots.txt, để xác định bò của trang web của bạn. Ở đây là việc sử dụng tập tin robots.txt:
Khi một công cụ tìm kiếm chương trình đi trên blog của bạn, họ có một nguồn lực hạn chế để thu thập thông tin trang web của bạn. Nếu họ không thể thu thập thông tin tất cả các trang trên Website của bạn trong tài nguyên nhất định, họ sẽ ngừng thu thập dữ liệu, và điều này sẽ cản trở lập chỉ mục của bạn. Đây là một lý do, đôi khi nhiều trang từ blog của bạn không phải là một phần của công cụ tìm kiếm. Bây giờ, cùng một lúc có rất nhiều phần của trang web của bạn, bạn không muốn chương trình công cụ tìm kiếm để thu thập thông tin. Ví dụ, thư mục của bạn Wp-admin, bảng điều khiển quản trị của bạn hoặc các trang khác, mà không phải là hữu ích cho công cụ tìm kiếm. Sử dụng robots.txt, bạn đang chỉ đạo thu thập công cụ tìm kiếm (chương trình), không thu thập thông tin khu vực đó của trang web của bạn. Điều này sẽ không chỉ tăng tốc độ thu thập dữ liệu của blog của bạn, nhưng cũng sẽ giúp thu thập dữ liệu sâu bên trong các trang của bạn.
Một trong những quan niệm sai lớn nhất về Robots.txt là, người sử dụng nó cho noindexing. Không nhớ, file Robots.txt không phải là bị cho những chỉ số hoặc không có chỉ số, nó chỉ là để trực tiếp chương trình công cụ tìm kiếm để ngăn chặn bò phần nào đó của blog của bạn. Ví dụ, nếu bạn nhìn vào ShoutMeLoud Robots.txt tập tin (nền tảng WordPress), bạn sẽ hiểu rõ ràng, những gì một phần của blog của tôi, tôi không muốn chương trình công cụ tìm kiếm để thu thập thông tin.



0 nhận xét:

Đăng nhận xét

+