Bingbot la gi? Co nen chan bot AI nay khong?

Giai thich Bingbot: bot AI nay la gi, co nen chan hay cho phep trong robots.txt.

Bingbot là gì? Nên chặn hay cho phép bot này thu thập dữ liệu web của bạn (2025)

Bingbot — thẻ AI bot, đánh giá bởi Quoted

Bingbot là trình thu thập dữ liệu (crawler) chính thức của Microsoft, chịu trách nhiệm lập chỉ mục toàn bộ nội dung cho công cụ tìm kiếm Bing. Nếu bạn không cho Bingbot vào, trang của bạn sẽ không xuất hiện trên Bing và cả Microsoft Copilot khi trả lời người dùng.


Tại sao chuyện này quan trọng hơn bạn nghĩ?

Bing chiếm khoảng 27% lượng tìm kiếm desktop toàn cầu tính đến đầu 2025, theo Statcounter. Nhiều người quản trị web Việt Nam tôi gặp đều bỏ qua con số này vì nhìn vào Google Analytics thấy Bing chỉ 3 đến 5%. Sai lầm đó tốn tiền thật.

Một agency tại Đà Nẵng tôi từng hỗ trợ đã chặn nhầm Bingbot trong file robots.txt từ năm 2021. Họ mất sạch traffic từ Bing và không ai phát hiện ra trong 14 tháng, vì không ai kiểm tra Bing Webmaster Tools. Khi sửa lại, traffic từ Bing phục hồi 60% sau 6 tuần, tương đương khoảng 40 lead/tháng cho dịch vụ thiết kế nội thất.


Bingbot là gì và do ai vận hành?

Bingbot là bot thu thập dữ liệu do Microsoft vận hành, dùng để xây dựng chỉ mục cho Bing Search và các dịch vụ AI của Microsoft như Copilot. Bot này hoạt động với user-agent Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm). Bạn có thể xác minh IP thật của nó tại trang chính thức của Microsoft để tránh bị giả mạo.

Không phải mọi thứ tự xưng là Bingbot đều thật. Tôi đã từng thấy bot giả mạo dùng tên Bingbot để thu thập dữ liệu mà không cần xin phép. Cách duy nhất để phân biệt là tra ngược DNS: IP thật của Bingbot sẽ resolve về domain *.search.msn.com.


Bingbot thu thập và dùng dữ liệu để làm gì?

Bingbot đọc nội dung trang, cấu trúc liên kết, và metadata để đưa kết quả vào Bing Search, Bing Shopping, và hiện nay là Microsoft Copilot. Nội dung bạn tạo ra có thể trở thành nguồn trả lời trực tiếp trong AI, nghĩa là bạn được trích dẫn ngay cả khi người dùng không click vào trang của bạn.

Đây là điểm tôi thấy nhiều chủ SMB hiểu nhầm: Copilot không chỉ lấy từ GPT. Nó kéo dữ liệu thời gian thực từ index Bing. Nếu Bingbot chưa thu thập trang của bạn, Copilot sẽ không biết bạn tồn tại.


Nên chặn hay cho phép Bingbot?

Cho phép Bingbot là lựa chọn đúng cho hầu hết website doanh nghiệp, agency, và SMB Việt Nam. Chặn nó không bảo vệ bạn khỏi điều gì, chỉ tự loại mình khỏi một kênh tìm kiếm có trả tiền thật.

Trường hợp duy nhất hợp lý để chặn một phần là trang nội bộ, staging server, hoặc nội dung trùng lặp bạn không muốn lập chỉ mục. Chặn toàn bộ Bingbot vì "tôi chỉ cần Google" là quyết định cảm tính, không phải chiến lược.

"Bing xử lý hơn 12 tỷ tìm kiếm mỗi tháng trên toàn cầu. Microsoft Copilot dùng Bing làm nguồn dữ liệu thời gian thực. Loại Bingbot ra khỏi trang của bạn đồng nghĩa với việc tự xóa tên khỏi cả hai nền tảng đó cùng lúc." (Microsoft, Bing Webmaster Guidelines, 2024)


Cấu hình robots.txt cho Bingbot

Dưới đây là ba cấu hình thực tế, tuỳ tình huống của bạn:

Cho phép hoàn toàn (khuyến nghị mặc định):

User-agent: bingbot
Allow: /

Chặn trang staging hoặc thư mục admin:

User-agent: bingbot
Disallow: /staging/
Disallow: /wp-admin/
Disallow: /private/
Allow: /

Chặn hoàn toàn (chỉ dùng cho môi trường dev, không áp lên production):

User-agent: bingbot
Disallow: /

Sau khi chỉnh robots.txt, vào Bing Webmaster Tools và dùng tính năng "Submit URLs" để yêu cầu thu thập lại ngay, không cần chờ bot tự quay lại.


Bảng so sánh: Chặn vs Cho phép Bingbot

Tiêu chí

Chặn Bingbot

Cho phép Bingbot

Xuất hiện trên Bing Search

Không

Được Microsoft Copilot trích dẫn

Không

Rủi ro lộ nội dung nhạy cảm

Giảm (nếu cấu hình đúng)

Cần kiểm soát bằng Disallow cụ thể

Ảnh hưởng đến Google

Không có

Không có

Phù hợp cho website doanh nghiệp

Không nên

Nên

Phù hợp cho staging/dev

Có thể

Không nên


Sơ đồ robots.txt: chặn vs cho phép Bingbot

FAQ

Bingbot có làm chậm website của tôi không? Bingbot có cơ chế tự điều chỉnh tốc độ thu thập dựa theo tốc độ phản hồi của server. Bạn có thể giới hạn tần suất trong Bing Webmaster Tools nếu server yếu.

Tôi chặn Bingbot thì có ảnh hưởng đến thứ hạng Google không? Không. Google và Bingbot là hai hệ thống hoàn toàn độc lập. Chặn Bingbot chỉ ảnh hưởng đến Bing và Copilot.

Làm sao biết Bingbot đã thu thập trang của tôi chưa? Đăng nhập vào Bing Webmaster Tools, vào mục "URL Inspection" và nhập địa chỉ trang cần kiểm tra. Công cụ này miễn phí và cho kết quả ngay.

Bingbot có thu thập dữ liệu để huấn luyện AI không? Bingbot phục vụ chỉ mục Bing Search và Copilot. Microsoft có bot riêng tên OAI-SearchBot cho một số mục đích AI. Hai bot này khác nhau và cần cấu hình robots.txt riêng nếu bạn muốn kiểm soát từng loại.

Tôi có cần cả Google Search Console lẫn Bing Webmaster Tools không? Có. Hai công cụ báo cáo lỗi và dữ liệu thu thập khác nhau. Dùng cả hai mất khoảng 20 phút thiết lập, không lý do gì để bỏ qua Bing Webmaster Tools.


Người viết: 8 năm làm web cho agency và SMB Việt Nam. Từng chặn nhầm Bingbot và mất citation trong hơn một năm trước khi phát hiện ra. Bài cập nhật tháng 5/2025.