Grok la gi? Co nen chan bot AI nay khong?
Giai thich Grok: bot AI nay la gi, co nen chan hay cho phep trong robots.txt.
Grok Là Gì và Có Nên Chặn Bot Này Trên Website Của Bạn Không? (2025)
Grok là AI chatbot do xAI (công ty của Elon Musk) phát triển, ra mắt năm 2023. Bot crawl web của nó mang tên Grok (user-agent: Grokbot) và đang thu thập dữ liệu từ hàng triệu trang web để huấn luyện mô hình, bao gồm cả website của bạn, trừ khi bạn chặn nó lại.
Grok là gì và ai đang chạy nó?
Grok là mô hình ngôn ngữ lớn do xAI vận hành, tích hợp trực tiếp vào nền tảng X (Twitter cũ). Elon Musk thành lập xAI năm 2023 như một đối thủ trực tiếp của OpenAI, và Grok là sản phẩm chủ lực. Điểm khác biệt là Grok có quyền truy cập dữ liệu thời gian thực từ X, còn bot crawler của nó thì đang quét web rộng hơn để nạp thêm dữ liệu huấn luyện. Năm 2024, xAI công bố Grok-2 với khả năng xử lý hình ảnh và văn bản, và hiện tại Grok-3 đang được triển khai. Đây không phải bot nhỏ để bạn bỏ qua.
Grokbot đọc và dùng dữ liệu của bạn để làm gì?
Grokbot thu thập nội dung website để huấn luyện mô hình AI của xAI, không phải để đưa traffic về cho bạn. Khác với Googlebot hay Bingbot, Grokbot không index trang của bạn vào kết quả tìm kiếm. Nó đọc bài viết, trang sản phẩm, mô tả dịch vụ của bạn rồi đưa vào dữ liệu huấn luyện. Kết quả: nội dung bạn viết 3 tiếng có thể xuất hiện trong câu trả lời của Grok mà không có một link nào trỏ về site bạn. Tôi đã thấy điều này xảy ra với một agency ở Đà Nẵng: bài hướng dẫn SEO của họ bị Grok paraphrase hoàn toàn, không citation, không traffic.
Nên chặn hay cho phép Grokbot?
Khuyen nghi dứt khoát: chặn Grokbot nếu bạn chạy site nội dung, agency, hoặc SMB bán dịch vụ. Lý do đơn giản là tỉ lệ đánh đổi quá tệ. Bạn mất nội dung (dữ liệu huấn luyện cho xAI), không nhận lại traffic, không nhận citation, không nhận backlink. Nếu bạn đang chạy một nền tảng muốn được AI nhắc đến, câu chuyện khác. Nhưng với 95% SMB và agency Việt Nam tôi từng làm việc cùng, không có lý do gì để để cửa mở cho Grokbot.
"Theo khảo sát của Originality.ai (2024), hơn 60% các publisher lớn đã chặn ít nhất một AI crawler, và con số này tăng gấp đôi so với năm 2023. Grokbot nằm trong top 3 bot bị chặn nhiều nhất."
So sánh: Chặn vs Cho Phép Grokbot
Tiêu chí | Chặn Grokbot | Cho phép Grokbot |
|---|---|---|
Traffic từ bot | Không có (bot không mang traffic) | Không có |
Nội dung bị dùng | Không | Có, không citation |
Ảnh hưởng SEO Google | Không ảnh hưởng | Không ảnh hưởng |
Tốc độ server | Nhẹ hơn một chút | Bot crawl tiêu tốn tài nguyên |
Rủi ro mất nội dung | Thấp | Cao |
Phù hợp với | Agency, SMB, blog nội dung | Nền tảng muốn AI nhắc tên |
Cấu hình robots.txt để chặn Grokbot
Thêm đoạn này vào file robots.txt ở thư mục gốc của website:
# Chặn Grokbot (xAI / Elon Musk) - cap nhat 2025
User-agent: Grok
Disallow: /
User-agent: Grokbot
Disallow: /Nếu bạn muốn chặn đồng thời nhiều AI crawler đang lấy dữ liệu không trả lại gì:
# Chặn cac AI training bot - cap nhat 2025
User-agent: Grok
Disallow: /
User-agent: Grokbot
Disallow: /
User-agent: GPTBot
Disallow: /
User-agent: CCBot
Disallow: /
User-agent: anthropic-ai
Disallow: /
User-agent: Claude-Web
Disallow: /Sau khi chỉnh, kiểm tra lại tại yourdomain.com/robots.txt để chắc file được serve đúng.
FAQ
Grokbot có ảnh hưởng đến thứ hạng Google của tôi không? Không. Chặn Grokbot không tác động gì đến Googlebot hay thứ hạng tìm kiếm. Đây là hai hệ thống hoàn toàn tách biệt.
Nếu tôi chặn Grok, website tôi có bị Grok "ghét" hoặc không được nhắc đến không? Không có bằng chứng nào cho thấy điều này. Grok không phạt hay ưu tiên site dựa trên robots.txt. Nội dung bạn đã bị crawl trước khi chặn thì vẫn có thể nằm trong dữ liệu cũ.
User-agent của Grokbot viết hoa hay thường? Dùng cả hai: Grok và Grokbot như trong ví dụ trên để chắc ăn, vì một số server xử lý case-sensitive.
Tôi có thể chỉ chặn một phần thư mục không, thay vì chặn toàn bộ? Được. Thay Disallow: / bằng Disallow: /blog/ hoặc /san-pham/ nếu bạn chỉ muốn bảo vệ nội dung có giá trị cao. Trang giới thiệu và liên hệ thường không cần bảo vệ.
Robots.txt có bắt buộc bot phải tuân theo không? Không bắt buộc về mặt kỹ thuật, nhưng Grokbot tuyên bố tuân thủ robots.txt. Nếu bạn muốn cứng hơn, cân nhắc thêm header X-Robots-Tag: noindex hoặc dùng firewall chặn theo IP range của xAI.
Tôi làm web cho khách, tôi có nên tự thêm cấu hình này vào không? Nên hỏi khách trước, nhưng tôi thường đề xuất chặn mặc định và giải thích lý do. Tám năm làm cho SMB, chưa khách nào phản đối khi nghe rõ là bot này không mang traffic về.
Bài viết dựa trên kinh nghiệm 8 năm quản trị web và cấu hình robots.txt cho agency và SMB Việt Nam. Cập nhật tháng 6/2025.