Grok la gi? Co nen chan bot AI nay khong?

Giai thich Grok: bot AI nay la gi, co nen chan hay cho phep trong robots.txt.

Grok Là Gì và Có Nên Chặn Bot Này Trên Website Của Bạn Không? (2025)

Grok — thẻ AI bot, đánh giá bởi Quoted

Grok là AI chatbot do xAI (công ty của Elon Musk) phát triển, ra mắt năm 2023. Bot crawl web của nó mang tên Grok (user-agent: Grokbot) và đang thu thập dữ liệu từ hàng triệu trang web để huấn luyện mô hình, bao gồm cả website của bạn, trừ khi bạn chặn nó lại.


Grok là gì và ai đang chạy nó?

Grok là mô hình ngôn ngữ lớn do xAI vận hành, tích hợp trực tiếp vào nền tảng X (Twitter cũ). Elon Musk thành lập xAI năm 2023 như một đối thủ trực tiếp của OpenAI, và Grok là sản phẩm chủ lực. Điểm khác biệt là Grok có quyền truy cập dữ liệu thời gian thực từ X, còn bot crawler của nó thì đang quét web rộng hơn để nạp thêm dữ liệu huấn luyện. Năm 2024, xAI công bố Grok-2 với khả năng xử lý hình ảnh và văn bản, và hiện tại Grok-3 đang được triển khai. Đây không phải bot nhỏ để bạn bỏ qua.


Grokbot đọc và dùng dữ liệu của bạn để làm gì?

Grokbot thu thập nội dung website để huấn luyện mô hình AI của xAI, không phải để đưa traffic về cho bạn. Khác với Googlebot hay Bingbot, Grokbot không index trang của bạn vào kết quả tìm kiếm. Nó đọc bài viết, trang sản phẩm, mô tả dịch vụ của bạn rồi đưa vào dữ liệu huấn luyện. Kết quả: nội dung bạn viết 3 tiếng có thể xuất hiện trong câu trả lời của Grok mà không có một link nào trỏ về site bạn. Tôi đã thấy điều này xảy ra với một agency ở Đà Nẵng: bài hướng dẫn SEO của họ bị Grok paraphrase hoàn toàn, không citation, không traffic.


Nên chặn hay cho phép Grokbot?

Khuyen nghi dứt khoát: chặn Grokbot nếu bạn chạy site nội dung, agency, hoặc SMB bán dịch vụ. Lý do đơn giản là tỉ lệ đánh đổi quá tệ. Bạn mất nội dung (dữ liệu huấn luyện cho xAI), không nhận lại traffic, không nhận citation, không nhận backlink. Nếu bạn đang chạy một nền tảng muốn được AI nhắc đến, câu chuyện khác. Nhưng với 95% SMB và agency Việt Nam tôi từng làm việc cùng, không có lý do gì để để cửa mở cho Grokbot.

"Theo khảo sát của Originality.ai (2024), hơn 60% các publisher lớn đã chặn ít nhất một AI crawler, và con số này tăng gấp đôi so với năm 2023. Grokbot nằm trong top 3 bot bị chặn nhiều nhất."


So sánh: Chặn vs Cho Phép Grokbot

Tiêu chí

Chặn Grokbot

Cho phép Grokbot

Traffic từ bot

Không có (bot không mang traffic)

Không có

Nội dung bị dùng

Không

Có, không citation

Ảnh hưởng SEO Google

Không ảnh hưởng

Không ảnh hưởng

Tốc độ server

Nhẹ hơn một chút

Bot crawl tiêu tốn tài nguyên

Rủi ro mất nội dung

Thấp

Cao

Phù hợp với

Agency, SMB, blog nội dung

Nền tảng muốn AI nhắc tên


Cấu hình robots.txt để chặn Grokbot

Thêm đoạn này vào file robots.txt ở thư mục gốc của website:

# Chặn Grokbot (xAI / Elon Musk) - cap nhat 2025
User-agent: Grok
Disallow: /

User-agent: Grokbot
Disallow: /

Nếu bạn muốn chặn đồng thời nhiều AI crawler đang lấy dữ liệu không trả lại gì:

# Chặn cac AI training bot - cap nhat 2025
User-agent: Grok
Disallow: /

User-agent: Grokbot
Disallow: /

User-agent: GPTBot
Disallow: /

User-agent: CCBot
Disallow: /

User-agent: anthropic-ai
Disallow: /

User-agent: Claude-Web
Disallow: /

Sau khi chỉnh, kiểm tra lại tại yourdomain.com/robots.txt để chắc file được serve đúng.


Sơ đồ robots.txt: chặn vs cho phép Grok

FAQ

Grokbot có ảnh hưởng đến thứ hạng Google của tôi không? Không. Chặn Grokbot không tác động gì đến Googlebot hay thứ hạng tìm kiếm. Đây là hai hệ thống hoàn toàn tách biệt.

Nếu tôi chặn Grok, website tôi có bị Grok "ghét" hoặc không được nhắc đến không? Không có bằng chứng nào cho thấy điều này. Grok không phạt hay ưu tiên site dựa trên robots.txt. Nội dung bạn đã bị crawl trước khi chặn thì vẫn có thể nằm trong dữ liệu cũ.

User-agent của Grokbot viết hoa hay thường? Dùng cả hai: GrokGrokbot như trong ví dụ trên để chắc ăn, vì một số server xử lý case-sensitive.

Tôi có thể chỉ chặn một phần thư mục không, thay vì chặn toàn bộ? Được. Thay Disallow: / bằng Disallow: /blog/ hoặc /san-pham/ nếu bạn chỉ muốn bảo vệ nội dung có giá trị cao. Trang giới thiệu và liên hệ thường không cần bảo vệ.

Robots.txt có bắt buộc bot phải tuân theo không? Không bắt buộc về mặt kỹ thuật, nhưng Grokbot tuyên bố tuân thủ robots.txt. Nếu bạn muốn cứng hơn, cân nhắc thêm header X-Robots-Tag: noindex hoặc dùng firewall chặn theo IP range của xAI.

Tôi làm web cho khách, tôi có nên tự thêm cấu hình này vào không? Nên hỏi khách trước, nhưng tôi thường đề xuất chặn mặc định và giải thích lý do. Tám năm làm cho SMB, chưa khách nào phản đối khi nghe rõ là bot này không mang traffic về.


Bài viết dựa trên kinh nghiệm 8 năm quản trị web và cấu hình robots.txt cho agency và SMB Việt Nam. Cập nhật tháng 6/2025.