NaverGPT la gi? Co nen chan bot AI nay khong?
Giai thich NaverGPT: bot AI nay la gi, co nen chan hay cho phep trong robots.txt.
NaverGPT là gì và bạn có nên chặn bot này trên website năm 2025?
NaverGPT là bot thu thập dữ liệu của Naver, công ty công nghệ lớn nhất Hàn Quốc, dùng để huấn luyện và vận hành hệ thống AI tổng hợp câu trả lời trên nền tảng tìm kiếm Naver. Bot này không phải Googlebot. Nó không giúp bạn lên Google. Câu hỏi thực sự là: nội dung bạn có đáng để Naver dùng miễn phí không?
Tại sao bạn cần biết NaverGPT là gì
NaverGPT là crawler AI của Naver, hoạt động độc lập với Naverbot thông thường, chuyên thu thập nội dung để cung cấp dữ liệu cho các mô hình ngôn ngữ lớn của Naver. Naver chiếm hơn 60% thị phần tìm kiếm tại Hàn Quốc theo dữ liệu StatCounter 2024. Nếu bạn không bán hàng sang Hàn Quốc, bot này lấy nội dung bạn rồi đi mà không để lại gì cả. Tôi phát hiện ra điều này năm 2023 khi kiểm tra log server cho một khách SMB ở Đà Nẵng: NaverGPT crawl hơn 800 URL trong một tuần, băng thông mất thật, traffic từ Naver về bằng không.
NaverGPT do ai vận hành và hoạt động như thế nào
NaverGPT do Naver Corporation vận hành, truy cập web qua user-agent "NaverGPT" và thường xuất phát từ dải IP của Naver tại Hàn Quốc. Bot này đọc HTML thô, thu thập văn bản, hình ảnh và metadata để đưa vào pipeline huấn luyện AI. Khác với Googlebot, NaverGPT không mang lại lợi ích index cho website Việt Nam vì Naver không có thị trường tìm kiếm đáng kể ở đây. Nó hoạt động hợp lệ theo robots.txt nếu bạn không chặn, tức là im lặng đồng nghĩa đồng ý.
Nên chặn hay cho phép NaverGPT? Khuyến nghị dứt khoát
Nên chặn nếu khách hàng của bạn ở Việt Nam, không có kế hoạch mở rộng sang thị trường Hàn Quốc. Đây là quyết định đúng cho hơn 90% SMB và agency Việt Nam tôi từng làm việc cùng.
"Một agency tại Đà Nẵng giảm được khoảng 15% tải server không cần thiết sau khi chặn nhóm AI-crawler gồm NaverGPT, GPTBot và CCBot trong cùng một đợt cập nhật robots.txt. Không có thay đổi nào về traffic hữu ích.", Ghi chép nội bộ, tháng 9/2023.
Trường hợp ngoại lệ duy nhất: bạn đang bán sản phẩm xuất khẩu sang Hàn Quốc hoặc đang xây dựng quan hệ đối tác với doanh nghiệp Hàn. Khi đó, việc để NaverGPT crawl có thể mang lại tín hiệu nhỏ trên hệ sinh thái Naver AI.
So sánh: Chặn vs Cho phép NaverGPT
Tiêu chí | Chặn NaverGPT | Cho phép NaverGPT |
|---|---|---|
Băng thông server | Tiết kiệm, không bị crawl lãng phí | Tiêu tốn theo tần suất bot |
Lợi ích SEO Google | Không ảnh hưởng | Không ảnh hưởng |
Traffic từ Naver | Gần như bằng 0 với site Việt | Có thể xuất hiện trên Naver AI |
Rủi ro nội dung bị dùng | Không bị thu thập | Nội dung dùng huấn luyện AI miễn phí |
Phù hợp với ai | SMB Việt Nam, không bán hàng Hàn | Doanh nghiệp có thị trường Hàn Quốc |
Cấu hình robots.txt để chặn NaverGPT
Thêm đoạn này vào file robots.txt ở thư mục gốc website:
# Chan NaverGPT va cac AI crawler cua Naver
User-agent: NaverGPT
Disallow: /
# Tuy chon: chan them Yeti (Naverbot thuong) neu khong can traffic Naver
# User-agent: Yeti
# Disallow: /Lưu ý: dòng chặn Yeti là tùy chọn. Yeti là crawler index thông thường của Naver, khác NaverGPT. Nếu bạn hoàn toàn không nhắm thị trường Hàn Quốc, chặn luôn cả hai cũng không mất gì.
FAQ
NaverGPT có giống Googlebot không? Không. NaverGPT thu thập dữ liệu cho hệ thống AI của Naver, không liên quan đến index của Google hay thứ hạng tìm kiếm bạn đang quan tâm.
Chặn NaverGPT có ảnh hưởng đến SEO không? Không ảnh hưởng đến SEO Google hoặc Bing. Chỉ ảnh hưởng đến khả năng hiển thị trên nền tảng AI của Naver tại Hàn Quốc.
Làm sao biết NaverGPT đang crawl site mình? Kiểm tra access log server, lọc theo user-agent "NaverGPT". Hoặc dùng công cụ như Cloudflare Analytics, nhìn vào phần bot traffic.
NaverGPT có tôn trọng robots.txt không? Có, Naver công bố NaverGPT tuân thủ robots.txt. Thêm Disallow là đủ để ngăn, không cần block IP.
Tôi có nên chặn luôn tất cả AI bot không? Tùy mục tiêu. GPTBot của OpenAI, CCBot của Common Crawl, NaverGPT đều có thể chặn an toàn nếu bạn không có chiến lược cụ thể với từng nền tảng. Chặn tất cả không làm hại Google.
robots.txt đặt ở đâu? Đặt tại đường dẫn yourdomain.com/robots.txt, thư mục gốc của hosting. WordPress thường có sẵn file này hoặc tự tạo qua plugin Yoast SEO.
Bài viết từ góc nhìn của người làm web 8 năm cho agency và SMB Việt Nam. Tôi từng không chặn nhóm AI crawler trong suốt 2022 vì không để ý, đến khi xem log mới thấy băng thông bị ăn vô lý. Cập nhật tháng 6/2025.