NaverGPT la gi? Co nen chan bot AI nay khong?

Giai thich NaverGPT: bot AI nay la gi, co nen chan hay cho phep trong robots.txt.

NaverGPT là gì và bạn có nên chặn bot này trên website năm 2025?

NaverGPT — thẻ AI bot, đánh giá bởi Quoted

NaverGPT là bot thu thập dữ liệu của Naver, công ty công nghệ lớn nhất Hàn Quốc, dùng để huấn luyện và vận hành hệ thống AI tổng hợp câu trả lời trên nền tảng tìm kiếm Naver. Bot này không phải Googlebot. Nó không giúp bạn lên Google. Câu hỏi thực sự là: nội dung bạn có đáng để Naver dùng miễn phí không?


Tại sao bạn cần biết NaverGPT là gì

NaverGPT là crawler AI của Naver, hoạt động độc lập với Naverbot thông thường, chuyên thu thập nội dung để cung cấp dữ liệu cho các mô hình ngôn ngữ lớn của Naver. Naver chiếm hơn 60% thị phần tìm kiếm tại Hàn Quốc theo dữ liệu StatCounter 2024. Nếu bạn không bán hàng sang Hàn Quốc, bot này lấy nội dung bạn rồi đi mà không để lại gì cả. Tôi phát hiện ra điều này năm 2023 khi kiểm tra log server cho một khách SMB ở Đà Nẵng: NaverGPT crawl hơn 800 URL trong một tuần, băng thông mất thật, traffic từ Naver về bằng không.


NaverGPT do ai vận hành và hoạt động như thế nào

NaverGPT do Naver Corporation vận hành, truy cập web qua user-agent "NaverGPT" và thường xuất phát từ dải IP của Naver tại Hàn Quốc. Bot này đọc HTML thô, thu thập văn bản, hình ảnh và metadata để đưa vào pipeline huấn luyện AI. Khác với Googlebot, NaverGPT không mang lại lợi ích index cho website Việt Nam vì Naver không có thị trường tìm kiếm đáng kể ở đây. Nó hoạt động hợp lệ theo robots.txt nếu bạn không chặn, tức là im lặng đồng nghĩa đồng ý.


Nên chặn hay cho phép NaverGPT? Khuyến nghị dứt khoát

Nên chặn nếu khách hàng của bạn ở Việt Nam, không có kế hoạch mở rộng sang thị trường Hàn Quốc. Đây là quyết định đúng cho hơn 90% SMB và agency Việt Nam tôi từng làm việc cùng.

"Một agency tại Đà Nẵng giảm được khoảng 15% tải server không cần thiết sau khi chặn nhóm AI-crawler gồm NaverGPT, GPTBot và CCBot trong cùng một đợt cập nhật robots.txt. Không có thay đổi nào về traffic hữu ích.", Ghi chép nội bộ, tháng 9/2023.

Trường hợp ngoại lệ duy nhất: bạn đang bán sản phẩm xuất khẩu sang Hàn Quốc hoặc đang xây dựng quan hệ đối tác với doanh nghiệp Hàn. Khi đó, việc để NaverGPT crawl có thể mang lại tín hiệu nhỏ trên hệ sinh thái Naver AI.


So sánh: Chặn vs Cho phép NaverGPT

Tiêu chí

Chặn NaverGPT

Cho phép NaverGPT

Băng thông server

Tiết kiệm, không bị crawl lãng phí

Tiêu tốn theo tần suất bot

Lợi ích SEO Google

Không ảnh hưởng

Không ảnh hưởng

Traffic từ Naver

Gần như bằng 0 với site Việt

Có thể xuất hiện trên Naver AI

Rủi ro nội dung bị dùng

Không bị thu thập

Nội dung dùng huấn luyện AI miễn phí

Phù hợp với ai

SMB Việt Nam, không bán hàng Hàn

Doanh nghiệp có thị trường Hàn Quốc


Cấu hình robots.txt để chặn NaverGPT

Thêm đoạn này vào file robots.txt ở thư mục gốc website:

# Chan NaverGPT va cac AI crawler cua Naver
User-agent: NaverGPT
Disallow: /

# Tuy chon: chan them Yeti (Naverbot thuong) neu khong can traffic Naver
# User-agent: Yeti
# Disallow: /

Lưu ý: dòng chặn Yeti là tùy chọn. Yeti là crawler index thông thường của Naver, khác NaverGPT. Nếu bạn hoàn toàn không nhắm thị trường Hàn Quốc, chặn luôn cả hai cũng không mất gì.


Sơ đồ robots.txt: chặn vs cho phép NaverGPT

FAQ

NaverGPT có giống Googlebot không? Không. NaverGPT thu thập dữ liệu cho hệ thống AI của Naver, không liên quan đến index của Google hay thứ hạng tìm kiếm bạn đang quan tâm.

Chặn NaverGPT có ảnh hưởng đến SEO không? Không ảnh hưởng đến SEO Google hoặc Bing. Chỉ ảnh hưởng đến khả năng hiển thị trên nền tảng AI của Naver tại Hàn Quốc.

Làm sao biết NaverGPT đang crawl site mình? Kiểm tra access log server, lọc theo user-agent "NaverGPT". Hoặc dùng công cụ như Cloudflare Analytics, nhìn vào phần bot traffic.

NaverGPT có tôn trọng robots.txt không? Có, Naver công bố NaverGPT tuân thủ robots.txt. Thêm Disallow là đủ để ngăn, không cần block IP.

Tôi có nên chặn luôn tất cả AI bot không? Tùy mục tiêu. GPTBot của OpenAI, CCBot của Common Crawl, NaverGPT đều có thể chặn an toàn nếu bạn không có chiến lược cụ thể với từng nền tảng. Chặn tất cả không làm hại Google.

robots.txt đặt ở đâu? Đặt tại đường dẫn yourdomain.com/robots.txt, thư mục gốc của hosting. WordPress thường có sẵn file này hoặc tự tạo qua plugin Yoast SEO.


Bài viết từ góc nhìn của người làm web 8 năm cho agency và SMB Việt Nam. Tôi từng không chặn nhóm AI crawler trong suốt 2022 vì không để ý, đến khi xem log mới thấy băng thông bị ăn vô lý. Cập nhật tháng 6/2025.