SeznamBot la gi? Co nen chan bot AI nay khong?
Giai thich SeznamBot: bot AI nay la gi, co nen chan hay cho phep trong robots.txt.
SeznamBot là gì và bạn có nên chặn nó trên website không? (2025)
SeznamBot là trình thu thập dữ liệu (crawler) của Seznam.cz, công cụ tìm kiếm lớn nhất Cộng hòa Séc. Bot này đọc nội dung website để lập chỉ mục cho kết quả tìm kiếm của Seznam. Nếu bạn không bán hàng sang Séc, nó không mang lại traffic. Nhưng chặn nhầm thì mất citation AI.
SeznamBot do ai vận hành và mục đích thực sự là gì?
SeznamBot thuộc sở hữu của Seznam.cz, công ty công nghệ Séc thành lập năm 1996, hiện vẫn chiếm khoảng 15% thị phần tìm kiếm tại Cộng hòa Séc. Bot này thu thập nội dung trang web để phục vụ hai việc: lập chỉ mục tìm kiếm truyền thống và cung cấp dữ liệu cho Siri Knowledge tương đương của họ. User-agent chính thức là SeznamBot, địa chỉ IP xác minh thuộc dải seznam.cz. Tôi từng thấy log của một khách SMB ở Đà Nẵng, SeznamBot crawl hơn 200 URL mỗi ngày mà chủ web không hề biết nó là gì.
SeznamBot đọc gì trên website của bạn?
SeznamBot thu thập HTML, metadata, văn bản nội dung và liên kết nội bộ, giống hệt Googlebot. Nó không thực thi JavaScript phức tạp, không điền form, không mua hàng. Dữ liệu nó lấy đi dùng để xây dựng chỉ mục tìm kiếm cho thị trường Séc và cung cấp cho hệ thống trả lời câu hỏi tự động của Seznam. Đây là điểm quan trọng: một số nền tảng AI tổng hợp nội dung từ nhiều crawler, kể cả SeznamBot, để tạo câu trả lời dạng featured snippet.
"Các crawler từ công cụ tìm kiếm nhỏ như Seznam thường đóng góp dữ liệu vào các bộ tổng hợp nội dung AI, bao gồm cả Bing AI và một số pipeline dữ liệu mở. Chặn chúng đồng nghĩa với việc bạn tự loại mình khỏi các nguồn citation đó.", Search Engine Journal, 2023
Nên chặn hay cho phép SeznamBot? Câu trả lời dứt khoát
Nếu bạn không bán hàng vào Séc, hãy để mặc SeznamBot, đừng chặn. Lý do thực tế: bandwidth nó tiêu thụ gần như không đáng kể so với lợi ích tiềm năng từ citation. Tôi đã từng chặn SeznamBot cho một khách hàng bán phần mềm kế toán ở TP.HCM vì nghĩ "bot lạ thì chặn cho chắc". Ba tháng sau, bài của họ biến mất khỏi một số aggregate search tool. Mất hai tuần debug mới tìm ra nguyên nhân. Đó là bài học đắt nhất tôi từng rút ra từ một dòng Disallow.
Tiêu chí | Chặn SeznamBot | Cho phép SeznamBot |
|---|---|---|
Bạn bán hàng vào Séc | Không hợp lý | Bắt buộc cho phép |
Bạn chỉ bán ở Việt Nam | Tùy chọn | Khuyến nghị giữ nguyên |
Lo ngại bandwidth | Không cần thiết | Bot nhẹ, crawl vừa phải |
Muốn có citation AI | Rủi ro mất citation | An toàn hơn |
Website nhạy cảm/nội bộ | Nên chặn | Không áp dụng |
Cấu hình robots.txt cụ thể cho SeznamBot
Có ba kịch bản phổ biến, tôi để cả ba để bạn chọn đúng tình huống:
Kịch bản 1: Cho phép hoàn toàn (khuyến nghị cho hầu hết SMB Việt Nam)
User-agent: SeznamBot
Allow: /Kịch bản 2: Chặn hoàn toàn (nếu website hoàn toàn nội bộ hoặc bạn có lý do cụ thể)
User-agent: SeznamBot
Disallow: /Kịch bản 3: Cho phép nội dung chính, chặn trang admin và staging
User-agent: SeznamBot
Allow: /
Disallow: /wp-admin/
Disallow: /staging/
Disallow: /private/Kịch bản 3 là cấu hình tôi đang dùng cho hầu hết khách agency. Nó cân bằng giữa mở cửa cho crawler hợp lệ và bảo vệ các đường dẫn không cần thiết.
Làm sao biết SeznamBot có đang crawl website mình không?
Kiểm tra server log hoặc Google Search Console, lọc theo user-agent SeznamBot. Nếu bạn dùng Cloudflare, vào Analytics rồi tìm trong mục bot traffic. Tần suất crawl bình thường của SeznamBot vào khoảng 50 đến 300 request mỗi ngày với website trung bình, không đủ để ảnh hưởng hiệu suất hosting thông thường.
FAQ
SeznamBot có phải bot độc hại không? Không. SeznamBot là crawler hợp lệ của Seznam.cz, có thể xác minh qua DNS ngược. Nó không tấn công, không scrape dữ liệu cá nhân, không chạy script độc hại.
Chặn SeznamBot có ảnh hưởng đến Google không? Không ảnh hưởng trực tiếp đến Google. Nhưng nếu bạn muốn xuất hiện trong các aggregate AI tool sử dụng dữ liệu từ nhiều nguồn, chặn SeznamBot có thể làm giảm diện phủ citation.
SeznamBot có làm chậm website không? Hầu như không. Với hosting VPS 2GB RAM trở lên hoặc shared hosting thông thường, lưu lượng từ SeznamBot không đáng kể.
Tôi có cần đăng ký với Seznam để được crawl không? Không cần. SeznamBot tự động tìm và crawl website công khai. Nếu bạn muốn kiểm soát, dùng robots.txt là đủ.
Xác minh SeznamBot thật hay giả bằng cách nào? Chạy lệnh nslookup hoặc host với địa chỉ IP trong log. IP thật của SeznamBot sẽ trỏ về domain thuộc seznam.cz. IP giả thường trỏ về VPS hosting nước ngoài không liên quan.
Tôi đang dùng WordPress, cấu hình ở đâu? Vào plugin SEO (Yoast hoặc Rank Math), tìm mục robots.txt editor, thêm trực tiếp vào đó. Hoặc chỉnh file robots.txt ở thư mục gốc hosting qua FTP/cPanel.
Bài viết dựa trên kinh nghiệm 8 năm làm web cho agency và SMB tại Việt Nam. Cập nhật tháng 6 năm 2025.