MojeekBot la gi? Co nen chan bot AI nay khong?

Giai thich MojeekBot: bot AI nay la gi, co nen chan hay cho phep trong robots.txt.

MojeekBot là gì và bạn có nên chặn nó không? (Hướng dẫn 2025 cho SMB Việt Nam)

MojeekBot — thẻ AI bot, đánh giá bởi Quoted

MojeekBot là trình thu thập dữ liệu (crawler) của công cụ tìm kiếm Mojeek, một search engine độc lập của Anh không dùng Google hay Bing làm nguồn. Bot này đọc nội dung website của bạn để lập chỉ mục cho Mojeek. Với SMB Việt Nam, đây là nguồn traffic thứ cấp nhỏ nhưng hoàn toàn vô hại nếu cấu hình đúng.


Tại sao bạn thấy MojeekBot trong log server?

MojeekBot xuất hiện trong access log vì nó đang thu thập dữ liệu để xây chỉ mục riêng của Mojeek. Mojeek là một trong số ít search engine tự vận hành chỉ mục độc lập, không mua dữ liệu từ Google hay Bing. Thị phần Mojeek còn nhỏ, dưới 0.1% toàn cầu theo SimilarWeb 2024, nhưng nó đang tăng dần vì nhóm người dùng lo ngại quyền riêng tư chọn nó thay Google. Tôi thấy tên nó lần đầu năm 2022 khi audit log cho một khách SMB Da Nang và cứ tưởng bot lạ đang quét để tìm lỗ hổng.


MojeekBot do ai vận hành và có đáng tin không?

MojeekBot do Mojeek Ltd, công ty có trụ sở tại Brighton, Anh, vận hành từ năm 2004. Đây không phải bot mờ ám hay scraper giấu mặt. Mojeek công khai user-agent, IP range, và tài liệu robots.txt trên trang chủ. Bạn có thể xác minh bằng cách reverse DNS địa chỉ IP crawler: nó sẽ trả về hostname kết thúc bằng .mojeek.com. Tôi đã kiểm tra cách này cho ba khách hàng agency và kết quả nhất quán.


MojeekBot đọc gì và dùng dữ liệu đó để làm gì?

MojeekBot đọc nội dung HTML công khai của bạn để đưa trang vào chỉ mục Mojeek, không dùng cho quảng cáo hay bán dữ liệu. Khác với Googlebot hay Bingbot, Mojeek tuyên bố không theo dõi người dùng qua kết quả tìm kiếm, đây là điểm bán hàng chính của họ với người dùng quan tâm quyền riêng tư. Dữ liệu nó thu thập là dữ liệu công khai, tương tự mọi crawler hợp lệ khác.

"Mojeek là search engine duy nhất trong top 10 toàn cầu có chỉ mục hoàn toàn độc lập, không phụ thuộc Google, Bing hay Yandex.", Search Engine Journal, tháng 3/2024


Nên chặn hay cho phép MojeekBot?

Kết luận dứt khoát: cho phép MojeekBot crawl nếu bạn muốn traffic tự nhiên từ mọi nguồn có thể.

Chặn nó không giúp gì cho bạn ngoài việc mất một kênh tìm kiếm nhỏ đang lớn dần. Tốc độ crawl của MojeekBot thấp, không gây tải đáng kể lên server. Tôi từng chặn toàn bộ bot lạ theo kiểu "an toàn là chặn hết" cho một khách Hà Nội năm 2021 và sau đó phát hiện mình đã chặn luôn cả DuckDuckBot, mất citation trên DDG mất sáu tháng mới lấy lại được. Bài học đắt. MojeekBot không nằm trong danh sách cần chặn.

So sánh: Chặn vs Cho phép MojeekBot

Tiêu chí

Chặn MojeekBot

Cho phép MojeekBot

Traffic từ Mojeek

Không có

Có (nhỏ nhưng tăng dần)

Tải server

Không đổi (crawl rate thấp sẵn)

Không đáng kể

Rủi ro bảo mật

Không giảm

Không tăng

Citation trên Mojeek

Mất

Giữ được

Công việc cấu hình

Phải thêm rule

Không cần làm gì thêm


Cấu hình robots.txt cho MojeekBot

Mặc định, nếu bạn không có rule nào nhắm vào MojeekBot, nó sẽ đọc theo User-agent: *. Cấu hình rõ ràng luôn tốt hơn để tránh nhầm lẫn sau này.

Trường hợp 1: Cho phép toàn bộ (khuyến nghị)

User-agent: MojeekBot
Allow: /

Trường hợp 2: Chặn hoàn toàn nếu bạn có lý do riêng

User-agent: MojeekBot
Disallow: /

Trường hợp 3: Chặn một số thư mục nhạy cảm, cho phép phần còn lại

User-agent: MojeekBot
Disallow: /admin/
Disallow: /private/
Disallow: /cart/
Allow: /

Đặt file robots.txt ở root domain: https://yourdomain.com/robots.txt. Nếu bạn dùng WordPress, plugin Yoast SEO hoặc RankMath đều cho phép chỉnh robots.txt trực tiếp từ dashboard mà không cần đụng server.


Sơ đồ robots.txt: chặn vs cho phép MojeekBot

FAQ

MojeekBot có user-agent cụ thể là gì? User-agent chính thức là MojeekBot, viết hoa chữ M và B. Bạn dùng chuỗi này trong robots.txt để nhắm đúng.

MojeekBot có crawl website tiếng Việt không? Có. Mojeek không lọc theo ngôn ngữ hay địa lý ở bước crawl. Nếu site của bạn public, nó sẽ đọc.

Tôi có cần đăng ký với Mojeek để được index không? Không cần. MojeekBot tự tìm và crawl site qua liên kết, tương tự Googlebot.

Tốc độ crawl của MojeekBot có làm chậm server không? Không đáng kể. Mojeek không phải search engine lớn nên tần suất crawl thấp hơn nhiều so với Googlebot hay Bingbot.

Làm sao xác minh đúng là MojeekBot thật, không phải bot giả mạo? Chạy reverse DNS trên IP trong log: host [IP]. Kết quả phải trả về hostname kết thúc bằng .mojeek.com. Nếu không khớp, đó là bot giả, chặn ngay.

Mojeek có phổ biến ở Việt Nam không? Hiện tại rất nhỏ. Nhưng nhóm người dùng quan tâm quyền riêng tư đang lớn dần, và chi phí để được index trên Mojeek là bằng không. Không có lý do gì để chặn.


Bài viết dựa trên kinh nghiệm 8 năm quản lý SEO cho agency và SMB Việt Nam, bao gồm việc kiểm tra trực tiếp access log và robots.txt cho hơn 40 dự án. Cập nhật tháng 6/2025.