MJ12bot la gi? Co nen chan bot AI nay khong?

Giai thich MJ12bot: bot AI nay la gi, co nen chan hay cho phep trong robots.txt.

MJ12bot là gì và bạn có nên chặn nó trên website năm 2025?

MJ12bot — thẻ AI bot, đánh giá bởi Quoted

MJ12bot là trình thu thập dữ liệu web (crawler) do công ty SEO Majestic vận hành, dùng để xây dựng chỉ mục backlink cho bộ công cụ phân tích SEO của họ. Nó không phải Googlebot. Nó không giúp bạn lên thứ hạng. Câu hỏi thực sự là nó có đáng tốn băng thông của bạn không.

Tại sao MJ12bot xuất hiện trong server log của bạn?

MJ12bot crawl web liên tục để cập nhật dữ liệu backlink cho Majestic, một nền tảng SEO của Anh có hơn 15 năm hoạt động. Khi ai đó dùng Majestic để kiểm tra profile backlink của một domain, dữ liệu đó đến từ chính bot này. Tôi từng thấy MJ12bot chiếm tới 8% tổng lượng request trên một site SMB 50 trang, không có gì đặc biệt, chỉ là một tiệm nội thất ở Bình Dương. Băng thông không phải vô tận, nhất là khi bạn đang dùng shared hosting giá rẻ.

MJ12bot thu thập dữ liệu gì và dùng để làm gì?

MJ12bot thu thập URL, anchor text và cấu trúc liên kết giữa các trang, không thu thập thông tin cá nhân người dùng. Dữ liệu này đi thẳng vào cơ sở dữ liệu của Majestic, cụ thể là hai chỉ số Fresh Index và Historic Index mà các SEO agency hay dùng để phân tích đối thủ hoặc audit backlink. Nếu bạn là agency, đây là nguồn dữ liệu bạn đang trả tiền để xài. Nếu bạn là SMB bị crawl, bạn đang cho không dữ liệu đó mà không nhận lại gì.

"Majestic crawls over 400 billion URLs and its link database is one of the largest on the web, but the data benefits primarily paying subscribers, not the sites being crawled." , Search Engine Journal, tổng hợp dữ liệu Majestic 2023

Nên chặn hay cho phép MJ12bot?

Kết luận dứt khoát: Chặn nó, trừ khi bạn đang trả tiền dùng Majestic.

Đây là lý do tôi nói thẳng như vậy: bot này không mang lại ranking, không mang lại traffic, không index bạn lên Google. Lợi ích duy nhất là dữ liệu backlink của bạn có mặt trong hệ thống Majestic, để người khác có thể phân tích bạn. Năm 2022, tôi từng không chặn MJ12bot cho một khách hàng agency tại Đà Nẵng, kết quả là hosting shared của họ bị chậm vào giờ cao điểm vì bot crawl quá mạnh. Sau khi chặn, tốc độ trang cải thiện rõ, không có bất kỳ thay đổi ranking nào cả theo chiều xấu.

Tiêu chí

Chặn MJ12bot

Cho phép MJ12bot

Ảnh hưởng Google ranking

Không có

Không có

Băng thông tiêu tốn

Giảm đáng kể

Tốn thêm 5-15% request

Dữ liệu trong Majestic

Không cập nhật

Được index đều đặn

Phù hợp với ai

SMB, site nhỏ, shared hosting

Agency dùng Majestic để báo cáo

Rủi ro khi chặn

Gần như không có

Không áp dụng

Cách chặn MJ12bot bằng robots.txt

Thêm hai dòng sau vào file robots.txt ở thư mục gốc website của bạn:

User-agent: MJ12bot
Disallow: /

Nếu bạn muốn chặn nhiều bot SEO cùng lúc (SEMrush, Ahrefs, Majestic) để giảm tải tổng thể:

User-agent: MJ12bot
Disallow: /

User-agent: AhrefsBot
Disallow: /

User-agent: SemrushBot
Disallow: /

Lưu ý: MJ12bot thường tôn trọng robots.txt. Tôi chưa gặp trường hợp nào nó cố tình bỏ qua trong 8 năm làm việc với SMB Việt Nam, nhưng nếu bạn thấy nó vẫn xuất hiện sau 24-48 giờ, kiểm tra lại xem file robots.txt có được lưu đúng định dạng UTF-8 không có BOM chưa.


Sơ đồ robots.txt: chặn vs cho phép MJ12bot

FAQ

MJ12bot có phải Googlebot không? Không. MJ12bot thuộc Majestic, một công ty SEO độc lập tại Anh. Chặn nó không ảnh hưởng gì đến việc Google index website của bạn.

Chặn MJ12bot có làm web tôi mất thứ hạng không? Không. Majestic không có bất kỳ ảnh hưởng nào đến thuật toán xếp hạng của Google hay Bing.

MJ12bot có thu thập thông tin khách hàng của tôi không? Không. Nó chỉ thu thập URL và cấu trúc liên kết, không đọc dữ liệu form hay thông tin đăng nhập.

Tôi có cần chặn nó nếu dùng hosting tốt, băng thông lớn không? Không bắt buộc, nhưng vẫn nên chặn nếu bạn không dùng Majestic. Không có lý do để cho một bot lạ ăn tài nguyên mà bạn không hưởng lợi gì.

Làm sao biết MJ12bot đang crawl site tôi? Mở server access log và tìm chuỗi MJ12bot trong User-Agent, hoặc dùng Google Search Console phần Crawl Stats để xem bot bên thứ ba.

Nếu tôi là agency dùng Majestic để báo cáo cho khách thì sao? Thì giữ nguyên, cho phép MJ12bot crawl site khách để dữ liệu backlink trong Majestic luôn mới. Chặn hay không phụ thuộc vào bạn có trả tiền dùng dữ liệu đó không.


Bài viết dựa trên kinh nghiệm 8 năm quản lý web cho agency và SMB tại Việt Nam. Cập nhật tháng 6 năm 2025.