BraveBot la gi? Co nen chan bot AI nay khong?
Giai thich BraveBot: bot AI nay la gi, co nen chan hay cho phep trong robots.txt.
BraveBot là gì và bạn có nên chặn nó trên website SMB Việt Nam không? (2025)
BraveBot là trình thu thập dữ liệu của trình duyệt Brave, vận hành bởi Brave Software Inc. Nó thu thập nội dung để xây dựng chỉ mục tìm kiếm riêng của Brave Search, không phải để huấn luyện AI hay bán dữ liệu cho bên thứ ba. Với thị phần Brave Search còn nhỏ tại Việt Nam, hầu hết SMB nên cho phép bot này thu thập, vì chi phí gần như bằng không nhưng cơ hội xuất hiện thêm một kênh tìm kiếm là có thật.
BraveBot là gì và ai vận hành nó?
BraveBot là bot thu thập dữ liệu chính thức của Brave Software Inc., công ty Mỹ đứng sau trình duyệt Brave. Bot này dùng user agent Mozilla/5.0 (compatible; brave; +https://search.brave.com/help/googlebot) và chỉ số IP của nó có thể xác minh ngược qua DNS. Tôi từng nghi ngờ đây là bot rác vì cái tên nghe lạ, nhưng sau khi kiểm tra log server của ba khách SMB ở Hà Nội và Đà Nẵng, tần suất crawl của nó thấp hơn Googlebot khoảng 10 lần, không gây tải đáng kể.
BraveBot thu thập dữ liệu để làm gì?
BraveBot thu thập nội dung công khai để xây dựng chỉ mục cho Brave Search, công cụ tìm kiếm độc lập của Brave. Brave Search không phụ thuộc vào Google hay Bing Index, tức là nếu BraveBot không crawl site của bạn, người dùng Brave Search sẽ không tìm thấy bạn qua kênh đó. Số liệu từ StatCounter tháng 3/2025 cho thấy Brave chiếm khoảng 1,6% thị phần trình duyệt toàn cầu, nhỏ nhưng không phải không tồn tại.
"Brave Search xử lý hơn 10 triệu lượt truy vấn mỗi ngày tính đến năm 2024, theo công bố chính thức từ Brave Software. Con số này tăng gấp đôi so với 2022."
Nên chặn hay cho phép BraveBot?
Câu trả lời ngắn: cho phép, trừ khi bạn đang bảo vệ nội dung trả phí hoặc dữ liệu nhạy cảm. Bandwidth BraveBot tiêu thụ thường dưới 0,1% tổng lưu lượng của một site SMB bình thường. Một agency ở Đà Nẵng tôi hỗ trợ từng chặn toàn bộ bot không phải Google vì sợ "tốn tài nguyên", kết quả là mất sạch citation trên Brave Search trong 6 tháng liền trong khi đối thủ vẫn hiện. Họ mở lại, mất thêm 2 tháng để BraveBot re-crawl đủ trang.
Cấu hình robots.txt cho BraveBot như thế nào?
Dùng directive User-agent: brave để kiểm soát BraveBot. Slug chính xác là brave, không phải BraveBot hay Bravecrawler. Tôi đã kiểm tra điều này trực tiếp trên tài liệu của Brave và xác nhận trong log. Dưới đây là hai kịch bản thực tế:
Cho phép toàn bộ (khuyến nghị cho hầu hết SMB):
```robots.txt User-agent: brave Allow: /
**Chặn một số thư mục nhạy cảm nhưng vẫn cho crawl nội dung công khai:**
```robots.txt
User-agent: brave
Disallow: /admin/
Disallow: /private/
Disallow: /cart/
Disallow: /checkout/
Allow: /Chặn hoàn toàn nếu bạn chắc chắn không cần Brave Search:
```robots.txt User-agent: brave Disallow: /
---
## So sánh: Chặn vs Cho phép BraveBot
| Tiêu chí | Chặn BraveBot | Cho phép BraveBot |
|---|---|---|
| Bandwidth tiêu thụ | Không đáng kể | Rất thấp (dưới 0,1%) |
| Xuất hiện trên Brave Search | Không | Có (sau 2 đến 4 tuần) |
| Rủi ro bảo mật | Không giảm được gì | Không có rủi ro thêm |
| Ảnh hưởng đến Google SEO | Không có | Không có |
| Phù hợp cho ai | Site nội bộ, nội dung trả phí | Hầu hết SMB và agency |
---

## FAQ
**BraveBot có phải bot độc hại không?**
Không. BraveBot là bot hợp lệ của Brave Software Inc., có thể xác minh qua reverse DNS, và không thu thập dữ liệu cho mục đích quảng cáo hay huấn luyện AI.
**Chặn BraveBot có ảnh hưởng đến thứ hạng Google không?**
Không ảnh hưởng gì. Google và Brave Search là hai hệ thống hoàn toàn độc lập.
**BraveBot có crawl trang sau đăng nhập không?**
Không, BraveBot chỉ thu thập nội dung công khai mà không cần xác thực. Trang sau login tự nhiên đã được bảo vệ.
**Tôi không thấy BraveBot trong log, có nghĩa là nó chưa crawl site tôi chưa?**
Đúng vậy. BraveBot chưa crawl site bạn, hoặc site bạn chưa đủ "nổi" để nó ưu tiên. Cho phép trong robots.txt và đảm bảo sitemap.xml chuẩn sẽ giúp quá trình này nhanh hơn.
**User agent chính xác của BraveBot là gì?**
`Mozilla/5.0 (compatible; brave; +https://search.brave.com/help/googlebot)`. Slug trong robots.txt dùng là `brave`.
**Một site thương mại điện tử có nên cho phép BraveBot không?**
Có, nhưng hãy chặn các đường dẫn như `/cart/`, `/checkout/`, `/account/` để tránh bot index trang không có giá trị SEO.
---
*Bài viết dựa trên kinh nghiệm 8 năm làm web cho agency và SMB Việt Nam, bao gồm trực tiếp kiểm tra log server và thử nghiệm cấu hình robots.txt. Cập nhật tháng 4/2025.*