Khắc phục lỗi “Googlebot cannot access CSS/JS files” WordPress

2 tháng ago, Hướng dẫn WordPress, Views
Khắc phục lỗi “Googlebot cannot access CSS/JS files” WordPress

Khắc phục lỗi “Googlebot không thể truy cập file CSS/JS” trên WordPress

Lỗi “Googlebot cannot access CSS/JS files” (Googlebot không thể truy cập file CSS/JS) là một vấn đề phổ biến trên các trang web WordPress, đặc biệt là khi website mới được thiết lập hoặc sau khi thực hiện các thay đổi cấu hình lớn. Lỗi này xảy ra khi Googlebot, trình thu thập dữ liệu của Google, không thể truy cập và index các file CSS (Cascading Style Sheets) và JavaScript (JS) cần thiết để hiển thị trang web một cách chính xác. Điều này ảnh hưởng tiêu cực đến thứ hạng SEO, trải nghiệm người dùng và hiệu suất tổng thể của website.

Tại sao Googlebot cần truy cập CSS/JS?

Googlebot cần truy cập các file CSS và JavaScript vì nhiều lý do quan trọng:

  • Hiểu rõ nội dung trang web: CSS và JavaScript không chỉ đơn thuần là định dạng và thêm hiệu ứng. Chúng có thể chứa thông tin quan trọng về cấu trúc, nội dung động và các yếu tố tương tác trên trang web. Googlebot cần những thông tin này để hiểu đầy đủ ngữ cảnh và nội dung trang.
  • Đánh giá trải nghiệm người dùng: Google ưu tiên các trang web cung cấp trải nghiệm người dùng tốt. Googlebot sử dụng CSS và JavaScript để đánh giá các yếu tố như tính tương tác, bố cục responsive và tốc độ tải trang. Một trang web hiển thị không chính xác do thiếu CSS hoặc JavaScript có thể bị đánh giá thấp.
  • Đảm bảo index nội dung chính xác: Nếu Googlebot không thể render trang web một cách chính xác, nó có thể bỏ lỡ các phần quan trọng của nội dung, ảnh hưởng đến việc index và thứ hạng của trang.

Các nguyên nhân phổ biến gây ra lỗi “Googlebot cannot access CSS/JS files”

Có nhiều nguyên nhân có thể dẫn đến việc Googlebot không thể truy cập các file CSS và JavaScript. Dưới đây là một số nguyên nhân phổ biến nhất:

  • robots.txt chặn truy cập: File robots.txt là một file văn bản đơn giản hướng dẫn các trình thu thập dữ liệu (như Googlebot) về những phần của website nên và không nên thu thập. Nếu robots.txt chặn Googlebot truy cập vào các thư mục chứa file CSS và JavaScript, lỗi sẽ xảy ra.
  • Quy tắc .htaccess chặn truy cập: File .htaccess là một file cấu hình mạnh mẽ cho phép bạn kiểm soát cách Apache web server xử lý các yêu cầu. Các quy tắc trong .htaccess có thể vô tình chặn Googlebot truy cập vào các file CSS và JavaScript.
  • Cấu hình tường lửa (Firewall): Tường lửa có thể chặn các yêu cầu từ Googlebot nếu nó bị cấu hình sai hoặc quá nghiêm ngặt.
  • Plugin bảo mật chặn truy cập: Một số plugin bảo mật WordPress có thể chặn các yêu cầu đáng ngờ, và đôi khi vô tình chặn cả Googlebot.
  • Lỗi cấu hình CDN (Content Delivery Network): Nếu bạn sử dụng CDN để phân phối nội dung tĩnh, lỗi cấu hình có thể khiến Googlebot không thể truy cập các file CSS và JavaScript trên CDN.
  • Các vấn đề về quyền truy cập file (File Permissions): Quyền truy cập file không chính xác có thể ngăn Googlebot đọc các file CSS và JavaScript.

Cách kiểm tra lỗi “Googlebot cannot access CSS/JS files”

Để kiểm tra xem website của bạn có gặp phải lỗi này hay không, bạn có thể sử dụng các công cụ sau:

  • Google Search Console: Đây là công cụ mạnh mẽ nhất để theo dõi hiệu suất SEO của website. Google Search Console sẽ thông báo cho bạn nếu nó phát hiện ra bất kỳ vấn đề nào với việc thu thập dữ liệu, bao gồm cả lỗi “Googlebot cannot access CSS/JS files”. Để kiểm tra, hãy truy cập Google Search Console, chọn website của bạn, và sau đó kiểm tra phần “Index” > “Coverage”.
  • Công cụ kiểm tra URL của Google: Trong Google Search Console, bạn có thể sử dụng công cụ “URL Inspection” để kiểm tra cách Googlebot render một trang cụ thể. Công cụ này sẽ cho bạn biết liệu Googlebot có thể truy cập các file CSS và JavaScript hay không, và nếu không, nó sẽ cung cấp thông tin chi tiết về lỗi.
  • Các công cụ kiểm tra website trực tuyến: Có nhiều công cụ trực tuyến có thể giúp bạn kiểm tra xem website của bạn có chặn Googlebot truy cập các file CSS và JavaScript hay không. Ví dụ: bạn có thể sử dụng các công cụ như “WebPageTest” hoặc “GTmetrix” để kiểm tra hiệu suất và phát hiện các lỗi liên quan đến tài nguyên bị chặn.

Các bước khắc phục lỗi “Googlebot cannot access CSS/JS files”

Sau khi xác định được nguyên nhân gây ra lỗi, bạn có thể thực hiện các bước sau để khắc phục:

1. Kiểm tra và chỉnh sửa file robots.txt

File robots.txt là một trong những nguyên nhân phổ biến nhất gây ra lỗi này. Hãy kiểm tra file robots.txt của bạn để đảm bảo rằng nó không chặn Googlebot truy cập vào các thư mục chứa file CSS và JavaScript. Thông thường, các thư mục này là `/wp-content/themes/` (chứa các file CSS và JavaScript của theme) và `/wp-content/plugins/` (chứa các file CSS và JavaScript của plugin).

Để kiểm tra file robots.txt, hãy truy cập `yourwebsite.com/robots.txt` (thay `yourwebsite.com` bằng tên miền của bạn). Tìm kiếm các dòng có dạng:

Disallow: /wp-content/themes/
Disallow: /wp-content/plugins/

Nếu bạn thấy các dòng này, hãy xóa chúng hoặc sửa đổi để cho phép Googlebot truy cập:

Allow: /wp-content/themes/
Allow: /wp-content/plugins/

Hoặc bạn có thể sử dụng cú pháp `User-agent: *` để áp dụng cho tất cả các trình thu thập dữ liệu, bao gồm cả Googlebot.

User-agent: *
Allow: /wp-content/themes/
Allow: /wp-content/plugins/

2. Kiểm tra và chỉnh sửa file .htaccess

File .htaccess có thể chứa các quy tắc chặn truy cập vào các file CSS và JavaScript. Hãy kiểm tra file .htaccess của bạn để đảm bảo rằng không có quy tắc nào gây ra vấn đề này. File .htaccess thường nằm ở thư mục gốc của website. Bạn có thể truy cập và chỉnh sửa nó thông qua FTP hoặc File Manager trong cPanel.

Tìm kiếm các dòng code có thể chặn truy cập vào các file CSS và JavaScript. Ví dụ:

<FilesMatch ".(css|js)$">
Order Deny,Allow
Deny from all
</FilesMatch>

Nếu bạn thấy các dòng code tương tự, hãy xóa chúng hoặc sửa đổi để cho phép truy cập. Lưu ý: Chỉnh sửa file .htaccess có thể gây ra các vấn đề nghiêm trọng cho website của bạn. Hãy sao lưu file .htaccess trước khi thực hiện bất kỳ thay đổi nào.

3. Kiểm tra cấu hình tường lửa (Firewall)

Tường lửa có thể chặn các yêu cầu từ Googlebot. Hãy kiểm tra cấu hình tường lửa của bạn để đảm bảo rằng nó không chặn các IP của Googlebot. Bạn có thể tìm thấy danh sách các IP của Googlebot trên trang web chính thức của Google.

4. Kiểm tra plugin bảo mật

Một số plugin bảo mật có thể chặn các yêu cầu đáng ngờ, và đôi khi vô tình chặn cả Googlebot. Hãy tạm thời vô hiệu hóa các plugin bảo mật và kiểm tra xem lỗi có được giải quyết hay không. Nếu lỗi được giải quyết sau khi vô hiệu hóa một plugin cụ thể, hãy kiểm tra cài đặt của plugin đó hoặc tìm một plugin thay thế.

5. Kiểm tra cấu hình CDN

Nếu bạn sử dụng CDN, hãy kiểm tra cấu hình CDN của bạn để đảm bảo rằng các file CSS và JavaScript được phân phối chính xác. Đảm bảo rằng CDN không chặn Googlebot truy cập vào các file này.

6. Kiểm tra quyền truy cập file (File Permissions)

Quyền truy cập file không chính xác có thể ngăn Googlebot đọc các file CSS và JavaScript. Đảm bảo rằng các file CSS và JavaScript có quyền truy cập phù hợp (thường là 644 hoặc 755).

7. Kiểm tra xem có lỗi JavaScript hay không

Lỗi JavaScript có thể ngăn Googlebot render trang web một cách chính xác. Hãy sử dụng công cụ Developer Tools trong trình duyệt (ấn F12) để kiểm tra xem có lỗi JavaScript nào trên trang web của bạn hay không. Sửa chữa các lỗi JavaScript này có thể giúp Googlebot render trang web một cách chính xác hơn.

Sau khi khắc phục lỗi

Sau khi thực hiện các bước khắc phục, hãy sử dụng công cụ “URL Inspection” trong Google Search Console để yêu cầu Googlebot thu thập lại trang web của bạn. Điều này sẽ giúp Googlebot phát hiện ra các thay đổi bạn đã thực hiện và index trang web một cách chính xác.

Việc khắc phục lỗi “Googlebot cannot access CSS/JS files” là rất quan trọng để cải thiện SEO và trải nghiệm người dùng của website. Hãy thực hiện các bước trên một cách cẩn thận và kiểm tra kỹ lưỡng để đảm bảo rằng lỗi đã được giải quyết hoàn toàn.