kế hoạch có con

Drupal SEO – Vấn đề vẫn là trung lặp nội dung (duplicate content)

Nói đến Drupal, một số có thể cho rằng nó quá phức tạp để phát triển website vì lý do những thuật ngữ được sử dụng trong drupal khác rất nhiều so với joomla và wordpress. Nhưng có 1 điều chúng ta phải thừa nhận rằng, trong thế giới SEO thì drupal sẻ là 1 lựa chọn hoàn hảo nhất cho việc phát triển webstie mã nguồn mở. Ngoài một bộ sườn uyển chuyển, drupal còn hỗ trợ rất tốt heading tag, tagling keyword là đặc biệt là url sef.

 

Nhưng vẫn còn đó một số vấn đề cần giải quyết đối với việc làm SEO cho  website drupal. Một vấn đề mà các bạn thường hay mắc phải nhất chính là trùng lặp nội dung (duplicate content), đặt biệt là với Drupal. Website drupal sử dụng khá nhiều các mặc định giúp tối ưu hóa công cụ tìm kiếm, những một số chức năng mặc định ấy chính là nguyên nhân dẫn đến việc duplicate content. Hy vọng rằng với một số thủ thuật nhỏ ở bài viết này, SEO Việt Nam sẻ giúp bạn giải quyết ổn thỏa vấn đề này.

drupal seo - Drupal SEO - Vấn đề vẫn là trung lặp nội dung (duplicate content)

Vấn đề duplicate của drupal:

 

Hãy nhìn vào 2 đường link dưới đây:

 

http://www.drupal.com/article/duplicate-content/

http://www.drupal.com/article/duplicate-content

 

Với một website drupal thông thường, được bất chức năng clear url thì việc tạo ra nhưng url vô cùng friendly như trên là hoàn toàn có thể. Những url kiểu này giúp ích rất nhiều trong cả việc SEO tối ưu hóa trên mạng tìm kiếm lẫn hạn chế lỗi 404 cho người đọc. Nhưng nó vẫn còn đó 1 vấn đề đó là duplicate, cả 2 url cùng cho ra 1 kết quả giống nhau, điều này có thể tốt cho người đọc những thật sự là ko tốt cho website của bạn 1 chút nào.

 

May thay, thủ thuật nhỏ với việc sử dụng .htaccess này sẻ giúp bạn loại bỏ hoàn toàn vấn đề trên.
Redirect drupal với .htaccess:

 

Chắc hẳn các bạn đã phần nào hiểu được sức mạnh của .htaccess trong việc chuyển hướng server, tác dụng của .htaccess đã giúp những website joomla cũng như wordpress có thể tạo ra những url cực kì SEF giống SEO Việt Nam Wink

 

Và với drupal chúng ta cũng sẻ sử dụng .htaccess như một công cụ giúp tránh trùng lặp nội dung. Cách giải quyết ở đây là chúng ta sẻ chuyển hướng tất cả các url có dạng:

 

http://www.drupal.com/article/duplicate-content/

 

thành những url có dạng :

 

http://www.drupal.com/article/duplicate-content

 

Với việc sử dụng 301 redirect ở trường hợp này, chúng ta có thể yên tâm rằng sẻ ko còn tồn tại bất cứ link nào có dạng http://www.drupal.com/article/duplicate-content/ mà mọi truy vấn đến đường link này sẻ được tự động redirect về http://www.drupal.com/article/duplicate-content

 

Tất cả việc bạn cần làm là thêm đoạn code sau vào file .htaccess trên server:

 

#get rid of trailing slashes
RewriteCond %{HTTP_HOST} ^(www.)?seovietnam.org$ [NC]
RewriteRule ^(.+)/$ http://%{HTTP_HOST}/ [R=301,L]

 

Tham khảo thêm bài viết: .htaccess và redirect 301
Sử dụng file robots.txt để ẩn đi nội dung trùng lặp:

 

Không chỉ có những url như trên, một website drupal còn có thể tồn tại thêm một dạng url như sau:

 

http://www.seovietnam.org/articles/duplicate-content
http://www.seovietnam.org/node/44

 

Và điều chúng ta cần làm trong trường hợp này là thêm đoạn code sau vào file robots.txt

 

Disallow: /node/

 

Việc làm này sẻ giúp chúng ta quy định các bọ tìm kiếm không quét nhứng phận nội dung trên thư mục /node/, vì vậy các bọ tìm kiếm sẻ ưu tiên index những url có cùng nội dùng khác thay vì url có chứa thư mục /node/

 

Đây sẻ không phải là vấn đề của bạn nến bạn sử dung module pathauto và Global Redirect, 2 module này sẻ giúp bạn trong việc loại bỏ url chứa biến /node/. Riêng về phần tôi thì tôi sẻ sử dụng chức năng của .htaccess và robots.txt thay vì những module mở rộng thêm, vì phần nào những module mở rộng cũng sẻ hạn chế một phần tốc độ của website bạn.

 

Hy vọng rằng với những thủ thuật nhỏ trong việc sử dụng .htaccess và robots.txt phía trên, sẻ phần nào giúp các bạn tối ưu hóa webiste drupal của mình tối hơn.

 

Tham khảo thêm các bài viết:

 

1. Cách tránh lỗi duplicate content.
2. Duplicate content và cách phát hiện mới của google.
3. Canonical – Hạn chế trùng lặp nội dung.

 

Chúc các bạn may mắn.

 

Theo: SEO Việt Nam

Website tiêu biểu

Bài viết mới

Top 8 truyện wiki đáng đọc nhất bạn nên đọc

Top 8 truyện wiki đáng đọc nhất bạn nên đọc

Nếu bạn chưa từng khám phá các tác phẩm thuộc thể loại truyện, bạn đang bỏ lỡ một kho tàng […]

Top 5 truyện đam mỹ hoàn đỉnh nhất nên đọc

Top 5 truyện đam mỹ hoàn đỉnh nhất nên đọc

Bạn đã sẵn sàng để bước vào thế giới đầy mê hoặc của đam mỹ hoàn chưa? Đây là thể […]

Top 7 truyện sắc tục đáng đọc nhất

truyện sắc tục

Nếu bạn đang tìm kiếm một thể loại truyện đầy cảm xúc và hấp dẫn, truyện sắc tục chính là […]

Top 10+ Truyện Xuyên Nhanh hay HOT đáng đọc nhất năm 2024

truyện xuyên nhanh hay

Top 10+ Truyện Xuyên Nhanh hay HOT đáng đọc nhất năm 2024 là list tổng hợp các tựa truyện đáng […]

website đọc truyện tranh online nhanh nhất hiện nay là site nào ?

271120231632 1701077559 ginger sunny just living photo collage facebook cover 150x150 - website đọc truyện tranh online nhanh nhất hiện nay là site nào ?

Việc tìm kiếm một website đọc truyện tranh online nhanh nhất hiện nay phụ thuộc vào nhiều yếu tố như […]