Google Panda là gì? 9 nguyên nhân website bị dính án phạt Panda 2019

CÓ THỂ BẠN QUAN TÂM

Thiết kế Website trọn gói 2,900,000đ

Quảng cáo Google

Quảng cáo Facebook

Chăm sóc Website

Chăm sóc Fanapge

Thiết kế Mobile App

Quảng cáo Tiktok

Nào, bài viết này tôi sẽ giúp cho bạn hiểu khái niệm Google Panda là gì và  đưa ra những nguyên nhân khiến cho website của bạn bị phạt bởi thuật toán Panda này.

Bắt đầu thôi!

1. Thuật toán Google Panda là gì?

Google Panda được công bố lần đầu tiên vào ngày: 23 tháng 2 năm 2011.

Vậy Google Panda là gì?

Panda là một thuật toán Google phát triển với mong muốn:

Hỗ trợ cho công cụ tìm kiếm và trả về các kết quả chính xác và phù hợp nhất với nhu cầu người dùng, giúp thay đổi cách xếp hạng các kết quả tìm kiếm trên mạng tốt hơn và công bằng hơn.

Mục đích chính của bản cập nhật thuật toán Google Panda là gì?

  • Xem xét chất lượng nội dung website. Qua đó nhằm loại bỏ phần nội dung sai phạm, nội dung rác hoặc được copy từ những trang khác
  • Làm giảm sự hiện diện của các trang web chất lượng thấp trong kết quả Organic Search của Google
  • Thưởng cho các trang web chất lượng cao

Nếu trang website của bạn bị rớt hạng trong quá trình thuật toán Panda đang cập nhật và điều này lặp đi lặp lại trong thời gian dài thì rất có thể là nội dung website đó không đủ sức thuyết phục với Google.

Trên thực tế thì website đang tăng trưởng tốt vẫn có khả năng bị Panda phạt.

khắc phục website bị google panda

Dù website đang phát triển nhưng đã bị Google Panda “dòm ngó”.

2. 9 nguyên nhân website bị dính án phạt Panda

7 nguyên nhân được xem là do Onpage

#1- Nội dung mỏng, thông tin ít (Thin content)

Thin content (hay còn gọi là nội dung mỏng) ở đây bạn có thể hiểu theo cả nghĩa đen lẫn nghĩa bóng: content ngắn và chất lượng content thấp!

Về chất lượng content thấp có thể kể đến các lỗi như:

  • Nội dung copy từ web khác
  • Nội dung không cung cấp giá trị hữu ích cho người đọc
  • Topic ở mỗi bài viết không liên quan nhiều đến lĩnh vực chính của website, không đồng nhất về chủ đề.

#2- Trùng lặp nội dung (Duplicate content)

Nội dung copy thường xuất hiện ở nhiều website trên Internet.

Vì bạn không biết phải ghi gì, miêu tả như thế nào cho bài viết của bạn. Từ đó bạn buộc phải sao chép nội dung bài viết của người khác được lấy từ nhiều nguồn Internet ở nhiều nơi.

Duplicate content cũng xảy ra ngay trên chính website của bạn khi bạn có nhiều trang chứa cùng một nội dung hoặc có rất ít sự biến đổi trong nội dung giữa các trang.

Lưu ý: Google tính trùng lặp về nội dung theo:

  • Nội dung từng trang
  • Thẻ meta description
  • Thẻ heading
  • Code HTML
  • Khung giao diện
  • Khung design mặc định của website (Vd bài viết chữ quá ít nhưng khung design lại lớn)
Google tính nội dung trùng lặp dựa trên Code HTML
bị phạt panda do lỗi dublicate heading
Website có nội dung thẻ titles hoặc H1, H2 giống nhau cũng bị Google panda tính là duplicate content.

Google định nghĩa content là toàn bộ code HTML của website.

Khi cào (crawl) dữ liệu website thì Google bot sẽ cào code html từ trên xuống dưới, từ trái sang phải.

Khung design mặc định của website giống nhau mỗi trang cũng được tính là trùng lặp. HTML của bạn phải unique 51% thì website mới an toàn. Nếu 1 bài của bạn chỉ cỡ 300 – 400 chữ mà khung design cố định của website lớn thì chắc chắn website bạn bị trùng lặp.

Do vậy hầu hết website Việt Nam bị duplicated content, nhất là các trang thương mại điện tử bán hàng.

Google định nghĩa Content như thế nào?

Duplicate content là một điều vô cùng tối kị và cực kì nguy hiểm cho website của bạn. Mọi công sức của bạn có thể sẽ “đổ sông đổ bể” chỉ vì đạo một vài câu văn.

#3- Nội dung có chất lượng thấp

Các website cung cấp ít giá trị hoặc nội dung chất lượng thấp cho người đọc vì thiếu thông tin chuyên sâu.

Nội dung content thường:

  • Truyền tải vắn tắt, qua loa
  • Thiếu ý
  • Không phân tích chuyên sâu, ít có sự đào sâu nghiên cứu.
  • Ít tìm tòi, mở rộng chủ đề

#4- Website thiếu Authority/ không có độ tin tưởng cao

Nội dung được tạo ra bởi các nguồn không được xác minh về Entity, thiếu thẩm quyền (authority), thiếu độ tin cậy (trust) cho người dùng sẽ bị Google Panda loại bỏ ngay lập tức.

#5- Content farming

Content farming là thuật ngữ dùng để ám chỉ các website spam nội dung, thu thập và copy content của các web khác, sau đó bị nhồi nhét rất nhiều từ khóa và tối ưu SEO tốt hơn so với web gốc.

Các web sử dụng content farming này đều hướng tới mục đích tăng thứ hạng từ khóa trên công cụ tìm kiếm nhiều hơn là tập trung cung cấp giá trị cho người đọc.T

#6- Website có quá nhiều nội dung quảng cáo

Website chủ yếu đặt nhiều banner quảng cáo với rất ít nội dung thực sự cung cấp giá trị cho người đọc. Hầu hết các web này được tạo ra để kiếm tiền từ việc đặt banner quảng cáo, ít nội dung.

#7- Lỗi Schema

Google đưa ra quy luật rõ ràng về vấn đề Schema như sau:

Nếu bạn khai gì trên schema thì người dùng phải thấy y chang như vậy trên website của bạn.

Ví dụ: bạn làm schema review và khai rằng website đang có 100 lượt review trên website, đồng thời website được đánh giá 5 sao,… thì lẽ dĩ nhiên, tất cả thông số ấy phải hiển thị chính xác trên trang web bạn đang quản lý.

phạt google panda do sai schema
Website bị phạt Google Panda do sai schema.

Nếu các thông tin này sai lệch hay nói cách khác là schema bạn làm sai với quy luật của Google; đến lúc nào đó Google scan qua và thu thập đủ dữ liệu về bạn, nó sẽ tiến hành phạt bạn ngay.

2 nguyên nhân còn lại do Offpage

#8- Trộn nội dung (Spin content)

Spin content (trộn nội dung) lại với nhau để cho ra những bài viết mới

Bài viết mới có thể cùng ý nghĩa với bài viết gốc nhưng khác về mặt câu chữ hoặc cũng có thể mang ý nghĩa khác hoàn toàn so bài viết gốc.

Tuy nhiên, hình thức Spin Content tạo ra những nội dung này, đã được Google xem như là nội dung rác.

Google liên tục cập nhật nhiều thuật toán nhằm xóa bỏ những nội dung rác này. Đặc biệt nhất là dùng thuật toán Google Panda để xóa bỏ nó.

#9- Keyword cannibalization

Keyword Cannibalization (từ khóa cạnh tranh lẫn nhau) là hiện tượng khi bạn vô tình hay có chủ ý tạo lập nên nhiều bài viết cùng nói về một chủ đề hay cùng tối ưu một số từ khóa cụ thể.

Dẫn đến các URL này dù đều được hiển thị trên công cụ tìm kiếm, nhưng kết quả cuối cùng là không có trang nào lên vị trí top 10.

Google Panda khi vào xem xét website, nó sẽ ưu tiên quan sát những trang được tối ưu duy nhất.

Nếu nó vào scan một ngàn trang và thấy tất cả các trang đều tối ưu theo:

  • Các chủ đề bài viết khác nhau
  • Bộ từ khóa riêng biệt

Thì Google sẽ dễ dàng nhận diện và cho bạn lên đúng URL hơn.

Note: Cách kiểm tra Keyword Cannibalization:

Sử dụng công cụ Screaming Frog hoặc search google theo cú pháp site:domain + keyword seo.

Ví dụ: Bạn tìm kiếm cụm từ: “site:gtvseo.com dịch vụ seo” lúc này bạn có thể xem những trang khác cũng đang tối ưu từ khóa “dịch vụ seo” tương tự như hình sau:

phạt panda do keyword cannibalization
Website bị phạt Panda do lỗi keyword cannibalization.

3. Hai dấu hiệu website đang bị Google Panda phạt

Từ bài viết, bạn cũng nhận ra được dấu hiệu chính cho thấy website đang “dính” Panda đó là:

Organic traffic giảm dần theo thời gian

Đây được xem là dấu hiệu phổ biến và dễ nhận diện nhất.

Ở khoảng thời gian đầu giảm traffic, có thể bạn thấy nó không ảnh hưởng gì nhiều.

Tuy nhiên, qua 1 hay 2 tháng, thậm chí chỉ vỏn vẹn vài tuần, bạn sẽ nhận ra ngay độ giảm sút traffic ngày càng mạnh mẽ, trầm trọng. Nó kéo theo hàng loạt ảnh hưởng tiêu cực khác mà Google Panda mang đến cho website của bạn.

Giảm dần traffic do google panda
Ví dụ minh họa về sự sụt giảm organic traffic dưới tác động của Google Panda.

Nếu website bạn gặp tình trạng trùng lặp nội dung với số lượng ít thì Panda sẽ không phạt liền. Mà chờ đến khi mức trùng lặp lên đến 20%-30% mới kéo hẳn traffic xuống.

Lưu ý nhỏ:

Liên quan đến hiện tượng này, tôi xin có vài lưu ý về sự khác biệt giữa Panda và Penguin.

Nếu hình phạt từ Panda kéo traffic xuống dần dần thì Penguin hoàn toàn trái ngược. Penguin phạt thẳng tay và traffic giảm không phanh xuống tận đáy.

So sánh thuật toán panda và penguin
Website gtvseo.com bị phạt Penguin khoảng cuối tháng 1/2018.

Traffic giảm một nửa

Một dấu hiệu nhận biết Google Panda khác nữa là:

Website đang hoạt động tốt bỗng dưng lại mất đi 1/2 traffic.

Từ đó khiến website từ top đầu trang 1 lập tức bay vèo xuống cuối trang 1 hay qua đến trang 2. Lúc này, số lượng organic traffic vẫn có nhưng còn rất ít và không đáng kể.

dấu hiệu website bị phạt panda, thuật toán google panda
Ví dụ minh họa về sự sụt giảm một nửa organic traffic dưới tác động của Google Panda

Vậy website bạn chưa bị phạt thì sao?

Đừng nghĩ rằng bây giờ bạn chưa thấy hiện tượng sụt giảm traffic thì nghĩa là bạn đang an toàn đâu. Việc Google ghé thăm và thu thập dữ liệu có thể tới vài tháng.

Đến một ngày đẹp trời, bỗng dưng bạn thấy từ khóa lặn tăm thì lúc ấy mới biết thì quá muộn.

Phòng bệnh hơn chữa bệnh bạn nhé!

4. Hướng dẫn 3 cách khôi phục website sau thuật toán

Hầu hết SEOer đều cho rằng: Sẽ rất khó để phục hồi các web bị Panda phạt.

Tuy nhiên, như đã đề cập ở phần đầu, bản cập nhật Panda chủ yếu dựa trên chất lượng trang web/nội dung.

Vì thế các bước phục hồi thường tập trung vào cải thiện chất lượng trang web đó.

Kỹ thuật Noindex và thẻ Canonical

Để chặn việc lập chỉ mục nội dung trang web nội bộ trùng lặp hoặc trùng lặp ít và các yếu tố có vấn đề khác

Đối với cách khắc phục, bạn có thể sử dụng kĩ thuật noindex và thẻ canonical.

(Xem kĩ trong phần video – trong video tôi sẽ giải thích lại thuật toán từ đầu và thậm chí kĩ hơn bài viết. Cũng như các case study và hướng khắc phục cụ thể)

 

 

Cải thiện content kém chất lượng và content mỏng

Google Panda luôn liên tục hoạt động và tiến hành loại bỏ từng chút một những website bị thin content hoặc kém chất lượng.

Thông thường, Panda đánh giá chất lượng cho toàn bộ trang web bằng cách xem xét một số lượng lớn các trang trong đó. Sau đó, nó sẽ điều chỉnh thứ hạng cho phù hợp.

Ngoài ra, Panda còn chấm điểm thứ hạng website dựa trên chất lượng các phần nội dung bao gồm trong đó.

dính án phạt Google Panda
Google Panda đánh giá website theo nội dung trong từng URL và chất lượng của tất cả các URL.

Do vậy cốt lõi của vấn đề chính là việc cải thiện nội dung chất lượng content của web.

Loại bỏ content kém chất lượng và content mỏng

Xóa bỏ content kém chất lượng khỏi website không chỉ nhằm mục đích SEO mà còn vì lợi ích của người dùng.

Nói cách khác, bạn hãy đặt mình vào vị trí của người dùng và thử truy cập vào website mình. Sau khi mở lên 1 bài blog lên và chẳng có nội dung gì cuốn hút hay không đáp ứng nhu cầu gì cả? Hay tệ hơn là truy cập vào 1 chuyên mục toàn quảng cáo, chẳng có thông tin gì giá trị hết?

Vì thế, việc mang đến nội dung và trải nghiệm người dùng tốt nhất khi họ nhấp vào 1 kết quả tìm kiếm và truy cập vào website của bạn là cực kì quan trọng.

Cách loại bỏ content kém chất lượng

Việc đầu tiên, bạn cần chắt lọc ra các phần nội dung kém chất lượng.

Và khi bạn tìm thấy phần nội dung kém chất lượng trên một URL đã bị Panda phạt, tôi gợi ý cách giải quyết bằng cách áp dụng:

Chiến lược “Giữ – Bỏ”.

Chiến lược này rất đơn giản:

Nếu có thể cải thiện phần content trong website của bạn thì nên làm ngay. Nếu content đó đã quá tốt, bạn không thể cải thiện hơn nữa và người dùng không phàn nàn gì khi họ truy cập vào thì hãy để noindex nó.

Cách khắc phục Google panda
Chiến lược GIỮ & BỎ content kém chất lượng

Tôi còn gọi đây là chiến lược “quản lí index”.

Đối với các content đã được Google index, việc duy trì chất lượng nội dung ở mức cao nhất (thậm chí phải cao hơn đối thủ) là cực kỳ quan trọng. Việc này có thể giúp website của bạn thoát khỏi các thuật toán kiểm tra chất lượng của Google, trong đó có Panda.

Chiến lược giữ bỏ không chỉ loại đi phần nội dung kém chất lượng, mà còn giúp người dùng dễ dàng tìm được những gì họ đang cần, đảm bảo content đạt hiệu quả cao. Hơn hết là đáp ứng đủ hoặc có khi hơn cả mong đợi của người dùng. Đồng thời, đảm bảo Google sẽ chỉ index những phần nội dung giá trị nhất của bạn.

Tất cả chung quy lại vẫn chỉ để cải thiện chất lượng. Hay nói cách khác là mang đến cho người dùng những website tốt nhất.

Nâng cao chất lượng tổng thể website

Trong quá trình hỗ trợ khách hàng – những người chịu ảnh hưởng tiêu cực từ thuật toán Panda, tôi luôn khuyên họ rằng:

Không bao giờ dừng lại ở việc loại bỏ các content kém chất lượng.

Mà còn phải xây dựng kế hoạch khắc phục toàn bộ nội dung, bao gồm:

  • Nâng cao chất lượng nội dung
  • Cải thiện các yếu tố trải nghiệm người dùng (UX) khác như cắt giảm banner quảng cáo vô nghĩa, form gây rối mắt…

Vì vậy, tôi không cho rằng chỉ loại bỏ mỗi phần nội dung kém chất lượng thôi sẽ mang lại những cải thiện. Cái chính là còn phải tập trung nâng cao chất lượng tổng thể của nó.

Cách tốt nhất để tránh Google Panda là hãy phát triển thương hiệu cho riêng bạn.  Cùng đó là xây dựng một trang web của bạn trở thành một nguồn thông tin đáng tin cậy với nội dung tuyệt vời, mang lại giá trị cho người đọc.

5. 2 công cụ hỗ trợ sửa phạt thuật toán Google Panda

Trong quá trình làm SEO, để tránh các hình phạt Google, đặc biệt là vấn đề copy bài viết, bạn có thể nhờ đến sự hỗ trợ của nhiều công cụ kiểm tra.

Dưới đây, tôi gợi ý 2 công cụ phổ biến sau:

Copy scape

Copy scape là công cụ trả phí. Nó giúp bạn theo dõi những nội dung bạn đã copy từ trang khác hoặc nội dung nào trên trang bạn đang bị trang khác copy. Chú ý cột Risk bài viết nào có màu càng đậm thì chứng tỏ đó đó là những bài viết bị copy nhiều nhất.

công cụ hỗ trợ làm Google Panda
Công cụ hỗ trợ làm Google Panda – Copyscape

Nên tập trung sửa chữa những trang bị đánh giá màu đậm, độ rủi ro Panda phạt cao.

Siteliner

Thêm 1 công cụ khác là siteliner với chức năng tìm nội dung copy dựa trên gốc domain của bạn (Duplicate content on your site). Công cụ này sẽ báo cho bạn chỉ số phần trăm giống nhau giữa các bài. Đây cũng là 1 công cụ trả phí!

KẾT LUẬN

Cho đến nay, Panda vẫn chỉ được coi là một hình phạt của Google dành cho các website cố tình spam về nội dung.  Và công cụ tìm kiếm này vẫn chưa thể áp dụng Panda như là một thuật toán gốc lõi (core algorithm) của Google.
Sau khi đọc xong bài viết này, tôi hy vọng bạn có thể nắm được những ý chính sau:

Thuật toán Panda có thể xử phạt trên tất cả website dù đang phát triển trên cả mặt Onpage & Offpage. Hầu hết các website ở Việt Nam đều có khả năng cao bị Panda dòm ngó và ảnh hưởng tiêu cực đến toàn domain.

9 nguyên nhân bị dính phạt của Google Panda:

7 nguyên nhân được xem là do Onpage

  • Nội dung mỏng, thông tin ít (Thin content)
  • Trùng lặp nội dung/ sao chép nội dung (Duplicate content)
  • Nội dung có chất lượng thấp
  • Content farming
  • Website thiếu Authority/ không có độ tin tưởng cao
  • Website có quá nhiều nội dung quảng cáo
  • Lỗi schema

2 nguyên nhân còn lại do Offpage

  • Trộn nội dung (Spin content)
  • Keyword cannibalization

Chúc bạn thành công!

Nguồn : gtvseo.com

CÔNG TY TNHH HBMEDIA – HBMEDIA CO.,LTD
Trụ sở: 242/8D Bà Hom -Phường 13, Quận 6 – Hồ Chí Minh
Điện thoại : (028) 6253 8332
Tư vấn dịch vụ : 0933 576 079
Chăm sóc khách hàng : 0933 534 039
Từ 8h00 – 18h00 các ngày từ thứ 2 đến thứ 7

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *