HBmedia Company

Entity Building: 10 Cách tối ưu SEO theo Entity 2019

CÓ THỂ BẠN QUAN TÂM

Thiết kế Website trọn gói 2,900,000đ

Quảng cáo Google

Quảng cáo Facebook

Chăm sóc Website

Chăm sóc Fanapge

Thiết kế Mobile App

Quảng cáo Tiktok

Tôi đã từng giới thiệu về phương pháp SEO Entity Building (xây dựng thực thể) cho website trong đợt offline cách đây 1 năm trước.

Tuy nhiên, trong bài viết này, tôi sẽ giải đáp chi tiết 3 câu hỏi trên, đồng thời hướng dẫn từ lý thuyết đến cung cấp giải pháp chi tiết để bạn có thể thực hành Xây dựng Entity ngay trên website của mình!

Giờ thì… Bắt đầu ngay thôi!

Tại sao Entity lại quan trọng trong SEO?

Nhìn chung SEO đang ngày càng khó khăn và phức tạp hơn, bởi 2 lý do sau:

  1. Google đang sử dụng nhiều machine learning (học máy) hơn.
    Nhiều thuật toán được tung ra thường xuyên nên rất khó để nắm bắt nguyên lý và thực sự hiểu Google muốn gì.
  2. Paid search (quảng cáo có trả phí) ngày càng tốn kém.
    Chạy quảng cáo tốn nhiều ngân sách là lý do hàng đầu cho việc nhiều công ty và cá nhân đang chuyển sang organic search để tìm kiếm khách hàng, dẫn đến lý do thứ ba là bạn đang đối đầu trực diện với Google.
  3. Bạn đang cạnh tranh trực tiếp với Google!

Cạnh tranh với Google ư?

Hãy để tôi giải thích cho bạn!

Trên đây là screenshot kết quả tìm kiếm cho truy vấn “buy sneaker” (mua giày sneaker) trên cả bản desktop lẫn mobile.

So sánh phiên bản Desktop và Mobile khi search “buy sneaker”

Bạn có thể thấy phía trên của trang kết quả là những gì người dùng thấy khi họ tìm kiếm từ khóa này trên Google.

Tất cả kết quả tìm kiếm đều cho thấy:

Google có thể ngay lập tức cung cấp câu trả lời cho câu hỏi hoặc thỏa mãn mục đích tìm kiếm của bạn.

Hơn 90% người làm SEO đều không biết:

Google đã thay đổi cuộc chơi trong việc phân phối traffic về cho website!

Giờ đây Google cố gắng trả lời câu hỏi của người dùng ngay trên trang kết quả tìm kiếm (SERP)

Điều đó có nghĩa bạn sẽ nhận được ít lượt click hơn (vì người dùng đã có được câu trả lời ngay trên trang kết quả mà ko cần click vào web bạn để xem thông tin).

Chính vì vậy, bạn càng phải xếp hạng cao hơn và đảm bảo tất cả chiến thuật SEO đều phải tối ưu tốt hơn nữa.

Entity trong SEO: Tạo content

Câu hỏi đặt ra ở đây là:

Làm thế nào viết content hay hơn để có được traffic mà vẫn đến các trang khác?

Một tình trạng phổ biến đó chính là ngày càng có nhiều content được viết ra để cạnh tranh thứ hạng chứ không phải để được chia sẻ.

Dưới là nghiên cứu của BuzzSumo cho thấy sự tương quan giữa lượt chia sẻ trên Twitter so với lượng content đang được tạo ra.

Lượng Content publish ngày càng cao nhưng số lượng content được share giảm sút

Đó là lý do vì sao chúng ta cần tối ưu Content theo Entity, không chỉ để cung cấp một trải nghiệm tốt nhất dành cho người dùng, mà còn để hiện diện và xếp hạng tốt hơn trên công cụ tìm kiếm!

Entity trong SEO là gì?

Entity (thực thể) là một khái niệm trừu tượng. Nó có thể là bất cứ thứ gì: địa điểm, con người, tổ chức, khái niệm hay ý tưởng.

Lấy ví dụ đoạn văn bản sau, bạn sẽ thấy Google nhận biết nhiều loại Entity khác nhau như con người, tổ chức như Google, mốc thời gian như 2007, quốc gia như Mỹ …

Đây là cách Google dần hoàn thiện tính tự nhiên hay khả năng hiểu ngôn ngữ cũng như nội dung văn bản.

Nếu buộc phải định nghĩa Entity là gì, tôi sẽ nói đây là những thực thể có mối liên hệ với nhau về mặt ngữ nghĩa, từ đó giúp máy hiểu được nghĩa đen lẫn nghĩa bóng.

Lưu ý:

Entity không chỉ là vật thể rõ ràng ra, nó còn có thể là khái niệm, ý tưởng, xu hướng.

Vậy tại sao Google lại quan tâm đến việc rút trích Entity (Entity extraction) hay xét Entity trên tổng thể?

Chắc hẳn nhiều bạn đã nghe về biểu đồ liên kết (link graph), liên quan đến link building cũng như spam.

Thực ra Google luôn cố gắng ngăn chặn tình trạng này.

Từng có thời gian nhiều người cho rằng social signal (số lượt người dùng chia sẻ bài viết của bạn trên mạng xã hội) đóng vai trò ngày càng quan trọng vì chỉ số này cho Google biết đây là content thích hợp – nhưng hiện nay dường như Entity đã thế chỗ nó.

Entity cũng giúp nhóm content đến từ cùng một thương hiệu hoặc một công ty.

Nếu bạn nghĩ về ứng dụng của một công ty và website của công ty đó thì hai Entity này sẽ cho Google biết cái nào đến từ cùng thương hiệu và cái nào đến từ 2 thương hiệu khác nhau.

Đây cũng là ngôn ngữ bất khả tri và hỗ trợ rất nhiều trong tìm kiếm bằng giọng nói.

Rút trích Entity & Google rút trích Entity như thế nào?

Rút trích Entity là lọc tất cả Entity ra khỏi văn bản để xử lý, phân tích, làm việc với chúng…

Nếu bạn đang cố tự rút trích Entity thì bạn cần 4 yếu tố sau:

  1. ID để nhận biết Entity như địa chỉ và các MREID (Machine Readable Entity ID). Nói đơn giản thì chúng giống như URL nhưng không phải vậy.
    *Chú thích: MREID là một chuỗi ký tự (thường là chữ cái và số) được viết để chỉ riêng một Entity đơn (người, nơi, cột mốc). Ví dụ: /m/0qs4dyq
  1. Dữ liệu khổng lồ (data) – Google đã có kho dữ liệu khổng lồ nhờ vào kho ngữ liệu (corpus) hay Google index.
  2. Kho kiến thức lớn như Freebase hoặc Wikipedia. Google đã mua Freebase nhiều năm về trước và chính xác là để phục vụ cho mục đích này.
  3. Thuộc tính (attribute), trên cơ bản những thuộc tính này là mối quan hệ giữa các Entity giúp Google hiểu về khái niệm đằng sau chúng.

Năm 2012, Google công bố một số dữ liệu họ có được – khoảng 500 thực thể, 3.5 tỷ thông tin trong kho kiến thức của Google và tất cả số liệu này được cập nhật khoảng 7 năm về trước.

Bạn có thể tưởng tượng đến thời điểm hiện tại thì con số này còn kinh khủng đến mức nào.

Google đã dùng thuật toán gọi là Word2Vec để tăng độ nhận biết ngôn ngữ.

Thuật toán Word2Vec dựa trên hai thuật toán nhỏ khác là Skip Grams và Continuous Bag of Words (viết tắt CBOW).

Về cơ bản, thuật toán này kết hợp các từ lại với nhau, phân tích các từ đứng gần nhau, từ đó hiểu cách các từ liên kết như thế nào trong văn bản.

Với Word2Vec, Google có thể vẽ sơ đồ chữ hoặc chuyển đổi chữ thành số và rồi những con số này sẽ được biểu diễn dưới dạng vector hoặc biểu đồ.

**Note: Nếu bạn vẫn còn nhớ kiến thức về vector, hãy đọc kĩ phần này. Nhưng nếu đã quên nó và chưa từng có khái niệm về vector, hãy đi đến phần kế tiếp!

Google sẽ hiểu được các từ đặt trong mối quan hệ giống nhau giữa các ngôn ngữ khác nhau.

Ví dụ trong biểu đồ đầu tiên có các con số 1, 2, 3, 4, 5 bằng Tiếng Anh là one, two, three, four, five. Những con số này trong tiếng Tây Ban Nha cũng nằm ở vị trí tương tự.

Phía dưới, chúng ta có biểu đồ đầu tiên gồm các từ heo, bò, ngựa trong Tiếng Anh là pig, cow, horse và trong tiếng Tây Ban Nha thì những từ này cũng nằm ở vị trí giống vậy.

Một khi chuyển chữ thành số thì chữ sẽ biến thành khái niệm và con số đại diện sẽ hoàn toàn không liên quan đến ngôn ngữ bạn đang sử dụng.

Khi nối các vector lại, chúng ta sẽ thấy được mối quan hệ giữa ngôn ngữ và quốc gia.

Chẳng hạn Hà Nội là thủ đô của Việt Nam cũng như Moscow là thủ đô của Nga, hai mối quan hệ này như nhau.

Từ đó, bạn có thể ghép chữ để rút ra những nguyên tắc cơ bản.

Mọi thứ trở nên cực kỳ logic.

‘THINGS NOT STRINGS’ (Vật thể, không phải chuỗi)

Nguyên lý này không chỉ giúp bạn biết được có bao nhiêu từ trên một trang mà còn là nghĩa của những từ này, từ đó biết được người dùng đang tìm kiếm và muốn biết thông tin gì.

Nếu xem thuật toán này là biểu đồ, thì Entity ở đây là giao điểm (node) và mối quan hệ có được là các cạnh (edge) khi nối các điểm giao nhau lại.

Nếu tìm kiếm trên Google từ khóa  “United States presidential candidates in 2012”, bạn sẽ có kết quả như Mitt Romney, Ron Paul, Gary Johnson – họ đều là những ứng viên tổng thống từ đảng Cộng hòa và vẫn còn sống.

Tuy nhiên trên thực tế, cũng có nhiều người họ Johnson như Andrew Johnson hay Lyndon B Johnson cũng là thành viên của đảng Cộng hòa.

Tiếp đến Mitt Romney và Johnson đều liên quan đến Medicare (chương trình bảo hiểm sức khỏe liên bang) Tất cả mối liên hệ trên giữa các Entity giúp Google hiểu được bản chất của các Entity này là gì.

Và nếu xét trên cấp độ lớn hơn 1 tỷ lần thì khả năng nhận biết của Google đã được nâng lên tầm cao mới chứ không đơn thuần là mật độ từ khóa (keyword density) mà bạn phải nhồi nhét từ khóa để thông báo với Google bạn đang viết về chủ đề gì.

Nguyên lý này đã được ứng dụng trong thuật toán Knowledge Graph, tại cột bên tay phải Google đã cung cấp nhiều thông tin khác nhau về từ khóa “dưa hấu”.

 

Nguyên lý này cũng được thể hiện trong carousel (phần khoanh đỏ trong hình), rõ ràng Google có thể hiểu tất cả các dòng iphone, apple watch, ipod, … đều thuộc về sản phẩm của Apple

Và một lần nữa, nguyên lý này được áp dụng trong SERP, khi gõ từ khóa Airbus A380, Google sẽ tự động xuất ra kết quả tìm kiếm về các loại máy bay dân dụng.

Google cũng từng công bố họ đang thay đổi theo cách này trong thông báo từ Amit Singhal –  trưởng phòng Google Search năm 2012:

Giới chuyên môn gọi đây là biểu đồ (graph) – có khả năng hiểu được các Entity trong thế giới thực đặt trong mối quan hệ của chúng với thực thể khác: things not strings.” – Amit Singhal

Có lẽ bạn đã từng nghe “things not strings” ở đâu đó và đây thực sự là cuộc cách mạng, thay đổi từ mật độ từ khóa và văn bản hướng đến thực thể của văn bản là gì.

Chúng ta đã chứng kiến nhiều cập nhật trong năm nay và tôi cho rằng những cập nhật này có mối liên kết với nhau chứ không đơn thuần là cập nhật riêng lẻ nhằm hướng đến Entity và rút trích Entity.

Những cập nhật này nhằm tăng khả năng hiểu ngôn ngữ tự nhiên, từ đó Google có thể hiểu được ngôn ngữ và content đó đang viết về chủ đề gì.

10 Gợi ý giúp bạn triển khai Entity cho website

1. Không chỉ xây dựng website mà còn xây dựng thương hiệu

Nghĩa là thương hiệu của bạn phải cung cấp cho Google đủ các tiêu chí mà các thương hiệu lớn nổi tiếng khác có, bao gồm:

Trong đó domain, logo, maps là những tín hiệu quan trọng; do đó đừng quên thêm địa chỉ công ty trên website. Và chắc chắn là bạn cũng muốn trở thành chuyên gia của nhiều topic khác nhau. Vậy hãy đọc tiếp gợi ý số 2.

2. Tạo ra content có độ chuyên sâu

Vậy để tạo ra content chuyên sâu thì trước hết cần tạo ra content xoay quanh một chủ đề duy nhất nhưng vẫn bao quát tất cả thông tin như một thư viện thu nhỏ về chủ đề đó. Đó là phương pháp Topic cluster (nội dung theo cụm chủ đề) mà tôi đã giới thiệu đầu tháng 4 vừa qua!

Nên tránh viết hàng loạt bài viết về các chủ đề pha trộn khác nhau. Để một khi vào trang này, bạn sẽ tìm được tất cả thông tin cần thiết về chủ đề nào đó.

3. Sử dụng Google natural language API

Bạn có thể truy cập cloud.google.com/natural-language để đăng nhập vào API và thử nghiệm trực tiếp bằng cách copy một đoạn văn bản vào đây và xem Google tìm thấy những Entity nào trong đoạn content đó.

Dưới đây là hình minh họa bài viết mẫu trên Google:

Google có thể nhận diện được khái niệm, nơi chốn, con người, thương hiệu và một số thông tin nhỏ khác.

Bạn còn có thể tìm thấy:

Trong bài viết tôi có đề cập đến những khái niệm quan trọng như backlink, linking, Cheirank … nên tôi muốn những Entity này phải xuất hiện phía trên với điểm số salience cao nhất có thể.

Đôi lúc Google cũng chèn liên kết về bài viết Wikipedia về một chủ đề cụ thể nào đó. Đây là tín hiệu tốt cho thấy Google dựa trên Wikipedia rất nhiều để hiểu các Entity.

Và giờ Google cho biết bài viết của bạn chứa các Entity mà Wikipedia đã có bài viết riêng về các Entity này. Từ đó, bạn sẽ yên tâm rằng Google biết được độ tin cậy của trang bạn hay độ tin cậy của bài viết về một chủ đề nhất định.

Một tính năng tuyệt vời khác nhưng thường bị bỏ qua là categories. Cùng một landing page, cùng một API, Google thừa hiểu content của bạn thuộc lĩnh vực nào và không thuộc lĩnh vực nào.

Nếu bạn đang viết một đoạn content và muốn biết nó đã được tối ưu tốt chưa thì chỉ việc copy paste vào đây rồi thay đổi theo gợi ý của Google. Lưu ý những khái niệm quan trọng nhất phải tương ứng với Entity quan trọng nhất trong bản kết quả.

4. Xây dựng cấu trúc content

Đây có vẻ là kiến thức cơ bản khi nhập môn SEO nhưng tôi muốn nhấn mạnh một lần nữa.

Content của bạn phải dễ đọc, dễ hiểu, sử dụng nhiều headline, table. Google thích những thứ này.

List có sử dụng gạch đầu dòng hay đánh số thứ tự đều giúp bạn diễn đạt tốt hơn đến người dùng cũng như hệ thống crawl dữ liệu web.

Cấu trúc content càng chuẩn thì Google càng hiểu rõ content của bạn, các phần, đoạn, từ khác nhau kết hợp với nhau như thế nào và quan trọng ra sao.

Đừng quên ghi nguồn, tên tác giả. Có rất nhiều tranh luận xoay quanh E-A-T (viết tắt của expertise and authority), trang có thẩm quyền và đáng tin đang trở thành yếu tố quan trọng trong SEO.

5. Thay đổi content chuẩn SEO dựa trên SERP

Nghe có vẻ vô lý nhưng đây được chứng minh là cách hiệu quả để tái tạo content chất lượng. Nghĩa là bạn sẽ dựa trên những kết quả của Google trên SERP để nắm được Google cho rằng thông tin nào là quan trọng nhất.

Vì phần này chưa được Google triển khai cho thị trường VN, nên bạn có thể chuyển từ: “cách để giảm cân” sang tiếng anh là “how to loose weight” và  tham khảo mục “People also ask”.

Bạn có thể nhấn vào mở rộng và Google sẽ cho bạn thêm nhiều câu hỏi khác. Sử dụng những câu hỏi này làm đoạn văn, subheading và đảm bảo bài viết đã giải đáp tất cả thông tin quan trọng ở đây.

Đồng thời, cũng đừng quên nhìn sang phần Knowledge Graph nếu có. Đây là thông tin cực kì giá trị giúp bạn trả lời đúng trọng tâm của chủ đề đó.

Ngoài ra bạn có thể lấy ý tưởng từ ‘Searches related to’ ở cuối trang hay ‘People also search’, ‘People also look for’.

Nói chung bạn sẽ dễ dàng gom được dàn ý cho content chỉ bằng việc quan sát thật kỹ SERP.

6. Schema

Như đã biết, bạn nên sử dụng schema và schema json-ld nhưng có một loại tương tự rất hay là dùng itemprop tag “same as”.

Code này sẽ giúp thông báo đến Google đại loại “Tổ chức này giống như tổ chức được đề cập trong bài viết này trên Wikipedia nè” hay “Đây là social profile của thương hiệu này” …

Do đó hãy thêm tag này khi chèn structured data vào trang của bạn để giúp Google hiểu mối quan hệ trực tiếp giữa các Entity.

7. Tối ưu theo hành trình tìm kiếm

Khi viết content, bạn cần biết người dùng xuất phát điểm từ giai đoạn nào và sẽ đi đến giai đoạn nào trong hành trình tìm kiếm.

Mỗi truy vấn, mỗi từ khóa người dùng gõ ra để tìm đến trang của bạn đều có phần quá khứ và tương lai. Bạn cần phải tự hỏi người dùng đã tìm kiếm những bước nào trước đó và bước tiếp theo là gì.

Từ đó, bạn có thể đặt thêm các bài viết khác dưới dạng bài viết liên quan phía bên dưới hoặc chèn trực tiếp vào content.

Ngoài ra, thêm breadcrumb, navigation vào trang sẽ giúp người dùng biết được truy vấn họ đang tìm kiếm nằm trong chủ đề, lĩnh vực nào.

Đó là lý do vì sao trước đó tôi khuyên bạn nên tạo một thư viện thông tin về chủ đề, chứ không chỉ mở rộng bài viết khác nhau về các chủ đề khác nhau.

8. Thỏa mãn mục đích tìm kiếm

Ngày nay, nếu bạn không trực tiếp thỏa mãn mục đích tìm kiếm của người dùng, bạn sẽ không có mặt trong bảng xếp hạng.

Google phân chia mục đích tìm kiếm thành 4 loại cơ bản như tôi đã đề cập trước đó, bao gồm: thông tin, điều hướng, review sản phẩm, mua hàng.

Khi nhìn vào kết quả tìm kiếm, chúng ta có thể xác định mục đích tìm kiếm ở đây là gì, dưới góc độ của Google. Chẳng hạn với truy vấn “mua giày sneakers” thì rõ ràng người dùng muốn mua giày sneaker.

Nếu người dùng đặt câu hỏi thì rõ ràng mục đích tìm kiếm ở đây là thông tin. Nói cách khác, chúng ta hoàn toàn có thể biết được mục đích tìm kiếm khác nhau của người dùng dựa trên kết quả tìm kiếm hiển thị.

Nghe có vẻ đơn giản nhưng không phải trường hợp nào cũng vậy. Chẳng hạn với từ khóa ‘Independence Day’. Hầu hết thời gian trong năm, khi tìm kiếm từ khóa này trên Google, bạn sẽ thấy hàng loạt kết quả liên quan đến bộ phim ‘Independence Day’.

Nhưng nếu sắp đến ngày 4/7, kết quả hiển thị lại nói về kỳ nghỉ? Có thể nói mục đích tìm kiếm và Entity thay đổi theo thời điểm. Mục đích tìm kiếm của người dùng cũng thay đổi thời gian.

Chẳng hạn như nói đến Apple. Làm sao để phân biệt Apple là tên của thương hiệu nổi tiếng hay tên của một loại trái cây? Nếu hãng Apple không nổi tiếng như hiện nay thì mọi chuyện có lẽ đã khác?

Hãy ghi nhớ điểm này và không ngừng theo dõi kết quả tìm kiếm để hiểu được Google đang muốn những gì và thay đổi như thế nào.

9. Tham khảo top 5 kết quả tìm kiếm

Đừng quên tham khảo top 5 bài viết đầu để xem đối thủ đang viết gì và cố gắng viết tốt hơn họ.

Bạn không nhất thiết phải xem đúng 5 bài. Số lượng không quan trọng mà cốt lõi là bạn phải quan sát đối thủ đang viết gì, topic phụ của họ là gì và cấu trúc của content được sắp xếp như thế nào.

Sau đó, bạn có thể làm tương tự, hoặc tốt hơn. Bạn có thể tìm xem bài viết đối thủ đang thiếu thông tin nào, từ đó bổ sung cho bài biết của mình để có cơ hội xếp hạng cao hơn trên Google.

10. Tránh để tỷ lệ nhấp chuột (CTR) kém

Chúng ta đều công nhận rằng user signal (tín hiệu về hành vi của người dùng mà Google dựa trên đó để quyết định thứ hạng website) rất quan trọng. CTR hay time on site đều được xem là user signal.

Nếu bạn cũng bị ảnh hưởng bởi những đợt update lớn trong năm nay, bạn nên vào Search Console và kiểm tra CTR là bao nhiêu trước khi trang mất traffic và xem CTR có phải nguyên nhân khiến bạn bị ảnh hưởng bởi update không.

Do đó bạn nên thường xuyên vào Search Console xem truy vấn nào có CTR thấp để từ đó tối ưu lại snippet và content.

Kiểm tra lại bài viết của bạn đã thỏa mãn mục đích tìm kiếm chưa, hay content đã cũ, content kém và tối ưu lại bài mới.

Kết luận:

Đến đây thì tôi đã giải thích cặn kẽ cho bạn hiểu rõ hơn về Entity trong SEO và làm thế nào Google nhận biết được các mối quan hệ giữa những Entity với nhau!

Và quan trọng hơn hết, bạn đã biết được 10 cách áp dụng Entity cho website của mình. Bạn sẽ áp dụng cách nào? Hãy cho tôi biết kết quả nhé!

Nguồn : gtvseo.com

CÔNG TY TNHH HBMEDIA – HBMEDIA CO.,LTD
Trụ sở: 242/8D Bà Hom -Phường 13, Quận 6 – Hồ Chí Minh
Điện thoại : (028) 6253 8332
Tư vấn dịch vụ : 0933 576 079
Chăm sóc khách hàng : 0933 534 039
Từ 8h00 – 18h00 các ngày từ thứ 2 đến thứ 7