Đầu tuần này, tin tức đã phá vỡ khoảng RankBrain của Google, một hệ thống máy tính học tập, cùng với các yếu tố thuật toán khác, giúp xác định những kết quả tốt nhất sẽ được cho một bộ truy vấn cụ thể.

Cụ thể, RankBrain xuất hiện có liên quan đến xử lý truy vấn và tinh tế, sử dụng nhận dạng mẫu để lấy các truy vấn tìm kiếm phức tạp và / hoặc không rõ ràng và kết nối chúng với chủ đề cụ thể.

Điều này cho phép Google phân phối kết quả tìm kiếm tốt hơn cho người dùng, đặc biệt là trong trường hợp của hàng trăm triệu các truy vấn tìm kiếm mỗi ngày mà các công cụ tìm kiếm đã không bao giờ được thấy trước đó.

Không thể coi nhẹ, Google đã nói rằng RankBrain là một trong những quan trọng nhất trong số hàng trăm xếp hạng tín hiệu thuật toán sẽ đưa vào tài khoản.

RankBrain là một trong những “hàng trăm” của tín hiệu mà đi vào một thuật toán xác định kết quả những gì xuất hiện trên trang tìm kiếm Google và nơi họ được xếp hạng, Corrado nói. Trong vài tháng nó đã được triển khai, RankBrain đã trở thành tín hiệu thứ ba quan trọng nhất đóng góp vào kết quả của một truy vấn tìm kiếm, ông nói.
(Lưu ý: RankBrain có nhiều khả năng một “bộ xử lý truy vấn” hơn một sự thật là hiện chưa rõ chính xác RankBrain chức năng như một tín hiệu xếp hạng, kể từ khi những người thường được gắn liền với nội dung trong một số cách “yếu tố xếp hạng.”.)

Đây không phải là sự thay đổi lớn duy nhất để tìm kiếm trong thời gian gần đây, tuy nhiên. Trong vài năm qua, Google đã thực hiện một vài thay đổi quan trọng để tìm kiếm hoạt động như thế nào, từ bản cập nhật thuật toán để tìm kiếm kết quả bố cục trang. Google đã phát triển và thay đổi thành một con vật khác nhau rất nhiều so với trước Penguin và pre-Panda.

Những thay đổi này không chỉ dừng lại ở việc tìm kiếm, hoặc. Công ty đã thay đổi như thế nào nó được cấu trúc. Với chiếc ô “Alphabet” mới và riêng biệt, Google không còn là một sinh vật, hoặc thậm chí là một trong những chính.

Ngay cả thông tin liên lạc từ Google SEO và Webmasters phần lớn đã đi theo con đường của dodo. Matt Cutts không còn là “Google đi đến,” và thông tin đáng tin cậy đã trở nên khó khăn để có được. Vì vậy, nhiều thay đổi trong một thời gian ngắn như vậy. Có vẻ như Google đang đẩy về phía trước.

Tuy nhiên, RankBrain là rất khác nhau từ những thay đổi trước đó. RankBrain là một nỗ lực để tinh chỉnh các kết quả truy vấn tìm kiếm thực thể kiến ​​thức đồ thị dựa trên của Google. Trong khi tìm kiếm thực thể không phải là mới, việc bổ sung một thuật toán học máy cuộn ra đầy đủ những kết quả chỉ có khoảng ba tháng tuổi.

Vì vậy, tìm kiếm thực thể là gì? Làm thế nào để làm việc này với RankBrain? Đâu là Google sẽ đi đâu?

Để hiểu rõ bối cảnh, chúng ta cần phải quay trở lại một vài năm.

Hummingbird
Sự ra đời của thuật toán Hummingbird là một sự thay đổi triệt để. Đó là đại tu toàn bộ cách Google xử lý các truy vấn. Nghỉ đêm, tìm kiếm đã đi từ việc tìm kiếm “dây” (tức là chuỗi các chữ cái trong một truy vấn tìm kiếm) để tìm “những thứ” (nghĩa là pháp nhân).

Trường hợp đã Hummingbird đến từ đâu? Các thuật toán Hummingbird mới được sinh ra từ những nỗ lực của Google để kết hợp tìm kiếm ngữ nghĩa vào công cụ tìm kiếm của mình.

Đây được cho là bước đột phá của Google vào không chỉ học máy, nhưng sự hiểu biết và xử lý ngôn ngữ tự nhiên (hoặc NLP). Không cần nhiều hơn cho các từ khóa pesky – Google sẽ chỉ hiểu những gì bạn có nghĩa là bởi những gì bạn gõ vào hộp tìm kiếm.

tìm kiếm ngữ nghĩa tìm cách cải thiện độ chính xác tìm kiếm bằng sự hiểu biết ý định tìm kiếm và ý nghĩa theo ngữ cảnh của thuật ngữ như chúng xuất hiện trong dataspace tìm kiếm, cho dù trên Web hoặc trong một hệ thống khép kín, để tạo ra các kết quả có liên quan hơn. các hệ thống tìm kiếm ngữ nghĩa xem xét các điểm khác nhau bao gồm cả ngữ cảnh tìm kiếm, vị trí, ý định, biến thể của từ, từ đồng nghĩa, các truy vấn tổng quát và chuyên ngành, khái niệm phù hợp và truy vấn ngôn ngữ tự nhiên để cung cấp kết quả tìm kiếm có liên quan. công cụ tìm kiếm web lớn như Google và Bing kết hợp một số yếu tố của tìm kiếm ngữ nghĩa.
Tuy nhiên, chúng tôi hai năm trôi qua, và bất cứ ai sử dụng Google biết ước mơ tìm kiếm ngữ nghĩa đã không được nhận ra. Nó không phải là Google đáp ứng không ai trong số các tiêu chí, nhưng Google thua xa với định nghĩa đầy đủ.

Ví dụ, nó sử dụng cơ sở dữ liệu để xác định và các tổ chức liên kết. Tuy nhiên, một công cụ ngữ nghĩa sẽ hiểu bối cảnh ảnh hưởng từ và sau đó có thể đánh giá và giải thích ý nghĩa.

Google không có sự hiểu biết này. Trong thực tế, theo một số, Google chỉ đơn giản là tìm kiếm điều hướng – và tìm kiếm điều hướng không được coi là theo định nghĩa là ngữ nghĩa trong tự nhiên.

Vì vậy, trong khi Google có thể hiểu được các đơn vị biết và mối quan hệ thông qua các định nghĩa dữ liệu, khoảng cách và học máy, nó có thể chưa hiểu ngôn ngữ tự nhiên (con người). Nó cũng không thể dễ dàng giải thích liên kết thuộc tính không giải thích gì thêm khi những mối quan hệ trong kho lưu trữ của Google được yếu liên quan hoặc không tồn tại. làm rõ điều này thường là kết quả của thêm người dùng nhập vào.

Tất nhiên, Google có thể học được rất nhiều các định nghĩa và các mối quan hệ theo thời gian nếu đủ mọi người tìm kiếm một tập hợp các điều khoản. Đây là nơi học máy (RankBrain) đi vào trộn. Thay vì những bộ truy vấn người dùng lọc dầu, máy làm một đoán tốt nhất dựa trên ý định nhận thức của người sử dụng.

Tuy nhiên, ngay cả với RankBrain, Google không thể giải thích ý nghĩa như một con người là vậy, và đó là phần ngôn ngữ tự nhiên của định nghĩa ngữ nghĩa.

Vì vậy, theo định nghĩa, Google là không một công cụ tìm kiếm ngữ nghĩa. Thế nó là gì?

Việc di chuyển từ “Strings” để “điều”
[W] e’ve được làm việc trên một mô hình thông minh – trong geek-nói chuyện, một “đồ thị” – mà hiểu được các đơn vị thực thế giới và mối quan hệ của họ với nhau: những điều, không dây.
Google Blog chính thức
Như đã đề cập, Google hiện đang rất tốt ở bề mặt dữ liệu cụ thể. Cần một báo cáo thời tiết? điều kiện giao thông? đánh giá nhà hàng? Google có thể cung cấp thông tin này mà không có sự cần thiết cho bạn thậm chí truy cập một trang web, hiển thị nó ngay trên đầu trang kết quả tìm kiếm. các vị trí như vậy thường được dựa trên đồ tri thức và là kết quả của hành động của Google từ “dây” để “mọi thứ.”

Việc chuyển từ “dây” để “điều” đã được tuyệt vời cho các tìm kiếm dựa trên dữ liệu, đặc biệt là khi nó đặt các bit dữ liệu trong đồ tri thức. Các bit dữ liệu là những người thường trả lời ai, cái gì, ở đâu, khi nào, tại sao, và làm thế nào câu hỏi của của Google tự định nghĩa “Micro-Moments.” Google có thể cung cấp cho người dùng thông tin mà họ có thể không có ngay cả khi biết họ muốn tại lúc nào họ muốn.

Tuy nhiên, điều này đẩy về phía các đơn vị là không phải không có một nhược điểm. Trong khi Google đã rất xuất sắc ở bề mặt, thông tin dựa trên dữ liệu đơn giản, những gì nó đã không được làm cũng nữa là trở về câu trả lời rất phù hợp với các bộ truy vấn phức tạp.

Ở đây, tôi sử dụng “truy vấn phức tạp” để chỉ đơn giản là để truy vấn không dễ dàng bản đồ đến một thực thể, một phần dữ liệu được biết và / hoặc dữ liệu thuộc tính – “. Hiểu” do đó làm cho các truy vấn như Google khó

Kết quả là, khi bạn tìm kiếm một tập hợp các điều kiện phức tạp, có một cơ hội tốt bạn sẽ chỉ nhận được một vài kết quả có liên quan và không nhất thiết phải là những người có liên quan. Kết quả là nhiều hơn một bồn rửa nhà bếp của những khả năng hơn là một tập hợp các câu trả lời trực tiếp, nhưng tại sao?

Truy vấn phức tạp Và Effect của họ Trên Tìm kiếm

RankBrain sử dụng trí thông minh nhân tạo để nhúng một lượng lớn các ngôn ngữ viết vào đơn vị toán học – được gọi là vectơ – mà máy tính có thể hiểu được. Nếu RankBrain thấy một từ hoặc cụm từ đó không phải là quen thuộc với, máy có thể làm cho một đoán như những gì từ hoặc cụm từ có thể có một ý nghĩa tương tự và lọc kết quả phù hợp, làm cho nó hiệu quả hơn trong việc xử lý các truy vấn tìm kiếm không bao giờ trước khi nhìn thấy .
kinh doanh của Bloomberg
Bạn muốn xem các truy vấn phức tạp trong hành động? Tới gõ một tìm kiếm vào Google như bình thường. Bây giờ kiểm tra kết quả. Nếu bạn sử dụng một bộ phổ biến hay không liên quan các điều khoản, bạn sẽ thấy Google ném lên một bồn rửa nhà bếp của các kết quả cho các mục không biết hoặc unmapped. Tại sao vậy?

Google đang tìm kiếm đối với các mặt hàng được biết đến Google và sử dụng máy học (RankBrain) để tạo / hiểu các mối quan hệ / suy ra khi họ không dễ dàng có nguồn gốc. Về cơ bản, khi các thực thể hoặc mối quan hệ không được biết, Google không thể suy ra ngữ cảnh hay có nghĩa là rất tốt – vì vậy nó đoán.

Ngay cả khi các thực thể được biết đến, không có khả năng để xác định sự liên quan giữa các mục tìm kiếm giảm khi liên quan chưa được biết đến. Hãy nhớ rằng các tìm kiếm mà Google đã cho các bạn những lời đó không sử dụng trong việc tìm kiếm? Nó hoạt động như thế, chúng ta không thể nhìn thấy những thuật ngữ tìm kiếm loại bỏ bất kỳ hơn.

Nhưng không dùng từ ngữ của tôi cho nó.

Chúng ta có thể thấy điều này trong hành động nếu bạn gõ truy vấn của bạn một lần nữa – nhưng khi bạn gõ, tìm trong hộp thả xuống và xem kết quả xuất hiện. Lần này, thay vì truy vấn mà bạn ban đầu tìm kiếm, chọn một trong các từ thả xuống gần giống nhất với ý định của bạn.

Thông báo kết quả là bao nhiêu chính xác hơn khi bạn sử dụng những lời nói của Google? Tại sao? Google không thể hiểu ngôn ngữ mà không biết làm thế nào từ đó được xác định, và nó không thể hiểu được mối quan hệ nếu không đủ người đã nói với nó (hoặc nó không biết trước đây) các thuộc tính liên quan chặt.

Đây là những cách tổ chức làm việc trong các tìm kiếm về đơn giản hóa.

Một lần nữa, mặc dù, các thực thể chỉ là những gì?

Nói chung, danh từ – hay người / Địa điểm / ý tưởng / Những điều – là những gì chúng ta gọi là các thực thể. Các thực thể được biết đến với Google, và ý nghĩa của chúng được định nghĩa trong cơ sở dữ liệu tài liệu tham khảo Google.

Như chúng ta đã biết, Google đã trở thành thực sự tuyệt vời tại nói với tất cả các bạn về thời tiết, các bộ phim, các nhà hàng và những gì số điểm của trận đấu đêm qua đã xảy ra được. Nó có thể cung cấp cho bạn các định nghĩa và các điều khoản liên quan và thậm chí đóng vai trò như một bách khoa toàn thư số. Nó là rất tốt tại kéo trở lại các điểm dữ liệu dựa trên sự hiểu biết thực thể.

Có nằm trong chà. Những điều Google trả về cũng được biết đến và đã được biết đến, được ánh xạ hoặc các mối quan hệ suy ra. Tuy nhiên, nếu mặt hàng đó không dễ dàng ánh xạ hoặc các mục không được ánh xạ với nhau, Google đã gặp khó khăn trong việc tìm hiểu các truy vấn. Như đã đề cập trước đây, Google về cơ bản đoán những gì bạn muốn nói.

Google bây giờ muốn chuyển đổi từ xuất hiện trên một trang thành các thực thể có nghĩa là một cái gì đó và có các thuộc tính liên quan. Đó là những gì bộ não con người không tự nhiên, nhưng đối với máy tính, nó được gọi là trí tuệ nhân tạo.

Đó là một nhiệm vụ đầy thử thách, nhưng công việc đã bắt đầu. Google đang “xây dựng rất lớn, trong nhà hiểu biết về những gì một thực thể và một kho lưu trữ về những gì thực thể là trên thế giới và những gì bạn nên biết về những thực thể”, ông [kỹ sư phần mềm của Google Amit] Singhal.
Vì vậy, như thế nào này làm việc?
Để đưa ra một ví dụ, “Tea Iced”, “Chanh” và “Thủy tinh” là tất cả các thực thể (vật), và những thực thể có một mối quan hệ được biết đến. Điều này có nghĩa rằng khi bạn tìm kiếm các mặt hàng này – [Iced Tea, Chanh, Glass] – Google có thể dễ dàng kéo lại nhiều kết quả có liên quan. Google “biết” những gì bạn muốn. Mục đích sử dụng là rất rõ ràng.

Nếu như, tuy nhiên, tôi thay đổi các truy vấn để …
Iced Tea, Rooibos, Glass
Google vẫn chủ yếu là hiểu được tìm kiếm này, nhưng nó không phải là rõ ràng một sự hiểu biết.
Tại sao? Rooibos không thường được sử dụng cho trà Iced, mặc dù nó là một loại trà.
Bây giờ, nếu chúng ta thay đổi truy vấn này để …
Trà đá, Goji, Glass
Bây giờ, Google đang bắt đầu để ném vào trong bồn rửa nhà bếp. Một số mặt hàng được chết trên. Một số mặt hàng là chỉ liên quan đến trà goji, không đá trà.
Google là bối rối.
Bây giờ, nếu tôi thực hiện một sự thay đổi cuối cùng để …
trà đá, hòa tan đường, thủy tinh
Google mất gần như bất kỳ sự hiểu biết về những gì thiết lập truy vấn này có nghĩa. Mặc dù đây là những thành phần trong công thức cho chè ngọt, bạn sẽ nhìn thấy (giữa một vài công thức nấu chè ngọt) một số trang hóa học liên quan.
Tại sao? Google không biết làm thế nào để bản đồ chính xác mối quan hệ với dịch vụ SEO ( http://dichvuseoweb.com.vn/)
Nhưng nếu tôi nhìn vào trình đơn thả xuống với các điều kiện khác có ý nghĩa tương tự với tôi như một con người khi Google không còn có thể xác định các thực thể và mối quan hệ của họ? Nếu tôi tìm kiếm thả xuống cho kết quả?
Ly có đường Iced Tea
Những lời chỉ có ý nghĩa thay đổi là “đường” để “ngọt”, và từ “giải thể” đã bị bỏ. Tuy nhiên, điều này dẫn chúng ta đến một tập hợp hoàn hảo của kết quả ngọt Trà.
Nhưng tại sao?

Google có thể làm là hiểu rằng thực thể Iced Tea là, trên thực tế, một điều được gọi là Iced Tea. Nó có thể nói rằng một thủy tinh thực sự là một Glass.

Tuy nhiên, trong ví dụ cuối cùng, nó không biết phải làm gì với các sửa đổi lần tan trong quan hệ với Iced Tea, đường và Glass.

Kể từ truy vấn này có thể tham khảo các đường trong Iced Tea hoặc (trong “tâm” của Google) một dung dịch đường được sử dụng trong phòng thí nghiệm, nó mang lại cho bạn kết quả đã Iced Tea. sau đó nó sẽ cho bạn kết quả mà không có trà Iced trong họ nhưng làm đã hòa tan đường. Sau đó, bạn có một số kết quả với cả hai, nhưng chúng không có liên quan rõ ràng để làm Iced Tea.

Những gì chúng ta thấy là các trang có thể là kết quả của RankBrain cố gắng để giải mã ý định. Nó cố gắng để xác định mối quan hệ nhưng đã trở lại một bồn rửa nhà bếp của các kết quả có thể xảy ra bởi vì nó không phải là chắc chắn về ý định của bạn.

Vì vậy, những gì chúng ta có bây giờ là một tập hợp các thuật ngữ truy vấn mà Google phải đánh giá lại được biết đến “những điều” (thực thể). Sau đó, mối quan hệ giữa những điều này sẽ được phân tích đối với các mối quan hệ được biết, vào thời điểm mà họ hy vọng sẽ có một sự hiểu biết rõ ràng về ý định của bạn.

Khi nó có một sự thiếu hiểu biết về ý định này, tuy nhiên, nó có thể sử dụng RankBrain để liệt kê cho bạn những kết quả tập hợp có thể xảy ra cho truy vấn của bạn. Đơn giản chỉ cần đặt, khi họ không thể phù hợp với ý định đến kết quả là, họ sử dụng một máy tính để giúp tinh chỉnh truy vấn để xác suất.

Vì vậy, nơi được Google sẽ đi đâu?

Tương lai của Google
Trong khi Google đã được thử nghiệm với RankBrain, họ đã bị mất thị phần – không nhiều, nhưng vẫn còn, con số của họ tại Mỹ đang xuống. Trong thực tế, Google đã mất khoảng ba phần trăm của phần kể từ Hummingbird đưa ra, có vẻ như những kết quả không được nhận là phù hợp hơn hoặc cải thiện (và trong một số trường hợp, bạn có thể nói họ là tồi tệ).

Google có thể phải quyết định xem nó là một công cụ trả lời hoặc một công cụ tìm kiếm, hoặc có thể nó sẽ tách những điều này và làm cả hai.

Không thể để sản xuất một động cơ ngữ nghĩa, Google xây dựng một căn cứ trên thực tế. RankBrain hiện đã được thêm vào để giúp tinh chỉnh kết quả tìm kiếm bởi vì tìm kiếm thực thể đòi hỏi không chỉ hiểu biết những gì các danh từ trong một tìm kiếm có nghĩa, mà còn làm thế nào họ có liên quan.

Theo thời gian, RankBrain sẽ nhận được tốt hơn. Nó sẽ được học các đơn vị mới và các mối quan hệ có thể giữa chúng. Nó sẽ trình bày kết quả tốt hơn so với hiện nay. Tuy nhiên, họ đang chạy với một đồng hồ hẹn giờ được biết đến như là người dùng chia sẻ.

Chỉ có thời gian mới biết, nhưng thời gian đó là hạn chế.