Làm thế nào Công cụ Tìm kiếm Có thể Xác định sự liên quan của kết quả tìm kiếm Từ truy vấn liên quan

Đó là thú vị để xem làm thế nào một công cụ tìm kiếm có thể cố gắng để đảm bảo sự phù hợp của các kết quả tìm kiếm của mình.

Một thời gian gần đây được cấp bằng sáng chế Yahoo tra một phương pháp có thể giúp xác định nó như thế nào các kết quả có liên quan nó sẽ hiển thị cho người tìm kiếm thực sự có thể, và làm thế nào có thể những kết quả để hiển thị một loạt các kết quả khi một người tìm kiếm sử dụng một thuật ngữ truy vấn có thể bao gồm một loạt các chủ đề.

Trước khi trình bày cách tiếp cận tự động của họ để kiểm tra tính phù hợp và đa dạng, các bằng sáng chế cho chúng ta biết về một số hạn chế trong việc sử dụng nó thấy dẫn đánh giá hoặc dữ liệu nhấp chuột để xác định như thế nào kết quả có liên quan có thể được.

Nhân phản biện

Một lựa chọn cho việc kiểm tra về sự liên quan của kết quả tìm kiếm sẽ tự sàng lọc kết quả cho mỗi truy vấn. Đó có thể là tốn thời gian khá, liên quan đến khả năng lỗi của con người, và không có vẻ như nó thậm chí sẽ bắt đầu để trang trải tất cả các truy vấn được tiến hành trên dịch vụ seo website.

Tôi đã nhìn thấy một quảng cáo trên danh sách của Craig một vài tuần trước từ Lionbridge Technologies, Inc., yêu cầu cho timers phần để hoạt động như Internet Thẩm phán. Một thám tử nhỏ trên Web cho thấy Google có thể đã sử dụng Lionbridge trong quá khứ để thuê người để xếp hạng sự liên quan của kết quả tìm kiếm, mặc dù của Craig Danh sách niêm yết đã không xác định chủ nhân cuối cùng. Từ các mô tả công việc từ các quảng cáo:

Vị trí Mô tả

Đo lường sự liên quan là nền tảng của tất cả các công cụ tìm kiếm, mà không có nó không ai có thể biết được một sự thay đổi đã làm cho hệ thống tốt hơn hoặc tồi tệ hơn. Là một Thẩm phán Internet, bạn sẽ có một người tham gia chủ chốt trong việc giúp xác định sự liên quan của công cụ tìm kiếm. Chúng tôi đang tìm kiếm cho Thẩm phán Internet những người sẽ làm việc tại nhà; xem xét và tỷ lệ các trang web dựa trên một tập hợp mục tiêu của hướng dẫn. Ứng viên phải là những người đam mê internet avid. Nếu bạn yêu thích trình duyệt web và có thể theo tập cụ thể của các hướng dẫn để đánh giá các trang web, sau đó chúng tôi muốn nghe từ bạn.

Công cụ tìm kiếm sử dụng nhận xét của nhãn hiệu. Vì vậy, không bóng chày. Họ không bao giờ phạm sai lầm, bây giờ làm họ?

Một trọng tài xét xử một vở kịch tại cơ sở thứ hai.

Nhấp chuột theo dõi

Trong một bài viết gần đây, tôi đã mô tả một bằng sáng chế nộp từ Yahoo, nơi mà họ trình bày một phương pháp xếp hạng hình ảnh dựa trên một phương pháp dự đoán được tỷ lệ nhấp của hình ảnh ở vị trí khác nhau trong các kết quả tìm kiếm.

Giả định đằng sau phương pháp đó là hình ảnh xuất hiện là có liên quan cho truy vấn sẽ được click vào, và rằng một tỷ lệ dự đoán cho hình ảnh tại các vị trí nhất định trong các kết quả tìm kiếm có thể được sử dụng để xác định hình ảnh đó overperformed dựa vào nơi họ xuất hiện trong các kết quả và di chuyển những người lên, và để tìm hình ảnh mà tụt lại dựa trên vị trí của họ, và di chuyển chúng xuống trong kết quả. Với kết quả tìm kiếm hình ảnh cho thấy một hình ảnh thu nhỏ của một hình ảnh, mà có thể làm việc tốt cho hình ảnh.

Sẽ theo dõi số lần mà kết quả tìm kiếm web được click vào khi họ xuất hiện trong kết quả tìm kiếm tiết lộ rằng những kết quả có liên quan cho các thuật ngữ truy vấn mà họ xếp hạng cho?

Một vấn đề với cách tiếp cận đó là người tìm kiếm chỉ thấy một tiêu đề trang, trừu tượng (hay đoạn), và URL cho các trang web, và những người có thể không phản ánh chính xác các nội dung xuất hiện trên các trang web mà họ đại diện. Điều đó có nghĩa là hạn chế đó nhấp chuột vào kết quả tìm kiếm cho các trang web có thể không chỉ tốt về cách thức có liên quan những kết quả là cho một truy vấn cụ thể.

một hệ thống tự động để đánh giá những quả bóng và đình công trên tấm nhà.

Những hình ảnh trên là từ một bằng sáng chế cho hệ thống Umpiring Automated bóng chày. Trong khi nó có thể có thể làm tốt công việc của gọi bóng và đình công, thì có lẽ nó sẽ không thể hữu ích với các nhiệm vụ khác, chẳng hạn như xác định liệu một hitter bị trúng một sân, hoặc nếu một Á hậu là an toàn hay trên một thân chơi ở các tấm.

Một thuật toán để xác định sự liên quan Chủ và đa dạng của Kết quả tìm kiếm

Quy trình cấp bằng sáng chế của Yahoo sử dụng thông tin từ tìm kiếm gần đây để xem kết quả tìm kiếm phù hợp tốt với các tìm kiếm mà mọi người đang biểu diễn tại các công cụ tìm kiếm.

Liên quan tự động và nhiều kiểm tra cho dịch vụ seo web và công cụ tìm kiếm theo chiều dọc
Được phát minh bởi Jignashu G. Parikh
Giao cho Yahoo
US Patent 7.558.787
Cấp 07 tháng bảy năm 2009
Nộp 05 tháng 7 năm 2006

Trừu tượng

Kỹ thuật để tự động kiểm tra sự phù hợp và nhiều loại kết quả tìm kiếm được cung cấp.

Một truy vấn được gửi đến một công cụ tìm kiếm, trong đó sử dụng một thuật toán tìm kiếm để có được kết quả tìm kiếm dựa trên các truy vấn. Một tập hợp các điều kiện đầu n liên quan cho truy vấn được xác định. Đối với mỗi thuật ngữ liên quan trong tập hợp các điều khoản, tần số tương đối của nó trong mối quan hệ với tất cả các điều khoản trong bộ từ ngữ được xác định. Nếu thuật ngữ này không xảy ra ở bất kỳ kết quả, sau đó là một mất mát trong nhiều tỷ lệ thuận với tần số tương đối hạn cho thuật ngữ này đã xảy ra.

Nếu không, sự phù hợp của các kết quả tìm kiếm được tính bằng cách so sánh tỷ lệ các kết quả chứa từ với tần số tương đối hạn có thời hạn. Quá trình này được lặp đi lặp lại cho tất cả các điều khoản trong tập hợp các thuật ngữ liên quan đến sản xuất một loạt các tổng và phù hợp cho các kết quả.

Khi ai đó tìm kiếm một công cụ tìm kiếm, họ bước vào một thuật ngữ truy vấn vào hộp tìm kiếm và nhấn Enter.

Một tập hợp các kết quả được trả về bởi các công cụ tìm kiếm mà đứng những kết quả theo thuật toán tìm kiếm. Các thuật toán thực tế được sử dụng để xếp hạng các kết quả này thường bao gồm các yếu tố đo cả sự liên quan và tầm quan trọng của các trang phù hợp với truy vấn tìm kiếm.

Nộp bằng sáng chế này mô tả một giao diện thử nghiệm rằng thuật toán tìm kiếm và công cụ tìm kiếm các nhà phát triển có thể sử dụng để kiểm tra sự đa dạng và phù hợp của kết quả tìm kiếm.

Như tôi đã nói ở đầu bài viết này, nó là thú vị để xem làm thế nào một công cụ tìm kiếm có thể cố gắng để xác định có liên quan của kết quả tìm kiếm có thể được.

Sử dụng điều khoản liên quan

Quá trình này xác định tính thích hợp và sự đa dạng trong các kết quả tìm kiếm bắt đầu bằng cách xác định các điều khoản mà có thể liên quan đến truy vấn của người tìm kiếm.

Ai đó tìm kiếm [Amazon] và các công cụ tìm kiếm lấy kết quả liên quan đến các truy vấn và hiển thị kết quả cho người tìm kiếm.

Các kết quả xuất hiện có thể liên quan đến các cửa hàng trực tuyến tại “Amazon.com” hoặc các “dòng sông Amazon.”

Không có cách nào để thực sự xác định tự động cho dù người tìm kiếm muốn thông tin về một hay khác, hoặc về một cái gì đó thậm chí khác nhau.

Tuy nhiên, công cụ tìm kiếm có thể nhìn vào bản ghi truy vấn và dữ liệu tìm kiếm dựa phiên và dữ liệu khác đặt ra để xác định phụ khái niệm cho một truy vấn.

Những phụ khái niệm có thể là loại mà bạn xem được cung cấp tại các đề xuất truy vấn của một công cụ tìm kiếm. Xem bài viết trước đây của tôi, thế nào Công cụ Tìm kiếm Có thể quyết định khi và Tối ưu hóa truy vấn Đề xuất cho một số ý tưởng về làm thế nào một công cụ tìm kiếm có thể xác định và tối ưu hóa truy vấn gợi ý cho một truy vấn cụ thể.

Cùng một loại dữ liệu mà Yahoo có thể sử dụng để cung cấp “Cũng Hãy thử” kiểu truy vấn hoặc Yahoo gợi ý tìm kiếm tiên đoán cũng có thể được sử dụng để xác định các bộ điều khoản liên quan cho truy vấn của người tìm kiếm.

yahoo đề xuất truy vấn tự động hoàn thành dưới hộp tìm kiếm

Một công cụ tìm kiếm cũng theo dõi các lần truy vấn được gửi đến một công cụ tìm kiếm, mà có thể hữu ích trong việc xác định các truy vấn thời gian nhạy cảm.

Điều khoản liên quan có thể được thu thập từ các công cụ tìm kiếm truy vấn dữ liệu log từ tuần trước, chứ không phải là năm cuối cùng, để đảm bảo rằng các thông tin kịp thời.

Vì vậy, nếu một trận động đất đã xảy ra một vài tháng trước đây, các bản ghi truy vấn khoảng thời gian đó có thể bao gồm nhiều tìm kiếm cho [trận động đất Amazon]

Một tháng hoặc nhiều hơn sau này, có thể có các tìm kiếm ít hơn rất nhiều nhiệm kỳ đó, và [trận động đất amazon] có thể không được coi là một truy vấn có liên quan như nó sẽ là thời gian gần đây sau khi thời gian của sự kiện.

Một tìm kiếm thông qua các bản ghi truy vấn gần đây có thể hiển thị số lần truy vấn bao gồm, hoặc đồng xảy ra “với” Amazon “xuất hiện trong dữ liệu đó. Vì vậy, các truy vấn liên quan như “sách amazon”, “sông amazon,” và “rừng amazon” có thể được xác định là có liên quan đến truy vấn nếu chúng hiển thị frenquently đủ trong các bản ghi truy vấn đó được kiểm tra.

Các công cụ tìm kiếm cũng có thể nhìn vào các buổi tìm kiếm từ tìm kiếm trong các bản ghi truy vấn, để xem cách thường truy vấn khác xuất hiện trong các phiên tìm kiếm tương tự như các truy vấn cho, hoặc có chứa “Amazon”.

Một phiên tìm kiếm có thể được định nghĩa là tìm kiếm nhiều từ một người tìm kiếm trong một khoảng thời gian cụ thể, chẳng hạn như một giờ hoặc một ngày.

Tần số hạn tương đối và Kiểm tra Mức độ liên quan

Khi một công cụ tìm kiếm đã đưa ra một tập hợp các điều khoản liên quan cho một truy vấn, nó có thể tính toán tần số tương đối của mỗi người trong những điều khoản liên quan so với truy vấn tìm kiếm ban đầu của các bản ghi trong truy vấn đó đã được kiểm tra. Dưới đây là một ví dụ về cách tính toán đó có thể làm việc từ khi nộp đơn sáng chế.

Ví dụ, ám chỉ đến bàn 216, các F.sub.term của “cuốn sách” hạn là 25, có nghĩa là “sách” đồng xảy ra với “Amazon” 25 lần trong các phần được chọn của Query Log 210, đại diện bởi bảng 212 . Hơn nữa, F.sub.total là 50, tương ứng với tổng số lần xuất hiện đồng cho tất cả các điều khoản trong bộ bảng 216.

Do đó, việc xác định có thể được thực hiện mà các F.sub.relative của “cuốn sách” hạn là 25/50 hoặc 50%. Bảng 216 tiếp tục có các tần số thuật ngữ tương đối của tất cả các điều khoản khác trong tập hợp các thuật ngữ liên quan. Cụ thể, các tần số hạn của “rừng nhiệt đới” là 12/50, hoặc 24%, trong “dòng sông” là 8/50, hoặc 16%; và “cá” là 5/50, hoặc 10%.

Tần số thuật ngữ tương đối của mỗi thuật ngữ liên quan trong tập được sử dụng để xác định cả phù hợp và đa dạng của kết quả tìm kiếm cho một truy vấn chính như mô tả thêm trong tài liệu này.

Những tỷ lệ có thể được sử dụng trong việc tìm kiếm các kết quả tìm kiếm cho truy vấn tìm kiếm ban đầu.

Nếu bạn nhìn vào các tiêu đề và đoạn (hoặc các nội dung thực tế) trong mười kết quả tìm kiếm cho [amazon], không một nửa của những kết quả chứa từ “sách” giống như các bản ghi truy vấn kiểm tra làm gì? Có một phần tư trong số họ có những khu rừng nhiệt đới từ? Có một đề cập đến từ “sông” trong một hoặc hai trong số họ? Có ít nhất một bằng từ “cá” ở trong đó?

Nếu tỷ lệ giữa các bản ghi truy vấn và các kết quả tìm kiếm phù hợp tốt, nó có thể là một dấu hiệu cho thấy sự liên quan của những kết quả khá tốt. Nó cũng có thể cho thấy sự đa dạng của các kết quả cũng là tốt.

Các bằng sáng chế không cảnh báo rằng một số kết quả tìm kiếm có thể liên quan lắm, nhưng cũng có thể hoàn toàn thiếu nhiều nếu truy vấn của người tìm kiếm không chứa may chủ đề phụ, hoặc các điều khoản liên quan liên quan đến các chủ đề khác nhau.

Phần kết luận

Tôi nghĩ rằng nó là thú vị mà bằng sáng chế này mô tả một cách để tìm gợi ý truy vấn liên quan đó là rất tương tự như phương pháp mô tả trong một ứng dụng bằng sáng chế của Microsoft trong bài cuối cùng của tôi.

Ý tưởng cho rằng tần suất xuất hiện của từ ngữ từ các truy vấn liên quan có thể được sử dụng để đánh giá tính thích hợp và sự đa dạng của các kết quả cho truy vấn của người tìm kiếm cũng đáng suy nghĩ về.

Nếu một nửa số người sử dụng [amazon] trong tìm kiếm của họ bao gồm từ “sách” trong những tìm kiếm, một nửa các kết quả tìm kiếm trong một tìm kiếm cho [amazon] nên chứa từ “sách?” Nếu 20 phần trăm những người tìm kiếm tìm kiếm [amazon] bao gồm từ “rừng nhiệt đới” trong những tìm kiếm, nên hai của kết quả tìm kiếm hàng đầu mười được kết quả về các khu rừng nhiệt đới Amazon?

Hiện nay, các kết quả tìm kiếm hàng đầu mười tại Yahoo cho [amazon] chứa hai kết quả cho phần mở rộng .com của hiệu sách, theo sau là hai kết quả cho các phiên bản .ca của hiệu sách, sau đó vào trang wikipedia cho amazon.com, một entry về sông Amazon, một vài trang về các dịch vụ web của Amazon, một kết quả cho co.uk Amazon cửa hàng, và kết quả cuối cùng cho các dịch vụ bán Amazon, cho phép người bán sản phẩm của mình thông qua Amazon.

Do các kết quả tìm kiếm gần đây phản ánh chứa trong nhật ký truy vấn của Yahoo mà bao gồm từ “amazon”, hoặc hiển thị trong các phiên tìm kiếm tương tự như tìm kiếm cho [amazon]?

Nên sự liên quan của kết quả tìm kiếm được dựa trên các tần số từ ngữ liên quan trong nhật ký truy vấn gần đây? Đó có phải là một biện pháp tốt có liên quan của những kết quả có thể được?

Tôi đã thực sự được viết một bài trước đây về bằng sáng chế này khi nó được công bố như là một ứng dụng bằng sáng chế vào tháng Giêng năm 2008. Tôi đã không nhận ra rằng cho đến khi tôi đã được hầu hết các cách thực hiện với bài viết này, nhưng tôi nghĩ rằng hai bài viết thực sự khen nhau, vì vậy tôi quyết định đi trước và đăng bài viết này.

Tôi nghĩ rằng hai bài làm tốt công việc của nhấn mạnh tầm quan trọng của cố gắng để hiểu những gì một công cụ tìm kiếm có thể xem như “truy vấn liên quan” cho một truy vấn cụ thể, và làm thế nào những người có thể không chỉ ảnh hưởng mà gợi ý tìm kiếm có thể được hiển thị trong một bộ kết quả tìm kiếm, nhưng cũng có liên quan của một công cụ tìm kiếm có thể tin rằng những kết quả tìm kiếm sẽ được dựa trên các truy vấn liên quan.

Share this post