Tìm kiếm Nguyên tắc phân loại Và Tìm kiếm Động cơ: Trả lời câu hỏi Vs. Index trang web

Nếu bạn đã tìm kiếm [Ronald Reagan Movies] tại Google hay Yahoo hoặc Bing, bạn sẽ mong đợi để xem một danh sách các phim mà các cựu tổng thống và diễn viên xuất hiện trong?

Đó là nhiều khả năng là bạn sẽ thấy một loạt các trang web có chứa các từ “Ronald” và “Reagan” và “Phim”, mà có thể chứa tên của bộ phim với sự tham gia chính trị cũ và thespian.

Một ứng dụng bằng sáng chế từ Yahoo công bố tuần trước khám phá cách để trở lại thông tin trực tiếp tới người tìm kiếm, dựa vào việc tạo dựng nguyên tắc phân loại các thông tin về những người cụ thể, địa điểm, và những thứ, thu thập từ các thông tin tìm thấy trên các trang web, thay vì phải tìm kiếm xem xét thông qua nhiều trang web để tìm câu trả lời cho các truy vấn như “phim Ronald Reagan.”

Cả Yahoo và Google làm một số câu hỏi trả lời khi phải đối mặt với các truy vấn nhất định có liên quan đến “thực thể có tên,” hoặc tên của những người nổi tiếng, địa điểm, và sự vật. Ví dụ, tìm kiếm ở một trong hai công cụ tìm kiếm cho [Babe Ruth nơi sinh], và trên các trang web trên các trang kết quả tìm kiếm xuất hiện một câu trả lời cho câu hỏi đó:

Kết quả tìm kiếm Google cho thấy Nơi sinh Babe Ruth.

Kết quả tìm kiếm của Yahoo cho thấy Nơi sinh Babe Ruth.

Nhưng không phải công cụ tìm kiếm cung cấp cho bộ chi tiết hơn về thông tin, chẳng hạn như danh sách các báo giá từ những người nhất định, hoặc phim mà họ có thể đã xuất hiện bên trong, hoặc văn phòng chính trị tổ chức. Sẽ có những loại những điều mà mọi người có thể nhìn thấy trong kết quả tìm kiếm? Nộp bằng sáng chế của Yahoo tìm hiểu làm thế nào họ có thể xây dựng các nguyên tắc phân loại các thông tin về một người như Ronald Reagan, và lấy thông tin từ các trang dịch vụ seo web để xây dựng câu trả lời cho những câu hỏi như những để hiển thị trên trang kết quả tìm kiếm. Việc nộp đơn sáng chế là:

Sáng tạo và làm giàu của Search Dựa Phân loại tư duy cho việc tìm thông tin từ Semistructured liệu
Được phát minh bởi Sudharsan Vasudevan, Rohan Monga, Hemanth Sambrani, và NS Sekar
US Patent Application 20090282010
Giao cho Yahoo!
Đăng ngày 12 Tháng Mười Một 2009
Nộp 18 tháng 6 2008

Trừu tượng

Kỹ thuật được cung cấp cho việc tạo và cập nhật một hệ thống phân cấp thực thể (phân loại) dựa trên thông tin bị bắt về tương tác người dùng với một hệ thống. Kỹ thuật này cũng được cung cấp cho việc sử dụng các nguyên tắc phân loại để xác định bản chất của các thực thể đại diện bởi các điều khoản nộp vào một công cụ tìm kiếm. Tìm kiếm các bản ghi phân tích cho bộ liên quan của các thực thể, và được sử dụng để cải thiện các nguyên tắc phân loại để lưu trữ thông tin.

Sau khi phân loại được tạo ra, thông tin trên các nguồn dữ liệu được lấy và tổng hợp dựa trên các nguyên tắc phân loại. Khi hệ thống được truy vấn, truy vấn được sửa đổi để một mẫu định sẵn, và các kết quả phù hợp nhất nhanh chóng được trả. Một cơ chế phản hồi cũng được cung cấp để tăng cường phân loại và thực thể dữ liệu dựa trên khối lượng tìm kiếm. Hệ thống này cho phép các công cụ tìm kiếm để cung cấp câu trả lời chính xác khi các thực thể, các thuộc tính và mối quan hệ của họ có liên quan.

Các nhà sáng chế của việc sử dụng bằng sáng chế Ronald Reagan là một ví dụ bởi vì ông có thể phù hợp với nhiều hơn một thể loại “chính” trong một hệ thống phân loại hoặc phân loại, với một lịch sử như là cả một ngôi sao điện ảnh và một chính trị gia. Theo các “ngôi sao điện ảnh” thể loại có thể có các thuộc tính như “ngày sinh” cũng như “phim hành động.” Theo thể loại “chính trị gia”, chúng ta cũng có thể thấy “ngày sinh”, nhưng thuộc tính khác như “văn phòng tổ chức “cũng có thể được bao gồm.

Có gì loại thú vị về việc này là nó nhắc tôi về cấu trúc rễ của nguồn gốc của Yahoo như một thư mục. Chúng tôi đang nói rằng Yahoo sẽ xây dựng nguyên tắc phân loại bằng cách sử dụng một sự kết hợp của thông tin phản hồi từ các bản ghi truy vấn tìm kiếm và từ con người can thiệp của nhãn hiệu. Các khía cạnh con người biên tập xây dựng một nguyên tắc phân loại sẽ giúp làm cho thông tin chắc chắn là đúng, và phản hồi tự động từ các bản ghi truy vấn sẽ giúp đảm bảo rằng các nguyên tắc phân loại là up-to-date và bao gồm các thông tin gần đây nhất từ ​​xu hướng tìm kiếm.

Nhiều ví dụ bao gồm trong bản mô tả sáng chế liên quan đến người nổi tiếng hoặc địa điểm hoặc sự vật, thường được gọi là “thực thể có tên,” như Johnny Depp hay tòa nhà Empire State, nhưng việc nộp bằng sáng chế cho chúng ta biết rằng nó có thể bao gồm việc mở rộng và cụ thể loại mà không liên quan đến thực thể có tên là tốt, từ “con người” để “giáo viên lớp 11”.

Đối với nhiều người trong số các nguyên tắc phân loại rằng một hệ thống như thế này có thể tạo ra, các công cụ tìm kiếm có thể bắt đầu với các nguồn dữ liệu đã có cung cấp thông tin như Internet Movie Database (không có tên cụ thể trong việc nộp bằng sáng chế), hoặc thư mục trang vàng.

Khi nói đến một số loại loại, chẳng hạn như những người mà có thể liệt kê những người, có thể có các thuộc tính mặc định liên kết với những người được xác định bởi các biên tập viên của con người, chẳng hạn như là một “ngày sinh”, hoặc “nơi sinh”, hoặc một “ngày giỗ.”

Các thuộc tính khác mà có thể được áp dụng cho các mục này có thể được học bằng cách nhìn vào các bản ghi tìm kiếm để xem những gì mọi người đang tìm kiếm. Một ví dụ có thể là những người thường xuyên tìm kiếm trích dẫn từ một người như “Mark Twain.” Nếu những loại tìm kiếm xu hướng phổ biến, nó có thể là hợp lý cho một công cụ tìm kiếm để thu thập Mark Twain trích dẫn để hiển thị cho người tìm kiếm khi có các truy vấn cho [dấu hai dấu ngoặc kép].

Một số người, địa điểm, và các thuộc tính có bí danh phổ biến hoặc tên thay thế. Ví dụ, khi bạn tìm kiếm một ngày sinh cho một người nào đó, bạn có thể sử dụng các từ “sinh nhật”, hay “sinh ra”, hoặc “DOB”. Khi ai đó tìm kiếm Johnny Depp, họ cũng có thể tìm kiếm cho “Johnny D.”, “J. Depp “, và” Jack Sparrow “. Một truy vấn tìm kiếm bao gồm “Hoa Kỳ” có thể gọi các quốc gia “của Mỹ,” hoặc “USA” hay “United States of America.” Một công cụ tìm kiếm có thể tìm hiểu để kết hợp các tên bí danh tự động từ các bản ghi tìm kiếm.

Nguồn cho các loại và các thuộc tính để hiển thị cho người tìm kiếm có thể được xác định bởi các biên tập viên cũng như từ các nhấp chuột thông qua thông tin từ tìm kiếm như đã thấy trong các bản ghi tìm kiếm. Một số nguồn tin có thể được đưa ra “mức độ tin cậy” cao hơn từ những biên tập viên của con người, hoặc bởi các công cụ tìm kiếm, mặc dù các bằng sáng chế không cho chúng tôi biết những phẩm chất mà có thể được sử dụng để xác định những mức độ tự tin. Có lẽ, nếu một trang dịch vụ seo website cụ thể được sử dụng để cung cấp thông tin và trả lời các truy vấn, các công cụ tìm kiếm sẽ liên kết đến trang đó như trong các ví dụ trên về nơi sinh Babe Ruth từ Google và Yahoo.

Phần kết luận

Các bằng sáng chế không đi vào chi tiết hơn về cách nó có thể xây dựng các nguyên tắc phân loại, và làm thế nào nó có thể quyết định những thông tin nào có thể được hiển thị để đáp ứng với một số loại truy vấn.

Trong khi đó là giá trị chi tiêu một số thời gian với, những gì là thú vị nhất về ứng dụng bằng sáng chế này là nó cho thấy một mong muốn để trả lời câu hỏi để truy vấn trực tiếp, chứ không phải là người tìm kiếm trình bày với các trang có thể có hoặc không có thể cung cấp những câu trả lời. Tất nhiên, các công cụ tìm kiếm có thể sẽ tiếp tục hiển thị các trang web đó có thể là kết quả tốt cho các truy vấn từ tìm kiếm sau khi hiển thị câu trả lời.

Nếu bạn là một người tìm kiếm tìm kiếm thông tin về một chủ đề, và công cụ tìm kiếm trực tiếp trả lời câu hỏi của bạn như thế này, làm thế nào thoải mái, bạn sẽ cảm thấy với những câu trả lời?

Nếu bạn là một chủ sở hữu trang web, nó sẽ làm phiền bạn rằng một công cụ tìm kiếm có thể khai thác trang web của bạn để hiển thị câu trả lời và có khả năng giữ khách truy cập từ đến trực tiếp đến trang web của bạn cho những câu trả lời?

Share this post