Khi có ai đó “George Washington” vào hộp tìm kiếm, họ có thể quan tâm nhiều hơn trong chiến tranh cách mạng nói chung và Tổng thống George so với một số ngẫu nhiên ở Washington. Một tìm kiếm cho “Khách sạn Washington” có nhiều khả năng tìm kiếm khách đến Washington hơn khách sạn tên là Washington. Tìm kiếm cho những nơi có dấu hiệu cho thấy nói “Washington Slept Here” có lẽ không phải về khách sạn (và những người tìm kiếm có thể có quá nhiều thời gian trên tay).

Một bản in thạch của George và Martha Washington với hai đứa con, ban đầu có bản quyền vào năm 1889 bởi Kurz và Allison.

Khi từ được sử dụng trong các truy vấn tìm kiếm dịch vụ seo có thể có nhiều hơn một nghĩa, một công cụ tìm kiếm có thể cung cấp kết quả tìm kiếm tốt hơn để tìm kiếm nếu các công cụ tìm kiếm có thể tính toán xác suất ý nghĩa nhiều khả năng đến từ đó. Đó là trọng tâm của một bằng sáng chế được cấp cho Yahoo trong tuần vừa qua:

Hệ thống để xác định nghĩa có thể của các từ đã nhập vào
Được phát minh bởi David Richardson-Bunbury, Soren Riise, Devesh Patel, Eugene H. Stipp, Paul J. Grealish
Giao cho Yahoo!
US Patent 7.681.147
Cấp ngày 16 tháng 3 năm 2010
Nộp 13 Tháng 12 2005

Trừu tượng

Một hệ thống được công bố để xác định ý nghĩa của các từ có thể xảy ra. Một đầu vào của một từ được thu được. Ý nghĩa có thể của các từ có thể được xác định phù hợp với một suất trước của ý nghĩa có thể của các từ và một xác suất tần số bối cảnh của những ý nghĩa có thể của các từ này.

Ví dụ trong bằng sáng chế chủ yếu tập trung vào tên địa danh, nhưng các nhà phát minh được liệt kê trong bằng sáng chế cho chúng tôi biết rằng các quá trình được mô tả có thể được sử dụng với các điều kiện khác có thể được giải thích nhiều cách. Vì vậy, một con báo đốm Mỹ có thể là một loại động vật, xe hơi hay một cầu thủ bóng đá NFL từ Jacksonville.

Một công cụ tìm kiếm có thể cố gắng để tính toán xác suất mà một tìm kiếm cho “báo đốm” có thể được dùng để đáp ứng một trong những ý nghĩa. Nếu hạn khác được thêm vào, những xác suất có thể được tính cách khác nhau dựa vào bối cảnh. Một tìm kiếm cho “Jacksonville Jaguar” có nhiều khả năng về một người chơi bóng đá, trong khi tỷ lệ cược được rằng một tìm kiếm cho “Jaguar bộ chế hòa khí” thì không.

Một tìm kiếm web của Google cho Jaguar mang lại hình ảnh của chiếc xe và mèo. Cùng tìm kiếm của Yahoo cho thấy một vài hình ảnh cùng đoạn trích cho trang, một trong một giống mèo trong tự nhiên, và một trong một giống mèo cách điệu trong logo cho ô tô.

Làm thế nào có thể một công cụ tìm kiếm như Yahoo (và có thể Bing nếu họ có được quyền bằng sáng chế này), sử dụng xác suất thống kê ý nghĩa của từ ngữ? Tác giả của sáng chế cung cấp cho chúng tôi danh sách sau đây về cách ước tính tốt nhất về ý nghĩa của một từ có thể được sử dụng theo nhiều cách khác nhau:

Trang web có thể được lập chỉ mục để tìm kiếm.
Câu chuyện tin tức vị trí có thể được vẽ trên bản đồ.
Về mặt địa lý quảng cáo có liên quan có thể được đặt trên một trang dịch vụ seo website.
Thống kê nâng cao có thể được tính toán để sử dụng trong phân tích truy vấn.
Danh sách kết quả tìm kiếm có thể được trình bày cho người sử dụng phù hợp với khả năng.
Quảng cáo có thể tập trung vào ý nghĩa mà cho là trả cho một vị trí, giá mỗi nhấp chuột, trả cho mỗi cuộc gọi và trả cho mỗi hành động loại hình dịch vụ.
Thay vì cố gắng để phù hợp với các truy vấn với trang mà những từ có thể được cụm từ khóa đó xuất hiện trên các trang hoặc trong các liên kết đến các trang này, công cụ tìm kiếm có thể rerank kết quả tìm kiếm dựa trên xác suất mà một người tìm kiếm dự định để xem một cái gì đó liên quan đến một loại tìm kiếm hơn là khác.

Vì vậy, một người có tên cuối cùng “Ind” và cái tên đầu tiên “Gary” có thể có thể có một trang web cá nhân mà có thể xếp hạng cao nhất trên một tìm kiếm cho “Gary Ind.” Tuy nhiên, các công cụ tìm kiếm có thể tính toán một xác suất cao hơn mà ai đó tìm kiếm cho “Gary Ind.” muốn xem thông tin về một thành phố tên là Gary ở Indiana State, so với các trang nhà của Gary Ind. Dựa trên những xác suất, nó có thể rerank kết quả tìm kiếm cho “Gary, Ind.” để hiển thị các trang về Thành phố đầu tiên.

Nếu bạn sống ở thành phố Bath ở Anh, và bạn đang cần một thợ sửa ống nước, bạn vẫn có thể có vấn đề tìm kiếm những gì bạn đang tìm kiếm khi bạn tìm kiếm cho “Bath thợ ống nước” (Chúc may mắn cho bạn). Chúng tôi đang nói về các thành phố của Springfield:

Ví dụ, nếu có ba mươi nơi khác nhau gọi là “Springfield”, sau đó ba mươi mốt xác suất trước có thể được tạo ra, một cho mỗi nơi cộng với một cho khả năng rằng nó không phải là một nơi nào cả.

Các bằng sáng chế không cung cấp một số ví dụ cũng như một số chi tiết về cách xác suất có thể được tính cho các từ khác nhau được sử dụng cả hai một mình, và trong bối cảnh các từ khác. Nếu bạn quan tâm đến làm thế nào xác suất có thể được sử dụng để rerank kết quả tìm kiếm, bạn có thể muốn dành thời gian với bằng sáng chế này.

Khi ai đó tìm kiếm “Washington”, làm họ có nghĩa là nhà nước của Washington, District of Columbia, một thành phố có tên là Washington, George, hoặc một cái gì đó khác hoàn toàn? Xác suất, ngoài việc xếp hạng tín hiệu dựa trên những thứ như phù hợp và chất lượng và phân tích liên kết, có thể đóng một vai trò trong những trang hiện lên ở đâu trong kết quả tìm kiếm.