Bạn mua một chiếc điện thoại mới, và nó không hoạt động như quảng cáo, và dịch vụ khách hàng thậm chí còn tồi tệ hơn. Nhiều người trong giày của bạn sẽ đi trực tuyến, và viết bình luận tiêu cực ở đâu đó.

Bạn đi trên một kỳ nghỉ, và nghỉ tại giường rẻ tiền và duyên dáng và ăn sáng. Bạn có một thời gian tuyệt vời, một phần không nhỏ vào sự chu đáo và góp ý của máy chủ của bạn, và lòng hiếu khách tuyệt vời của họ. Có thể, bạn viết nhận xét glowing về những kinh nghiệm trên Web.

Của số ý kiến ​​và các trang dịch vụ seo website xem trên các trang web đã được phát triển trong vài năm qua. Tùy chọn “xem xét lại” tìm kiếm gần đây của Google là một trong những nỗ lực để giúp mọi người tìm thấy bình luận cả tích cực và tiêu cực.

Google cũng trình bày ý kiến ​​trong kết quả Google Maps. Nếu bạn tìm kiếm cho các doanh nghiệp và các tổ chức trong Google Maps, bạn sẽ thấy dưới mỗi danh sách liên kết để “viết bình luận” cho từng doanh nghiệp niêm yết. Nếu bạn click trên “biết thêm” liên kết cho một doanh nghiệp niêm yết, bạn sẽ thấy một “xem xét lại” tab trong hộp xuất hiện ở giữa bản đồ cho doanh nghiệp đó. Các kết quả cho thấy đánh giá là tóm tắt, thường chứa một số mức độ tình cảm về các doanh nghiệp niêm yết.

ba xét tóm tắt cho một nhà hàng hải sản từ Google Maps cho thấy tình cảm rất khác nhau về cùng một nhà hàng.

Làm thế nào để Google đưa ra những tóm tắt tình cảm từ các ý kiến?

Tâm lý thị trường và xét

Trong việc cung cấp đánh giá, Google đã phải cố gắng tìm một cách để mang lại ý nghĩa và hữu ích cho các kết quả tìm kiếm của họ. Điều này có nghĩa là đi xếp hạng qua đó có thể được giới hạn trong một số lượng nhất định của các ngôi sao trong năm, hoặc cung cấp xếp hạng trên các khía cạnh của một sản phẩm hoặc dịch vụ mà có thể là phi vật chất để ai đó tìm kiếm thêm thông tin.

Ví dụ, một người nào đó tìm kiếm một máy nghe nhạc kỹ thuật số có thể được quan tâm hơn đến chất lượng âm thanh và tuổi thọ pin của máy nghe nhạc so với trọng lượng của nó hay số lượng màu sắc nó có sẵn trong.

Đánh giá của một số Music Player bao gồm các tính năng khác nhau của các cầu thủ

Một bộ ba của các ứng dụng bằng sáng chế từ Google cung cấp một số hiểu biết về cách tiếp cận của họ cho việc tìm kiếm ý kiến ​​của người viết đánh giá trực tuyến về âm nhạc, sách, phim, nhà hàng, khách sạn, thiết bị điện tử, và nhiều sản phẩm và dịch vụ khác.

Tôi đã viết về một trong các hồ sơ bằng sáng chế trong một bài viết gần đây, có tựa đề New xét Tìm kiếm Lựa chọn của Google và Sentiment Analysis. Nó đã khám phá cách ngôn ngữ thể hiện tình cảm khác nhau trong đánh giá của các loại khác nhau. Ví dụ, “rất nhỏ” có thể là một cụm từ tích cực khi nói đến nhiều linh kiện điện tử, nhưng cùng một cụm từ có thể được xem là tiêu cực khi nói đến kích thước của phòng khách sạn.

Google đã theo dõi với hai ứng dụng bằng sáng chế hơn về đánh giá và tình cảm chứa trong chúng. Một trong số họ thảo luận về cách Google có thể tóm tắt tình cảm trong phần đánh giá. Các khác đào sâu vào cách Google có thể tạo ra các đoạn trích cho rằng xuất hiện đánh giá kết quả tìm kiếm. Cả tóm tắt và các đoạn có thể được hiển thị cho những người có thể quan tâm nhìn thấy đánh giá, và có thể nhấp chuột vào kết quả tìm kiếm để đọc thêm.

Hôm nay của bài viết là về việc tạo ra và sử dụng các tóm tắt tình cảm. Trong một bài đăng trong tương lai, tôi sẽ viết về việc tạo ra các đoạn tình cảm.

Tổng kết Tâm lý Nhận xét

Ứng dụng bằng sáng chế này sẽ cố gắng để tìm thấy những khía cạnh khác nhau của sản phẩm hoặc dịch vụ đang được xem xét lại, và tìm các cụm từ trong những ý kiến ​​thể hiện một số loại ý kiến ​​hoặc tâm lý về những khía cạnh, hoặc các tính năng.

Aspect-Dựa Sentiment Summarization
Được phát minh bởi George Reis, Sasha Blair-Goldensohn, Ryan T. McDonald
US Patent Application 20090193328
Đăng ngày 30 Tháng bảy 2009
Nộp: 19 Tháng 3 2008

Trừu tượng

Nhận xét bày tỏ tình cảm về một hoặc nhiều thực thể. Các cụm từ trong đánh giá thể hiện tình cảm về một khía cạnh cụ thể được xác định. Khía cạnh Reviewable của thực thể cũng được xác định.

Các khía cạnh reviewable bao gồm các khía cạnh tĩnh được cụ thể cho loại hình cụ thể của các đơn vị và các khía cạnh năng động được chiết xuất từ ​​những nhận xét của một trường hợp tổ chức cụ thể. Các cụm từ tình cảm có liên quan đến các khía cạnh reviewable mà các cụm từ liên quan.

Những tình cảm thể hiện bằng các cụm từ liên quan đến từng khía cạnh được tóm tắt, do đó tạo ra một bản tóm tắt của tình cảm gắn liền với từng khía cạnh reviewable của thực thể. Tâm lý tóm tắt và cụm từ liên quan có thể được lưu trữ và hiển thị cho người sử dụng như là một mô tả tóm tắt của các thực thể.

Chúng tôi đang nói trong việc nộp bằng sáng chế mà các quá trình mà đánh giá được tóm tắt và hiển thị yêu cầu sử dụng một động cơ tâm lý tổng hợp, trong đó bao gồm ba phần:

Một Summarizer tình cảm – cung cấp bản tóm tắt về tình cảm về các khía cạnh của đối tượng hoặc dịch vụ reviewable.

Khía cạnh này là tài sản có thể được đánh giá bởi một ai đó. Một nhà hàng có thể được cung cấp với bản tóm tắt về tình cảm về thực phẩm phục vụ ở đó, và về các dịch vụ đó. Bản tóm tắt có thể bao gồm một đánh giá, chẳng hạn như ba trong số năm sao hoặc một lớp thư. Các tóm tắt tình cảm có thể đến từ các ý kiến ​​được tìm thấy trên các trang web, và tại các địa điểm khác.

Các khía cạnh có thể được tóm tắt có thể được tạo ra tĩnh cho một số loại đối tượng hay dịch vụ. Khía cạnh tĩnh để được tóm tắt là những gì mà được xác định trước – ví dụ, đánh giá của khách sạn sẽ có thể luôn luôn bao gồm vị trí, dịch vụ, do đó, những khía cạnh sẽ được bao gồm trong tất cả các tóm tắt cho các khách sạn.

Các khía cạnh cũng có thể tự động xác định các đối tượng và các dịch vụ khác nhau. Điều đó có nghĩa là một người xem có thể đưa ra ý kiến ​​hoặc tâm lý về một số khía cạnh của những gì họ đang xem xét đó là không được định sẵn. Khi xem xét một quầy, người xem có thể bày tỏ ý kiến ​​về các “cheesesteaks,” các “sa lát,” và các “ngón tay gà” mà họ có được khi họ đã ăn tối ở đó.

Một đánh giá của một loại pizza thảo luận về các loại thực phẩm, chẳng hạn như gà lắc, cheesesteaks, và sa lát.

Các Summarizer tâm lý trông cho các cụm từ khác nhau về khía cạnh tĩnh và năng động của các đối tượng và các dịch vụ trong đánh giá, và tạo ra một bản tóm tắt của việc xem xét bao gồm những tình cảm.

Một kho dữ liệu – Các ý kiến ​​nguồn thực tế, và tóm tắt các ý kiến ​​có thể được lưu trữ trong một kho lưu trữ dữ liệu.

Đây có thể bao gồm cả đánh giá chuyên nghiệp và người sử dụng cung cấp các ý kiến ​​từ các trang dịch vụ seo web trên internet. Một loạt các đánh giá có thể được bao gồm trong các kho lưu trữ dữ liệu, ngoài chỉ là nhà hàng, khách sạn, và thiết bị điện tử. Các ứng dụng bằng sáng chế chỉ ra một số ví dụ về các thực thể khác mà có thể được bao gồm, chẳng hạn như “tiệm làm tóc, trường học, viện bảo tàng, các nhà bán lẻ, các cửa hàng tự động, sân golf, vv” Có thể là ngoài bao gồm cả các đánh giá thực tế tại đây cơ sở dữ liệu, các liên kết trỏ đến các nguồn gốc của sự đánh giá có thể được bao gồm.

Các tóm tắt được lưu trữ trong cơ sở dữ liệu bao gồm các cụm từ tình cảm từ những nhận xét nguồn. Ví dụ, nếu một nhà hàng được xem xét, và các khía cạnh là “dịch vụ”, cụm từ tình cảm mà có thể được bao gồm có thể là những thứ như “dịch vụ khá tốt” hay “dịch vụ thật sự khủng khiếp.”

Một công cụ hiển thị tình cảm – Ngoài tóm tắt các ý kiến ​​và lưu trữ chúng, quá trình này đòi hỏi phải có một cách để hiển thị bản tóm tắt để tìm kiếm.

Trong khi chúng ta có thể nhìn thấy bản tóm tắt tình cảm trong các tùy chọn tìm kiếm tab xét của Google, việc nộp bằng sáng chế chỉ ra rằng bản tóm tắt có thể được hiển thị trong một tìm kiếm địa phương.

Trong một phương án, các công cụ hiển thị tình cảm được kết hợp với một máy tìm kiếm nhận được truy vấn về các thực thể địa phương đến các vùng địa lý. Ví dụ, các công cụ tìm kiếm có thể nhận được một thông tin truy vấn tìm kiếm về các nhà hàng Nhật Bản ở New York, NY hoặc về khách sạn ở San Francisco, California.

Công cụ tìm kiếm cung cấp các truy vấn và / hoặc thông tin liên quan (chẳng hạn như một danh sách các thực thể đáp ứng các truy vấn) để các công cụ hiển thị tình cảm, và các công cụ hiển thị tình cảm cung cấp bản tóm tắt về các khía cạnh của các thực thể phù hợp trong trở lại. Như vậy, nếu truy vấn là các nhà hàng Nhật Bản tại New York, các công cụ hiển thị tình cảm trở lại bản tóm tắt về các khía cạnh của nhà hàng Nhật Bản ở khu vực New York.

Các bản tóm tắt có thể bao gồm một đánh giá sao cho từng khía cạnh, cũng như các đoạn có liên quan rà soát văn bản trên đó tóm tắt này được dựa.

Làm thế nào Sentiment Summarization trình

Các phương pháp tiếp cận phân loại tình cảm đòi hỏi các công cụ tìm kiếm để thu thập một khối lượng lớn các ý kiến ​​dưới dạng văn bản, và để đi qua chúng và phá vỡ chúng xuống một từ bằng cách cấp độ từ, nơi mà mỗi từ được đánh dấu với một “phần của bài phát biểu” token đó phân loại nó. Mục tiêu cuối cùng là để xác định các cụm từ như sau:

Chất lượng âm thanh rất tốt
Đây là loại pizza yêu thích của tôi bao giờ !!
Chất lượng in rất tốt ngay cả trên giấy thông thường.
Trước khi chúng tôi có thể nhận được những cụm từ như thế, chương trình phân loại cần phải hiểu những gì loại của các từ được đưa vào đánh giá, và để xem họ có phù hợp với các mẫu nhất định, hoặc biểu thức thông thường.

Các “phần của bài diễn văn” gắn thẻ có thể xác định dấu chấm câu, tính từ, động từ, danh từ, đại từ. Nó có thể sử dụng xử lý ngôn ngữ tự nhiên để ngăn chặn từ để rễ của họ, hiểu giác quan hay ý nghĩa của từ được sử dụng khác nhau, và nhận ra các từ ghép.