Năm 2009, Google đã ký một thỏa thuận với Twitter lên tới 15 tỉ đô-la Mỹ nhằm tích hợp các tweet (những thông điệp không quá 140 ký tự trên Twitter) thành từ khóa tìm kiếm liên quan trên Google. Mới tháng trước, Google cũng đã tích hợp công nghệ tìm kiếm thời gian thực nhằm làm nổi bật nội dung tin tức hay các bài post blog được bình chọn nhiều nhất trên web – một sự cải tiến đột ngột nhưng sâu sắc bởi trước đây các công cụ tìm kiếm của gã khổng lồ này phải mất từ 5 đến 15 phút lùng sục trên web mới thực hiện xong. Và dù Collecta cũng có khả năng tìm kiếm web theo thời gian thực nhưng các kết quả của hệ thống này chỉ gói gọn ở những trang phổ biến trong phạm vi kết nối mạng xã hội. Vậy nên Twitter Search đã bắt đầu thể hiện thời đại của mình khi trỗi dậy bên cạnh Google và Collecta.
Những cơ hội và lợi ích của việc truy cập web thời gian thực luôn cho thấy các khiếm khuyết đáng kể nhất do khả năng tập trung hoàn toàn vào dòng thông tin được phân thành chuỗi dữ liệu liên quan. Ngay cả những công ty như My6Sense cũng đang sử dụng dạng “trực giác số hóa” để phân tách các tweet phù hợp theo khuôn mẫu, hành vi và nội dung cho chúng ta đọc.
Giờ đây, chúng ta đang dõi theo từng bước đi của một kỷ nguyên tìm kiếm thời gian thực tinh vi hơn để mong đưa lại sự tiến bộ, khoanh vùng nhận biết và cá nhân hóa hơn nữa theo thời gian. Và mọi thứ sẽ bắt đầu bằng sự thử nghiệm các thuật toán tinh vi nhằm chắt lọc và xếp hạng nội dung mà chúng ta hy vọng được khám phá.
Lấy ví dụ, mới đây Google đã thích ứng công nghệ PageRank của mình vào việc làm nổi bật các tweet liên quan. Ban đầu PageRank được phát triển để giúp tìm kiếm các trang web liên quan thông qua tìm kiếm truyền thống và trở thành sự khác biệt chủ yếu của Google trong giới giải thuật tìm kiếm thương mại. Về cơ bản, PageRank của Google đánh giá sự quan trọng của những trang web kết hợp chặt chẽ với những từ khóa dựa theo cấu trúc liên kết. Uy tín của mỗi trang web được xác định theo số lượng và chất lượng của những liên kết trỏ về trang đó cũng như những phân nhánh sâu hơn nữa theo các quan hệ liên kết đó trỏ tới các trang khác trong phạm vi bậc kết nối trỏ về thứ nhất. Nói một cách khác, càng nhiều liên kết trỏ tới một trang và nhiều liên kết khác theo mỗi liên kết đó thì giá trị của trang ban đầu càng lớn.
Do đó, thách thức với tìm kiếm thời gian thực chính là phân loại các tweet hoặc nội dung xã hội khác theo các nhà xuất bản nổi tiếng và mạng lưới những người ủng hộ danh tiếng có uy tín của chúng cùng với kiểu kiến trúc phân cấp người ủng hộ ít uy tín hơn theo những người ủng hộ danh tiếng đó.
Trong một cuộc trả lời phỏng vấn với Technology Review, chuyên gia Google, Amit Singhal – người đứng đầu về phát triển tìm kiếm thời gian thực đã nói rằng: “Bạn giành được danh tiếng thì bạn cũng nên cho đi danh tiếng. Nếu nhiều người ủng hộ bạn thì bạn cũng ủng hộ một ai đó – cho dù người đó không có nhiều người ủng hộ như bạn nhưng thông điệp – tweet – của người đó vẫn là vô giá bởi những người ủng hộ người đó luôn có những người ủng hộ đông đảo của riêng mình.”
Và Singhal đã nhấn mạnh rằng: “Điều này là rõ ràng, rõ ràng hơn so với một cuộc tranh luận đại chúng.”
Google cũng nghiên cứu dấu hiệu theo tin đồn để làm nổi bật những tweet phù hợp nhất có liên quan tới các đề tài thông thường cũng như khó hiểu. Còn Twitter thì tự mình cải tiến công nghệ đóng gói các tweet chẳng hạn như dữ liệu theo vị trí địa lý – điều khiến chúng ta có thể mong chờ trông thấy một bước phát triển nhanh chóng của tìm kiếm thời gian thực.
Về cơ bản, một người ủng hộ ngang với một trang liên kết tới trang khác trên web. Google thừa nhận mỗi liên kết đó như một kiểu thư giới thiệu. Vì các trang chất lượng cao hơn liên kết tới các nguồn khác nhau nên trang đầu tiên sẽ gia tăng về mặt giá trị. Trong web kết nối mạng xã hội, chính những người được xem là ủng hộ những người khác đã làm tăng tầm cỡ cá nhân của người mà họ kết nối tới.
Việc tìm kiếm một từ khóa cụ thể giờ đây sẽ tạo ra những kết quả phù hợp nhất cho các trang web, và với nội dung được đưa ra trên Twitter hay các mạng kết nối xã hội khác, việc xếp hạng theo uy tín của trang và nhà xuất bản về những mục đích xã hội đều được đánh giá theo công nghệ PageRank.
Theo những đánh giá của Google, sự thích ứng của PageRank về các kênh truyền thông xã hội cơ bản là để tạo ra một thuật toán trí tuệ nhân tạo hoặc một PeopleRank về sắp xếp mà cuối cùng có thể đáp ứng được cơ sở đánh giá uy tín của một cá nhân trong web kết nối mạng xã hội.
Trong khi đó, các công ty khác cũng đang giới thiệu các dịch vụ mới nhằm đánh giá chung uy tín của các cá nhân trực tuyến. Chẳng hạn như Klout đã phát triển một nền tảng tinh vi cho việc đánh giá sự ảnh hưởng của người dùng theo Twitter. Dựa trên ba giai đoạn phân tích ngữ nghĩa tinh vi (True Reach, Amplification Probability, Network Value) mà Klout có thể xác định không chỉ cấp độ ảnh hưởng của bất kỳ người dùng nào trên Twitter mà còn cả những quan điểm có ảnh hưởng lớn nhất theo các chủ đề hoặc từ khóa. Còn Bing, công cụ tìm kiếm của Microsoft, cũng đang đưa các tweet vào tập kết quả tìm kiếm thời gian thực, và biết đâu có thể tích hợp công cụ đánh giá mức ảnh hưởng của Klout vào để xếp hạng các tweet hay những mục tiêu xã hội khác nhằm đưa ra các kết quả tìm kiếm đúng nhất.
Song, cho dù ý tưởng về xếp hạng sự ảnh hưởng trên web kết nối mạng xã hội đã trở nên cần thiết và gây được sự quan tâm đáng kể thì cũng phải một thời gian dài nữa nó mới được hoàn thiện. Ngày nay, việc thực hiện tìm kiếm theo bất cứ công cụ nào cũng chỉ để củng cố thêm quan điểm này. Tuy nhiên, chính nhận định chung về vấn đề như vậy lại đang giúp đỡ chúng ta thông qua việc giảm bớt các trở ngại thường ngăn cản hoặc kéo dài quá trình tìm kiếm thông tin thích hợp. Theo thời gian, điều này sẽ được cải thiện mà không cần quan tâm tới các quan điểm cá nhân trong việc thiết lập hệ thống đánh giá mức độ ảnh hưởng của mọi người theo các kênh truyền thông xã hội.
Và ngay khi tiếp tục phát triển, thuật toán trí tuệ nhân tạo sẽ làm biến đổi định nghĩa cùng lô-gíc về các mối quan hệ. Chúng ta đang thích ứng cách thức kết nối tới người khác cũng như đang định ra những hướng đi mới đối với việc chia sẻ, chắt lọc và xếp hạng các mục đích kết nối mạng xã hội liên quan. Những mối ràng buộc này giờ đây buộc chúng ta phải đáp ứng được nguồn nhu cầu về cách thức khám phá và khai thác thông tin. Và như vậy, những mối quan hệ chúng ta duy trì trên web kết nối mạng xã hội sẽ quyết định được việc xếp hạng nội dung chúng ta tạo ra cùng vị thế của nó trong phạm vi cấp độ xã hội của những kết quả tìm kiếm.
Có lẽ những phát triển tới đây về tối ưu hóa công cụ tìm kiếm (Search Engine Optimization –SEO) và tối ưu hóa các kênh truyền thông xã hội (Social Media Optimization – SMO) sẽ tập trung vào việc nâng cao các cấu trúc liên kết của những mối quan hệ nhân tạo để phân tách được sự nổi bật về tầm cỡ của cá nhân cũng như những mục đích xã hội mà chúng ta đưa ra và chia sẻ.
(Minh Hà dịch từ briansolis//tinkinhte.com)
Chuyển nhượng, cho thuê hoặc hợp tác phát triển nội dung trên các tên miền:
Quý vị quan tâm xin liên hệ: tieulong@6vnn.com