Giai đoạn tiếp theo của Google Tìm kiếm: ngữ cảnh là vua

Tại sự kiện Search On ngày hôm nay, Google đã giới thiệu một số tính năng mới, kết hợp lại với nhau, là những nỗ lực mạnh mẽ nhất của họ để khiến mọi người thực hiện nhiều hơn là nhập một vài từ vào hộp tìm kiếm. Bằng cách tận dụng công nghệ máy học mô hình hợp nhất đa nhiệm (MUM) mới của mình theo những cách nhỏ, công ty hy vọng sẽ khởi động một chu kỳ hiệu quả: nó sẽ cung cấp các câu trả lời chi tiết hơn và giàu ngữ cảnh hơn, đồng thời hy vọng người dùng sẽ hỏi chi tiết và ngữ cảnh hơn – câu hỏi phong phú. Công ty hy vọng kết quả cuối cùng sẽ là trải nghiệm tìm kiếm phong phú và sâu sắc hơn.

Google SVP Prabhakar Raghavan giám sát tìm kiếm cùng với Trợ lý, quảng cáo và các sản phẩm khác. Anh ấy thích nói – và lặp lại trong một cuộc phỏng vấn vào Chủ nhật vừa qua – rằng “tìm kiếm không phải là một vấn đề đã được giải quyết”. Điều đó có thể đúng, nhưng những vấn đề mà anh ấy và nhóm của anh ấy đang cố gắng giải quyết bây giờ không liên quan đến việc quấn quanh web mà còn liên quan đến việc thêm ngữ cảnh vào những gì họ tìm thấy ở đó.

Về phần mình, Google sẽ bắt đầu linh hoạt khả năng nhận ra các chòm sao của các chủ đề liên quan bằng cách sử dụng máy học và trình bày chúng cho bạn một cách có tổ chức. Một thiết kế lại sắp tới đối với tìm kiếm của Google sẽ bắt đầu hiển thị các hộp “Những điều cần biết” đưa bạn đến các chủ đề phụ khác nhau. Khi có một phần của video có liên quan đến chủ đề chung – ngay cả khi không có toàn bộ video – thì phần đó sẽ đưa bạn đến đó. Kết quả mua sắm sẽ bắt đầu hiển thị khoảng không quảng cáo có sẵn trong các cửa hàng lân cận và thậm chí cả quần áo theo các kiểu khác nhau liên quan đến tìm kiếm của bạn.

Về phần bạn, Google đang cung cấp – mặc dù có lẽ “hỏi” là một thuật ngữ tốt hơn – những cách mới để tìm kiếm vượt ra ngoài hộp văn bản. Họ đang thực hiện một nỗ lực tích cực để đưa phần mềm nhận dạng hình ảnh Google Lens của mình đến nhiều nơi hơn. Nó sẽ được tích hợp vào ứng dụng Google trên iOS và cả trình duyệt web Chrome trên máy tính để bàn. Và với MUM, Google hy vọng sẽ giúp người dùng làm được nhiều việc hơn là chỉ xác định hoa hoặc địa danh, mà thay vào đó, sử dụng Lens trực tiếp để đặt câu hỏi và mua sắm.

“Đó là một chu kỳ mà tôi nghĩ sẽ tiếp tục leo thang,” Raghavan nói. “Nhiều công nghệ hơn dẫn đến khả năng chi trả của người dùng nhiều hơn, dẫn đến khả năng biểu đạt tốt hơn cho người dùng và sẽ đòi hỏi nhiều hơn ở chúng tôi, về mặt kỹ thuật.”


Google Lens sẽ cho phép người dùng tìm kiếm bằng hình ảnh và tinh chỉnh truy vấn của họ bằng văn bản.
Hình ảnh: Google

Hai mặt đó của phương trình tìm kiếm có nghĩa là bắt đầu giai đoạn tìm kiếm tiếp theo của Google, một giai đoạn mà các thuật toán máy học của nó trở nên nổi bật hơn trong quá trình này bằng cách tổ chức và trình bày thông tin trực tiếp. Trong đó, nỗ lực của Google sẽ được giúp đỡ rất nhiều bởi những tiến bộ gần đây trong xử lý ngôn ngữ AI. Nhờ các hệ thống được gọi là các mô hình ngôn ngữ lớn (MUM là một trong những mô hình này), máy học đã trở nên tốt hơn nhiều trong việc lập bản đồ các kết nối giữa các từ và chủ đề. Đó là những kỹ năng mà công ty đang tận dụng để làm cho tìm kiếm không chỉ chính xác hơn mà còn mang tính khám phá nhiều hơn và hy vọng sẽ hữu ích hơn.

Một trong những ví dụ của Google là mang tính hướng dẫn. Bạn có thể không biết đầu tiên các bộ phận của xe đạp của bạn được gọi là gì, nhưng nếu có gì đó bị hỏng, bạn sẽ cần phải tìm ra điều đó. Google Lens có thể xác định trực quan derailleur (bộ phận thay đổi bánh răng treo gần bánh sau) và thay vì chỉ cung cấp cho bạn một phần thông tin rời rạc, nó sẽ cho phép bạn trực tiếp đặt câu hỏi về cách sửa lỗi đó, đưa bạn đến thông tin ( trong trường hợp này là kênh Youtube Berm Peak xuất sắc).

Việc thúc đẩy nhiều người dùng mở Google Lens thường xuyên hơn là điều hấp dẫn, nhưng bức tranh lớn hơn (có thể nói) là về nỗ lực của Google nhằm thu thập nhiều ngữ cảnh hơn về các truy vấn của bạn. Các tìm kiếm đa phương thức, phức tạp hơn kết hợp văn bản và hình ảnh đòi hỏi “một mức độ ngữ cảnh hóa hoàn toàn khác mà nhà cung cấp chúng tôi phải có, và do đó, nó giúp chúng tôi rất nhiều để có nhiều ngữ cảnh nhất có thể,” Raghavan nói.

Chúng ta đang ở rất xa cái gọi là “mười liên kết xanh” của kết quả tìm kiếm mà Google cung cấp. Nó đã hiển thị hộp thông tin, kết quả hình ảnh và câu trả lời trực tiếp từ lâu rồi. Các thông báo hôm nay là một bước khác, một bước mà thông tin Google cung cấp không chỉ là xếp hạng thông tin có liên quan mà còn là sự chắt lọc những gì máy móc của nó hiểu được bằng cách tìm kiếm trên web.

Trong một số trường hợp – cũng như mua sắm – sự chắt lọc đó có nghĩa là bạn có thể sẽ gửi cho Google nhiều lượt xem trang hơn. Đối với Lens, xu hướng đó rất quan trọng cần phải theo dõi: các tìm kiếm của Google ngày càng đẩy bạn đến các sản phẩm của chính Google. Nhưng có một mối nguy hiểm lớn hơn ở đây. Thực tế là Google đang nói với bạn nhiều thứ hơn trực tiếp làm tăng gánh nặng mà nó luôn phải chịu: nói với ít thành kiến ​​hơn.

Ý tôi là sự thiên vị theo hai nghĩa khác nhau. Đầu tiên là kỹ thuật: các mô hình học máy mà Google muốn sử dụng để cải thiện tìm kiếm có các vấn đề được ghi nhận rõ ràng về thành kiến ​​chủng tộc và giới tính. Họ được đào tạo bằng cách đọc nhiều trang web và kết quả là họ có xu hướng chọn những cách nói chuyện khó nghe. Những rắc rối của Google với nhóm đạo đức AI của họ cũng được ghi nhận rõ ràng vào thời điểm này – họ đã sa thải hai nhà nghiên cứu chính sau khi họ xuất bản một bài báo về chính chủ đề này. Với tư cách là Phó chủ tịch phụ trách tìm kiếm của Google, Pandu Nayak, đã nói với The VergeJames Vincent trong bài báo của mình về các thông báo MUM ngày hôm nay, Google biết rằng tất cả các mô hình ngôn ngữ đều có thành kiến, nhưng công ty tin rằng nó có thể tránh được việc “đưa nó ra để mọi người sử dụng trực tiếp”.


Một tính năng mới có tên “Những điều cần biết” sẽ giúp người dùng khám phá các chủ đề liên quan đến tìm kiếm của họ.
Hình ảnh: Google

Điều đó có thể xảy ra (và rõ ràng là có thể không), nó bỏ qua một câu hỏi hệ quả khác và một kiểu thiên vị khác. Khi Google bắt đầu trực tiếp cho bạn biết nhiều hơn về các tổng hợp thông tin của riêng mình, thì quan điểm mà Google đang nói là gì? Là nhà báo, chúng tôi thường nói về cách mà cái gọi là “xem từ hư không” là một cách không đầy đủ để trình bày báo cáo của chúng tôi. Quan điểm của Google là gì? Đây là một vấn đề mà công ty đã đối mặt trong quá khứ, đôi khi được gọi là vấn đề “một câu trả lời đúng”. Khi Google cố gắng cung cấp cho mọi người những câu trả lời ngắn gọn, dứt khoát bằng cách sử dụng các hệ thống tự động, nó thường dẫn đến việc phát tán thông tin xấu.

Trình bày với câu hỏi đó, Raghavan trả lời bằng cách chỉ ra sự phức tạp của các mô hình ngôn ngữ hiện đại. “Hầu hết tất cả các mô hình ngôn ngữ, nếu bạn nhìn vào chúng, đều được nhúng trong một không gian chiều cao. Có những phần nhất định của những không gian này có xu hướng có thẩm quyền hơn, những phần nhất định ít thẩm quyền hơn. Chúng tôi có thể đánh giá một cách máy móc những điều đó khá dễ dàng, ”ông giải thích. Raghavan cho biết thách thức sau đó là làm thế nào để trình bày một số sự phức tạp đó cho người dùng mà không làm họ choáng ngợp.

Nhưng tôi hiểu rằng câu trả lời thực sự là, ít nhất bây giờ, Google đang làm những gì có thể để tránh phải đối mặt với câu hỏi về quan điểm của công cụ tìm kiếm của mình bằng cách tránh các miền mà nó có thể bị buộc tội, như Raghavan đã nói. , “Biên tập quá mức.” Thông thường, khi nói chuyện với các giám đốc điều hành của Google về những vấn đề thiên vị và tin tưởng này, họ tập trung vào những phần dễ xác định hơn của những không gian chiều cao đó như “tính có thẩm quyền”.

Ví dụ: các hộp “Những điều cần biết” mới của Google sẽ không xuất hiện khi ai đó tìm kiếm những thứ mà Google đã xác định là “đặc biệt có hại / nhạy cảm”, mặc dù một người phát ngôn nói rằng Google không “cho phép hoặc không cho phép các danh mục được sắp xếp cụ thể, nhưng hệ thống của chúng tôi có thể hiểu được các chủ đề theo quy mô mà các loại tính năng này nên hoặc không nên kích hoạt. “

Tìm kiếm của Google, đầu vào, đầu ra, thuật toán và mô hình ngôn ngữ của nó đều trở nên phức tạp đến mức không thể tưởng tượng được. Khi Google nói với chúng tôi rằng bây giờ nó có thể hiểu nội dung của video, chúng tôi cho rằng nó có bộ máy tính toán để thực hiện điều đó – nhưng thực tế là ngay cả khi chỉ lập chỉ mục một kho dữ liệu khổng lồ như vậy cũng là một nhiệm vụ lớn khiến nhiệm vụ ban đầu của việc lập chỉ mục trang web ban đầu. (Google chỉ lập chỉ mục các bản ghi âm của một tập hợp con của YouTube, cho bản ghi, mặc dù với MUM, nó nhằm mục đích thực hiện lập chỉ mục trực quan và các nền tảng video khác trong tương lai).

Thông thường, khi bạn đang nói chuyện với các nhà khoa học máy tính, vấn đề nhân viên bán hàng đi du lịch sẽ xuất hiện. Đó là một câu hỏi hóc búa nổi tiếng khi bạn cố gắng tính toán con đường ngắn nhất có thể giữa một số thành phố nhất định, nhưng nó cũng là một phép ẩn dụ phong phú cho việc suy nghĩ thông qua cách máy tính thực hiện các kế hoạch của chúng.

Raghavan nói: “Nếu bạn đưa cho tôi tất cả các máy móc trên thế giới, tôi có thể giải quyết các trường hợp khá lớn. Nhưng đối với tìm kiếm, anh ấy nói rằng nó không thể giải quyết được và có lẽ không thể giải quyết được bằng cách ném nhiều máy tính hơn vào nó. Thay vào đó, Google cần đưa ra các phương pháp tiếp cận mới, như MUM, để tận dụng tốt hơn các tài nguyên mà Google có thể tạo ra trên thực tế. “Nếu bạn đưa cho tôi tất cả các máy móc ở đó, tôi vẫn bị giới hạn bởi sự tò mò và nhận thức của con người.”

Cách hiểu thông tin mới của Google rất ấn tượng, nhưng thách thức là nó sẽ làm gì với thông tin và cách trình bày thông tin. Điều buồn cười về vấn đề của nhân viên bán hàng lưu động là dường như không ai dừng lại và hỏi chính xác trường hợp đó là gì, anh ta đang cho tất cả khách hàng của mình xem điều gì khi anh ta đi từng cửa?

Bạn cũng có thể thích

Menu