Báo Đồng Nai điện tử
En

Trí tuệ nhân tạo giúp nâng cao chất lượng tìm kiếm

09:10, 24/10/2020

Tìm kiếm là câu chuyện không bao giờ kết thúc vì nhu cầu tìm kiếm của con người ngày càng đa dạng và phong phú. Một công cụ tìm kiếm phải luôn được tinh chỉnh để thỏa mãn nhu cầu của người dùng. Với Google, ban đầu họ chỉ tìm kiếm trong vô số thông tin để lấy ra những gì bạn cần, nhưng giờ đây trí tuệ nhân tạo (AI) ngày càng giúp họ hiểu thế giới của chúng ta hơn với những phức tạp và sinh động của nó.

Tìm kiếm là câu chuyện không bao giờ kết thúc vì nhu cầu tìm kiếm của con người ngày càng đa dạng và phong phú. Một công cụ tìm kiếm phải luôn được tinh chỉnh để thỏa mãn nhu cầu của người dùng. Với Google, ban đầu họ chỉ tìm kiếm trong vô số thông tin để lấy ra những gì bạn cần, nhưng giờ đây trí tuệ nhân tạo (AI) ngày càng giúp họ hiểu thế giới của chúng ta hơn với những phức tạp và sinh động của nó.

Ông Prabhakar Raghavan trình bày về hệ thống hiểu ngôn ngữ BERT tại sự kiện trực tuyến Search On 2020
Ông Prabhakar Raghavan trình bày về hệ thống hiểu ngôn ngữ BERT tại sự kiện trực tuyến Search On 2020

22 năm, Google Tìm kiếm ngày càng thông minh hơn

22 năm trước, Google ra đời. Khi ấy internet chỉ mới phôi thai và là một chốn rất đơn giản, việc tìm kiếm được hiểu theo nghĩa hết sức cơ bản là: cho một chuỗi ký tự, hãy tìm sự xuất hiện chuỗi ký tự ấy trong các trang web đã biết.

Ví dụ như muốn biết khoảng cách từ Biên Hòa đi TP.HCM là bao xa, thì ta nhập vào ô Tìm kiếm: “khoảng cách Biên Hòa - TP.HCM” hay “cự ly Biên Hòa - TP.HCM”. Nếu trang web có nội dung “từ Biên Hòa đến TP.HCM là 30km” thì nó sẽ không được hiện ra trong kết quả tìm kiếm vì nó không có những chữ giống hệt như những chữ trong ô Tìm kiếm, dù rằng nó giải đáp đúng điều người ta cần tìm. Hoặc người dùng nhập chữ “TP.HCM” mà nội dung trang là “Thành phố Hồ Chí Minh”, cũng coi là không khớp.

22 năm sau, sự thể đã khác rất nhiều. Google không chỉ đơn giản là so từng chữ nữa mà nó hiểu ý nghĩa cả câu. Người hỏi có thể nhập vào ô Tìm kiếm câu hỏi: “Từ Biên Hòa đi TP.HCM bao xa?” và Google có thừa khả năng để tìm câu trả lời thích hợp. Còn hơn thế nữa, nếu trong câu hỏi hay cụm từ tìm kiếm có chữ viết tắt hay… sai chính tả, Google vẫn có thể đoán ra để tìm câu trả lời chính xác. Chưa dừng lại ở đó, sợ người dùng gõ phím mỏi tay và mất thời gian, Google chấp nhận cho người dùng bật micro lên và hỏi bằng giọng nói.

Tại sự kiện Search On 2020 diễn ra ngày 16-10-2020, Google giới thiệu những điều họ đang và sẽ cải tiến đối với công cụ tìm kiếm của mình dựa trên nền tảng AI. Phần sau đây tóm tắt những nét chính mà ông Prabhakar Raghavan, Phó chủ tịch cấp cao của Google, phụ trách về Search & Assistant, Geo, Ads, Commerce, Payments & NBU, đã công bố tại sự kiện này.

 Giúp bạn tìm thấy chính xác những gì bạn đang tìm kiếm

Có một thực tế là đôi khi bạn muốn tìm hiểu về một vấn đề gì đó mà không biết hỏi sao cho đúng. Nhiệm vụ của Google là phải hiểu được ý của người dùng để đưa ra kết quả phù hợp. Để làm được điều này, Google đã đầu tư sâu vào nghiên cứu hiểu ngôn ngữ và năm ngoái hệ thống hiểu ngôn ngữ BERT giúp cung cấp kết quả phù hợp hơn trong Google Tìm kiếm đã ra đời.

BERT là viết tắt của Bidirectional Encoder Representations from Transformers (tạm dịch Biểu diễn mã hóa hai chiều từ bộ chuyển đổi). Đây là kết quả nghiên cứu của Google về bộ chuyển đổi: các mô hình xử lý các từ liên quan đến tất cả những từ khác trong một câu, thay vì từng từ một theo thứ tự. Do đó, mô hình BERT có thể xem xét ngữ cảnh đầy đủ của một từ bằng cách xem xét các từ đứng trước và sau nó - đặc biệt hữu ích để hiểu mục đích đằng sau các truy vấn tìm kiếm. BERT đã được sử dụng trong hầu hết mọi truy vấn bằng tiếng Anh, giúp người dùng nhận được kết quả chất lượng cao hơn cho các câu hỏi của mình.

Google cho biết cứ 10 truy vấn thì có 1 truy vấn viết sai chính tả. Vì vậy, Google giới thiệu một thuật toán chính tả mới sử dụng mạng thần kinh sâu để cải thiện đáng kể khả năng giải mã lỗi chính tả. Thuật toán chính tả mới này giúp Google hiểu ngữ cảnh của các từ sai chính tả, vì vậy nó giúp người dùng tìm ra kết quả phù hợp, tất cả chỉ trong dưới 3 mili giây.

Những cải tiến ứng dụng AI khác là: cải thiện khả năng hiểu các đoạn văn cụ thể trên các trang web và chủ đề phụ (subtopics) xung quanh mối quan tâm - giúp cung cấp nội dung đa dạng hơn khi người dùng tìm kiếm một chủ đề rộng. Google cho biết họ sẽ bắt đầu triển khai tính năng này vào cuối năm 2020 bằng tiếng Anh.

Tìm trong video thông qua những khoảnh khắc quan trọng

Tìm kiếm trong nội dung video.

Kết quả tìm kiếm cho thấy nội dung cần tìm xuất hiện ở phút, giây thứ mấy trong video. Nguồn: Google
Kết quả tìm kiếm cho thấy nội dung cần tìm xuất hiện ở phút, giây thứ mấy trong video. Nguồn: Google

Một cải tiến thú vị là tìm trong nội dung video. Nếu trước đây khi tìm kiếm ta chỉ có thể tìm thấy video nếu trong tựa đề hay mô tả của nó có chứa từ khóa tìm kiếm, thì bây giờ có thể tìm thấy video mà trong nội dung của nó có chứa từ khóa tìm kiếm.

Bằng cách sử dụng phương pháp tiếp cận dựa trên AI, giờ đây Google có thể hiểu ngữ nghĩa sâu sắc của video và tự động xác định những khoảnh khắc quan trọng. Điều này cho phép Google gắn thẻ những khoảnh khắc đó trong video, vì vậy người dùng có thể tua đến đoạn đó trong video như lật từng chương trong một cuốn sách. Google đã bắt đầu thử nghiệm công nghệ này trong năm nay và hy vọng vào cuối năm 2020, 10% các lượt tìm kiếm trên Google sẽ có thể sử dụng công nghệ mới này.

Hiểu sâu hơn thông qua dữ liệu

Khi hỏi “có bao nhiêu người làm việc ở Chicago”, Google sẽ truy cập vào các bảng dữ liệu để tìm ra số liệu phù hợp. Nguồn: Google
Khi hỏi “có bao nhiêu người làm việc ở Chicago”, Google sẽ truy cập vào các bảng dữ liệu để tìm ra số liệu phù hợp. Nguồn: Google

Đôi khi kết quả tìm kiếm tốt nhất là một bảng thống kê, nhưng thường thì số liệu thống kê bị nằm khuất trong các bộ dữ liệu lớn và không dễ dàng hiểu được hoặc có thể truy cập tới được.

Kể từ năm 2018, Google đã làm việc trong dự án Data Commons, một cơ sở dữ liệu kiến thức mở về số liệu thống kê, khởi đầu với sự hợp tác của Cục Điều tra dân số Hoa Kỳ, Cục Thống kê Lao động, Ngân hàng Thế giới và nhiều tổ chức khác. Tập hợp các tập dữ liệu này lại với nhau là bước đầu tiên và giờ đây Google đang làm cho thông tin này dễ tiếp cận và hữu ích hơn thông qua Google Tìm kiếm.

Bây giờ khi người dùng hỏi một câu như “có bao nhiêu người làm việc ở Chicago”, Google sử dụng xử lý ngôn ngữ tự nhiên để ánh xạ tìm kiếm của họ tới một tập hợp cụ thể trong số hàng tỷ điểm dữ liệu trong Data Commons nhằm cung cấp số liệu thống kê dưới một hình thức trực quan, dễ hiểu.

Người dùng cũng sẽ tìm thấy các điểm dữ liệu và ngữ cảnh có liên quan khác - như số liệu thống kê cho các thành phố khác - để giúp họ dễ dàng khám phá chủ đề sâu hơn.

Tìm kiếm những gì bạn thấy và khám phá thông tin bằng 3D

Đối với nhiều chủ đề, nhìn thấy là yếu tố mấu chốt để hiểu. Một số tính năng mới như thực tế tăng cường (AR) trong Google Tìm kiếm giúp bạn tìm hiểu và khám phá thế giới theo những cách mới. Chúng ta đã thấy điều này khi ứng dụng AR để tìm kiếm khủng long, thú hoang dã… trên Google.

Nhiều người đang phải đối mặt với những thách thức khi học ở nhà và với Lens, giờ đây bạn có thể nhận được trợ giúp từng bước về bài tập về nhà về các vấn đề Toán, Hóa học, Sinh học và Vật lý.

Sự xa rời xã hội cũng đã thay đổi đáng kể cách chúng ta mua sắm, vì vậy, Google đang làm cho việc mua sắm trực quan những thứ bạn đang tìm kiếm trực tuyến trở nên dễ dàng hơn, cho dù bạn đang tìm kiếm một chiếc áo len hay muốn xem kỹ hơn một chiếc ô tô mới nhưng không thể thăm một phòng trưng bày.

Nếu bạn không biết cách tìm kiếm nó, hãy ngâm nga nó

Tất cả chúng ta đều đã từng có kinh nghiệm về giai điệu lởn vởn trong đầu nhưng lại không thể nhớ được lời bài hát. Giờ đây, khi những khoảnh khắc đó xuất hiện, bạn chỉ cần ngâm nga để tìm kiếm và các mô hình AI của Google có thể khớp giai điệu với bài hát phù hợp (xem trang Công nghệ Báo Đồng Nai ngày 19-10).

Phạm Hoài Nhân

(dựa theo thông tin cung cấp trong bài phát biểu của Prabhakar Raghavan, Senior Vice President, Search & Assistant, Geo, Ads, Commerce, Payments & NBU)


 

Tin xem nhiều
Liên kết hữu ích