Bạn đã mệt mỏi với việc phải liên tục ra lệnh cho trợ lý AI của mình? Google đang hé lộ tầm nhìn về một trợ lý AI thế hệ mới, có khả năng hiểu ngữ cảnh xung quanh bạn, tự động đưa ra giải pháp và thực hiện chúng thay bạn. Mục tiêu cuối cùng là tạo ra một trợ lý toàn diện, “thấy và nghe” mọi thứ, có thể tự động nhận biết khi nào cần thiết và can thiệp mà không cần bạn phải ra lệnh thủ công.
Dự án mới này có tên là Project Astra, và Google đã trình diễn một số khả năng rất ấn tượng tại sự kiện I/O 2025.
Project Astra: Khi AI Thực Sự Hiểu Và Hành Động Thay Bạn
Trong một buổi trình diễn, người dùng gặp vấn đề với phanh xe đạp và yêu cầu Astra tìm hướng dẫn sử dụng xe đạp trực tuyến. Khi Astra tìm thấy hướng dẫn, nó được yêu cầu cuộn đến phần nói về phanh xe và thực hiện một cách hoàn hảo. Sau đó, người dùng tiếp tục yêu cầu Astra tìm kiếm video hướng dẫn trên YouTube và liên hệ với cửa hàng xe đạp để hỏi về các phụ tùng cần thiết. Ấn tượng hơn, Astra thậm chí có thể hỏi cửa hàng xem các phụ tùng đó có còn hàng hay không.
Theo báo cáo từ The Verge, trong một buổi demo khác, Bibo Xiu, quản lý sản phẩm trong nhóm Google DeepMind, đã dùng camera điện thoại của mình hướng vào một cặp tai nghe Sony và yêu cầu Astra nhận diện chúng. Astra trả lời rằng đó là tai nghe WH-1000XM4 hoặc WH-1000XM3, một sự nhầm lẫn mà ngay cả hầu hết con người cũng có thể gặp phải. Sau khi nhận diện, Xiu yêu cầu Astra tìm hướng dẫn và giải thích cách ghép nối tai nghe với điện thoại của cô. Ngay khi trợ lý AI đang giải thích, Xiu đã ngắt lời và yêu cầu nó tự ghép nối tai nghe cho cô. Đúng như bạn đoán, Astra đã hoàn thành nhiệm vụ mà không gặp bất kỳ vấn đề nào.
Từ các buổi demo, có vẻ như Astra đang mô phỏng các thao tác chạm màn hình để di chuyển xung quanh giao diện. Các chỉ báo ghi lại màn hình cũng cho thấy Astra đọc nội dung trên màn hình của bạn và quyết định nơi cần đi, điều hướng qua các giao diện người dùng khác nhau khi thực hiện nhiệm vụ của mình.
Tầm Nhìn Về Một Trợ Lý AI Phổ Quát Trong Tương Lai
Mặc dù rất ấn tượng, các bản demo này vẫn chưa hoàn hảo. Chúng vẫn yêu cầu người dùng nhập liệu, và trong trường hợp demo của Xiu, cô ấy đã phải tự kích hoạt tính năng cho phép Astra truy cập màn hình điện thoại của mình.
Hiện tại, Project Astra vẫn là một “bãi thử” cho những tham vọng AI táo bạo nhất của Google. Các tính năng hoạt động tốt ở đây cuối cùng sẽ được tích hợp vào các công cụ như Gemini và được cung cấp cho người dùng. Google khẳng định rằng tầm nhìn tối thượng của họ là “biến ứng dụng Gemini thành một trợ lý AI toàn năng sẽ thực hiện các tác vụ hàng ngày cho chúng ta.”
Google đang nỗ lực hết mình, dần loại bỏ các công cụ cũ để ưu tiên những công cụ mới hơn, được trang bị AI. Chế độ AI đang dần thay thế Google Search, và đã có danh sách các tính năng Gemini ấn tượng mà bạn nên thử.
Biểu tượng ứng dụng Google Gemini trên màn hình điện thoại thông minh
Ngay cả những hệ thống AI tiên tiến nhất hiện nay cũng yêu cầu bạn nhập các lệnh ở mỗi bước, cung cấp cho chúng dữ liệu và ngữ cảnh cần thiết, và đôi khi bạn vẫn cần thực hiện các thao tác thủ công. Với khả năng truy cập internet và các dịch vụ của Google, Astra đang tìm cách thay thế tất cả các thao tác nhập liệu này bằng cách truy cập thông tin của bạn từ các nền tảng khác nhau và xây dựng ngữ cảnh cần thiết để thực hiện hành động.
Đây không phải là một mục tiêu dễ đạt được, và chúng ta còn chưa kể đến các vấn đề về quyền riêng tư và bảo mật mà một trợ lý AI toàn năng như Astra có thể gây ra trong tương lai. Astra có thể đang thực hiện các tác vụ nặng nhọc cục bộ bằng cách sử dụng mô hình Gemini Nano, nhưng bản demo không cho thấy bất kỳ dấu hiệu nào của việc đó.
Việc xây dựng một trợ lý như thế này sẽ mất khá nhiều thời gian, nhưng với những buổi demo này, Google đã cho chúng ta thấy một cái nhìn thoáng qua về tương lai. Có thể nó sẽ không sớm xuất hiện, nhưng một trợ lý AI toàn năng đang dần hiện rõ, và chúng ta hoàn toàn có quyền mong đợi sự ra đời của nó.