ChatGPT đang nhận được một bản nâng cấp khổng lồ, được thiết kế để tăng tốc cuộc sống của bạn và loại bỏ các tác vụ nền tẻ nhạt làm chúng ta mất tập trung khỏi công việc, giải trí và nhiều hơn nữa. Tính năng ChatGPT Agent mới của nó sẽ ra mắt khả năng duyệt web tự động hoàn toàn (agentic browsing) và sẽ sớm đến tay người dùng. Đây là một bước tiến vượt bậc, biến ChatGPT từ một công cụ tìm kiếm thông tin đơn thuần thành một trợ lý AI tự động mạnh mẽ, có khả năng thực hiện hàng loạt tác vụ phức tạp với sự can thiệp tối thiểu từ người dùng. Với sự bổ sung này, OpenAI đang định hình lại cách chúng ta tương tác với trí tuệ nhân tạo, hứa hẹn một tương lai nơi các tác vụ lặp đi lặp lại được xử lý hoàn toàn tự động bởi AI.
OpenAI Nâng Tầm ChatGPT Với Sức Mạnh Của Agent
ChatGPT đang có được khả năng sử dụng các tác nhân AI tự động hoàn toàn, được gọi là ChatGPT Agent. Hãy hình dung thế này: Cho đến nay, ChatGPT có thể duyệt web và tìm kiếm thông tin cho bạn, nhưng bạn vẫn cần phải tương tác và hướng dẫn quá trình nghiên cứu của nó. Tuy nhiên, giờ đây ChatGPT Agent có thể tự động hóa hoàn toàn tất cả các quy trình, yêu cầu và tác vụ này, hoàn thành chúng mà hầu như không cần sự can thiệp của người dùng.
Giao diện ChatGPT Agent hiển thị trong cửa sổ trò chuyện, minh họa khả năng lựa chọn và tương tác tự động.
Về nhiều mặt, ChatGPT Agent là sự kết hợp của hai công cụ trước đây của OpenAI—Operator và Deep Research—để tạo ra một công cụ mạnh mẽ hơn đáng kể, có thể tự chủ hoàn thành các hành động. Operator là nỗ lực trước đây của OpenAI trong việc tạo ra một tác nhân AI, có khả năng duyệt web, đặt chỗ và hoàn thành một số tác vụ cơ bản. Trong khi đó, Deep Research là một công cụ nghiên cứu chuyên sâu được thiết kế để đào sâu vào bất kỳ yêu cầu nào được đưa ra, tạo ra các báo cáo toàn diện với phân tích dữ liệu từ nhiều nguồn, nhưng nó không được thiết kế cho cùng cấp độ tương tác web như Operator.
Việc kết hợp các công cụ này với sức mạnh của AI tự chủ (agentic AI) mang đến một công cụ có thể duyệt web hoàn toàn cho bạn, tính đến hầu hết mọi thông tin bạn cung cấp. Trong đó, ChatGPT Agent có thể truy cập “ChatGPT connectors” cho phép bạn liên kết các ứng dụng và tài khoản với tác nhân, nơi nó có thể tìm thấy thông tin rất cụ thể về bạn và yêu cầu của bạn. Ví dụ, bạn có thể kết nối Gmail, ứng dụng lịch của mình, v.v., và biến tác nhân AI này thành một trợ lý cá nhân toàn diện.
ChatGPT Agent của OpenAI đang duyệt web, thể hiện khả năng tương tác và thu thập thông tin trên internet.
Bạn có thể chia khả năng của ChatGPT Agent thành ba lĩnh vực chính:
- Tác vụ Tự động: ChatGPT Agent có thể hoàn thành các tác vụ phức tạp, đa bước mà không yêu cầu người dùng nhập liệu liên tục.
- Duyệt Web: Tác nhân có thể duyệt web trong ChatGPT, mô phỏng chính xác một con người thực với các cú nhấp chuột và thao tác của nó. Nó cũng có thể điều hướng các biểu mẫu, một điều rất quan trọng trong internet ngày nay. Đây là một máy tính ảo trong ChatGPT, có cả giao diện dựa trên văn bản và trình duyệt trực quan mà Agent có thể lựa chọn sử dụng.
- Công cụ Đa dạng: OpenAI đã xác nhận rằng ChatGPT Agent có thể sử dụng tất cả các công cụ đã có sẵn để hoàn thành tác vụ của nó, chẳng hạn như truy cập API, thao tác tệp, nhập dữ liệu, suy luận và thậm chí lập trình để hoàn thành công việc. Ví dụ, Agent có quyền truy cập vào terminal riêng để làm việc trên các tác vụ cụ thể hoặc sử dụng AI tạo sinh để tạo ra hình ảnh độc đáo.
ChatGPT Agent của OpenAI sử dụng kết nối (connector) để liên kết với các ứng dụng khác, minh họa khả năng tích hợp hệ sinh thái.
Đây là mô hình đầu tiên mà OpenAI đã huấn luyện có thể chuyển đổi liền mạch giữa các chức năng khác nhau và “bộ công cụ hợp nhất” (unified toolbox) này. Sử dụng học tăng cường (reinforcement learning), Agent có thể quyết định khi nào nên sử dụng bất kỳ công cụ nào có sẵn, cho phép nó xử lý các yêu cầu và tác vụ phức tạp từng bước một. Nhưng theo thời gian, nó sẽ trở nên hiệu quả hơn trong việc hoàn thành tác vụ, tăng tốc quá trình và nâng cao độ chính xác.
Bảo Mật Và An Toàn Với ChatGPT Agent: Liệu Có Tự Ý Hành Động?
Buổi livestream của OpenAI đã làm nổi bật một vài tính năng bảo mật chính được tích hợp trong ChatGPT Agent.
Đầu tiên, mặc dù nó có thể hoàn thành các tác vụ theo yêu cầu, nhưng nó sẽ nhắc nhở bạn khi cần gửi biểu mẫu, đăng nhập vào trang web và các tác vụ quan trọng khác. Những gián đoạn này được thiết kế để ngăn chặn các vấn đề phát sinh cụ thể trong các trường hợp này. Tự động hóa thật tuyệt vời, nhưng hiện tại, các đầu vào của người dùng vẫn rất quan trọng.
OpenAI cũng đã huấn luyện Agent từ chối các yêu cầu nguy hiểm, không an toàn hoặc mơ hồ mà nó không thể thực hiện. Điều này được điều chỉnh mạnh mẽ theo các tiêu chuẩn an toàn hiện có của OpenAI, đảm bảo nó không đi quá xa khỏi giới hạn hiện tại của ChatGPT. Điều này chắc chắn sẽ làm một số người thất vọng khi họ tin rằng ChatGPT đã bị khóa quá nhiều, nhưng nó là điều hợp lý khi tung ra các tác nhân AI tự động trên thế giới. Hơn nữa, tại thời điểm ra mắt, nó cũng sẽ không thực hiện bất kỳ giao dịch mua hàng nào mà không có xác nhận.
Agent cũng đi kèm với một số công cụ mới để bảo vệ chống lại prompt injection, một loại tấn công độc hại mới tập trung vào các công cụ AI. Prompt injection là một vấn đề đối với tất cả các loại AI tạo sinh, nhưng lại là mối lo ngại đặc biệt hiện nay khi các công cụ này sẽ bắt đầu duyệt web một cách tự động.
Theo đó, OpenAI đã xây dựng một số biện pháp bảo vệ mới vào Agent. Ví dụ, ChatGPT Agent chạy trong môi trường sandbox (hộp cát). Mặc dù nó có thể thay đổi lịch của bạn, tải xuống tệp, v.v., OpenAI không muốn nó tương tác trực tiếp với hệ điều hành của bạn ở cấp độ có thể gây ra thiệt hại, vì vậy nó cô lập công cụ này. Ngoài ra, nó sử dụng các bộ phân loại cụ thể để xác định các cuộc tấn công prompt injection và các loại thao túng khác, và được thiết kế để ngăn chặn chúng.
Thời Điểm Ra Mắt Và Bối Cảnh Thị Trường Của ChatGPT Agent
Thực tế, trong một khoảnh khắc hiếm hoi của OpenAI, Sam Altman đã xác nhận rằng Agent sẽ ra mắt ngay lập tức. Người đăng ký ChatGPT Pro sẽ nhận được 400 yêu cầu mỗi tháng, trong khi người đăng ký Plus và Team có giới hạn hơn là 40 yêu cầu.
Tuy nhiên, giống như hầu hết các tính năng mới của ChatGPT, ngay cả khi nó được ra mắt ngay lập tức, vẫn mất vài ngày để tính năng này đến được tài khoản cụ thể của bạn, ngay cả khi bạn đã đăng ký một trong các gói trên.
Đừng quên, lĩnh vực duyệt web tự động hóa (agentic browsing) trong trình duyệt là một không gian rất bận rộn. Đầu năm 2025, Opera đã ra mắt trình duyệt Neon tự động ấn tượng của mình, trong khi Perplexity cũng đang thử nghiệm trình duyệt Comet chạy bằng AI. Và đó là chưa kể gã khổng lồ chống vi-rút Norton cũng sẽ ra mắt Neo, một trình duyệt chạy bằng AI khác, vào khoảng năm 2025. Như đã nói, các trình duyệt được hỗ trợ bởi AI đã có mặt và chúng đang đến rất nhiều!
Với ChatGPT Agent, OpenAI một lần nữa khẳng định vị thế dẫn đầu trong cuộc cách mạng AI, mang đến một công cụ đột phá hứa hẹn thay đổi cách chúng ta làm việc và tương tác với công nghệ. Tính năng này không chỉ nâng cao hiệu quả công việc mà còn mở ra những khả năng mới cho việc tự động hóa trong cuộc sống hàng ngày. Hãy sẵn sàng trải nghiệm một cấp độ trợ lý AI hoàn toàn mới! Bạn có suy nghĩ gì về tính năng ChatGPT Agent này? Hãy chia sẻ ý kiến của bạn trong phần bình luận bên dưới và đừng quên tìm hiểu thêm các bài viết khác về trí tuệ nhân tạo và công nghệ mới nhất trên Thuthuatmoi.net nhé!