ChatGPT đang nhận một bản nâng cấp lớn được thiết kế để tăng tốc cuộc sống của bạn và loại bỏ các tác vụ nền nhàm chán, vốn thường làm chúng ta mất tập trung khỏi công việc, giải trí và nhiều hơn nữa. Tính năng ChatGPT Agent mới ra mắt khả năng duyệt web tự động hoàn toàn (agentic browsing) và sẽ sớm đến tay người dùng. Đây là bước tiến quan trọng, định hình lại cách chúng ta tương tác với trí tuệ nhân tạo, biến ChatGPT thành một trợ lý cá nhân mạnh mẽ và độc lập hơn bao giờ hết.
ChatGPT Agent: Nâng Tầm Sức Mạnh AI của OpenAI
ChatGPT đang được trang bị khả năng sử dụng các tác nhân AI (AI agents) được tự động hóa hoàn toàn, được biết đến với tên gọi ChatGPT Agent. Trước đây, ChatGPT có thể duyệt web và tìm kiếm thông tin cho bạn, nhưng bạn vẫn cần phải tương tác và hướng dẫn quá trình tìm kiếm. Giờ đây, ChatGPT Agent có thể tự động hóa tất cả các quy trình, yêu cầu và tác vụ này, hoàn thành chúng mà hầu như không cần sự can thiệp của người dùng.
Trong nhiều khía cạnh, ChatGPT Agent là sự kết hợp mạnh mẽ hơn của hai công cụ trước đây của OpenAI: Operator và Deep Research. Operator là nỗ lực trước đó của OpenAI về một tác nhân AI, có khả năng duyệt web, đặt lịch và hoàn thành một số tác vụ cơ bản. Trong khi đó, Deep Research là một công cụ nghiên cứu chuyên sâu, được thiết kế để đi sâu vào bất kỳ yêu cầu nào, tạo ra các báo cáo toàn diện với phân tích dữ liệu từ nhiều nguồn, nhưng nó không được thiết kế cho mức độ tương tác web như Operator.
Bằng cách kết hợp những công cụ này với sức mạnh của AI tác nhân (agentic AI), OpenAI đã tạo ra một công cụ có thể tự động duyệt web hoàn toàn cho bạn, tính đến hầu hết mọi thông tin bạn cung cấp. Hơn thế nữa, ChatGPT Agent có thể truy cập “ChatGPT connectors” cho phép bạn liên kết các ứng dụng và tài khoản vào tác nhân, nơi nó có thể tìm thấy thông tin rất cụ thể về bạn và yêu cầu của bạn. Ví dụ, bạn có thể kết nối Gmail, ứng dụng lịch của mình, v.v., biến AI tác nhân này thành một trợ lý cá nhân đầy đủ chức năng.
Giao diện ChatGPT Agent đang hiển thị tùy chọn và chờ xác nhận từ người dùng.
Ba Khả Năng Nổi Bật của ChatGPT Agent
Bạn có thể phân loại khả năng của ChatGPT Agent thành ba lĩnh vực chính:
- Tác vụ Tự động (Autonomous Tasks): ChatGPT Agent có thể hoàn thành các tác vụ phức tạp, nhiều bước mà không yêu cầu người dùng phải can thiệp liên tục. Điều này giúp tối ưu hóa thời gian và công sức đáng kể.
- Duyệt web (Web Browsing): Tác nhân này có thể duyệt web bên trong ChatGPT, bắt chước chính xác một người thật với các cú nhấp chuột và thao tác của nó. Nó cũng có thể điều hướng qua các biểu mẫu, một điều cực kỳ quan trọng trong môi trường internet ngày nay. Đây giống như một máy tính ảo trong ChatGPT, với cả giao diện dựa trên văn bản và trình duyệt trực quan mà Agent có thể lựa chọn sử dụng.
- Công cụ (Tools): OpenAI đã xác nhận rằng ChatGPT Agent có thể sử dụng tất cả các công cụ hiện có để hoàn thành nhiệm vụ của mình, chẳng hạn như truy cập API, thao tác tệp, nhập dữ liệu, suy luận và thậm chí là lập trình để hoàn thành công việc. Ví dụ, Agent có quyền truy cập vào thiết bị đầu cuối của riêng mình để thực hiện các tác vụ cụ thể hoặc sử dụng AI tạo sinh (generative AI) để tạo ra các hình ảnh độc đáo.
ChatGPT Agent của OpenAI đang tự động duyệt web và tương tác với các nội dung trực tuyến.
Đây là mô hình đầu tiên mà OpenAI đã huấn luyện có thể chuyển đổi liền mạch giữa các chức năng khác nhau này và “hộp công cụ thống nhất”. Sử dụng học tăng cường (reinforcement learning), Agent có thể quyết định khi nào nên sử dụng bất kỳ công cụ nào có sẵn, cho phép nó xử lý các yêu cầu và tác vụ phức tạp từng bước một. Theo thời gian, nó sẽ trở nên hiệu quả hơn trong việc hoàn thành nhiệm vụ, tăng tốc quá trình và nâng cao độ chính xác.
ChatGPT Agent Liệu Có Tự Ý Hành Động? Vấn Đề Bảo Mật Được Đảm Bảo?
Buổi trình diễn trực tiếp của OpenAI đã làm nổi bật một số tính năng bảo mật chính được tích hợp trong ChatGPT Agent:
Đầu tiên, mặc dù nó có thể hoàn thành các tác vụ theo yêu cầu, nhưng nó sẽ nhắc nhở bạn khi cần gửi biểu mẫu, đăng nhập vào trang web và các tác vụ quan trọng khác. Những điểm dừng này được thiết kế để ngăn chặn các vấn đề có thể phát sinh trong những tình huống cụ thể này. Tự động hóa rất tuyệt vời, nhưng ở thời điểm hiện tại, sự can thiệp của người dùng vẫn rất quan trọng.
OpenAI cũng đã huấn luyện Agent để từ chối các yêu cầu nguy hiểm, không an toàn hoặc mơ hồ mà nó không thể thực hiện. Điều này phù hợp chặt chẽ với các tiêu chuẩn an toàn hiện có của OpenAI, đảm bảo rằng nó không đi quá xa khỏi các giới hạn hiện tại của ChatGPT. Điều này chắc chắn sẽ làm một số người thất vọng khi họ tin rằng ChatGPT đã bị giới hạn quá nhiều, nhưng đó là một điều hợp lý khi tung ra các tác nhân AI tự động trên thế giới. Hơn nữa, tại thời điểm ra mắt, nó sẽ không thực hiện bất kỳ giao dịch mua nào mà không có xác nhận từ người dùng.
ChatGPT Agent đang sử dụng kết nối (connector) để tương tác với các ứng dụng và tài khoản bên ngoài.
Agent cũng đi kèm với một số công cụ mới để bảo vệ chống lại prompt injection, một loại tấn công độc hại mới tập trung vào các công cụ AI. Prompt injection là một vấn đề đối với tất cả các loại AI tạo sinh, nhưng đặc biệt đáng lo ngại khi các công cụ này sẽ bắt đầu duyệt web một cách tự động.
Theo đó, OpenAI đã xây dựng một số biện pháp bảo vệ mới vào Agent. Ví dụ, ChatGPT Agent chạy trong môi trường sandbox (sandboxed environment). Mặc dù nó có thể thực hiện thay đổi trên lịch của bạn, tải xuống tệp, v.v., OpenAI không muốn nó tương tác trực tiếp với hệ điều hành của bạn ở mức độ có thể gây hại, vì vậy họ cô lập công cụ này. Ngoài ra, nó sử dụng các bộ phân loại cụ thể để xác định các cuộc tấn công prompt injection và các loại thao túng khác, đồng thời được thiết kế để ngăn chặn chúng.
Thời Điểm Ra Mắt ChatGPT Agent và Tình Hình Cạnh Tranh
Trong một khoảnh khắc hiếm hoi đối với OpenAI, Sam Altman đã xác nhận rằng Agent sẽ ra mắt ngay lập tức. Người dùng đăng ký ChatGPT Pro sẽ nhận được 400 yêu cầu mỗi tháng, trong khi người đăng ký Plus và Team sẽ có giới hạn hơn với 40 yêu cầu.
Tuy nhiên, giống như hầu hết các tính năng mới của ChatGPT, ngay cả khi được ra mắt ngay lập tức, vẫn mất vài ngày để nó được cập nhật xuống tài khoản cụ thể của bạn, ngay cả khi bạn đã đăng ký một trong các gói dịch vụ nêu trên.
Đừng quên rằng, lĩnh vực duyệt web tự động hóa (in-browser agentic browsing) là một không gian rất sôi động. Đầu năm 2025, Opera đã ra mắt trình duyệt Agentic Neon ấn tượng của mình, trong khi Perplexity cũng đang thử nghiệm trình duyệt Comet được hỗ trợ bởi AI. Và không thể không nhắc đến gã khổng lồ chống virus Norton, dự kiến sẽ ra mắt Neo, một trình duyệt hỗ trợ AI khác, vào khoảng năm 2025. Như đã nói, các trình duyệt hỗ trợ AI đã xuất hiện, và chúng đang đổ bộ ồ ạt!
Tương Lai Năng Động của AI Tác Nhân
ChatGPT Agent đánh dấu một bước tiến vượt bậc trong hành trình phát triển của trí tuệ nhân tạo, biến một công cụ mạnh mẽ thành một trợ lý cá nhân gần như hoàn toàn tự động. Khả năng tự động hóa tác vụ, duyệt web thông minh và tích hợp công cụ rộng lớn sẽ thay đổi cách chúng ta làm việc và tương tác với công nghệ. Dù vẫn còn những cân nhắc về bảo mật và sự cần thiết của xác nhận từ người dùng, những cải tiến này hứa hẹn một tương lai nơi AI giúp chúng ta giải phóng khỏi những công việc lặp đi lặp lại, tập trung vào những gì thực sự quan trọng.
Hãy cùng chờ đón và trải nghiệm những tiện ích mà ChatGPT Agent mang lại trong thời gian tới. Bạn nghĩ sao về tính năng đột phá này của ChatGPT? Hãy chia sẻ ý kiến của bạn trong phần bình luận bên dưới!