Bản cập nhật ChatGPT mới nhất của OpenAI đánh dấu một bước tiến vượt bậc, mang đến nâng cấp lớn cho khả năng tạo hình ảnh của mô hình GPT-4o. Giờ đây, người dùng có thể trực tiếp tạo ra những hình ảnh chất lượng cực cao bằng GPT-4o ngay trong cuộc trò chuyện, loại bỏ nhu cầu phải chuyển sang DALL-E 3 riêng biệt. Tuy nhiên, vẫn có một số hạn chế nhất định đối với người dùng ChatGPT miễn phí, ít nhất là ở thời điểm hiện tại.
GPT-4o Đột Phá Khả Năng Tạo Hình Ảnh Trong ChatGPT
Mô hình GPT-4o của OpenAI hiện là lựa chọn mặc định cho hầu hết các cuộc trò chuyện trên ChatGPT, được đánh giá cao về khả năng xử lý nhiều loại câu hỏi với tốc độ và độ chính xác ấn tượng. Trước đây, nó chủ yếu hoạt động tốt với văn bản.
Sau bản cập nhật vào ngày 25 tháng 3 năm 2025, GPT-4o đã có thể tạo ra những hình ảnh chất lượng cao với độ chi tiết đáng kinh ngạc, vượt trội so với chất lượng của mô hình tiền nhiệm mà nó cơ bản thay thế là DALL-E 3. Hơn nữa, GPT-4o giờ đây còn có thể thực hiện chỉnh sửa và điều chỉnh hình ảnh vượt xa khả năng của DALL-E 3. Các tính năng như chỉnh sửa ảnh, điều chỉnh màu sắc và phong cách, thay đổi tinh tế, kiểm soát đối tượng tiền cảnh và hậu cảnh đều trở nên khả thi.
Hình ảnh một người đàn ông tóc trắng, phong trần với sẹo trên mặt giống thợ săn quái vật, đang mua sắm trong siêu thị hiện đại, được tạo bởi DALL-E 3.
Người đàn ông tóc bạc phong trần như thợ săn quái vật trong siêu thị, hình ảnh AI được tạo bởi GPT-4o của ChatGPT với độ chi tiết cao.
Khả năng tạo văn bản trong hình ảnh cũng được cải thiện một cách đáng kinh ngạc. Trong khi DALL-E 3 chưa bao giờ mạnh về điểm này (và đây cũng là điểm yếu chung của nhiều mô hình AI), GPT-4o giờ đây có thể tạo ra các infographic chi tiết với phần giải thích đầy đủ về gần như bất kỳ chủ đề nào. Vị trí văn bản trong hình ảnh giờ đây rất chính xác, sử dụng các kiểu chữ và hướng cụ thể mà không lo tạo ra hình ảnh AI bị mờ hoặc không rõ ràng. Khả năng giữ lại chi tiết cũng là một cải tiến rõ rệt khác, với các đặc điểm cụ thể dễ dàng được truyền từ hình ảnh này sang hình ảnh khác mà không khiến ChatGPT thay đổi hoàn toàn cảnh hoặc tạo ra một hình ảnh hoàn toàn mới.
Hình ảnh một người đàn ông giống Einstein đang ăn kem tại Công viên Trung tâm, được tạo ra bằng mô hình DALL-E 3.
Người đàn ông giống Einstein thưởng thức kem ở Central Park, ví dụ minh họa khả năng tạo ảnh của GPT-4o trong ChatGPT.
Một phần của việc nâng cấp chất lượng hình ảnh này đến từ sự hợp tác của OpenAI với các công ty như Shutterstock và một nhóm chuyên gia huấn luyện đã dành nhiều giờ để chỉ ra các lỗi mà GPT-4o mắc phải trong quá trình tạo hình ảnh. Trao đổi với Wall Street Journal, nhà nghiên cứu chính Gabriel Goh giải thích rằng kỹ thuật học tăng cường (Reinforcement Learning) này cho phép GPT-4o tuân thủ chính xác các hướng dẫn của con người trên nhiều yêu cầu tạo hình ảnh khác nhau, và quá trình này chỉ cần “hơn 100 nhân viên con người” để hoàn thành. Khả năng tạo ảnh mới của ChatGPT thực sự đáng kinh ngạc, và chúng tôi khuyến khích bạn nên thử nghiệm nó với bất kỳ chủ đề nào bạn mong muốn. Dù nó không hoàn hảo – không có công cụ tạo ảnh AI nào hoàn hảo – nhưng đây là một bước nhảy vọt đáng kể về chất lượng từ một mô hình tạo ảnh AI như DALL-E 3, vốn hữu ích nhưng chưa thực sự ấn tượng, sang khả năng mà GPT-4o hiện có.
Tình Hình Triển Khai Bản Cập Nhật Ảnh Cho Người Dùng ChatGPT
Đáng tiếc là do nhu cầu sử dụng GPT-4o tăng cao chưa từng có, người dùng ChatGPT miễn phí một lần nữa phải chờ đợi tính năng mới này. Vào ngày 26 tháng 3 năm 2025, CEO OpenAI Sam Altman đã xác nhận sự trì hoãn này mà không đưa ra một khung thời gian cụ thể cho việc kết thúc.
Sự gia tăng quan tâm đã được dự đoán, nhưng không đến mức lớn như vậy. Thật không may, điều đó có nghĩa là bạn sẽ phải chờ đợi thêm một chút hoặc nâng cấp lên ChatGPT Plus với chi phí 20 USD mỗi tháng. Công bằng mà nói, với những nâng cấp như thế này, việc nâng cấp lên ChatGPT Plus ngày càng trở nên xứng đáng hơn, thậm chí còn hơn cả thời điểm ra mắt mô hình trước đó của OpenAI là GPT-4.5.
Cần lưu ý rằng, như một phần của bản nâng cấp GPT-4o, DALL-E 3 sẽ trở thành “mô hình tạo ảnh kế thừa của OpenAI”. Điều này có nghĩa là OpenAI cuối cùng sẽ loại bỏ DALL-E 3 khỏi ChatGPT, mặc dù hiện tại chưa có lịch trình cụ thể cho sự thay đổi này.
Kết luận, GPT-4o đã thực sự định nghĩa lại khả năng tạo hình ảnh bằng AI với chất lượng và sự linh hoạt vượt trội. Dù người dùng miễn phí có thể phải chờ đợi, nhưng những cải tiến này khẳng định vị thế dẫn đầu của ChatGPT trong lĩnh vực AI tạo sinh. Bạn đã thử trải nghiệm khả năng tạo ảnh của GPT-4o chưa? Hãy chia sẻ cảm nhận của bạn dưới phần bình luận nhé!