Bản cập nhật ChatGPT mới nhất của OpenAI đã mang lại một nâng cấp vượt trội cho khả năng tạo hình ảnh của GPT-4o. Giờ đây, thay vì phải chuyển đổi sang DALL-E 3, người dùng có thể tạo ra những hình ảnh chất lượng cực cao trực tiếp bằng GPT-4o mà không cần bắt đầu một cuộc trò chuyện mới. Tuy nhiên, có một lưu ý nhỏ dành cho những người dùng ChatGPT miễn phí, ít nhất là ở thời điểm hiện tại.
Nâng Cấp Khổng Lồ Khả Năng Tạo Hình Ảnh của ChatGPT
Mô hình GPT-4o của OpenAI hiện là lựa chọn mặc định cho hầu hết các cuộc hội thoại trên ChatGPT. Nó có thể giải quyết một phạm vi câu hỏi rộng lớn, được OpenAI mô tả là “Tuyệt vời cho hầu hết các câu hỏi”. Và quả thực, GPT-4o xử lý thông tin nhanh chóng và chính xác, nhưng trước đây chỉ giới hạn ở văn bản.
Sau bản cập nhật vào ngày 25 tháng 3 năm 2025, GPT-4o đã có khả năng tạo ra những hình ảnh chất lượng cao với độ chi tiết đáng kinh ngạc, vượt trội hơn hẳn mô hình mà nó gần như thay thế là DALL-E 3. Hơn thế nữa, GPT-4o giờ đây có thể thực hiện các thao tác chỉnh sửa và điều chỉnh hình ảnh vượt xa khả năng của DALL-E 3. Các tùy chỉnh như chỉnh sửa hình ảnh, điều chỉnh màu sắc và phong cách, thay đổi tinh tế, thêm/bớt đối tượng ở tiền cảnh và hậu cảnh, cùng nhiều khả năng khác đều đã trở nên khả thi.
Hình ảnh người thợ săn quái vật giả tưởng với vết sẹo trên mặt, tóc trắng, đang mua sắm trong siêu thị hiện đại, được tạo bởi DALL-E 3.
Phiên bản hình ảnh người thợ săn quái vật giả tưởng tương tự, được tạo với độ chi tiết và chất lượng cao hơn bởi ChatGPT GPT-4o, minh họa khả năng cải tiến của AI.
Khả năng tạo văn bản trong hình ảnh cũng được cải thiện đáng kể. Việc tạo văn bản của DALL-E 3 chưa bao giờ là điểm mạnh (dù đây cũng không phải điểm mạnh của hầu hết các mô hình AI). Tuy nhiên, giờ đây, GPT-4o có thể tạo ra các infographic chi tiết với phần giải thích cụ thể về gần như bất kỳ chủ đề nào. Vị trí văn bản trong ảnh đã trở nên chính xác, sử dụng các kiểu chữ và hướng cụ thể mà không lo ngại về việc tạo ra hình ảnh mờ nhạt, kém chất lượng. Việc giữ lại chi tiết cũng là một cải tiến rõ ràng khác, với các đặc điểm cụ thể dễ dàng được truyền từ hình ảnh này sang hình ảnh khác mà không khiến ChatGPT thay đổi hoàn toàn cảnh quan hoặc tạo ra một hình ảnh hoàn toàn mới.
Hình ảnh một người đàn ông giống Einstein đang ăn kem tại công viên Central Park, được tạo bởi DALL-E 3.
Phiên bản hình ảnh người đàn ông giống Einstein ăn kem ở Central Park, được cải thiện rõ rệt về chi tiết và độ chân thực khi tạo bằng ChatGPT GPT-4o.
Một phần của chất lượng hình ảnh được nâng cấp đến từ quan hệ đối tác của OpenAI với các công ty như Shutterstock và một nhóm các nhà đào tạo đã dành nhiều giờ để chỉ ra những lỗi mà GPT-4o mắc phải trong quá trình tạo hình ảnh. Trao đổi với tờ Wall Street Journal, nhà nghiên cứu chính Gabriel Goh giải thích rằng kỹ thuật học tăng cường này cho phép GPT-4o tuân thủ chính xác các hướng dẫn của con người trên một phạm vi rộng lớn các yêu cầu tạo hình ảnh, và quá trình này chỉ cần “hơn 100 nhân viên” để hoàn thành. Khả năng tạo hình ảnh mới của ChatGPT thực sự rất ấn tượng, và chúng tôi khuyên bạn nên thử nó với bất kỳ chủ đề nào bạn muốn. Dĩ nhiên, nó vẫn chưa hoàn hảo; không có công cụ tạo hình ảnh AI nào là hoàn hảo. Nhưng đây là một bước nhảy vọt đáng kinh ngạc về chất lượng từ một mô hình tạo hình ảnh AI như DALL-E 3, vốn hữu ích nhưng chưa thực sự nổi bật, lên đến tầm mà GPT-4o hiện có thể đạt được.
Bản Cập Nhật Hình Ảnh Tuyệt Vời Của ChatGPT Đang Dần Đến Tay (Gần Như) Tất Cả Mọi Người
Đáng tiếc, do nhu cầu chưa từng có đối với GPT-4o, những người dùng ChatGPT miễn phí một lần nữa buộc phải chờ đợi tính năng mới này. Vào ngày 26 tháng 3 năm 2025, CEO của OpenAI, Sam Altman, đã xác nhận sự chậm trễ này mà không đưa ra khoảng thời gian cụ thể cho việc kết thúc.
Sự gia tăng quan tâm đã được dự kiến, nhưng không nhiều đến mức độ này. Điều đó có nghĩa là bạn sẽ phải chờ đợi thêm một thời gian nữa hoặc nâng cấp lên ChatGPT Plus với 20 đô la mỗi tháng. Công bằng mà nói, với những nâng cấp như thế này, việc nâng cấp lên ChatGPT Plus trở nên đáng giá hơn—thậm chí còn hơn cả thời điểm ra mắt mô hình nâng cấp trước đây của OpenAI, GPT-4.5.
Cũng cần lưu ý rằng, như một phần của bản nâng cấp GPT-4o, DALL-E 3 sẽ trở thành “mô hình tạo hình ảnh kế thừa của OpenAI”. Điều này có nghĩa là OpenAI cuối cùng sẽ loại bỏ DALL-E 3 khỏi ChatGPT, mặc dù hiện tại chưa có thời gian biểu cụ thể cho sự thay đổi này.