Trong bài đăng ngày 13/10, Microsoft giới thiệu MAI-Image-1, mô hình chuyển văn bản thành hình ảnh với khả năng tạo ảnh có độ chân thực cao, đặc biệt ở các chi tiết về ánh sáng và phong cảnh. Hãng phần mềm Mỹ khẳng định tốc độ xử lý của công cụ này vượt trội so với nhiều đối thủ, giúp người dùng hiện thực hóa ý tưởng nhanh chóng trước khi tinh chỉnh qua phần mềm khác.

Một điểm đáng chú ý, Microsoft cho biết đã hạn chế tình trạng ảnh đầu ra bị trùng lặp, mang tính rập khuôn, bằng cách đánh giá kỹ chất lượng dữ liệu đầu vào, tập trung vào các tình huống sử dụng thực tế trong sáng tạo. Trình tạo ảnh hiện được thử nghiệm trên nền tảng LMArena, nơi người dùng so sánh và bình chọn ảnh đầu ra của các hệ thống AI.
Theo Engadget, MAI-Image-1 là một phần trong chiến lược phát triển mô hình AI riêng nhằm giảm sự lệ thuộc vào đối tác OpenAI. Trước đó, Microsoft đã công bố hai mô hình khác gồm MAI-Voice-1 (tạo giọng nói) và MAI-1-preview (chatbot).
Trong tương lai gần, MAI-Image-1 sẽ được tích hợp vào AI Copilot và Bing Image Creator hai công cụ AI quan trọng trong hệ sinh thái Microsoft. Dù là nhà tài trợ lớn của OpenAI, nhưng Microsoft được cho là đang mở rộng hợp tác với các bên khác như Anthropic, đồng thời đầu tư mạnh mẽ vào đào tạo mô hình riêng, trong bối cảnh quan hệ với OpenAI có dấu hiệu phức tạp.