O Google acaba de lançar o Imagen 4, sua mais recente aposta no campo da inteligência artificial generativa de imagens. A nova versão promete aprimoramentos significativos na renderização de texto dentro das imagens, superando o desempenho do seu antecessor, o Imagen 3. Além da versão principal, a empresa também introduziu o Imagen 4 Ultra, uma versão premium projetada para seguir prompts de texto com ainda mais precisão, ideal para usuários que buscam resultados refinados e detalhados.
O Imagen 4 padrão se posiciona como a opção versátil para a maioria das tarefas, enquanto o Imagen 4 Ultra mira em aplicações que exigem alta fidelidade às instruções textuais. Para ilustrar as capacidades do novo modelo, o Google demonstrou a criação de uma história em quadrinhos de três painéis, onde uma pequena nave espacial era atacada por um lagarto espacial gigante, incluindo efeitos sonoros como “Crunch!” e “Had!!”. A imagem gerada seguia o prompt de forma precisa, com um estilo que lembra animações 3D.
Outro exemplo destacado foi a geração de uma imagem a partir do prompt: “frente de um cartão postal vintage de Kyoto: pagoda icônica sob flores de cerejeira, montanhas nevadas ao longe, céu azul claro, cores vibrantes”. O Imagen 4 criou uma imagem que correspondia precisamente à descrição, embora com um estilo um tanto genérico. Apesar dos avanços, algumas avaliações iniciais indicam que, embora o Imagen 4 represente uma melhoria em relação ao seu antecessor, ele pode não superar completamente os líderes de mercado como Dall-E 3 e Midjourney 7 em termos de impacto visual e originalidade.
Origem: Link