O modelo de imagem generativa de IA mais recente e poderoso do Google, o Imagen 3, já está disponível para todos. Sim, mesmo se você não estiver inscrito em um nível pago do Gemini. O Google afirma que o Imagen 3 é o seu modelo de geração de imagens de “mais alta qualidade” e que permite um grau ainda maior de fotorrealismo, melhor acompanhamento de instruções e muito mais. Aqui está tudo que você precisa saber.
Leia também: Lançamento do iPhone SE 4 cada vez mais próximo: 5 grandes atualizações esperadas no mid-ranger da Apple
Modelo Imagen 3 para todos via Google Gemini: veja como você pode acessá-lo
Simplificando, tudo que você precisa fazer para acessar o Imagen 3 é visitar o site do Gemini ou abrir o aplicativo Gemini em um dispositivo compatível e digitar um prompt detalhado descrevendo o que você deseja das imagens. Um exemplo de sugestão poderia ser: “Um alienígena misterioso e futurista parado em uma floresta brilhante e bioluminescente sob um céu repleto de galáxias rodopiantes e estrelas distantes. O alienígena tem uma pele metálica e elegante com padrões iridescentes que mudam de cor conforme se move. Seus olhos grandes e reflexivos brilham com inteligência e tatuagens intrincadas brilham suavemente em seu corpo.”
Depois de enviar a solicitação, o modelo Imagen 3 do Google entra em ação e gera uma imagem em alguns segundos. Agora, você pode simplesmente baixar a imagem, ou se não gostar de algo nela, peça para Gêmeos fazer variações com novos detalhes.
Leia também: X apresenta novo modelo de pagamento para impulsionar o envolvimento do usuário premium e a receita do criador
Google afirma que sua IA agora entende melhor as solicitações
Sejamos realistas: nem todos enviarão solicitações ideais, cheias de detalhes, e é por isso que o Google tem trabalhado para melhorar a compreensão da IA. “Melhoramos significativamente a capacidade do Imagen 3 de entender prompts, o que ajuda os modelos a gerar uma ampla variedade de estilos visuais e capturar pequenos detalhes de prompts mais longos”, afirma o Google.
O que é ainda mais interessante é que este modelo entende nuances sutis, como ângulos de câmera e composição, para que você possa fornecer instruções para renderizar uma imagem de um ângulo ou lente específico. Além disso, o Google afirma que também renderiza melhor o texto, para que você possa criar imagens com texto rapidamente, com facilidade e precisão.
Leia também: Ratan Tata já foi contratado pela IBM, usou seu dispositivo para criar um currículo para emprego em…