Tech 12 Abr
O Google lançou o Gemini (antigo Bard) para rivalizar diretamente com grandes rivais como ChatGPT e Bing, e assim como seus concorrentes, a inteligência artificial também é capaz de produzir imagens!
Hoje, dando sequência ao nosso quadro de dicas e tutoriais, confira a seguir como gerar imagens com comando de texto através do Gemini e dê asas a sua imaginação!
De forma muito parecida com o que é visto em outras IAs, como DALL-E e Midjourney, o Gemini também permite aos seus usuários gerar imagens usando apenas comandos de texto. Assim, basta solicitar a imagem através de uma descrição e aguardar o resultado.
Mas atenção! Até a data deste tutorial, os comandos para geração de imagem precisam ser – obrigatoriamente – em inglês (ou alguma outra língua suportada). No entanto, é provável que isso seja algo passageiro, já que o recurso está recém-lançado. Ao longo dos próximos meses, o suporte total ao português deve ser incluído.
De qualquer forma, se você não tem o controle da língua inglesa, pode usar o Google Tradutor (ou até mesmo outras IAs) para te ajudar a traduzir seu prompt. Depois, é só colar a descrição traduzida no Gemini e mandar ver!
Confira como realizar o processo em detalhes logo a seguir:
- Primeiro, acesse o Gemini em seu navegador clicando aqui ou acessando www.gemini.google.com;
- Agora, insira a descrição da imagem que deseja gerar.
- Como exemplo, “create a photo of a cat jumping to catch a ball” – traduzido do português: “crie uma foto de um gato pulando para pegar uma bola”;
- Se desejado, anexe uma imagem como referência.
- Aguarde o processamento;
- Se não estiver satisfeito com os resultados, clique em “Gerar mais” para receber mais alternativas ou peça alterações das imagens geradas – a IA é capaz de entender o contexto.
Por padrão, a IA irá gerar 4 imagens diferentes para um mesmo comando. Clique sobre as imagens para vê-las ampliadas. Clique no ícone de seta localizado no canto direito da imagem para baixá-la em resolução total.
Confira as imagens geradas com o nosso prompt:
O Google Gemini usa o SynthID para inserir uma marca d’água e indicar que a imagem foi criada por inteligência artificial. Então, mesmo que não seja possível ver a marca a olho nu, é possível verificar a origem da imagem usando os softwares adequados.
É válido lembrar que, atualmente, as imagens geradas pelo Gemini não podem ser usadas para fins comerciais. As imagens podem ser usadas para fins educacionais ou de pesquisa, ou para fins estritamente pessoais.
Além do modelo de IA que será usado para gerar a imagem, saber descrever bem o que deseja pode ser um diferencial para melhores resultados. Por isso, considere esses pontos para escrever seus prompts:
- Seja (mais) específico: Inclua detalhes como cores, objetos, cenário, estilo e até mesmo iluminação. Evite descrições vagas ou genéricas.
- Seja sucinto: frases longas e muito complexas podem ser mais difíceis para a IA interpretar. Por isso, expresse sua ideia de forma clara e direta;
- Experimente: se você não ficou satisfeito com os primeiros resultados, experimente dar descrições variadas e gere novas imagens. Persiga o resultado que deseja;
- Forneça referências: dê exemplos do que você está buscando. Você pode fazer isso anexando uma imagem ou colando o link da imagem desejada;
- Explore a documentação da IA para aprender mais sobre os seus recursos.
Apesar dessas e de outras ferramentas de IA oferecerem resultados satisfatórios na geração de imagens, elas não são capazes de substituir a criatividade e a sensibilidade de nós seres humanos. A expressão artística ainda é uma expressão única da alma humana. Por isso, sempre que possível e necessário, opte por um artista de carne e osso.
Comentários