Você digita um texto com detalhes, espera um pouco e então, uma imagem nunca vista na internet é gerada com base na descrição escrita. É desta forma que podemos explicar a Imagen, nova IA do Google que foi anunciada pela empresa como uma opção interessante e que deve ajudar a indústria a entender mais sobre machine learning (aprendizado de máquina).
A novidade se junta às outras opções de inteligência artificial que já fazem o mesmo trabalho, mas os avanços da empresa de navegadores são maiores e o resultado é realmente impressionante. Confira os primeiros detalhes compartilhados agora mesmo.
Machine learning avançado
Com base em sistemas de inteligência artificial, o Google Research, braço de pesquisa do Google, apresentou os primeiros resultados que foram criados – ainda em fase de protótipo – com a Imagen. Ao digitar um texto, basta esperar que a ferramenta crie uma imagem do zero, sem a necessidade de enviar uma referência gráfica. A ideia é permitir que por meio dos recursos de inteligência artificial, a ferramenta consiga fotos em alta qualidade apenas tendo a digitação em texto como base.
(Captura de tela: Victor Pacheco/Showmetech)
Em testes realizados com “concorrentes” como o DALL-E, VQ-GAN+CLIP e Latent Diffusion Model, o Google ressaltou que a Imagen conseguiu entregar melhores resultados, o que coloca a ferramenta em destaque, pelo menos por agora. O trabalho da IA do Google acontece em 4 passos, que vão desde a criação da imagem até a adaptação para uma maior resolução.
(Foto: Reprodução/Google)
Os resultados são impressionantes, uma vez que os testes foram feitos com palavras aleatórias como “Ursinhos de pelúcia nadando nos Jogos Olímpicos 400m Borboleta”. Alguns testes foram mais além e foi possível perceber que os desenvolvedores se divertiram nos testes com o Imagen, confira mais algumas imagens geradas:
O Google é uma das empresas que mais tem investido em soluções de inteligência artificial nos últimos anos e basta olhar os avanços no Google Assistente para ter uma pequena prévia. Mais do que uma simples ferramenta que ativa ou desativa funções em seu smartphone, o assistente pessoal já consegue fazer ligações em tom natural, assim como em alguns aparelhos, não é mais necessário dizer “Ok Google” para continuar uma conversa com a assistente.
Durante o Google I/O 2022, uma novidade que levou o nome de Pathways Language Model (PaLM) conseguiu resolver problemas matemáticos com texto, entregando o resultado e explicação sobre como as informações foram obtidas.
(Foto: Reprodução/Google)
A empresa espera que o PaLM possa ser utilizado em diversos campos e por meio do machine learning, até mesmo aprender novos idiomas que não tem alta fluência.
Quem pode usar o Imagen?
Por agora, o uso da IA do Google não está liberado para o público, devido à empresa ter certo receio sobre como os resultados serão aproveitados. Como os dados para criar imagens foram retirados de “uma escala web não curada”, de acordo com a própria empresa, há o risco da IA de texto para imagem acabar entregando resultados que podem ser ofensivos para algumas minorias, ainda mais se for solicitada a criação de fotos com pessoas. Nos resultados divulgados, não há imagens com pessoas, então não sabemos ainda como isso aconteceria na prática.
(Foto: Reprodução/Google)
Ao mesmo tempo, o Google Research ressalta que os filtros de treinamentos foram filtrados para que ruídos e conteúdos inapropriados, como pornografia, insultos racistas e esteriótipos sociais. Em outras palavras: como o treinamento de inteligência artificial foi realizado com base do que está na internet, o Google teme que o Imagen seja utilizado para criar imagens que despertem gatilhos de ansiedade ou outros problemas.
(Foto: Reprodução/Google)
Na publicação que divulgou os resultados da IA, o Google também mandou um recado para seus concorrentes para que tomem o mesmo cuidado ao realizar o treinamento de suas inteligências artificiais na criação de fotos com pessoas.
O que você achou dos primeiros resultados divulgados? Diga pra gente nos comentários!
Veja também
Confira todos os detalhes sobre novos produtos do Google que foram apresentados durante o Google I/O 2022
Fontes: Google Research l CNET l Google Blog