Você digita um texto com detalhes, espera um pouco e então, uma imagem nunca vista na internet é gerada com base na descrição escrita. É desta forma que podemos explicar a Imagen, nova IA do Google que foi anunciada pela empresa como uma opção interessante e que deve ajudar a indústria a entender mais sobre machine learning (aprendizado de máquina).
A novidade se junta às outras opções de inteligência artificial que já fazem o mesmo trabalho, mas os avanços da empresa de navegadores são maiores e o resultado é realmente impressionante. Confira os primeiros detalhes compartilhados agora mesmo.
Machine learning avançado
Com base em sistemas de inteligência artificial, o Google Research, braço de pesquisa do Google, apresentou os primeiros resultados que foram criados – ainda em fase de protótipo – com a Imagen. Ao digitar um texto, basta esperar que a ferramenta crie uma imagem do zero, sem a necessidade de enviar uma referência gráfica. A ideia é permitir que por meio dos recursos de inteligência artificial, a ferramenta consiga fotos em alta qualidade apenas tendo a digitação em texto como base.
Em testes realizados com “concorrentes” como o DALL-E, VQ-GAN+CLIP e Latent Diffusion Model, o Google ressaltou que a Imagen conseguiu entregar melhores resultados, o que coloca a ferramenta em destaque, pelo menos por agora. O trabalho da IA do Google acontece em 4 passos, que vão desde a criação da imagem até a adaptação para uma maior resolução.
Os resultados são impressionantes, uma vez que os testes foram feitos com palavras aleatórias como “Ursinhos de pelúcia nadando nos Jogos Olímpicos 400m Borboleta”. Alguns testes foram mais além e foi possível perceber que os desenvolvedores se divertiram nos testes com o Imagen, confira mais algumas imagens geradas:
O Google é uma das empresas que mais tem investido em soluções de inteligência artificial nos últimos anos e basta olhar os avanços no Google Assistente para ter uma pequena prévia. Mais do que uma simples ferramenta que ativa ou desativa funções em seu smartphone, o assistente pessoal já consegue fazer ligações em tom natural, assim como em alguns aparelhos, não é mais necessário dizer “Ok Google” para continuar uma conversa com a assistente.
Durante o Google I/O 2022, uma novidade que levou o nome de Pathways Language Model (PaLM) conseguiu resolver problemas matemáticos com texto, entregando o resultado e explicação sobre como as informações foram obtidas.
A empresa espera que o PaLM possa ser utilizado em diversos campos e por meio do machine learning, até mesmo aprender novos idiomas que não tem alta fluência.
Quem pode usar o Imagen?
Por agora, o uso da IA do Google não está liberado para o público, devido à empresa ter certo receio sobre como os resultados serão aproveitados. Como os dados para criar imagens foram retirados de “uma escala web não curada”, de acordo com a própria empresa, há o risco da IA de texto para imagem acabar entregando resultados que podem ser ofensivos para algumas minorias, ainda mais se for solicitada a criação de fotos com pessoas. Nos resultados divulgados, não há imagens com pessoas, então não sabemos ainda como isso aconteceria na prática.
Ao mesmo tempo, o Google Research ressalta que os filtros de treinamentos foram filtrados para que ruídos e conteúdos inapropriados, como pornografia, insultos racistas e esteriótipos sociais. Em outras palavras: como o treinamento de inteligência artificial foi realizado com base do que está na internet, o Google teme que o Imagen seja utilizado para criar imagens que despertem gatilhos de ansiedade ou outros problemas.
Na publicação que divulgou os resultados da IA, o Google também mandou um recado para seus concorrentes para que tomem o mesmo cuidado ao realizar o treinamento de suas inteligências artificiais na criação de fotos com pessoas.
O que você achou dos primeiros resultados divulgados? Diga pra gente nos comentários!
Veja também
Confira todos os detalhes sobre novos produtos do Google que foram apresentados durante o Google I/O 2022
Fontes: Google Research l CNET l Google Blog
Descubra mais sobre Showmetech
Assine para receber nossas notícias mais recentes por e-mail.