3 minutos de leitura

Nova Inteligência Artificial cria imagens a partir de texto

12 de maio de 2021

A OpenAI desenvolveu uma nova pesquisa em IA: a nova Inteligência Artificial cria imagens a partir de textos, usando 12 bilhões de parâmetros herdados da GPT-3

Depois do anúncio do GPT-3, uma linguagem de inteligência artificial que apareceu no ano passado, a OpenAI, instituição responsável por pesquisas na área de IA, mostrou os resultados de sua mais recente descoberta. Uma Inteligência Artificial cria imagens a partir de texto: ela é chamada de DALL-E. Usando 12 bilhões de parâmetros herdados da GPT-3, a DALL-E consegue desenvolver imagens de quase qualquer coisa que for escrita dentro dela, partindo do princípio que esteja numa linguagem “normal”, digamos assim.

A IA, cujo nome é derivado da personagem WALL-E, da Pixar, e inspirado também no dono dos mais belos bigodes do mundo, o pintor espanhol Salvador Dalí, consegue criar imagens um tanto curiosas ao mesclar animais e objetos, frutas, vegetais e afins também com objetos ou praticamente qualquer coisa que você imaginar (ou não imaginar, dada a quantidade de parâmetros).

Segundo o blog da OpenAI, isso mostra que a manipulação de imagens a partir de textos está finalmente ao alcance de mãos humanas. Se é que podemos considerar isso como humano – mas aí a questão fica para escritores e filósofos.

Ainda de acordo com o blog, o objetivo é analisar em que medida essa ferramenta consegue impactar determinadas profissões e facilitar certos trabalhos, como desenvolvimento de modelos industriais e outras produções do gênero.

Como a inteligência artificial cria imagens com o texto?

Usando combinações dos 12 bilhões de parâmetros entre texto e imagem, ela gera um modelo perfeito (ou quase perfeito, dependendo do que você colocar) daquilo que foi escrito. Pode parecer loucura só lendo essa matéria, mas a seguir deixo algumas imagens do que a IA é capaz e vocês tirem suas próprias conclusões. Ah, detalhe: ela consegue desenhar vários objetos de uma vez também.

A inteligência artificial dall-e cria imagens a partir de texto — A Inteligência Artificial cria imagens se baseando num texto, no caso: poltrona no formato de um abacate; poltrona imitando um abacate. (Imagem: OpenAI)

Achou isso curioso? Pois bem, não se preocupe que há mais. Muito mais. Considerando que a GPT-3 consegue escrever e prever textos com precisão quase literária, não é de se surpreender que ela também seja capaz de entender comandos como “o mesmo gato na parte de cima e como esboço na parte de baixo“.

Inteligência artificial dall-e cria uma imagem de gato e depois a imagem do mesmo gato desenhado — A quantidade de tentativas para se aproximar do resultado perfeito é, no mínimo, assustadora. (Imagem: OpenAI)

Até aqui você pode até considerar que a inteligência artificial cria imagens relacionando alguns conceitos que são mais ou menos semelhantes em algum grau (ainda que uma poltrona e um abacate não sejam exatamente parentes), mas ela também é capaz de montar fotos com coisas um tanto diferentes, quase como um Photoshop automático.

No caso, o texto dessa foi “caracol feito de harpa. caracol com a textura de uma harpa”. (Imagem: OpenAI)
Essa aqui é meio bizarra, mas é porque o texto é “ilustração de um rabanete branco bebê usando tutu passeando com um cachorro”. (Imagem: OpenAI)
A Inteligência Artificial cria imagens também a partir de um comando que denote tempo, como foi o caso desse texto: “telefones da década de [X]”, sendo X a década desejada. (Imagem: OpenAI)

Outras informações muito legais que os desenvolvedores forneceram são as de que a inteligência artificial cria imagens de qualquer canto do mundo: ela reconhece espaços geográficos e mesmo comidas típicas de países distantes. Além disso, a tecnologia pesquisada pela OpenAI também consegue traduzir frases e passá-las para o espectro visual numa habilidade chamada pelos especialistas de zero-shot reasoning.

Caso queira saber mais, não deixe de acessar o site da OpenAi, onde há vários exemplos de fotos como essa.

Fontes: Geekologie | OpenAI

Descubra mais sobre Showmetech

Assine para receber nossas notícias mais recentes por e-mail.

Inteligência Artificial (AI)

VEJA-TAMBÉM Mais Lidas

Melhores da Semana: Galaxy S25 no Brasil, Grammy 2025 e Apple Invites

Veja os lançamentos do Amazon Prime Gaming em fevereiro de 2025

LG apresenta soluções de sinalização digital na ISE 2025

EM ALTA Tags

Nova Inteligência Artificial cria imagens a partir de texto

Como a inteligência artificial cria imagens com o texto?

Descubra mais sobre Showmetech

Deixe um comentário Cancelar resposta

Melhores da Semana: Galaxy S25 no Brasil, Grammy 2025 e Apple Invites

Veja os lançamentos do Amazon Prime Gaming em fevereiro de 2025

LG apresenta soluções de sinalização digital na ISE 2025

Sabia que você pode votar no Oscar 2025? Veja como

OmniHuman-1: dona do TikTok lança IA que cria vídeos humanos a partir de uma única imagem

Nova Inteligência Artificial cria imagens a partir de texto

Como a inteligência artificial cria imagens com o texto?

Descubra mais sobre Showmetech

Deixe um comentário Cancelar resposta

Posts Relacionados