Depois do anúncio do GPT-3, uma linguagem de inteligência artificial que apareceu no ano passado, a OpenAI, instituição responsável por pesquisas na área de IA, mostrou os resultados de sua mais recente descoberta. Uma Inteligência Artificial cria imagens a partir de texto: ela é chamada de DALL-E. Usando 12 bilhões de parâmetros herdados da GPT-3, a DALL-E consegue desenvolver imagens de quase qualquer coisa que for escrita dentro dela, partindo do princípio que esteja numa linguagem “normal”, digamos assim.
A IA, cujo nome é derivado da personagem WALL-E, da Pixar, e inspirado também no dono dos mais belos bigodes do mundo, o pintor espanhol Salvador Dalí, consegue criar imagens um tanto curiosas ao mesclar animais e objetos, frutas, vegetais e afins também com objetos ou praticamente qualquer coisa que você imaginar (ou não imaginar, dada a quantidade de parâmetros).
Segundo o blog da OpenAI, isso mostra que a manipulação de imagens a partir de textos está finalmente ao alcance de mãos humanas. Se é que podemos considerar isso como humano – mas aí a questão fica para escritores e filósofos.
Ainda de acordo com o blog, o objetivo é analisar em que medida essa ferramenta consegue impactar determinadas profissões e facilitar certos trabalhos, como desenvolvimento de modelos industriais e outras produções do gênero.
Como a inteligência artificial cria imagens com o texto?
Usando combinações dos 12 bilhões de parâmetros entre texto e imagem, ela gera um modelo perfeito (ou quase perfeito, dependendo do que você colocar) daquilo que foi escrito. Pode parecer loucura só lendo essa matéria, mas a seguir deixo algumas imagens do que a IA é capaz e vocês tirem suas próprias conclusões. Ah, detalhe: ela consegue desenhar vários objetos de uma vez também.
Achou isso curioso? Pois bem, não se preocupe que há mais. Muito mais. Considerando que a GPT-3 consegue escrever e prever textos com precisão quase literária, não é de se surpreender que ela também seja capaz de entender comandos como “o mesmo gato na parte de cima e como esboço na parte de baixo“.
Até aqui você pode até considerar que a inteligência artificial cria imagens relacionando alguns conceitos que são mais ou menos semelhantes em algum grau (ainda que uma poltrona e um abacate não sejam exatamente parentes), mas ela também é capaz de montar fotos com coisas um tanto diferentes, quase como um Photoshop automático.
Outras informações muito legais que os desenvolvedores forneceram são as de que a inteligência artificial cria imagens de qualquer canto do mundo: ela reconhece espaços geográficos e mesmo comidas típicas de países distantes. Além disso, a tecnologia pesquisada pela OpenAI também consegue traduzir frases e passá-las para o espectro visual numa habilidade chamada pelos especialistas de zero-shot reasoning.
Caso queira saber mais, não deixe de acessar o site da OpenAi, onde há vários exemplos de fotos como essa.
Fontes: Geekologie | OpenAI
Descubra mais sobre Showmetech
Assine para receber nossas notícias mais recentes por e-mail.