O Google anunciou, nesta terça-feira (14), o seu mais novo modelo generativo de vídeos, o Veo, que faz parte da ferramenta VideoFX. A novidade vai permitir a criação de vídeos com base em prompts de texto e chega como uma concorrente à Sora da OpenAI.
A ferramenta foi divulgada em uma transmissão ao vivo durante a Google I/O 2024. Além de permitir a criação de conteúdos, a plataforma permitirá uma interação com outras tecnologias da empresa, como a ferramenta para criar músicas a partir de IA.
O que é o Veo
Durante a revelação da mais recente inteligência artificial desenvolvida pelo Google para a criação de vídeos, um ponto de destaque foi enfatizado: o Veo vai além da típica duração de um minuto, oferecendo resultados em resolução 1080p e a habilidade de explorar uma variedade de estilos cinematográficos e visuais.
Segundo a empresa, essa IA possui um conhecimento avançado tanto em linguagem natural quanto em semântica visual, permitindo uma renderização mais precisa mesmo diante de comandos mais longos e detalhados.
O Google afirma que o Veo é capaz de gerar conteúdos consistentes e coesos, nos quais pessoas, animais e objetos se movem de maneira realista ao longo dos vídeos. Além disso, a ferramenta é capaz de compreender termos específicos do universo cinematográfico, como “timelapse” e “gravação aérea de uma paisagem”, proporcionando assim um maior controle criativo sobre os resultados desejados.
A apresentação da nova IA foi direcionada a um grupo de cineastas e criadores, que tiveram a oportunidade de experimentar o modelo e fornecer feedback à empresa, contribuindo para possíveis melhorias futuras.
O Google também anunciou que alguns recursos do Veo serão gradualmente integrados ao YouTube Shorts e a outros produtos da empresa, embora sem especificar uma data para isso.
VideoFX
O VideoFX é um portal acessado através do próprio navegador para usar o Veo, modelo generativo criado pela empresa para competir com o Sora, da OpenAI. Atualmente, a novidade está disponível em fase experimental apenas nos Estados Unidos.
Apenas com um prompt de texto, imagem ou vídeo, os novos recursos permitem criar e editar vídeos de mais de 60 segundos em diferentes estilos visuais, permitindo que o usuário possa explorar as mais diferentes ideias.
De acordo com o Google, a ferramenta também traz algumas opções de edição, como o modo Storyboard para trabalhar as cenas geradas, além da inclusão de músicas e efeitos sonoros.
Os moradores dos Estados Unidos podem ter acesso à ferramenta através de uma lista de espera. No momento, não há previsão para o lançamento no Brasil e em outros países.
ImageFX
O Google também anunciou o Imagem 3, disponível no ImageFX do Google Labs. Com ele, é possível criar imagens completamente novas partindo de um prompt de texto, algo muito parecido com o que vemos no MidJourney, por exemplo.
Com a 3ª geração, o Google promete que os usuários terão imagens igualmente fiéis à realidade, graças as melhorias na qualidade e fidelidade da geração de imagens.
Ainda segundo a gigante de Mountain View, o Imagem 3 será até mesmo capaz de colocar palavras e frases nas imagens, algo que ainda apresenta alguns problemas em plataformas com propostas similares.
MusicFX
O Google anunciou ainda mais uma ferramenta de IA generativa para a criação de músicas, o MusicFX com AI Sandbox. A novidade, que chega em parceria com o YouTube, vai competir diretamente com empresas como a Moises.ai, que usa IA para separar as faixas de uma mesma música.
“Estas ferramentas foram concebidas para abrir um novo parque de criatividade, permitindo às pessoas criar novas secções instrumentais a partir do zero, transformar o som de novas formas e muito mais“, afirmou o Google durante a apresentação.
LearnLM
Por fim, o Google revelou a sua nova família de modelos generativos de IA ajustado para o aprendizado. O LearnLM é projetado para orientar os alunos de forma “conversacional” em uma variedade de assuntos.
“O LearnLM é baseado em pesquisa educacional, tornando as experiências de aprendizagem mais pessoais e envolventes”, explicou James Manyika, vice-presidente sênior de pesquisa, tecnologia e sociedade do Google Research, no do I/O do Google na terça-feira.
Atualmente, o LearnLM já está potencializado recursos em produtos do Google, inclusive no YouTube, nos aplicativos Gemini do Google, na Pesquisa Google e no Google Classroom.
Nos aplicativos Gemini, por exemplo, será possível, já nos próximos meses, criar chatbots personalizados que podem atuar como especialistas em vários assuntos. Os chatbots fornecerão orientações de estudo e atividades práticas, como questionários e jogos, respeitando as preferências individuais de cada aluno.
Veja também:
Google mostra Astra, rival do GPT-4o que vê o mundo real pela câmera do celular.
Fonte: Google.
Descubra mais sobre Showmetech
Assine para receber nossas notícias mais recentes por e-mail.