Índice
Cerca de um mês e meio após o lançamento de seu modelo de linguagem para o público geral, o Google anunciou hoje a atualização para o Gemini 1.5. Entre as novidade, ele está mais rápido e tem capacidade para ler conteúdos mais longos. O Gemini 1.5 estará disponível para desenvolvedores com até um milhão de tokens. Confira o que foi anunciado.
O que chega com a atualização
O anúncio do Google para seu modelo de linguagem é mais uma mudança incremental que um novo lançamento. Em comparação com o modelo anterior, o Gemini 1.5 chega à internet com nova arquitetura que leva o nome de Mixture-of-Experts (MoE). Na prática, os modelos de linguagem serão divididos em pequenas redes neurais para melhor processamento e por meio de redes “especializadas”, em vez de serem lidas por gigantes parâmetros.
Tal novidade impacta diretamente no processamento de tarefas, que agora está mais rápido e pronto para realizar tarefas mais complexas. O Google também ressalta que o treinamento do Gemini está mais rápido. É importante lembrar que essa IA tem três variantes: Nano (nos smartphones Pixel), Pro (disponível no chatbot Gemini) e Ultra (disponível no Gemini Advanced para desenvolvedores).
O Google afirma que o Gemini 1.5 Pro tem poder de desempenho que se assemelha ao Ultra 1.0, e que ele está 87% mais rápido do que o foi apresentado no final do ano passado. A empresa afirma que, segundo os testes feitos internamente, ele está mais rápido e pode processar mais informações que a geração anterior.
Quando testado em um painel abrangente de avaliações de texto, código, imagem, áudio e vídeo, o 1.5 Pro supera o 1.0 Pro em 87% dos benchmarks usados para desenvolver nossos LLMs.
Google sobre novo lançamento do Gemini 1.5.
Maior capacidade de processamento
A janela de contexto é basicamente o local em que as informações são processadas em tokens. É importante lembrar que um token não é exatamente um parâmetro, mas sim blocos de dados utilizados para processar informações. A versão de dezembro de 2023 tinha suporte para até 32 mil tokens, o que já era muita coisa.
Porém, o Gemini 1.5 passou a ter uma janela de contexto de até 1 milhão de tokens. O poder de processamento é tão grande que, em testes divulgados pela empresa, a inteligência artificial conseguiu ler todo um arquivo PDF de 402 páginas sobre a missão Apolo 11, que levou o homem à Lua, e trazer três momentos cômicos, em apenas alguns segundos. Assista ao vídeo abaixo:
Outro exemplo mostrado foi a revisão de um filme mudo de 44 minutos de Buster Keaton. Ao receber o arquivo, a inteligência artificial do Google conseguiu identificar uma cena específica e dar mais informações sobre o momento do filme. Confira:
Com essa quantidade máxima de 1 milhão de tokens, a atualização do Gemini permitirá que a inteligência artificial analise até 1h de vídeo, 11h de áudio, 30 mil linhas de código ou mais de 700 mil palavras. E, como você percebeu nos exemplos, isso será feito em apenas alguns segundos.
Disponibilidade para público geral
Para este primeiro momento, apenas desenvolvedores devem aproveitar a atualização do Gemini, haja vista que ela estará disponível apenas pelo AI Studio ou Vertex AI em um contexto limitado.
Também é importante lembrar que a atualização do modelo de linguagem do Google ainda está em desenvolvimento e a empresa garante aos desenvolvedores com acesso antecipado 128 mil tokens para testes — os lotes de 1 milhão de tokens terão acesso restrito e serão liberados gradativamente.
Os primeiros testadores podem experimentar a janela de contexto de 1 milhão de tokens sem nenhum custo durante o período de teste, embora devam esperar tempos de latência mais longos com esse recurso experimental.
Google sobre novo lançamento do Gemini 1.5.
Em um futuro não tão distante, o modelo de linguagem será implementado aos serviços do Google, incluindo o assistente pessoal e o chatbot , que deixou de se chamar Bard e agora leva o nome de Gemini. Em quanto tempo você acredita que iremos usar a nova atualização do Gemini? Diga pra gente nos comentários!
Veja também
Como criar imagens no Bard, a IA do Google
Com informações: Google Blog l Google Brasil l The Verge
Revisado por Glauco Vital em 15/2/24.
Descubra mais sobre Showmetech
Assine para receber nossas notícias mais recentes por e-mail.