Índice
- O que é o Gemini?
- Gemini Live
- Anotações durante consumo de conteúdo de vídeo
- Transcrição de chamadas
- IA agora se conecta a apps do Google
- Pesquisa a partir de screenshots e fotos
- Pixel Studio e Gemini: criação de imagens inovadoras com IA
- Disponibilidade e lançamento para tablets e smartphones
- Melhorias no Circule para Pesquisar
- Made By Google 2024
Durante o evento Made by Google, sediado em São Francisco, Califórnia, nesta terça-feira (13), a gigante da tecnologia revelou novidades significativas para o Gemini, a inteligência artificial da empresa, por meio da transmissão do evento em seu canal do YouTube. A ferramenta promete transformar a interação dos usuários com seus dispositivos, ampliando a criatividade e a produtividade por meio de um assistente de IA avançado e ainda mais multifacetado. Veja os detalhes.
O que é o Gemini?
Lançado em dezembro do ano passado, o Gemini substituiu o Bard e se destaca por sua capacidade de lidar com tarefas complexas, desde codificações até raciocínio lógico avançado. Esta inteligência artificial é projetada para auxiliar os usuários em uma variedade de tarefas, manipulando e combinando diferentes tipos de arquivos e informações, incluindo:
- Textos
- Imagens
- Áudios
- Vídeos
- Linguagens de programação
O Gemini possui três modos de operação, cada um com características específicas:
- Gemini Nano: Ideal para tarefas em dispositivos móveis, oferecendo eficiência e praticidade, e permitindo realizar atividades de IA diretamente no dispositivo, mesmo sem acesso à internet. É a versão mais democrática, disponível no maior número de dispositivos.
- Gemini Ultra: Adequado para tarefas altamente complexas, com maior capacidade de processamento.
- Gemini Pro: Perfeito para escalar uma ampla gama de tarefas, e a nova versão Gemini 1.5 Pro promete superar a concorrência com suas capacidades avançadas.
Gemini Live
O grande destaque do evento foi o lançamento do Gemini Live, um recurso que promete tornar a interação com o assistente do Google mais natural e fluida. O Gemini Live simula diálogos humanos, proporcionando uma conversa mais semelhante ao cotidiano, com 10 diferentes opções de vozes para personalizar a experiência do usuário.
Jenny Blackburn, vice-presidente de Experiência do Usuário (UX) do Google, destacou que essas melhorias ajudam os usuários em atividades criativas, brainstormings, resolução de problemas, e oferecem um suporte valioso para professores e estudantes, tornando o aprendizado mais envolvente e divertido.
Anotações durante consumo de conteúdo de vídeo
Outra inovação importante é a nova função da IA que permite ao Gemini ler a tela do Android e realizar ações sem interromper o que está sendo exibido. Por exemplo, o assistente pode fornecer informações adicionais enquanto um vídeo do YouTube está sendo reproduzido, facilitando a compreensão do conteúdo com anotações sobre o que está sendo exibido. Com o assistente ativo, será possível obter informações e dar comandos para a IA a partir do botão “Pergunte sobre esta tela”. Além disso, o Gemini agora pode gerar e compartilhar imagens diretamente em aplicativos como e-mail e mensagens.
Transcrição de chamadas
Quando estiver em uma chamada no Pixel 9, toque no menu de overflow “Mais” para acessar “Notas da Chamada”. A partir disso, o Google informará os participantes da chamada que a gravação está em andamento, com a tela indicando que o processo está em progresso. As chamadas precisam durar mais de 30 segundos para que o recurso de transcrição possa ser utilizado.
Após o encerramento da chamada, levará um momento para que as Notas da Ligação possam gerar o resumo. Ele aparecerá na aba ‘Recents’ com uma opção para visualizar a transcrição completa e ouvir o áudio, com base nas funcionalidades do Gemini Nano.
IA agora se conecta a apps do Google
Foi confirmado durante o evento que a nova atualização do Gemini irá permitir que a IA se conecte a outros aplicativos do Google, como o Gmail, calendário, agenda, YouTube, docs, planilhas, entre outros. Essa conexão acontece a partir do Google Workspace, que vai atuar justamente para agilizar processos durante a experiência do usuário com a plataforma.
No exemplo ao vivo durante a apresentação, o Google Gemini pôde simplificar a organização de um jantar. Bastou solicitar que a inteligência artificial encontrasse a receita de lasanha no Gmail, adicionasse os ingredientes à lista de compras no Google Keep e que, por fim, até criou uma playlist no YouTube Music para esta noite especial. Tudo isso feito de forma integrada, sem a necessidade de alternar entre aplicativos. Em breve, a expectativa, é de que novas extensões permitirão ainda mais integração entre serviços.
Pesquisa a partir de screenshots e fotos
Os novos recursos do Gemini permitem que a IA tenha acesso ao banco de imagens do celular, assim como da câmera do aparelho. Portanto, o usuário pode tirar uma foto de algum cartaz informativo de um show, por exemplo, e questionar o assistente sobre as datas contidas nele, para saber se existe algum compromisso agendado para o dia da apresentação musical.
Também será possível pesquisar os dados de screenshots, as capturas de tela. A partir do conteúdo exibido, outras informações serão facilmente pesquisadas, estando acessíveis campo de pesquisa do aparelho, como textos, telefones e até produtos.
Pixel Studio e Gemini: criação de imagens inovadoras com IA
O Pixel Studio é uma ferramenta inovadora que utiliza IA generativa para criar imagens novas a partir de comandos de texto. Com o Pixel Studio, você pode gerar imagens únicas e personalizadas, facilitando a criação de materiais visuais, como convites. Durante o evento de lançamento, a funcionalidade foi demonstrada com a criação de um convite, destacando a flexibilidade da ferramenta.
Além do Pixel Studio, a IA do Gemini também oferece capacidades avançadas na criação de imagens. Com base nas instruções e detalhes fornecidos pelo usuário, o Gemini pode gerar imagens em segundos.
Um exemplo demonstrado no vídeo de divulgação do Gemini no canal do YouTube do Google foi a criação de um flamingo usando um chapéu, com nuvens ao fundo, ilustrando a capacidade ousada e criativa da IA em gerar imagens personalizadas e complexas.
Disponibilidade e lançamento para tablets e smartphones
O Gemini Live está disponível a partir de hoje para assinantes do plano Gemini Advanced, inicialmente apenas em inglês, com outros idiomas previstos para serem adicionados nas próximas semanas. O recurso está disponível apenas para os smartphones da Pixel e da linha Galaxy. O preço, que também inclui 2 TB de armazenamento no Google Drive, é de R$ 96,99 por mês e a assinatura pode ser feita no site do Google One.
O Google também anunciou que o Gemini será lançado para tablets Android ainda nos próximos dias, otimizando o assistente para funcionar de forma eficiente tanto na nuvem quanto localmente, como no caso da linha Pixel 9, que utiliza o modelo de linguagem Gemini Nano.
Melhorias no Circule para Pesquisar
Originalmente lançado com a linha Samsung Galaxy S24, o Circule para Pesquisar agora permite que você compartilhe recortes diretamente com contatos via mensagem ou WhatsApp.
O funcionamento permanece o mesmo: pressione a barra inferior de navegação para acionar o Circule para Pesquisar e selecione o objeto desejado. A novidade é a adição de um botão “compartilhar” que abre o menu de compartilhamento do Android, facilitando a distribuição de informações.
Confira abaixo o vídeo de divulgação das funcionalidades.
Made By Google 2024
O que achou de todos os anúncios de hoje? Conte pra gente aqui nos comentários!
Veja também:
Revisado por Victor Pacheco em 13/08/2024