“Google lança recursos de IA personalizáveis: Gems e Imagen 3”

Google lança recursos de IA personalizáveis: Gems e Imagen 3

O Google anunciou que seus recursos de IA personalizáveis, Gems, serão lançados em breve para assinantes do Gemini Advanced. Gems permite que você personalize o chatbot Gemini como um especialista em qualquer assunto de sua escolha.

O Google também anunciou que seu modelo de geração de imagens Imagen 3 estará disponível para todos os usuários do Gemini em breve. O Imagen 3 pode criar imagens mais realistas, incluindo detalhes como luz solar e bigodes de animais.

Gems

Os assinantes do Gemini Advanced, que pagam US$ 20 por mês para acessar o modelo Gemini 1.5 Pro, poderão acessar Gems \”nos próximos dias\”, escreveu Dave Citron, diretor sênior de gerenciamento de produtos do Gemini Experiences, na publicação.

Gems são projetados para servir como especialistas em tópicos ou como incentivadores para metas como pensar em um projeto, gerar ideias para um evento, escrever legendas para postagens de mídia social ou servir como um companheiro de ginástica.

Para criar um Gem, você fornece instruções, dá um nome a ele e conversa com ele. O Gem se lembrará das instruções, para que você não precise começar do zero cada vez que interagir, como você faria com um chatbot tradicional, disse Citron.

O Google também está lançando Gems pré-fabricados, que incluem um instrutor de aprendizagem, um gerador de ideias, um guia de carreira, um editor de escrita e um parceiro de codificação.

Gems estarão disponíveis em 150 países em \”a maioria dos idiomas\”, de acordo com a publicação. Eles também estarão disponíveis para usuários corporativos e empresariais.

Imagen 3

O Google também anunciou que seu modelo de geração de imagens Imagen 3 estará disponível para todos os usuários do Gemini nos próximos dias.

No I/O, o Google disse que este novo modelo pode criar imagens mais realistas, incluindo detalhes como luz solar ou bigodes em animais. Ele também se lembra de incluir detalhes como flores silvestres ou pássaros em prompts mais longos. Além disso, o Imagen 3 pode gerar estilos \”como paisagens realistas, pinturas a óleo texturizadas ou cenas de claymation caprichosas\”, diz a postagem.

Citron observou que o Google fez \”progresso significativo\” na geração de imagens de pessoas com o Imagen 3. No entanto, o modelo não gerará imagens realistas de indivíduos identificáveis, menores de idade ou cenas excessivamente sangrentas, violentas ou sexuais.

O Imagen 3 usa a ferramenta SynthID para marcar imagens geradas por IA.

Gemini Advanced

Além do acesso a Gems e Gemini 1.5 Pro, os assinantes do Gemini Advanced têm uma janela de 1 milhão de tokens, que o CEO Sundar Pichai em maio disse que aumentará para 2 milhões de tokens ainda este ano.

Grandes modelos de linguagem como Gemini dividem as palavras em tokens para dar sentido às nossas consultas. Os tokens na janela de contexto ajudam o modelo a se lembrar de coisas. Quanto mais tokens ele tiver, melhor será sua memória. De acordo com os dados do Google, a janela de contexto de 1 milhão de tokens é capaz de ingerir 1.500 páginas de texto.

No entanto, em sua análise do Gemini Advanced, Imad Khan, do CNET, disse que o modelo era cheio de erros e não era um concorrente digno da assinatura do ChatGPT Plus da OpenAI, que também custa US$ 20 por mês.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima