O Google lançou ao público nesta terça-feira (14) o Gemini 1.5 Pro, um novo modelo de inteligência artificial capaz de entender até 14 livros ou duas horas de contexto.
Para superar os erros comumente cometidos por IA, como as alucinações, o presidente-executivo do Google, Sundar Pichai, diz que a empresa trabalhou para construir agentes de IA capazes de raciocinar e planejar para executar as tarefas especificadas.
Leia mais:
Ascensão da Meia Lua: Doodle do Google celebra última Lua minguante de novembro
Fintech confere se jogador de bet usa CPF de morto; veja o caminho do dinheiro das apostas
Proposta a respeito do fim da jornada 6x1 movimenta redes sociais
Preguiça resgatada em rodovia do Espírito Santo faz pose em selfie e viraliza
O lançamento ocorre um dia após a OpenAI ter lançado uma nova versão do ChatGPT, que impressionou as pessoas nas redes sociais pela capacidade de conversar em tempo real. Na apresentação, feita totalmente ao vivo, o chatbot cometeu alguns deslizes, como confundir a foto de uma pessoa com um tronco de árvore. As demonstrações do Google, no entanto, foram gravadas.
Um milhão de pessoas se inscreveram para testar o Gemini -a OpenAI diz que o ChatGPT tem mais de 100 milhões de usuários mensais.
Os agentes de IA do Google usam dados climáticos, informações de catálogos e mapas para adicionar contexto aos pedidos feitos pelo usuário, de acordo com a executiva da empresa para buscas, Liz Reid.
O Gemini, apresentado em fevereiro, foi a primeira IA treinada para compreender áudio, vídeo e texto ao mesmo tempo, como faz nova versão do ChatGPT. O Google, no entanto, foi criticado por editar vídeos para fazer as respostas do chatbot parecerem mais rápidas.
A empresa demonstrou como o Gemini pode identificar imagens pela câmera e conversar. O Gemini Pro, no entanto, não demonstrou as capacidades de variação de tom de voz nem de identificação de emoções, apresentadas pela OpenAI na segunda (13).
A versão do chatbot do Google capaz de entender imagens e conversar, chamadas de Projeto Astra, chegará ao público ainda neste ano. Participantes do programa de teste do Google já podem acessar a tecnologia. Já o aplicativo do ChatGPT com essas habilidades começa a estar disponível a partir da próxima segunda (20), para testadores selecionados.
Os assinantes do pacote Gemini Advanced, disponível por US$ 20 (R$ 104), terão acesso a uma quantidade predeterminada de interações com a versão mais avançada do modelo, o Gemini 1.5 Pro -serão 1,5 milhão de tokens, a unidade de conversão para geração de palavras correspondentes em média a uma sílaba. O Google não informou se usuários não pagantes terão acesso à tecnologia.
O Google diz que o modelo entende até 2 milhões de tokens de contexto -cerca de 14 livros de 400 páginas-, escala de entendimento sem par no mercado.
O gigante das buscas continua a apostar na integração de inteligência artificial com suas soluções para computador e smartphone. Em sua plataforma de trabalho, Workspace, o Gemini 1.5 poderá ajudar na redação de emails e de documentos no Google Docs. Também atuará como assistente na edição de planilhas. A ferramenta será lançada no dia 30 de maio.
A integração da IA terá um painel próprio nos aplicativos do Google, com sugestões de pedido para acelerar a interação com a inteligência artificial.
O Google mostrou relatos de programadores que usam também o Gemini para programar. A versão anterior da IA generativa da empresa, Bard, foi criticada por não se comparar ao ChatGPT no que tocava à geração de código de computação.
Após uma reunião no Google Meet, será possível pedir um resumo dos pontos mais importantes em debate no encontro ao Gemini.
No smartphones Android (sistema operacional do Google), será possível, por exemplo, procurar fotos com instruções em texto. Para permitir que celulares operem os modelos de inteligência artificial localmente, o Google lançou uma versão mais leve de sua tecnologia, o Gemini 1.5 Flash, já disponível no smartphone Google Pixel. A empresa também conversa sobre acordos para compartilhar tecnologia com a Apple.
O Google anunciou no último dia 30 o lançamento do aplicativo da inteligência artificial generativa Gemini em português. O app já está disponível na Play Store, em celulares Android, e deve chegar a aparelhos da Apple "nos próximos dias".
A proposta da solução é turbinar o Google Assistente, que recebe comandos por voz, com inteligência artificial generativa. "O novo serviço de IA pode ajudar as pessoas economizarem tempo recuperando informações relevantes de aplicativos e serviços do Google, como Gmail, Busca, Google Voos e YouTube", diz o anúncio do gigante das buscas.
O sistema de inteligência artificial generativa Gemini foi lançado em 8 de fevereiro e substituiu o Bard. O chatbot do Google, mesmo que aberto ao público e capaz de gerar imagens, não recebeu a mesma projeção do que o ChatGPT. Já no vídeo de anúncio, o Bard cometeu uma gafe e disse que o telescópio James Webb havia capturado as primeiras imagens de planetas fora do sistema solar.
Também é possível acessar o Gemini no navegador Google Chrome. Basta digitar @gemini seguido do comando na barra de endereço do Chrome e o gemini.google.com é iniciado com uma resposta pronta.