Prime Time

seg - sex

Apresentação

Ao vivo

A seguir

    Google anuncia melhorias através do Gemini 1.5 Pro, sua nova versão de IA

    Durante seu evento anual para desenvolvedores, Google I/O, o CEO Sundar Pichai demonstrou novas usabilidades da inteligência artificial da empresa

    Samantha Murphy Kellyda CNN

    Um dia após o anúncio de melhoria do modelo de inteligência artificial (IA) ChatGPT pela OpenAI, o Google mostrou sua visão de como a IA irá aprimorar os produtos que bilhões de pessoas usam todos os dias. As atualizações, anunciadas em sua conferência anual de desenvolvedores, a Google I/O, surgem enquanto a empresa tenta ir além de seu negócio de publicidade com novos dispositivos e ferramentas alimentadas por IA.

    Sundar Pichai, CEO do Google, apresentou novas funcionalidades alimentadas pelo seu mais recente modelo de IA, o Gemini 1.5 Pro. Uma nova ferramenta, chamada de “Pergunte às fotos”, permite aos usuários pesquisar imagens em busca de informações mais profundas — como perguntar quando sua filha aprendeu a nadar ou lembrar o número da sua placa de carro, usando imagens salvas.

    Executivos do Google também demonstraram como o Gemini 1.5 Pro poderia “ler” um livro didático e transformá-lo em uma espécie de palestra de IA, apresentando professores com uma voz natural que responderão às suas perguntas.

    Os aprimoramentos de IA também estão chegando ao Gmail. Pichai mostrou como os usuários podem pedir ao Gemini 1.5 Pro para resumir todos os e-mails recentes da escola de seu filho analisando os anexos e resumindo os pontos-chave e apontando quais são as tarefas necessárias.

    Apenas um dia antes, a OpenAI — uma das líderes da indústria de tecnologia em inteligência artificial — revelou um novo modelo de IA que, segundo eles, tornará o chatbot ChatGPT mais inteligente e fácil de usar. O GPT-4o tem como objetivo transformar o ChatGPT em um assistente pessoal digital que pode se envolver em conversas em tempo real e interagir usando texto e “visão”. Isso significa que ele pode visualizar capturas de tela, fotos, documentos ou gráficos enviados pelos usuários e dialogar sobre eles.

    O Google também mostrou as últimas habilidades do Gemini, o chatbot da empresa, para aceitar diferentes tipos de entrada — ele terá capacidades “multimodais” para receber texto, voz ou imagens em resposta direta à atualização do ChatGPT. Um executivo também demonstrou um “colega” virtual que pode ajudar a manter o controle das listas de tarefas, organizar dados e gerenciar fluxos de trabalho.

    A empresa destacou melhorias na busca, permitindo que os usuários façam perguntas mais naturais ou mais focadas, e fornecendo várias versões das respostas, como resultados detalhados ou resumidos. Por exemplo, a IA pode sugerir restaurantes amigáveis para crianças com base na localização, ou o que pode estar errado com um dispositivo, como uma câmera, ao tirar um vídeo dele via Google Lens. O objetivo é basicamente facilitar a busca no buscador, segundo a empresa.

    Também foi dada uma breve prévia do Projeto Astra, desenvolvido pelo laboratório de IA DeepMind do Google, que permitirá que assistentes de IA ajudem na vida cotidiana dos usuários usando as câmeras dos telefones para interpretar informações sobre o mundo real, como identificar objetos e até mesmo encontrar itens perdidos. Na apresentação, foi demonstrado como isso funcionaria em óculos de realidade aumentada.

    O Google afirmou que ainda este ano integrará mais funções de IA nos celulares. Por exemplo, os usuários poderão arrastar e soltar imagens criadas pela IA no Google Messages e no Gmail e fazer perguntas sobre vídeos do YouTube e PDFs em um dispositivo Android. E em uma medida que provavelmente será atrativa para muitos, uma nova ferramenta integrada para Android ajudará a detectar atividades suspeitas no meio de uma ligação, como um golpista tentando imitar o banco de um usuário.

    Segundo o analista Jacob Bourne, da empresa de pesquisa de mercado Emarketer, não é surpresa que a IA tenha sido o foco principal da conferência de desenvolvedores do Google deste ano. “Ao apresentar seus modelos mais recentes e como eles vão impulsionar produtos existentes com forte alcance ao consumidor, o Google está demonstrando como pode se diferenciar efetivamente dos concorrentes”, afirmou.

    Bourne avalia que a recepção das novas ferramentas será um indicador de quão bem a empresa pode adaptar seu produto de busca para atender às demandas da era da IA generativa. “Para manter sua vantagem competitiva e satisfazer os investidores, o Google precisará se concentrar em traduzir suas inovações em IA em produtos e serviços lucrativos em escala”, acrescentou.

    À medida que a empresa expande sua presença em IA, ela afirmou que introduzirá mais proteções para reduzir o potencial de uso indevido. O Google está ampliando o recurso SynthID existente para detectar conteúdo gerado por meio dessas ferramentas. No ano passado, a ferramenta adicionou marcas d’água a imagens e áudios gerados por IA. A empresa também disse que está colaborando com especialistas e instituições para testar e melhorar as capacidades em seus novos modelos.

    Embora a empresa tenha dobrado sua aposta em inteligência artificial no último ano, também enfrentou obstáculos significativos. No ano passado, logo depois da introdução de sua ferramenta de IA generativa — que chamava Bard e foi renomeada como Gemini — o preço das ações do Google caiu após um vídeo de demonstração da ferramenta dar uma resposta factualmente incorreta para uma pergunta sobre o Telescópio Espacial James Webb.

    Mais recentemente, a empresa pausou em fevereiro a capacidade do Gemini de gerar imagens de pessoas depois de ser criticada nas redes sociais por produzir imagens historicamente imprecisas que mostravam principalmente pessoas de cor em vez de pessoas brancas.

    O Gemini, assim como outros chatbots como o ChatGPT, é treinado em vastos conjuntos de dados online. Há muito tempo especialistas alertam sobre as deficiências em torno das ferramentas de IA, como o potencial para imprecisões, preconceitos e a propagação de desinformação. Ainda assim, muitas empresas estão avançando em ferramentas ou parcerias de inteligência artificial.

    A Apple pode estar interessada em licenciar e integrar o mecanismo de IA Gemini do Google, que inclui chatbots e outras ferramentas, nos próximos iPhones e nas funcionalidades do iOS 18, informou a Bloomberg em março. A empresa também estaria conversando com a OpenAI, criadora do ChatGPT.

    Tópicos