Google 22 Nov
O Google anunciou nesta quarta-feira (06) o Gemini, seu novo modelo de linguagem grande para inteligência artificial generativa. O novo mecanismo promete ser o mais poderoso e versátil da gigante das buscas, trazendo versões otimizadas para diferentes cenários, englobando desde tarefas cotidianas até pesquisas científicas.
O Gemini é projetado do zero com foco em multimodalidade, portanto, é capaz de desempenhar variadas funções relacionadas a texto, imagem, vídeo, áudio e programação — tudo em uma única plataforma. Isso dispensa a necessidade de criar modelos separados para processar textos e gerar imagens, como é o caso do GPT e DALL-E, da OpenAI.
A ferramenta possui variantes otimizadas para diferentes tipos de plataforma, inclusive os novos celulares e notebooks com inteligência artificial nativa. O Gemini será disponibilizado em três “tamanhos” de modelo:
- Gemini Ultra: versão mais poderosa para tarefas complexas
- Gemini Pro: versão intermediária para tarefas diversificadas
- Gemini Nano: versão mais eficiente para processamento local em dispositivos de consumo, como celulares, tablets e notebooks
Demis Hassabis, CEO da DeepMind, empresa que pertence ao mesmo grupo empresarial do Google, afirma que vários testes foram realizados para verificar o desempenho do modelo, e os resultados apontam que o Gemini é a primeira inteligência artificial capaz de superar humanos em Compreensão Massiva de Linguagem Multitarefa (MMLU).
Utilizando um teste que combina 57 disciplinas — como matemática, física, história, direito, medicina e ética — para testar o conhecimento do mundo e as habilidades de resolução de problemas, o Google verificou que o Gemini Ultra obtém uma pontuação de 90,0%, enquanto um humano tem máximo de 89,8%. O GPT-4, modelo da OpenAI, alcança 86,4%.
O Gemini pode combinar entradas simultâneas de texto e imagem para produzir dados mais precisos aos usuários. Por exemplo, em seu modo “programador”, é possível inserir um vídeo com um bando de pássaros voando no céu e digitar: “Você poderia me ajudar a criar uma animação para uma página web em HTML baseada neste vídeo?”.
Com os testes de processamento de imagem, o Gemini Ultra superou todos os modelos de inteligência artificial de última geração rivais sem sequer utilizar sistemas de reconhecimento de caracteres, que extraem textos de imagens para ajudar a identificar do que o material se trata. Em todos os benchmarks, o Gemini Ultra superou o GPT-4V.
O Gemini 1.0 — primeira geração do modelo — é treinado para reconhecer e entender texto, imagens, áudio e muito mais ao mesmo tempo, permitindo que compreenda melhor informações com nuances e responda às perguntas relacionadas aos assuntos mais complexos, como ao explicar o raciocínio em cálculos de matemática e física, por exemplo.
Essas capacidades do modelo podem ser especialmente vantajosas aos estudantes, e para isso, faz sentido que a empresa tenha investido em uma versão otimizada para dispositivos de consumo, como smartphones e computadores pessoais.
Considerando que um único modelo é capaz de lidar com diversos tipos de informação, há uma maior demanda por mecanismos de segurança que permitam controlar os limites da inteligência artificial. Com isso, o Google afirma que em cada estágio do desenvolvimento, os especialistas analisam riscos potenciais e trabalham para mitigá-los.
“Conduzimos novas pesquisas em áreas de risco potencial, como ofensa cibernética, persuasão e autonomia, e aplicamos as melhores técnicas de teste para ajudar a identificar problemas críticos de segurança antes da implantação do Gemini”, disse Hassabis.
A partir desta quarta-feira, 6 de dezembro, o Google Bard passará a utilizar uma versão otimizada do Gemini Pro. Rival do ChatGPT, o chat de inteligência artificial promete raciocínio e compreensão muito mais avançados com seu novo motor, segundo o Google.
Por ora, o modelo está disponível somente em inglês em mais de 170 países e regiões. A expectativa da companhia é ampliar o suporte de idiomas e disponibilidade em breve.
O Gemini também estreará nos celulares do Google. O Pixel 8 Pro é o primeiro modelo da marca projetado com foco no Gemini Nano, que oferecerá funções avançadas nativas para o celular, como transcrever e resumir gravações de voz. Além disso, o Gboard terá um recurso de “Resposta Inteligente” compatível inicialmente com o WhatsApp.
Quanto ao Gemini Ultra, testes de validação de segurança ainda estão em andamento. “Estamos concluindo extensas verificações de confiança, incluindo a formação de equipes por partes externas confiáveis e refinando o modelo utilizando aprendizado de reforço a partir do feedback humano antes de torná-lo amplamente disponível”, afirma o Google.
Nos próximos meses, o modelo de inteligência artificial estará disponível em mais produtos e serviços da empresa, incluindo a Busca, Google Ads, Google Chrome e Duet AI.
Google Pixel 8
4 meses atrás9 celulares da linha Google Pixel devem receber novos recursos baseados em inteligência artificial em breve.
5 meses atrásVersão faz parte das atualizações liberadas trimestralmente pelo Google para seus celulares com grandes mudanças visuais e novas funções.
5 meses atrásVeja o que mudou na linha Pixel 9 em relação aos Pixel 8 e 8 Pro.
7 meses atrásAtualização já está disponível para celulares Google Pixel em todo o mundo.
Google Pixel 8 Pro
Comparar Aviso de preço Expandir5 meses atrásVersão faz parte das atualizações liberadas trimestralmente pelo Google para seus celulares com grandes mudanças visuais e novas funções.
5 meses atrásZoom Aprimorado também será lançado para o Pixel 8 Pro em breve!
5 meses atrásAplicativo de termômetro dos celulares da marca está recebendo mudanças de design para facilitar seu uso.
5 meses atrásVeja o que mudou na linha Pixel 9 em relação aos Pixel 8 e 8 Pro.
Comentários