LOADING...
Faça login e
comente
Usuário ou Email
Senha
Esqueceu sua senha?
Ou
Registrar e
publicar
Você está quase pronto! Agora definir o seu nome de usuário e senha.
Usuário
Email
Senha
Senha
» Anuncie » Envie uma dica Ei, você é um redator, programador ou web designer? Estamos contratando!

Google anuncia Gemini, seu novo modelo de inteligência artificial que será integrado ao Bard

06 de dezembro de 2023 5

O Google anunciou nesta quarta-feira (06) o Gemini, seu novo modelo de linguagem grande para inteligência artificial generativa. O novo mecanismo promete ser o mais poderoso e versátil da gigante das buscas, trazendo versões otimizadas para diferentes cenários, englobando desde tarefas cotidianas até pesquisas científicas.

O Gemini é projetado do zero com foco em multimodalidade, portanto, é capaz de desempenhar variadas funções relacionadas a texto, imagem, vídeo, áudio e programação — tudo em uma única plataforma. Isso dispensa a necessidade de criar modelos separados para processar textos e gerar imagens, como é o caso do GPT e DALL-E, da OpenAI.

A ferramenta possui variantes otimizadas para diferentes tipos de plataforma, inclusive os novos celulares e notebooks com inteligência artificial nativa. O Gemini será disponibilizado em três “tamanhos” de modelo:

  • Gemini Ultra: versão mais poderosa para tarefas complexas
  • Gemini Pro: versão intermediária para tarefas diversificadas
  • Gemini Nano: versão mais eficiente para processamento local em dispositivos de consumo, como celulares, tablets e notebooks

Demis Hassabis, CEO da DeepMind, empresa que pertence ao mesmo grupo empresarial do Google, afirma que vários testes foram realizados para verificar o desempenho do modelo, e os resultados apontam que o Gemini é a primeira inteligência artificial capaz de superar humanos em Compreensão Massiva de Linguagem Multitarefa (MMLU).

Utilizando um teste que combina 57 disciplinas — como matemática, física, história, direito, medicina e ética — para testar o conhecimento do mundo e as habilidades de resolução de problemas, o Google verificou que o Gemini Ultra obtém uma pontuação de 90,0%, enquanto um humano tem máximo de 89,8%. O GPT-4, modelo da OpenAI, alcança 86,4%.

(Imagem: Google)

O Gemini pode combinar entradas simultâneas de texto e imagem para produzir dados mais precisos aos usuários. Por exemplo, em seu modo “programador”, é possível inserir um vídeo com um bando de pássaros voando no céu e digitar: “Você poderia me ajudar a criar uma animação para uma página web em HTML baseada neste vídeo?”.

Com os testes de processamento de imagem, o Gemini Ultra superou todos os modelos de inteligência artificial de última geração rivais sem sequer utilizar sistemas de reconhecimento de caracteres, que extraem textos de imagens para ajudar a identificar do que o material se trata. Em todos os benchmarks, o Gemini Ultra superou o GPT-4V.


O Gemini 1.0 — primeira geração do modelo — é treinado para reconhecer e entender texto, imagens, áudio e muito mais ao mesmo tempo, permitindo que compreenda melhor informações com nuances e responda às perguntas relacionadas aos assuntos mais complexos, como ao explicar o raciocínio em cálculos de matemática e física, por exemplo.

Essas capacidades do modelo podem ser especialmente vantajosas aos estudantes, e para isso, faz sentido que a empresa tenha investido em uma versão otimizada para dispositivos de consumo, como smartphones e computadores pessoais.

Medidas de segurança

Considerando que um único modelo é capaz de lidar com diversos tipos de informação, há uma maior demanda por mecanismos de segurança que permitam controlar os limites da inteligência artificial. Com isso, o Google afirma que em cada estágio do desenvolvimento, os especialistas analisam riscos potenciais e trabalham para mitigá-los.

“Conduzimos novas pesquisas em áreas de risco potencial, como ofensa cibernética, persuasão e autonomia, e aplicamos as melhores técnicas de teste para ajudar a identificar problemas críticos de segurança antes da implantação do Gemini”, disse Hassabis.

Gemini será integrado ao Google Bard

A partir desta quarta-feira, 6 de dezembro, o Google Bard passará a utilizar uma versão otimizada do Gemini Pro. Rival do ChatGPT, o chat de inteligência artificial promete raciocínio e compreensão muito mais avançados com seu novo motor, segundo o Google.

Por ora, o modelo está disponível somente em inglês em mais de 170 países e regiões. A expectativa da companhia é ampliar o suporte de idiomas e disponibilidade em breve.

O Gemini também estreará nos celulares do Google. O Pixel 8 Pro é o primeiro modelo da marca projetado com foco no Gemini Nano, que oferecerá funções avançadas nativas para o celular, como transcrever e resumir gravações de voz. Além disso, o Gboard terá um recurso de “Resposta Inteligente” compatível inicialmente com o WhatsApp.

Quanto ao Gemini Ultra, testes de validação de segurança ainda estão em andamento. “Estamos concluindo extensas verificações de confiança, incluindo a formação de equipes por partes externas confiáveis e refinando o modelo utilizando aprendizado de reforço a partir do feedback humano antes de torná-lo amplamente disponível”, afirma o Google.

Nos próximos meses, o modelo de inteligência artificial estará disponível em mais produtos e serviços da empresa, incluindo a Busca, Google Ads, Google Chrome e Duet AI.

Veja mais!

Mais Notícias
Mais Notícias

5

Comentários

Google anuncia Gemini, seu novo modelo de inteligência artificial que será integrado ao Bard
Android

Celular mais rápido! Ranking TudoCelular com gráficos de todos os testes de desempenho

Android

Celular com a melhor bateria! Ranking TudoCelular com todos os testes de autonomia

Especiais

Nada de Black Fraude! Ferramenta do TudoCelular desvenda ofertas falsas

Software

Microsoft destaca novos recursos na build 26100.1876 do Windows 11 24H2