LOADING...
Faça login e
comente
Usuário ou Email
Senha
Esqueceu sua senha?
Ou
Registrar e
publicar
Você está quase pronto! Agora definir o seu nome de usuário e senha.
Usuário
Email
Senha
Senha
» Anuncie » Envie uma dica Ei, você é um redator, programador ou web designer? Estamos contratando!

PaliGemma 2: Google apresenta modelo de IA capaz de entender textos e imagens

06 de dezembro de 2024 2

O Google apresentou o PaliGemma 2, a nova geração de sua tecnologia de inteligência artificial que combina visão e linguagem, permitindo que máquinas interpretem imagens e textos de maneira integrada. A novidade promete facilitar o uso de IA avançada, oferecendo recursos poderosos com maior acessibilidade e flexibilidade para personalização.

O PaliGemma 2 aprimora o modelo Gemma 2, adicionando a capacidade de entender e interagir com imagens. Ele não só identifica objetos, mas também descreve ações, emoções e o contexto geral de uma cena, oferecendo legendas detalhadas e precisas. Além disso, o modelo demonstrou alto desempenho em aplicações complexas, como reconhecimento de fórmulas químicas, interpretação de partituras musicais, raciocínio espacial e geração de relatórios médicos baseados em radiografias.

Foto: Google

Suportanto tamanhos de modelo variados (parâmetros de 3B, 10B e 28B) e resoluções ajustáveis (224px a 896px), o PaliGemma 2 é escalável e pode ser otimizado para diferentes tarefas. Ele foi projetado como um substituto direto do PaliGemma original, permitindo uma migração simples com ganhos imediatos de desempenho e maior facilidade para ajustes específicos.

Desde o lançamento do primeiro modelo, a família Gemma cresceu rapidamente, formando o ecossistema conhecido como "Gemmaverse". Aplicações inovadoras, como recuperação de documentos visuais e rastreamento de objetos em tempo real, demonstram o impacto dessa tecnologia em diversas áreas.

O PaliGemma 2 já está disponível para download em plataformas como Hugging Face e Kaggle, com documentações e exemplos que facilitam sua integração em projetos. Essa evolução marca um novo patamar na IA multimodal, abrindo caminhos para aplicações transformadoras em setores variados.

Parece que os modelos de IA estão ficando cada vez mais inteligentes e funcionais.


2

Comentários

PaliGemma 2: Google apresenta modelo de IA capaz de entender textos e imagens
Android

Celular mais rápido! Ranking TudoCelular com gráficos de todos os testes de desempenho

Android

Celular com a melhor bateria! Ranking TudoCelular com todos os testes de autonomia

Especiais

Nada de Black Fraude! Ferramenta do TudoCelular desvenda ofertas falsas

Software

Microsoft destaca novos recursos na build 26100.1876 do Windows 11 24H2