PaliGemma 2: Google apresenta modelo de IA capaz de entender textos e imagens

Faça login e
comente

Registrar e
publicar

Você está quase pronto! Agora definir o seu nome de usuário e senha.

» Anuncie » Envie uma dica Ei, você é um redator, programador ou web designer? Estamos contratando!

PaliGemma 2: Google apresenta modelo de IA capaz de entender textos e imagens

06 de dezembro de 2024 2

O Google apresentou o PaliGemma 2, a nova geração de sua tecnologia de inteligência artificial que combina visão e linguagem, permitindo que máquinas interpretem imagens e textos de maneira integrada. A novidade promete facilitar o uso de IA avançada, oferecendo recursos poderosos com maior acessibilidade e flexibilidade para personalização.

Google Chrome no Android testa novo formato de notificação menos intrusivo com barra flutuante 0

Google 07 Dez

CEO do Google prevê mudança profunda para a busca em 2025 e provoca Microsoft 0

Economia e mercado 06 Dez

O PaliGemma 2 aprimora o modelo Gemma 2, adicionando a capacidade de entender e interagir com imagens. Ele não só identifica objetos, mas também descreve ações, emoções e o contexto geral de uma cena, oferecendo legendas detalhadas e precisas. Além disso, o modelo demonstrou alto desempenho em aplicações complexas, como reconhecimento de fórmulas químicas, interpretação de partituras musicais, raciocínio espacial e geração de relatórios médicos baseados em radiografias.

Foto: Google

Suportanto tamanhos de modelo variados (parâmetros de 3B, 10B e 28B) e resoluções ajustáveis (224px a 896px), o PaliGemma 2 é escalável e pode ser otimizado para diferentes tarefas. Ele foi projetado como um substituto direto do PaliGemma original, permitindo uma migração simples com ganhos imediatos de desempenho e maior facilidade para ajustes específicos.

Desde o lançamento do primeiro modelo, a família Gemma cresceu rapidamente, formando o ecossistema conhecido como "Gemmaverse". Aplicações inovadoras, como recuperação de documentos visuais e rastreamento de objetos em tempo real, demonstram o impacto dessa tecnologia em diversas áreas.

O PaliGemma 2 já está disponível para download em plataformas como Hugging Face e Kaggle, com documentações e exemplos que facilitam sua integração em projetos. Essa evolução marca um novo patamar na IA multimodal, abrindo caminhos para aplicações transformadoras em setores variados.

Parece que os modelos de IA estão ficando cada vez mais inteligentes e funcionais.

Curtir - 1 Tweet - 0

Guilherme Souza FONTE