
Curiosidade 02 Abr
O Google continua expandindo seus domínios no ramo de IA e anunciou esta semana o Vertex AI Media Studio, um conjunto de ferramentas generativas que permite a criação de vídeos usando apenas um prompt de texto. A plataforma é construída com base no Vertex AI do Google Cloud e reúne diversos dos modelos mais avançados da empresa para lidar com cada um dos aspectos da produção de vídeos, incluindo visuais, voz e música, sem precisar de nenhuma experiência com edição ou codificação.
As ferramentas generativas para criação de imagens, vídeos, músicas e até mesmo jogos de videogame têm se tornado cada vez mais avançadas, e embora muitos artistas se oponham a essas iniciativas, parece que a esse é realmente o futuro. Com isso em mente, o Google é a mais nova gigante da tecnologia a aumentar seus esforços para o lançamento de ferramentas capazes de produzir vídeos gerados por IA.
Os usuários podem começar gerando uma imagem usando o Imagen 3, o modelo de geração de imagens do Google. Essa imagem pode então ser transformada em vídeo usando o Veo 2, modelo de geração de vídeos da empresa, que também oferece ferramentas de customização.
De acordo com o Google, o Veo permite escolher o tipo de movimento da câmera (como fotos de drone ou panorâmica), ajustar a taxa de quadros e definir a duração do vídeo. Se o modelo adicionar quaisquer elementos que você não goste, um recurso no estilo Magic Eraser poderá removê-los, semelhante ao que os usuários de celulares Android já estão acostumados.
Assim que os visuais estiverem prontos, o Media Studio usa o Chirp, modelo sintético de voz do Google, para adicionar a narração. Para completar a produção, o Lyria, um modelo desenvolvido em conjunto pelo Google DeepMind e YouTube, gera a trilha sonora de fundo.
Na teoria, o resultado é um vídeo pronto para ser divulgado, com um resultado feito para parecer uma produção profissional. E tudo isso pode ser feito em um único lugar com o Vertex AI Studio, o mesmo lugar em que os usuários podem testar os modelos mais recentes do Gemini.
O Vertex AI, a plataforma mais ampla que abriga essas ferramentas, fornece acesso para os modelos do Gemini, nos quais o Google diz que pode processar múltiplos tipos de dados, incluindo texto, imagens e código, para gerar uma variedade de produtos. Os desenvolvedores e usuários menos técnicos podem experimentar esses recursos no Vertex AI Studio, um ambiente de prototipagem em que eles podem testar os prompts e refinar modelos de IA para funções específicas.
Será que a indústria do entretenimento vai se render de vez à essas ferramentas?
Celular mais rápido! Ranking TudoCelular com gráficos de todos os testes de desempenho
Celular com a melhor bateria! Ranking TudoCelular com todos os testes de autonomia
Nada de Black Fraude! Ferramenta do TudoCelular desvenda ofertas falsas
Microsoft destaca novos recursos na build 26100.1876 do Windows 11 24H2
Comentários