
Google 15 Out
O Google está disponibilizando para desenvolvedores e empresas, em código aberto e de forma gratuita, a sua ferramenta capaz de reconhecer e inserir marcas d’água em textos gerados por modelos de inteligência artificial (IA) generativa. A ferramenta se chama SynthID Text e pode ser baixado através da Hugging Face e pela página de Responsible Gen AI Toolkit, do Google.
"Estamos disponibilizando nossa ferramenta de marca d'água SynthID Text como código aberto. [...] Disponível gratuitamente para desenvolvedores e empresas, ela os ajudará a identificar seu conteúdo gerado por IA.", informou porta-voz da companhia em comunicado.
Modelos de geração de texto funcionam, basicamente, através da geração de tokens. Ao confrontar um prompt, a IA calcula qual token tem maior probabilidade de iniciar o texto e quais tokens deverão seguir um após o outro. Os tokens com melhores notas, tem chances maiores de serem incluídos no texto final da resposta. Esses tokens, que podem ser caracteres soltos ou palavras, são os blocos de construção que um modelo generativo usa para processar informações.
Para inserir uma marca d’água no texto gerado, o SynthID insere informações adicionais na distribuição de tokens ao “modular a probabilidade de os tokens serem gerados”, explica o Google. "O padrão final de notas para as escolhas de palavras do modelo, combinado com as notas de probabilidade ajustadas, é considerado a marca d'água", acrescenta.
Então, na hora de identificar a presença de uma marca d’água, o software compara o padrão de notas de um determinado texto com o que é esperado para um padrão de notas de textos com e sem marca d’água, identificando se a produção foi gerada por uma ferramenta de IA ou se veio de outra fonte.
Mas a empresa admite que a solução tem suas limitações.
Segundo a companhia, o SynthID não funciona tão bem em textos curtos, em textos que foram traduzidos ou rescritos de outras línguas, e em textos com respostas a perguntas factuais.
"Em respostas a perguntas factuais, há menos oportunidades de ajustar a distribuição dos tokens sem afetar a precisão dos fatos", explica a empresa. "Isso inclui comandos como ‘Qual é a capital da França?’ ou consultas em que pouca ou nenhuma variação é esperada, como ‘recite um poema de William Wordsworth’."
O Google afirma que o SynthID Text está integrado ao Gemini desde meados de março deste ano, e declara que a ferramenta não compromete qualidade, precisão e velocidade na geração dos textos. A empresa alega que a ferramenta funciona, inclusive, até mesmo em textos recortados, parafraseados ou modificados.
Mas o Google não é a única empresa que trabalha em uma tecnologia do tipo. A própria OpenAI, desenvolvedora do ChatGPT, também tem pesquisado métodos de marca d’água há anos, mas adiou o lançamento devido a considerações técnicas e comerciais.
Ferramentas de geração e detecção de marcas d’água em textos gerados por IA são necessárias em várias frentes. Em uma delas, se amplamente adotadas, podem ser ímpares na contenção de detectores de IA imprecisos, que rotulam artigos e ensaios como gerados por inteligência artificial, mesmo que não sejam.
Em outra, podem ser essenciais na detecção de conteúdo online gerado de forma sintética, para que possam ser rebaixados. A Agência de Aplicação da Lei da União Europeia estima que até 2026, 90% do conteúdo online será gerado de forma sintética. Timothy Shoup, do Instituto para Estudos de Futuros, em Copenhague, na Dinamarca, estima que até 2030 mais de 99% do conteúdo na internet será gerado por IA.
Recentemente, o governo da China instituiu a obrigatoriedade de marcar conteúdo gerado por inteligências artificiais. No ocidente, o estado da Califórnia, nos Estados Unidos – onde está o Vale do Silício, considera fazer o mesmo.
Celular mais rápido! Ranking TudoCelular com gráficos de todos os testes de desempenho
Celular com a melhor bateria! Ranking TudoCelular com todos os testes de autonomia
Nada de Black Fraude! Ferramenta do TudoCelular desvenda ofertas falsas
Microsoft destaca novos recursos na build 26100.1876 do Windows 11 24H2
Comentários