
Google 11 Nov
14 de novembro de 2019 2
No começo desta semana, o Google anunciou a chegada da sua caixa de som inteligente, Nest Mini, ao Brasil. O dispositivo tem como destaque a presença do Google Assistente em português, para gerenciamento de uma casa conectada por meio de comandos de voz.
Mas você sabe como funciona o Assistente no idioma falado no país? A questão vai além de tecnologia de ponta e une também um trabalho linguístico. A gigante de buscas explicou, durante o evento, como é feito o procedimento, e o Detetive TudoCelular conta um pouco sobre o recurso a seguir:
O Google levou ao palco a especialista em linguística da empresa, Larissa Rinaldi, para passar um pouco do funcionamento do Assistente no nosso idioma. Em uma das primeiras explicações, ela exibiu uma estrutura com as diversas áreas de estudo que precisam conter em uma tecnologia como a presente no Nest Mini.
“A linguística que está aqui representada em vários círculos é dividida em alguns módulos. E cada uma dessas áreas é muito complexa. Um pesquisador poderia fazer uma carreira inteira em uma delas. Mas, para a gente trabalhar com os computadores, tem que considerar todas.”
Larissa Rinaldi
Especialista em Linguística do Google
De acordo com Larissa, o círculo menor – o qual compreende a fonética e a fonologia – é onde há o maior nível de detalhes. Conforme esses círculos crescem, o detalhamento diminui, mas a complexidade aumenta.
Na prática, é como pensar em uma mesma sentença que pode gerar vários sentidos se analisada friamente, mas a forma como é falada que gera o significado. Apesar de a oralidade ser detectada facilmente para os seres humanos, a grande façanha é levar essa compreensão também para uma máquina.
Para ter uma noção de quais são os recursos utilizados, desde quando um dispositivo – como o Nest Mini – reconhece o comando de voz até ele traduzir aquela informação em uma resposta ao usuário, Larissa exemplificou como os módulos são aplicados em uma mesma interação com o Google Assistente.
Os vermelhos consistem em módulos de fala; já o azul e o amarelo se tratam de compreensão de texto e conteúdo semântico; e, por fim, em verde, há a geração de conteúdo. A combinação de todos gera a execução de uma ação – seja resposta a uma pergunta ou abertura de aplicativo, por exemplo. Veja como cada um se aplica no meio de uma “conversa” com o Assistente a seguir:
O chamado “Parsing Semântico” é como uma quebra da frase em unidades abstratas, as quais o computador entenderá como partes de uma função. Cada uma é ligada a uma intenção – a parte amarela –, a qual se traduz na ferramenta utilizada para a ação – seja uma Rotina configurada no Google Home, um lembrete na Agenda ou um endereço cadastrado no Maps, por exemplo.
Já na resposta do Assistente, o GenX faz o trabalho de gerar conteúdo. O sistema funciona para criar uma naturalidade e identificação com a forma de o brasileiro falar, além de estar correto na gramática. Para completar, o TTS (Text To Speech) pega toda a gravação da artista de fala, corta em pedaços e combina tudo para formar qualquer frase.
Nesse outro esquema acima, a diferença está na Persona como intenção. Isso significa que existe o sistema de personalidade do usuário aplicada, o qual passa por um processo diferente dos demais mostrados.
A especialista do Google acrescentou que o tempo para realizar o processamento de toda a quantidade de informações enviadas ao sistema é de 0,47 segundos. Ou seja, em menos de um segundo, o Assistente consegue fazer todos os passos que transformam a linguística em uma estrutura lógica.
Você costuma utilizar o Google Assistente no seu smartphone? Relate para a gente como é a sua experiência.
Celular mais rápido! Ranking TudoCelular com gráficos de todos os testes de desempenho
Celular com a melhor bateria! Ranking TudoCelular com todos os testes de autonomia
Nada de Black Fraude! Ferramenta do TudoCelular desvenda ofertas falsas
Microsoft destaca novos recursos na build 26100.1876 do Windows 11 24H2
Comentários