Smart Atlantics

Novidades / Produtos / Tendências

A Ciência por Trás dos Comandos de Voz

Nesta sexta-feira, 5, comemora-se o Dia Nacional da Cultura e da Ciência. Para celebrar a data, preparamos uma série com curiosidades científicas e culturais acerca da automação de ambientes, começando pelo nosso salva-vidas quando estamos com as mãos ocupadas ou no escuro: o RECONHECIMENTO POR VOZ, presente nos celulares (Siri para Apple e o Google Assistant para Android) e no controle de eletrodomésticos. Vamos entender melhor como funciona esse mecanismo.

Primeiramente, para realizar tais atividades, um comando qualquer é dado pelo usuário. A digitalização desta fala no sistema será feita por um meio analógico-digital, que transformará as vibrações da onda emitidas pelos sons em dados digitais específicos para cada fonema, assim armazenados no sistema e compreendidos pelos assistentes virtuais.

Em seguida, cada dado será filtrado para separá-lo de ruídos ou qualquer tipo de interferência sonora. Os dados já digitalizados são separados em frações de sons menores que uma sílaba para serem comparados com fonemas já conhecidos e presentes no banco de dados. Por exemplo, a palavra “pelo” pode ser tanto substantivo quanto uma contração de preposição e artigo. Essa etapa é importante, pois cada pessoa tem seu jeito de falar, isto é, velocidade e entonação próprias.

Após esse grande método de busca de palavras foneticamente equivalentes, a última parte é a testagem. O resultado é analisado e o sistema traça um comparativo com palavras e frases conhecidas, a fim de notar se o assistente virtual direciona ao caminho certo pela sua rede neural cheia de algoritmos manualmente configurados, onde são postos esses expressivos dados cheios de arquivos de áudio e falas. A rede, que tem esse nome por se assimilar ao Sistema Nervoso humano, fará o processamento da pergunta e a busca da resposta correta nos arquivos de áudio.