Nova patente da Microsoft mostra chatbots com expressões faciais humanas

A Microsoft entrou com pedido de registro de uma nova patente no United States Patent and Trademark Office (USPTO), que mostra que a empresa está trabalhando na criação de chatbots com expressões faciais humanas. A ideia é que esses agentes de conversa virtuais possam refletir o estilo de conversa e até mesmo as caras que o usuário faz.

O objeto da patente se chama “Linguistic Style Matching Agent” e foi aprovado no dia 3 de setembro de 2020. Os seus inventores são Daniel J. McDuff, Kael R. Rowan, Mary P. Czerwinski, Deepali Aneja e Rens Hoegen.
A ideia dessa invenção é capitalizar em cima dos avanços científicos e tecnológicos nos modelos de reconhecimento de fala e de geração de diálogo. Esse tipo de novidade fez com que os robôs de chat e agentes virtuais voltassem a ser populares na internet.
Como explica o site Neowin, os avanços nas interações de linguagem natural levaram a uma evolução na interação entre computadores e seres humanos. Mesmo assim, esse tipo de comunicação continua sendo bastante monotônico e restrito.
Fonte: Microsoft/USPTO
“Um agente de conversa que é implementado apenas com voz ou com um rosto que pode se utilizar do padrão de fala e das expressões de um usuário. A combinação de estilo de linguística do agente pode serr implementado ao identificar características prosódica da fala do usuário e sintetizar o discurso do agente virtual com as mesmas características ou algo similar”
Descrição oficial da patente da Microsoft
No final das contas, as conversas com chatbots ainda são bastante transacionais e não têm um jeito muito natural de fluir. A nova patente da Microsoft tenta corrigir isso, ao permitir que o agente de conversas tenha um diálogo mais natural com o usuário. Isso inclui conversas  com múltiplos turnos e referências a coisas que tenham sido ditas antes. Para aumentar a empatia, o chatbot conseguiria se alinhar com o estilo de conversa e as expressões faciais do usuário.
“As expressões faciais do usuário pode ser identificadas e imitadas pelo rosto de um agente de conversa corporificado. As declarações do agente virtual podem ser baseadas numa combinação de respostas já escritas e respostas abertas geradas por técnicas de machine learning”.
Descrição oficial da patente da Microsoft

Fonte: MundoConectado