top of page

Meu estudo parte da premissa de que novas formas de se comunicar surgem ao longo dos anos, inclusive na relação entre o humano e a máquina, onde, atualmente, a fala é o veículo comunicacional predominante. E nesse diálogo há uma busca pela adequação da máquina à nossa forma de comunicação e uma constante necessidade de adequação dos seres humanos à forma de comunicação da máquina. Essa investigação visa elucidar se sistemas baseados em interfaces de voz compõem o modelo de interação fundado no que se define como conversa, sendo amparados pelas áreas da ergonomia e usabilidade e por fundamentos provenientes da teoria da conversação. Este trabalho encontra-se estruturado em quatro seções: a primeira equivale a fundamentação teórica; a segunda seção abrange o levantamento de dados através de entrevistas com usuários de interfaces conversacionais; a terceira seção constitui-se na análise de conteúdo das entrevistas; e por fim, a quarta seção envolve as considerações em torno das experiências no uso de interfaces conversacionais atuais. Abaixo, trago algumas passagens da minha dissertação. Para ter acesso ao conteúdo completo clique aqui.
MEU PAPEL
Pesquisador.
EM COLABORAÇÃO COM
Manuela Quaresma
ANO
2020
Interfaces conversacionais:
A experiência no uso da voz em interações.
QUEM SOMOS
O Laboratório de Ergodesign e Usabilidade de Interfaces é líder há mais de duas décadas nos estudos de Ergonomia e Fatores Humanos aplicados ao Design e está localizado dentro do Departamento de Artes e Design da PUC-Rio. Com ênfase na abordagem de Design Centrado no Humano, nossas pesquisas buscam investigar questões atuais da interação dos seres humanos com interfaces, sistemas e tecnologias, considerando suas capacidades, habilidades e limitações. Nossas pesquisas têm impacto direto no ensino de Design em todos níveis de formação da PUC-Rio – pós-graduação (lato e stricto sensu), graduação e extensão.
PROBLEMA
Para Pangaro (2017, p. 1580), a definição de conversa parte dos conceitos que embasam o acrônimo CLEAT (Contexto, Linguagem, Engajamento, Acordo e Transação) como forma de construir uma conversa amplamente eficaz entre humano-humano, humano-ambiente e humano-máquina. A trajetória dos conceitos ilustrados de 1 a 5, na figura abaixo, define o que chamaremos de “turno” e, segundo
Pangaro (2017, p. 1585), uma conversa só se torna possível quando há turnos suficientes para que os participantes entrem em acordo sobre o que está sendo falado, possibilitando, então, o que o autor define como uma conversa efetiva, a qual ocorre quando as trocas efetuadas permitem mudanças de valores prolongados aos participantes.
Entendendo que uma conversa é fluida, tornam-se necessários N turnos para que haja um entendimento sobre o objeto/assunto central da conversa, permitindo assim que, pelo menos, uma das partes saia modificada após a troca.
Para Gil (2002, p. 26), uma pesquisa de cunho acadêmico como esta necessita ter seu problema delimitado, pois devemo-nos ater aos meios disponíveis para realização da investigação. A presente pesquisa busca entender, portanto, se sistemas baseados em interfaces de voz conseguem manter uma conversa com seres humanos para além do primeiro turno.

HIPÓTESE
Para Prodanov & Freitas (2013, p. 32), uma hipótese constitui-se numa suposta resposta para um problema. Segundo Gil (2002, p. 31), uma hipótese busca oferecer uma resposta mediante uma proposição, podendo se confirmar como sendo verdadeira ou falsa. Desta forma, a hipótese desta pesquisa é a seguinte: sistemas baseados em interação de voz, como estão projetados atualmente, não são capazes de manter uma conversação por mais de um turno, conforme os preceitos da Teoria da Conversação (Pask, 1976).
OBJETO DE PESQUISA
A interação por voz entre o humano e a máquina por meio de interfaces conversacionais.
OBJETIVOS
Identificar frustrações e limitações provenientes do uso de interfaces por voz,no que se entende atualmente como conversa entre o humano e a máquina,relacionando-as de forma categórica à estrutura conversacional decorrente daTeoria da Conversação (Pask, 1976).
Objetivos Específicos
Para a realização deste estudo foram determinados os seguintes objetivosespecíficos:
1 - Realizar levantamento cronológico sobre a comunicação humana;
2 - Realizar levantamento histórico-teórico da interação humano-máquina;
3 - Explorar e definir o universo da interação auditiva;
4 - Definir o que é conversação;
5 - Identificar obstáculos em interações realizadas através de interfaces por voz;
6 - Categorizar os obstáculos encontrados, de acordo com a estrutura
conversacional decorrente da Teoria da Conversação.
ANÁLISE
Inicialmente, aplicamos uma entrevista, técnica essa que, segundo Prodanov e Freitas (2013), consiste na obtenção de informações por meio de um indivíduo que se coloca à disposição para responder perguntas ao pesquisador. A escolha pela entrevista semiestruturada, por sua vez, oferece ao pesquisador a possibilidade de fazer perguntas que fujam ao roteiro pré-estabelecido, quando necessário.
Justificando o uso da técnica, expomos aqui uma passagem de Prodanov & Freitas (2013, p. 106): "A entrevista é a obtenção de informações de um entrevistado sobre determinado assunto ou problema." Tal passagem culmina na explicitação do fato de precisarmos angariar informações sobre o problema proposto neste documento, a fim de prosseguirmos com a análise de conteúdo das respostas obtidas.
Abaixo deixo em evidencia algumas imagens que trazem luz a análise realizada por mim



DISCUSSÃO
O modelo conversacional de Pangaro (2017, p. 1580), o qual podemos inferir ser baseado no conceito de feedback-loop apresentado no modelo de Kroemer e Grandjean (2007, p. 125), é composto por cinco etapas que constituem o acrônimo CLEAT.
Para uma melhor associação do pensamento aqui proposto, iremos trazer novamente os conceitos que integram o acrônimo. São eles: (1) Contexto - um momento, situação, lugar e/ou história compartilhada que prepara o cenário para [...]; (2) Linguagem - ao menos um significado inicial compartilhado que transmita sentido, para começar uma [...]; (3) Troca - engajamento recíproco, em interações baseadas em linguagens que podem resultar em [...]; (4) Acordo - (suficientemente) entendimento compartilhado de conceitos, intenções, valores, que podem levar a [...]; (5) Ação ou (trans)ação - uma interação coordenada em domínios que não sejam a linguagem, por exemplo, comércio, contratos, dança, jogos. Durante o processo de análise de conteúdo das entrevistas, foi possível inferir que os comandos dados pelos usuários perpassam todos os cinco pontos aqui apresentados, mas que alguns desses pontos se diferem conceitualmente do modelo apresentado por Pangaro (2017).
Pangaro define contexto como um momento, situação, lugar e/ou história compartilhada que prepara o cenário (2017, p. 1580). Podemos observar que a definição de contexto empregada por Pangaro é uma definição ampla, abrindo um leque de interpretações às partes pertencentes à conversa, que só se torna comum aos envolvidos caso ambos os participantes possuam algum conhecimento prévio, ou por meio de dados inseridos a partir de fluxo conversacional mantido até que seja possível um acordo sobre o objetivo.
Quando falamos de contexto numa interação baseada em comandos, precisamos atentar para o fato de que atualmente o "sistema máquina", por mais que se assemelhe ao "sistema humano", não possui as mesmas características.
Podemos inferir que o sistema máquina, conforme abordado nesta pesquisa, se difere do sistema humano, uma vez que não é capaz, por exemplo, de tomar decisões levando o contexto geral do usuário em consideração. É possível perceber esta afirmação ao olharmos as respostas referentes a unidade de contexto [1UC 10] que nos faz entender que, por mais que haja o aprendizado da máquina, esse aprendizado é percebido por menos da metade das pessoas entrevistadas. É importante ressaltar que as máquinas atuais são capazes de tomar decisões mediante dados coletados através do seu uso contínuo, porém esses dados são inseridos pelos usuários e não percebidos pelos sistemas como podemos averiguar nas passagens abaixo:
1 - "(...) Eu entendo que não aprende. A impressão que eu tenho é que ele não entende o contexto das coisas e acho que tenho a sensação que não aprende não." (Entrevistado 4)
2 - "Eu não sinto uma evolução na nossa troca, na nossa interação, com base do que já eu ensinei pra ela. Tudo o que eu sei que ela aprendeu foi o que eu configurei assim." (Entrevistado 14).
Apesar do relato dos entrevistados, sabemos que a máquina consegue tomar decisões mediante dados recebidos e armazenados.
A ideia de que o sistema humano e máquina sejam capazes de perceberem e aprenderem coisas de formas semelhantes, por exemplo, através do uso contínuo, não desvalida a necessidade de refletirmos acerca dos conceitos definidos por Pangaro (2017, p. 1580). Tal como acontece no que se refere ao contexto, já que esse aprendizado se torna imperceptível pela maior parte dos entrevistados.
A definição de Pangaro (2017) para contexto, por mais que possa ser empregada no modelo conversacional entre humano-humano, humano-sistemas, humano-ambiente, não é suficiente para aplicação na relação humano-sistema baseado em comando. Por conta disso, propomos o que chamaremos de “contexto de comando” - uma variação que antecede o conceito de contexto trazido por Pangaro.
RESULTADO
A revisão do modelo conversacional proposto nesta seção é construída com base em todas as inferências percebidas ao longo do trabalho e descritas no capítulo de discussão. O modelo possui seis conceitos chaves: (1) Contexto de comando - contexto limitado às pré-configurações do sistema capaz de preparar o cenário para [...]; (2) Linguagem - ao menos um significado inicial pré-configurado ao sistema que transmita sentido, para começar um [...]; (3) Comando - ato ou efeito de comandar em interações baseadas em linguagens que podem resultar em [...]; (4) Acordo - entendimento suficiente por parte do usuário sobre as pré-configurações do sistema que podem levar a [...]; (5) Resposta-ação - capacidade de resposta de sistemas baseados em interação por voz utilizando palavras e/ou executando ações, resultando em [...]; (6) Feedback/Percepção - recebimento de dados capaz de inferir em interpretações e tomadas de decisões.

bottom of page