revisiÓn sistemÁtica de modelos de negociaciÓn de …

103
REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE TURNOS PARA INTERACCIONES CONVERSACIONALES Heibert Pérez Hernández Mauricio Navarro Rocha Universidad Católica de Colombia Facultad de Ingeniería Programa de Ingeniería de Sistemas Modalidad Presencial Bogotá D.C., Colombia 2017

Upload: others

Post on 31-Jul-2022

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE TURNOS PARA INTERACCIONES CONVERSACIONALES

Heibert Pérez Hernández Mauricio Navarro Rocha

Universidad Católica de Colombia

Facultad de Ingeniería

Programa de Ingeniería de Sistemas

Modalidad Presencial

Bogotá D.C., Colombia

2017

Page 2: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

2

REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE TURNOS PARA INTERACCIONES CONVERSACIONALES

Heibert Pérez Hernández Mauricio Navarro Rocha

Tesis presentada como requisito parcial para optar al título de:

Ingeniero de Sistemas

Director:

Ph.D. Raúl Ernesto Menéndez Mora

Universidad Católica de Colombia

Facultad de Ingeniería

Programa de Ingeniería de Sistemas y Computación

Modalidad Presencial

Bogotá D.C., Colombia

2017

Page 3: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

3

Page 4: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

4

Nota de aceptación

________________________________

RAÚL ERNESTO MENÉNDEZ MORA

Director

____________________________

Revisor Metodológico

Aprobado por el comité de grado en cumplimiento de los requisitos exigidos por la Facultad de Ingeniería y la Universidad Católica de Colombia para optar por el título de Ingeniero de Sistemas.

Page 5: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

5

AGRADECIMIENTOS

El más profundo y sincero agradecimiento a todas aquellas personas que con su ayuda

han colaborado en el desarrollo del presente trabajo.

En primer lugar, queremos agradecer a Dios por ser guía en el transcurso de este trabajo y ser nuestra fortaleza para resolver dificultades, así como darnos la oportunidad de aprender nuevos conocimientos en el transcurso de la carrera universitaria.

Se agradece al director de trabajo de grado Raúl Ernesto Menéndez, por su constante labor de orientación, consejo y supervisión, así como su inestimable accesibilidad, cercanía y apoyo.

A continuación, no podemos dejar de agradecer al director de sistemas el Ing. Holman Diego Bolívar Barón por su permanente orientación y dirección del programa de Ingeniería de Sistemas.

Damos gracias a nuestras familias por el apoyo y acompañamiento durante el transcurso de la carrera y por darnos la oportunidad de obtener una excelente educación.

Por último, es necesario agradecer a la Universidad Católica de Colombia, por formarnos como excelentes ingenieros de sistemas y permitirnos hacer parte de la mejor comunidad educativa.

Page 6: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

6

CONTENIDO

pag.

INTRODUCCIÓN 20

1 PLANTEAMIENTO DEL PROBLEMA 22

1.1 DESCRIPCIÓN DEL PROBLEMA 22

1.2 FORMULACIÓN DEL PROBLEMA 23

2 OBJETIVOS 24

2.1 OBJETIVO GENERAL 24

2.2 OBJETIVOS ESPECÍFICOS 24

3 ALCANCES Y LIMITACIONES 25

3.1 ALCANCE 25

3.2 LIMITACIONES 25

4 METODOLOGÍA 26

4.1 METODOLOGÍA PARA LA REVISIÓN SISTEMÁTICA 26

4.2 PLANIFICACIÓN DE LA REVISIÓN SISTEMÁTICA 27

4.2.1 Palabras clave. 27

4.2.2 Selección de recursos. 27

4.2.3 Definición de la cadena de búsqueda. 27

4.2.4 Procedimiento para la selección de estudios. 28

4.2.5 Análisis de los resultados de la búsqueda. 31

4.2.6 Revisión del protocolo. 36

4.3 EJECUCIÓN DE LA REVISIÓN SISTEMÁTICA 36

4.3.1 Selección de artículos iniciales. 36

4.3.2 Evaluación de la calidad de los artículos. 36

4.3.3 Extracción de los datos de los artículos seleccionados. 36

4.4 REPORTE DE LA REVISIÓN SISTEMÁTICA 37

5 MARCO TEÓRICO 38

5.1 ¿QUÉ ES UN TURNO? 38

5.2 TIEMPO 38

5.3 SUPERPOSICIÓN 39

5.4 ESTRATEGIAS PARA LA TOMA DE TURNOS 39

Page 7: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

7

5.5 TOMA DE TURNOS CONVERSACIONALES 40

5.6 LA MIRADA EN LA TOMA DE TURNOS 42

5.7 MOVIMIENTOS DE LA CABEZA EN LA TOMA DE TURNOS 43

5.8 GESTOS EN LA TOMA DE TURNOS 44

5.9 RESPIRACIÓN EN LA TOMA DE TURNOS 46

5.10 ENTONACIÓN EN LA TOMA DE TURNOS 47

5.11 EDAD Y GÉNERO EN LA TOMA DE TURNOS 48

5.12 ESTADOS EMOCIONALES EN LA TOMA DE TURNOS 49

5.13 MÁQUINAS DE ESTADO FINITO EN LA TOMA DE TURNOS 49

5.14 SEÑALES NO VERBALES EN LA TOMA DE TURNOS 50

5.15 TECNOLOGÍA DE BOTS CONVERSACIONALES 51

5.16 ROBOTS EN LA TOMA DE TURNOS 52

5.17 LA TOMA DE TURNOS EN AGENTES CONVERSACIONALES

PERSONIFICADOS 53

6 RESULTADOS 55

6.2 CONCEPTOS RELACIONADOS CON LA TOMA DE TURNOS 55

6.3 MODELOS DE TOMA DE TURNOS, ANÁLISIS DE LAS CARACTERÍSTICAS

DE LA MIRADA, MOVIMIENTOS DE LA CABEZA, RESPIRACIÓN Y AGENTES

CONVERSACIONALES 56

6.4 CONVERSACIÓN DINÁMICA EN LA TOMA DE TURNOS 68

6.5 ANALIZAR Y DEFINIR ESTRATEGIAS EN LA CONVERSACIÓN PARA LA

TOMA DE TURNOS EN HUMANOS 68

6.6 TOMA DE TURNOS CON EL NIVEL DE ENTONACIÓN 71

6.7 MODELO DE TOMA DE TURNOS EN UNA CONVERSACIÓN MULTIPARTITA

74

6.8 ANALIZAR LA DENSIDAD DE UNA CONVERSACIÓN EN LA TOMA DE

TURNOS 75

6.9 LA PROXÉMICA EN LA TOMA DE TURNOS 75

6.10 MODELO DE PREDICCIÓN DE TOMA DE TURNOS EN BASE AL TIEMPO 76

6.11 MODELO DE TOMA DE TURNOS ANALIZANDO EL CONTEXTO 78

6.12 TOMA DE TURNOS EN UNA CONVERSACIÓN EN UNA CONVERSACIÓN

TELEFÓNICA 78

6.13 MODELO DE TOMA DE TURNOS, BASADO EN MÁQUINAS DE ESTADO

Page 8: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

8

FINITO 79

6.14 MODELOS DE TOMA DE TURNOS QUE TIENEN EN CUENTA LA EDAD Y EL

GÉNERO 79

6.15 ESTADOS EMOCIONALES EN LAS CONVERSACIONES HUMANO-ROBOT 82

CONCLUSIONES 84

BIBLIOGRAFÍA 86

Page 9: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

9

LISTA DE TABLAS

pag.

Tabla 1. Bases de datos 27

Tabla 2. Clasificación de artículos 30

Tabla 3. Artículos publicados por año 31

Tabla 4. Porcentaje de artículos por país 32

Tabla 5. Porcentaje de búsqueda de artículos en bases de datos 33

Tabla 6. Tipo de investigación 35

Tabla 7. Formato RAE 37

Page 10: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

10

LISTA DE ILUSTRACIONES

pag.

Figura 1. Protocolo de investigación 26

Figura 2. Proceso de selección de artículos 29

Figura 3. Porcentaje de clasificación de artículos 30

Figura 4. Artículos publicados por año 32

Figura 5. Porcentaje de artículos por país 33

Figura 6. Porcentaje de búsqueda de artículos en bases de datos 34

Figura 7. Porcentaje de artículos por tipo de investigación 35

Figura 8. Principios de la toma de turnos 42

Figura 9. Agente personificado Greta 46

Figura 10. Respiración toma de turnos 47

Figura 11. Agente personificado NAO 53

Figura 12. Agente personificado Érica 54

Page 11: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

11

GLOSARIO

AGENTE CONVERSACIONAL PERSONIFICADO (ECA): Un agente con características de tipo humano, generalmente representado por un avatar 3D1.

ÁRBOLES DE DECISIÓN: Árbol de decisión. Modelo de predicción utilizado en el ámbito de la inteligencia artificial. Es además un diagrama que representa en forma secuencial, condiciones y acciones. Sirven para representar y categorizar una serie de condiciones que ocurren de forma sucesiva, para la resolución de un problema. Ellos proveen una visión gráfica de la toma de decisión necesaria, especifican las variables que son evaluadas, qué acciones deben ser tomadas y el orden en la cual la toma de decisión será efectuada. Cada vez que se ejecuta un árbol de decisión, solo un camino será seguido dependiendo del valor actual de la variable evaluada2.

AVERSIÓN DE LA MIRADA: La aversión de la mirada se define como la redirección intencional de la mirada lejos de la cara de un interlocutor3.

BACKCHANNEL: En la conversación, un backchannel es un ruido, gesto, expresión o palabra utilizada por un oyente para indicar que él o ella está prestando atención a un hablante4 .

BRECHA: Brechas referidos a silencios cortos entre turnos o en posibles puntos de culminación5.

1 Griol, D., Molina, J. M., Callejas, Z., & López-Cózar, R. (2011). La plataforma EDUCAGENT: Agentes Conversacionales Inteligentes y Entornos Virtuales aplicados a la Docencia. Informática Educativa Comunicaciones. [En línea] Disponible en http://hdl.handle.net/10016/18278 2 UTM. (2014). Árbol de decisión. Universidad de México. [En línea].Disponible en http://www.utm.mx/~jahdezp/archivos estructuras/DESICION.pdf.

3 Fernández, R., Lucht, T., Rodríguez, K., & Schlangen, D. (2006). Interaction in task-oriented human-human dialogue: The effects of different turn-taking policies. In 2006 IEEE ACL Spoken Language Technology Workshop, SLT 2006. [En línea]. Disponible en. http://doi.org/10.1109/SLT.2006.326791

4 Nordquist, R. (2017). Back-Channel Signal Definition and Examples. Retrieved May 29, 2017. [En línea]. Disponible en https://www.thoughtco.com/back-channel-signal-communication-1689153

5 Heldner, M., & Edlund, J. (2010). Pauses, gaps and overlaps in conversations. Journal of Phonetics, 38(4), 555–568. [En línea]. Disponible en http://doi.org/10.1016/j.wocn.2010.08.002

Page 12: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

12

CHATTERBOT O BOT: Un chatterbot o bot conversacional es un programa que simula una conversación con una persona6.

COMUNICACIÓN NO VERBAL: Lo no verbal es lo que manifiesta "sin palabras", es decir a través de signos: Imágenes sensoriales, sonidos, movimientos corporales7.

COMUNICACIÓN VERBAL: Es la interacción que los seres humanos tienen por medio de las palabras de forma oral o escrita8.

CONVERSACIÓN: Conversación es la acción y efecto de hablar una o más personas con otra u otras. El término procede del latín conversatio y suele utilizarse como sinónimo de diálogo o plática9.

En muchos contextos, los turnos en una conversación son un medio valioso para participar en la vida social y han sido sometidos a la competencia. A menudo se piensa que las estrategias para tomar turnos a su vez se diferencian por género ; Mientras que los primeros estudios apoyaron los estereotipos de género, como los hombres interrumpen más que las mujeres y las mujeres hablan más que los hombres10.

ENTONACIÓN: Movimiento melódico con el que se pronuncian los enunciados, el cual implica variaciones en el tono, la duración y la intensidad del sonido, y refleja un significado determinado, una intención o una emoción11. Generalmente acompañan, modifican o complementan el lenguaje verbal, varían según la cultura,

6 Santos Pérez, M. (2014). Análisis y Optimización de Agentes Conversacionales 3D para Sistemas Empotrados. [En línea]. Disponible en http://doi.org/10.1098/rstb.2004.1476.

7 Guerri, M. (2017). La comunicación no verbal, el arte de expresarse sin hablar. Recuperado May 29, 2017. [En línea]. Disponible en https://www.psicoactiva.com/blog/la-comunicacion-no-verbal-el-arte-de-expresarse-sin-hablar/.

8 Diaz, M. (2013). La comunicación verbal - SELVV. Recuperado May 29, 2017. [En línea]. Disponible en https://selvv.com/comunicacion-verbal/.

9 et al. Varela Iglesias J L, Tadeo Monge FT, Carreño Rujillo G, Doménech Colón F, Abad León A, “Real Academia Española. Conversación,” Edición del Tricentenario. p. 1, 2014. [En línea]. Disponible en http://dle.rae.es/srv/fetch?id=AgW2atc. 10 Hayashi, M. (2012). Turn Allocation and Turn Sharing. In The Handbook of Conversation Analysis (pp. 167–190). Chichester, UK: John Wiley & Sons, Ltd. [En línea]. Disponible en http://doi.org/10.1002/9781118325001.ch9.

11 et al. Varela Iglesias J L, Tadeo Monge FT, Carreño Rujillo G, Doménech Colón F, Abad León A, “Real Academia Española. Diccionario Usual.Entonación,” Edición del Tricentenario. p. 1, 2014. [En línea]. Disponible en http://dle.rae.es/srv/fetch?id=FilFwSN.

Page 13: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

13

el tiempo y el contexto12.

GESTOS ICÓNICOS: Los gestos icónicos o no deícticos (también descriptivos, figurativos, caracterizadores, representacionales y simbólicos) simulan acciones que no se desarrollan, literalmente, en el momento y dependen de habilidades que entrañan algún tipo de imitación, simulación o simbolización; tienen como objetivo hacer que el receptor imagine la correspondiente acción en un contexto común, la cual le permitirá comprender la intención social del comunicador. Los gestos icónicos no dependen del lenguaje13.

Gracias a toda la información que captura este dispositivo, los desarrolladores de

software pueden hacer uso de él para programar toda una serie de aplicativos cuyo

activo principal es la interacción con los elementos “virtuales” a través de los

distintos movimientos del cuerpo humano14.

INHALAR: Aspirar voluntaria o involuntariamente, ciertas sustancias, como gases,

vapores, partículas15.

INTERACCIÓN DIÁDICA: Proceso en el que dos personas actúan frente a frente como emisores y receptores, en una conversación16.

INTERACCIÓN MULTIPARTITA: La interacción multipartita es una estrategia de comunicación donde se necesitan tres o más participantes en la conversación. En el campo de la interacción humano-máquina los científicos han tratado de crear un entorno donde el sistema sea capaz de interpretar de manera individual a los oradores, tiene como fin crear un ambiente en el que el agente artificial pueda

12 Gatica, J. (2014). Lo icónico se relaciona con imágenes ( representación gráfic de jaime gatica en Prezi. Retrieved May 23. [En línea]. Disponible en https://prezi.com/sqmvcjaitt1v/lo-iconico-se-relaciona-con-imagenes-representacion-grafic/.

13 Ovocomunicacionesoficia. (2015). Los gestos icónicos o no deícticos... - Comunicación NO Verbal. Retrieved May 29, 2017. [En línea]. Disponible en https://www.facebook.com/ovocomunicacionesoficial/posts/912944305466373.

14 Alejandro Murillo. (2012). ¿Qué es el dispositivo Kinect? | Kinect for Developers. Retrieved May 29, 2017. [En línea]. Disponible en http://www.kinectfordevelopers.com/es/2012/11/06/que-es-el-dispositivo-kinect/.

15 et al. Varela Iglesias J L, Tadeo Monge FT, Carreño Rujillo G, Doménech Colón F, Abad León A, “Real Academia Española. Diccionario Usual.Inhalar,” Edición del Tricentenario. p. 1, 2014. [En línea]. Disponible en http://dle.rae.es/srv/search?m=30&w=inhalar. 16 medciclopedia. (2008). comunicación interpersonal diádica | Diccionario Médico. Retrieved May 29, 2017. [en línea]. Disponible en https://diccionario.medciclopedia.com/c/comunicacion-interpersonal-diadica/.

Page 14: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

14

participar en una conversación humana de forma continua y equilibrada17.

KINECT: Kinect es un dispositivo, inicialmente pensado como un simple controlador de juego, que gracias a los componentes que lo integran: sensor de profundidad, cámara RGB, array de micrófonos y sensor de infrarrojos (emisor y receptor), es capaz de capturar el esqueleto humano, reconocerlo y posicionarlo en el plano18.

La conversación es un medio valioso en la participación social y ha sido sometido a la competencia por parte de sus participantes19.

LENGUAJE CORPORAL: La comunicación puede definirse como la interacción entre dos o más personas, con el propósito de compartir un significado. Partiendo de la premisa de que todo comunica, se puede decir que los seres humanos son capaces de enviar una gran cantidad de mensajes sin necesidad de utilizar palabras, así sean conscientes de ello o no. El lenguaje corporal, por lo tanto, es la capacidad de transmitir información a través de nuestro cuerpo. Revela completamente nuestras sensaciones y la percepción que se tiene acerca de nuestro interlocutor. También denominado como kinésica o comportamiento kinésico, el lenguaje corporal se ocupa de estudiar las referencias expresivas, comunicativas, que ostentan nuestros movimientos corporales y asimismo de aquellos gestos conscientes, inconscientes, que se han aprendido, o somatogénicos, ya sean no orales, de percepción visual, táctil o auditivo.

LÉXICO: El léxico es conocido como el inventario de las unidades que conforman una lengua. Cuando se habla de vocabulario de una lengua se está refiriendo al conjunto total de palabras que hay en ésta, en otras palabras, a su léxico. Este es un término que se aplica ampliamente en el estudio de la lingüística y sus formas para definir el modo de hablar de las personas. Los léxicos son por lo general, las formas de expresión de la lengua en un determinado grupo social. El léxico de una lengua, evidentemente, es un conjunto abierto, pues está constantemente enriqueciéndose con nuevas palabras, bien sea porque los hablantes de esa lengua las inventen, o porque las tomen prestadas de otras lenguas. Asimismo, el léxico de una lengua cambia rápida o lentamente de acuerdo con los cambios geográficos, políticos o culturales en que los hablantes participan. No todo el mundo habla ni

17 Bono, M. (2004). What is a Multiparty Interaction? Analysis 1: Facing formation and Participation Framework Analysis 2: Schisming in Multiparty and Sign Language Conversation. [En línea]. Disponible en http://research.nii.ac.jp/~bono/media/poster/IAB.pdf.

18 Alejandro Murillo. (2012). ¿Qué es el dispositivo Kinect? | Kinect for Developers. Retrieved May 29, 2017. [En línea]. Disponible en http://www.kinectfordevelopers.com/es/2012/11/06/que-es-el-dispositivo-kinect/. 19 Definición ABC, “Definición de Genética » Concepto en Definición ABC, Lenguaje corporal,” Definición de Genética, 2017. [En línea]. Disponible en https://www.definicionabc.com/comunicacion/lenguaje-corporal.php.

Page 15: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

15

escribe igual en todas las regiones y países20.

MÁQUINA DE ESTADOS FINITOS (FSM): Un autómata finito (AF) o máquina de estado finito es un modelo computacional que realiza cómputos en forma automática sobre una entrada para producir una salida21. Este modelo está conformado por un alfabeto, un conjunto finito de estados, una función de transición, un estado inicial y un conjunto de estados finales.

MODELOS DE MARKOV: En la teoría de la probabilidad, se conoce como cadena de Márkov o modelo de Márkov a un tipo especial de proceso estocástico discreto en el que la probabilidad de que ocurra un evento depende solamente del evento inmediatamente anterior. Esta característica de falta de memoria recibe el nombre de propiedad de Markov22.

MULTIMODAL: Se define a la comunicación multimodal como "aquella comunicación en la que intervienen modos humanos, como, por ejemplo: la voz o el habla, los gestos, los ojos, los movimientos, etc. El objetivo de la comunicación multimodal es hacer más natural la interacción hombre-máquina"23.

ORADOR: Se denomina en nuestro idioma orador a aquella persona que habla en público ya sea porque se dedica a hacerlo dando charlas, disertaciones y discursos inherentes a una materia que domina, o bien puede tratarse de un individuo que asume el rol de orador ante una circunstancia particular que lo lleva a pronunciar un discurso, o unas palabras improvisadas ante un gran público. Entonces, básicamente, la palabra se emplea para designar a aquel individuo que habla ante una gran audiencia24.

OYENTE: Un oyente es una persona que escucha algo. El término procede del verbo oír que refiere a la capacidad de un individuo para percibir un sonido. Los seres humanos pueden oír gracias al sistema auditivo25.

20 conceptodefinicion., “¿Qué es Léxico? - Su Definición, Concepto y Significado,” 2014. [En línea]. Disponible en http://conceptodefinicion.de/lexico/. 21 wordpress, “AFND | Interpolados,” 2017. [en línea]. Disponible en https://interpolados.wordpress.com/tag/afnd/.

22 Basharin, Gely P, Langville, Amy N, Naumov, V. A. (2004). Editorial note. Linear Algebra and Its Applications, 386, xii–xiii. [En línea]. Disponible http://doi.org/10.1016/j.laa.2004.04.001.

23 T. Tamayo, “Tesina Tamayo 2009 FADU UNL: Comunicación Multimodal,” 2009. [en línea]. Disponible en http://vaccaritesinatamayo2009.blogspot.com.co/2009/09/comunicacion-multimodal.html.

24 Gabriel D, “Definición de Orador » Concepto en Definición ABC,” Definición ABC, 2008. [En línea]. Disponible en https://www.definicionabc.com/comunicacion/orador.php. 25 J. Perez Porto and A. Gardey, “Definición de oyente - Qué es, Significado y Concepto,” 2008. [en línea]. Disponible en http://definicion.de/oyente/.

Page 16: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

16

PROSODIA: La Prosodia es una rama de la Lingüística, que analiza y representa formalmente aquellos elementos no verbales de la expresión oral, tales como el acento, los tonos, la entonación y la cantidad, realiza esta última en el tiempo y las pausas26.

PROXÉMICA: Se conoce por este nombre a una de las disciplinas que estudian la comunicación no verbal. La proxémica, creada en 1968 por el antropólogo estadounidense Edward Hall, examina la manera en que las personas ocupan el espacio y la distancia que guardan entre ellos al comunicarnos verbalmente. Ésta puede variar según nuestro interlocutor sea una audiencia, un conocido, un amigo o una persona especialmente querida que, como cabe suponer, es la más cercana. El grado de comodidad durante la conversación también es determinante: si las personas se sienten agredidas, se tiende a retroceder27.

RED NEURONAL: Existen numerosas formas de definir a las redes neuronales;

desde las definiciones cortas y genéricas hasta las que intentan explicar más

detalladamente qué son las redes neuronales. Por ejemplo:

1) Una nueva forma de computación, inspirada en modelos biológicos.

2) Un modelo matemático compuesto por un gran número de elementos

Procesales organizados en niveles.

3) Un sistema de computación compuesto por un gran número de elementos

simples, elementos de procesos muy interconectados, los cuales procesan

información por medio de su estado dinámico como respuesta a entradas

externas.

4) Redes neuronales artificiales son redes interconectadas masivamente en paralelo de elementos simples (usualmente adaptativos) y con organización jerárquica, las cuales intentan interactuar con los objetos del mundo real del mismo modo que lo hace el sistema nervioso biológico28.

26 Universidad Autónoma de Barcelona. (1999). Estudios de linguistica del espanol. Universidad Autónoma de Barcelona. [En línea]. Disponible en http://elies.rediris.es/elies15/cap21.html.

27 Martínez, L. (2014). ¿Qué es proxemica? Muy Interesante. [En línea]. Disponible en http://www.muyinteresante.es/cultura/arte-cultura/articulo/ique-es-la-proxemica.

28 Ruiz, C. A., Susana, M., Autor, B., Damián, :, & Matich, J. (2001). Universidad Tecnológica Nacional Facultad Regional Rosario Departamento de Ingeniería Química, Redes Neuronales: Conceptos Básicos y Aplicaciones. [En línea]. Disponible en

https://www.frro.tn.edu.ar/repositorio/catedras/quimica/5_anio/orientadora1/monograias/matich-redesneuronales.pdf.

Page 17: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

17

ROBOT: Es una máquina controlada por ordenador y programada para moverse, manipular objetos y realizar trabajos a la vez que interacciona con su entorno. Los robots son capaces de realizar tareas repetitivas de forma más rápida, barata y precisa que los seres humanos. El término procede de la palabra checa robota, que significa "trabajo obligatorio" y fue empleado por primera vez en la obra teatral de 1921 R.U.R. (Robots Universales de Rossum) por el novelista y dramaturgo checo Karel Èapek. Desde entonces se ha empleado la palabra robot para referirse a una máquina que realiza trabajos para ayudar a las personas29.

SEMÁNTICA: La Semántica es el estudio del significado de las palabras. A diferencia de la etimología, la semántica comprende un campo de relación entre palabras, formas y símbolos con el material real o abstracto que trata la elaboración de una frase. La semántica estudia el significado de una palabra cuando su acción describe una función, un objeto y este es parte de un contexto visible y comprensible. Se puede enunciar que la semántica comprende un complejo sistema de variables que son usadas para determinar el sentido de una oración o un texto. Los complementos que rodean lo principal del tema pueden alterar el curso de las ideas, trayendo consigo una diversificación de las palabras y los sonidos30.

SINTAXIS: Sintaxis es la parte de la gramática que estudia la forma en que se combinan y relacionan las palabras para formar secuencias mayores, cláusulas y oraciones y la función que desempeñan dentro de estas. La sintaxis estudia los tipos de oraciones. Es también el orden y modo de relacionarse las palabras dentro de la oración o las oraciones dentro de un discurso: la sintaxis de esta frase es incorrecta. En informática es la forma correcta en que deben estar dispuestos los símbolos que componen una instrucción ejecutable por el ordenador. Algunas palabras que tienen un significado similar son: construcción, ordenación, conexión, reunión31.

SUPERPOSICIÓN O SOLAPAMIENTO: La superposición es una conversación simultánea por dos o más participantes conversacionales, independientemente de su estatus denominado una interrupción32.

SVM (MÁQUINA DE VECTORES DE SOPORTE): Las máquinas de soporte vectorial (SVM, por sus siglas en inglés) son un conjunto de algoritmos de

29 EcuRed, “Robot,” 2017. [En líena]. Disponible en https://www.ecured.cu/Robot. 30 conceptodefinicion, “¿Qué es Semantica? - Su Definición, Concepto y Significado,” 2014. [En línea]. Disponible en http://conceptodefinicion.de/semantica/.

31 Definición.De, “Definición de sintaxis - Qué es, Significado y Concepto,” Definicion.de©, 2008. [En línea]. Disponible en http://definicion.de/sintaxis/. 32 Briz, A. (2000a). Las unidades de la conversación. Revista Del Instituto de Lengua Y Cultura Españolas, p. 225–246.

Page 18: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

18

aprendizaje supervisado desarrollados por Vapnik y Cortés (1995) y su equipo AT&T, que han surgido como métodos relacionados con problemas de clasificación y regresión33.

TOMA DE TURNOS: Es la forma en la que se organiza una conversación y el discurso en las cuales las personas que participan de esto, establecen turnos alternados. Es la transición de un orador diferente, utilizando una variedad de pistas lingüísticas y no lingüísticas34.

TONO PLANO: Entonación o afinación se dice que es plana cuando está por debajo del verdadero tono35.

TURNO: La palabra turno es sinónima de orden. Un mecanismo de orden, en la vida y en el lenguaje. Desde el punto de vista conceptual, el turno responde a una forma de sucesión establecida o prevista para hacer, decir, o recibir algo. Es un mecanismo de regulación social en cualquier interacción. En esta se entiende que alguien tiene el turno cuando le corresponde el momento de la acción. Dar el turno es favorecer o hacer posible dicha acción, Tomar el turno es pedir o ejercer la acción, haciéndola o recibiéndola36.

33 Sánchez Anzola, N. (2016). Máquinas de soporte vectorial y redes neuronales artificiales en la predicción del movimiento USD/COP spot intradiario. ODEON, (9), p.113. [En líena]. Disponible en http://doi.org/10.18601/17941113.n9.04.

34 Streeck, P. J. (1995). Conversation Analysis, (1994), p.1–6. [en línea]. Disponible en http://doi.org/10.4324/9780203798874.ch5.

35 Benward, B., & Saker, M. (2008). Music in theory and practice. McGraw-Hill. McGraw-Hill. [En línea]. Disponible en http://www.getcited.org/pub/103017394.

36 Briz, A. (2000b). Turno y alternancia de turno en la conversación. Revista Argentina de Lingüística, (16), p. 9–32.

Page 19: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

19

RESUMEN

La comunicación ha sido un proceso indispensable en la evolución de la humanidad. Sin esta, hubiese sido imposible la transición hasta el estado actual. Sin embargo, los procesos de comunicación entre los humanos, a pesar del desarrollo de la humanidad, siguen siendo objetos de estudio. La comunidad científica en áreas como la robótica, la inteligencia artificial, la psicología, el procesamiento de lenguaje natural, sigue muy de cerca esta temática debido a su interés en lograr agentes inteligentes con capacidades comunicativas similares a los humanos.

Esta revisión sistemática estudia los modelos de negociación de turnos en interacciones humanas. Describe el problema actual con el fin de comprender los conceptos, procesos y teorías que describen y fundamentan la temática. Para la realización de este trabajo se utilizó un protocolo de revisión sistemática que permitió la recopilación y análisis de la información. A continuación, se evaluaron los elementos predominantes de los modelos de toma o negociación de turnos conversacionales y se presentaron conclusiones sobre las características fundamentales.

Page 20: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

20

INTRODUCCIÓN

La conversación es la acción de hablar con una o más personas en un tiempo limitado, donde pueden expresar ideas opiniones o conocimiento referente al tema de conversación37. El diálogo es una plática entre dos o más personas, que alternativamente manifiestan sus ideas o afectos38, surge como una necesidad de comunicación, para lograr organización en las sociedades.

La toma de turnos permite organizar la participación de oradores e interlocutores en una conversación diádica o multipartita. Los interlocutores tienen la posibilidad de ser tanto emisores como receptores de información en el intercambio de turnos39.

¿Por qué es importante analizar la toma de turnos en una conversación humano-agente? En la actualidad los humanos dependen cada vez más de la tecnología para satisfacer sus necesidades como, por ejemplo, la creación de robots asistentes con inteligencia artificial que facilitan a los humanos la realización de determinadas tareas40. Es importante analizar la toma de turnos en las conversaciones humano-agente, la negociación de turnos permite organizar el diálogo como se mencionó anteriormente, logrando una comunicación fluida, coordinada como ayuda para la interacción o que incluso aumente la eficiencia de la tarea.

37 et al. Varela Iglesias J L, Tadeo Monge FT, Carreño Rujillo G, Doménech Colón F, Abad León A, “Real Academia Española. Conversación,” Edición del Tricentenario. p. 1, 2014. [En línea]. Disponible en http://dle.rae.es/srv/fetch?id=AgW2atc. 38 Ibíd.p.1. 39 C. I. Hovland, “Social Communication,” 1948. [en línea]. Disponible en http://socialcommunication.truman.edu/hidden-social-dimensions/turn-taking/.

40 Adrián Moreno, “Toyota ha creado un robot compañero para adultos - Voltaico,” 2016. [En línea]. Disponible en https://voltaico.lavozdegalicia.es/2016/10/toyota-robot-companero-adultos/.

Page 21: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

21

Además, se requiere que la conversación sea equilibrada entre el humano y el agente para que la participación sea igual entre las partes y el diálogo sea exitoso41. El contexto visual es un factor influyente en el éxito del tema que se quiere tratar, esto, sumado al inicio de una buena conversación son factores que ayudan a mantener y predecir el contenido del diálogo42.

Los gestos verbales y no verbales deben ser considerados e implementados en los agentes. El contacto visual, el movimiento de la cabeza, el movimiento de los brazos e incluso expresar emociones en el agente para lograr una conversación más humana y dar una pista de cuando la persona o el agente debe tomar o ceder el turno. El objetivo de que un agente realice una eficaz toma o negociación de turnos, requiere que se comporte en la conversación como un humano y pueda interactuar como éste. Por ello los agentes deben ser construidos con base en modelos de toma de turnos entre humanos.

En este trabajo se realizó una revisión sistemática sobre los modelos de toma o negociación de turnos en conversaciones. Para esto se adaptó un protocolo de revisión bibliográfica con el fin de establecer el estado del arte. Se determinó las bases de datos para buscar los artículos relevantes sobre modelos de negociación de turnos en conversaciones, se analizaron 50 artículos de los últimos 16 años. Se busca evaluar estos modelos para establecer las características predominantes en la toma de turnos, para que investigadores, compañías y universidades los puedan emplearla para mejorar los modelos existentes y se puedan aplicar a los agentes personificados y mejorar su interacción con el humano.

El trabajo está dividido en siete secciones, planteamiento y descripción del problema de la investigación, objetivo general y objetivos específicos, alcance y limitaciones de la investigación, metodología, ejecución de la revisión sistemática, marco conceptual, marco teórico, resultados, conclusiones y finalmente la bibliografía.

41 Skantze, G. (2017). Predicting and Regulating Participation Equality in Human-robot Conversations. Proceedings of the 2017 ACM/IEEE International Conference on Human-Robot Interaction - HRI ’17, (March), p.196–204. [En línea]. Disponible en http://doi.org/10.1145/2909824.3020210.

42 Richardson, D. C., Dale, R., & Tomlinson, J. M. (2009). Conversation, Gaze Coordination, and Beliefs About Visual Context. Cognitive Science, 33(8), p.1468–1482. [En línea], Disponible en http://doi.org/10.1111/j.1551-6709.2009.01057.x.

Page 22: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

22

1 PLANTEAMIENTO DEL PROBLEMA

1.1 DESCRIPCIÓN DEL PROBLEMA

En la toma de turnos en una conversación, existen diferentes patrones que se analizan tales como: la mirada, gestos, movimientos de los brazos, movimientos de la cabeza, respiración, entonación y tiempo de procesamientos de los enunciados o preguntas. En la actualidad los humanos utilizan la tecnología como un aliado confiable para solucionar diferentes problemas, como por ejemplo asistencia técnica, tanto vía web como telefónica43, realizar transacciones bancarias, búsquedas en la web, compras, entre otras. Por tal motivo es necesario estudiar los comportamientos en la toma de turnos en una conversación humano-humano y la toma de turnos cuando se interactúa con un aparato tecnológico, es decir interacciones conversacionales humano-agente. Las investigaciones realizadas podrían ayudar a construir modelos conversacionales donde los agentes evidencien comportamientos similares a los humanos en la toma de turnos. Estos modelos ayudarían a mejorar las interacciones de los agentes con los humanos, reduciendo costos en organizaciones o mejorando la calidad de vida del humano que interviene en la interacción44.

En el semillero Manning45, se decidió desarrollar una revisión sistemática de la toma de turno de una conversación diádica o multipartita, investigando los diferentes patrones mencionados. El objetivo de la revisión es tener las herramientas suficientes para desarrollar un agente conversacional capaz de interactuar con una persona, analizando las señales que se perciban del entorno.

43 Bohus, D., Raux, A., Harris, T. K., Eskenazi, M., & Rudnicky, A. I. (2007). Olympus. In Proceedings of the Workshop on Bridging the Gap Academic and Industrial Research in Dialog Technologies - NAACL-HLT ’07 (p. 32–39). Morristown, NJ, USA: Association for Computational Linguistics. [En línea]. Disponible en http://doi.org/10.3115/1556328.1556333.

44 S. Nadella, “¿Qué son los bots y por qué llegarán en un futuro a todas tus conversaciones? | tecno.americaeconomia.com | AETecno - AméricaEconomía,” 2016. [En línea]. Disponible en http://tecno.americaeconomia.com/articulos/que-son-los-bots-y-por-que-llegaran-en-un-futuro-todas-tus-conversaciones.

45 MANNING: Semillero de investigación en aprendizaje automático (Machine Learning) de

la Universidad Católica de Colombia.

Page 23: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

23

En el futuro se pretende desarrollar un agente conversacional completo que interactúe como un humano en una conversión espontánea. La información que contiene la revisión sistemática sería de utilidad para compañías e investigadores que desarrollen asistentes personales o cualquier tipo de interacción humano- agente.

1.2 FORMULACIÓN DEL PROBLEMA

Aunque existen numerosos artículos que describen modelos para la toma de turnos; los autores de este trabajo no han encontrado una revisión sistemática reciente, que ayude a identificar las características más importantes, para diseñar un modelo de toma de turnos que se pueda implementar en agentes conversacionales. Se requiere que estos modelos de toma de turnos puedan ser usados en conversaciones diádicas y multipartita como modelos de predicción eficaces que mejoren los modelos existentes.

Pregunta de investigación

¿Cómo comprender los modelos y las características fundamentales que describen el comportamiento en la toma de turnos en interacciones conversacionales, necesarias en el diseño de un modelo de negociación de turnos unificado y eficaz?

Page 24: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

24

2 OBJETIVOS

2.1 OBJETIVO GENERAL

Realizar una revisión sistemática sobre los modelos de toma o negociación de turnos.

2.2 OBJETIVOS ESPECÍFICOS

● Adaptar un protocolo de revisión bibliográfica para establecer el estado del arte.

● Determinar las bases de datos y herramientas de gestión bibliográfica para realizar la búsqueda de artículos científicos.

● Seleccionar artículos científicos relevantes para identificar los modelos de negociación utilizados en interacciones conversacionales.

● Evaluar los modelos de negociación de turnos para establecer las características predominantes.

Page 25: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

25

3 ALCANCES Y LIMITACIONES

3.1 ALCANCE

La investigación comprende una revisión de artículos científicos relevantes en los últimos 16 años, sobre modelos de toma de turnos conversacionales, donde se realizó una evaluación para establecer las características predominantes que un modelo unificado debe tener para realizar una eficaz toma de turnos.

3.2 LIMITACIONES

● El acceso restringido a algunas bases de datos, impidió considerar algunos artículos que parecían importantes para la investigación.

● La investigación no propone un modelo de toma de turnos; en su lugar se enfoca en investigar las características más importantes en los diferentes modelos de toma de turnos en conversaciones humano-humano y humano-agente.

● Los conceptos de los artículos se tradujeron al castellano, ajustándolos al contexto que el autor primario expresó en su investigación.

● La investigación no evalúa la toma de turnos en todas las culturas del mundo dado que en cada país la forma de tomar el turno es diferente, debido a que los gestos y expresiones cambian dependiendo el contexto.

● Los artículos están enfocados en la toma de turnos en una conversación. No se tuvieron en cuenta otro tipo de toma de turnos que no estuvieran enfocados en el tema.

Page 26: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

26

4 METODOLOGÍA

4.1 METODOLOGÍA PARA LA REVISIÓN SISTEMÁTICA

La metodología de revisión sistemática propuesta por el profesor Msc.Jhon Eder Masso Daza, del programa de Ingeniería de Sistemas de la Universidad Cooperativa de Colombia46. Se aplica en el desarrollo de la revisión sistemática de modelos de negociación de turnos para interacciones conversacionales. La metodología de revisión sistemática sigue los siguientes pasos:

Figura 1. Protocolo de investigación

Fuente: Propia.

46 A. Hoyos, “Proceso de Revision Sistematica,” 2011. [En línea]. Disponible en https://es.slideshare.net/GAlbertoHoyos/proceso-de-revision-sistematica.

Planeación de la revisión

Ejecución de la revisión

Reporte de la revisión

1. Formulación de

la pregunta.

2. Elección de

recursos.

3. Selección de

estudios.

4. Revisión de

protocolo.

Ejecución de la

selección.

Reporte de revisión

sistemática

Análisis de

resultados.

Page 27: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

27

4.2 PLANIFICACIÓN DE LA REVISIÓN SISTEMÁTICA

4.2.1 PALABRAS CLAVE. Se definieron las siguientes palabras claves para la búsqueda de artículos:

● Turn taking model. ● Turn taking prediction. ● Models of turn taking in conversational interaction. ● Non verbal behaviors in conversational interaction.

4.2.2 SELECCIÓN DE RECURSOS. Se utilizaron las siguientes bases de datos como fuente de información, para buscar los artículos, y comenzar la ejecución de la revisión sistemática.

Tabla 1. Bases de datos

Número Bases de datos

1 AAAI Digital Library

2 ACM Digital Library

3 Citeseer

4 Google Scholar

5 IEEE Xplore

6 ProQuest

7 PubMed

8 Sciencedirect

9 Semantic Scholar

10 SpringerLink

11 Wiley online library

12 World Scientific

Fuente: Propia

4.2.3 DEFINICIÓN DE LA CADENA DE BÚSQUEDA.

En dependencia de la base de datos usada, se realizó la búsqueda utilizando diferentes cadenas, como se observa a continuación:

● “Turn taking model”, La palabra en comillas para buscar todas las publicaciones que contengan esta frase.

Page 28: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

28

● Turn taking model filetype:pdf, para buscar solo pdf acerca de la palabra clave.

● Turn taking model and Turn taking prediction. ● Turn taking model or models of turn taking in conversational interaction. ● “turn taking” AND (OR model OR prediction) “in conversational interaction”. ● “turn taking” AND “conversation interaction” AND (model OR gestures OR

prediction).

4.2.4 PROCEDIMIENTO PARA LA SELECCIÓN DE ESTUDIOS.

Primero se realizó un proceso de selección, para incluir los estudios por título que estuvieran relacionados con el tema como:

El título del artículo, debe tratar sobre el comportamiento en la toma de turnos dentro una conversación como, por ejemplo:

● Models of turn taking in conversational interaction.

Se excluyeron los títulos que no tuvieran que ver con el objeto de estudio, como, por ejemplo:

● Turn taking model in farming.

Después de seleccionar los artículos por título, se incluyeron artículos en función al contenido del resumen, que contengan información acerca de un modelo de toma de turnos o describiera características importantes como rasgos culturales, gestos, movimientos oculares y movimientos de cabeza, en las conversaciones diádicas y multipartita de las personas (véase la figura 2).

Page 29: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

29

Figura 2. Proceso de selección de artículos

Fuente: Propia

En la tabla 2, se observa que se revisaron por título 104 y 58 por resumen, de un total de 275 artículos.

Búsqueda en bases de datos

Selección de artículos por resumen

Selección de artículos por titulo

Idioma de los artículos

Artículos seleccionados

275 artículos

Inglés

104 artículos

58 artículos

50 artículos

Page 30: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

30

Tabla 2. Clasificación de artículos

Cantidad Porcentaje

Artículos por título 104 38%

Artículos por resumen 58 21%

Total de artículos iniciales

275 100%

Fuente: Propia

En la figura 3 se observa el porcentaje de clasificación de artículos, donde el 38% corresponden a los artículos seleccionados por título y el 21% por resumen.

Figura 3. Porcentaje de clasificación de artículos

Fuente: Propia

Page 31: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

31

4.2.5 ANÁLISIS DE LOS RESULTADOS DE LA BÚSQUEDA.

Publicaciones y estadísticas realizadas en la última década acerca del comportamiento y expresiones para la toma de turnos en una conversación humana.

Tabla 3. Artículos publicados por año

Año Frecuencia Porcentaje

2001 1 2%

2002 1 2%

2004 2 4%

2005 3 6%

2006 4 8%

2007 2 4%

2009 3 6%

2010 4 8%

2011 3 6%

2012 4 8%

2013 4 8%

2014 4 8%

2015 10 20%

2016 3 6%

2017 2 4%

Total 50 100%

Fuente: Propia

En la figura 4 se observa el número de artículos consultados por año de publicación, en total se analizaron 50 artículos referentes al tema de investigación. Como se observa el año 2015 es el año con más publicaciones consultadas con el 20%, los años 2001 y 2002 tienen menos publicaciones consultadas.

Page 32: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

32

Figura 4. Artículos publicados por año

Fuente: Propia

Tabla 4. Porcentaje de artículos por país

País Frecuencia Porcentaje

Alemania 5 10%

China 1 2%

España 1 2%

Finlandia 1 2%

Francia 3 6%

Holanda 3 6%

Inglaterra 5 10%

Irán 1 2%

Japón 7 14%

Países Bajos 2 4%

Pakistán 1 2%

Suecia 4 8%

Suiza 1 2%

Usa 15 30%

Total 50 100%

Page 33: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

33

Fuente: Propia

En la figura 5, se observa el porcentaje de artículos consultados por país, en total hay14 países. La mayoría de las publicaciones son de Estados Unidos con el 30%, continúa Japón con el 14 % de las publicaciones consultadas.

Figura 5. Porcentaje de artículos por país

Fuente: Propia

Tabla 5. Porcentaje de búsqueda de artículos en bases de datos

Base De Datos Frecuencia Porcentaje

AAAI Digital Library 1 2%

ACM Digital Library 15 30%

Citeseer 1 2%

Google Scholar 13 26%

IEEE Xplore 3 6%

ProQuest 1 2%

PubMed 4 8%

Page 34: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

34

Sciencedirect 2 4%

Semantic Scholar 5 10%

SpringerLink 3 6%

Wiley online library 1 2%

World Scientific 1 2%

Cantidad 50 100%

Fuente: Propia

En la figura 6, se observa el porcentaje de artículos consultados por base de datos, en total hay 12 bases de datos. La mayoría de las publicaciones fueron consultadas de la base de datos ACM Digital Library con un porcentaje del 30%, seguida de Google Scholar con un 26%.

Figura 6. Porcentaje de búsqueda de artículos en bases de datos

Fuente: Propia

Page 35: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

35

Tabla 6. Tipo de investigación

Tipo de investigación Frecuencia Porcentaje

Cuantitativa 35 70%

Cualitativa 8 16%

Mixta 7 14%

Total 50 100%

Fuente: Propia

En la figura 7, se observa el porcentaje de artículos por tipo de investigación, en el 70% de las publicaciones el tipo de estudio correspondía a cuantitativo, seguido del 16% como cualitativo, y por último mixto con el 14%.

Figura 7. Porcentaje de artículos por tipo de investigación

Fuente: Propia

Page 36: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

36

4.2.6 REVISIÓN DEL PROTOCOLO.

Se realizaron reuniones periódicas con el asesor de trabajo de grado, para determinar si el protocolo es el adecuado en el trabajo de investigación.

4.3 EJECUCIÓN DE LA REVISIÓN SISTEMÁTICA

4.3.1 SELECCIÓN DE ARTÍCULOS INICIALES.

Se procedió a realizar una búsqueda en diferentes tipos de bases de datos acerca del tema de investigación, se encontraron 275 artículos, después de seleccionar los estudios más relevantes que cumplieran los criterios de inclusión y exclusión preestablecidos anteriormente se seleccionaron 50 artículos para realizar la revisión sistemática.

4.3.2 EVALUACIÓN DE LA CALIDAD DE LOS ARTÍCULOS.

Se buscó los artículos en bases de datos reconocidas, los artículos tratan sobre el objeto de estudio de la investigación además de tener referencias de otros artículos importantes, universidades y autores reconocidos que han estudiado el tema durante años.

4.3.3 EXTRACCIÓN DE LOS DATOS DE LOS ARTÍCULOS SELECCIONADOS.

Después de seleccionar los artículos y clasificarlos en Mendeley, se procedió a leer los artículos y se realizó el asentamiento bibliográfico, en el siguiente formato RAE (resumen analítico especializado), es una técnica para resumir documentos en materia educativa de manera que facilite la comprensión y análisis del material en cuestión, se redacta con lenguaje claro, sencillo y preciso, guardando la mayor fidelidad posible con el texto47:

47 L. D. R. Díaz, “RAE - Resumen Analítico Especializado,” 2014. [En línea]. Disponible en http://competenciascomunicativas2033.blogspot.com.co/2014/06/rae-resumen-analitico-especializado.html.

Page 37: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

37

Tabla 7. Formato RAE

NÚMERO Se especifica el número del artículo.

BASE DE DATOS -REV

Se especifica la base de datos.

TIPO DE BÚSQUEDA Se especifica el tipo de búsqueda del artículo, por ejemplo: Artículo Journal.

AUTOR Se especifica el autor del artículo.

TITULO Se especifica el título del artículo.

CENTRO O UNIVERSIDAD

Se especifica el Centro o la Universidad.

PAÍS Se especifica el país.

FECHA Se especifica la fecha de publicación del artículo.

PUBLICADO EN Se especifica el link de publicación.

CONCEPTOS CLAVE Se especifican las palabras clave del artículo.

TIPO DE INVESTIGACIÓN

Se especifica el tipo de investigación, por ejemplo: cuantitativa, cualitativa, mixta.

OBJETIVO Se especifica el objetivo de la investigación.

FUNDAMENTOS TEÓRICOS

Se especifica de forma comprensible, los temas que abordará el artículo.

METODOLOGÍA Se especifica la metodología del artículo.

RESULTADOS Se especifican los resultados obtenidos, durante la investigación.

DISCUSIÓN Se especifica el tema de discusión del artículo.

LIMITACIONES Se especifican las limitaciones del artículo.

BIBLIOGRAFÍA Se especifica toda la bibliografía del artículo.

CONCLUSIÓN Se especifica la conclusión de la bibliografía.

Fuente: Propia

4.4 REPORTE DE LA REVISIÓN SISTEMÁTICA

En el capítulo 6 se presenta una recopilación de los fundamentos teóricos que sustentaron los artículos que formaron parte de la revisión. Los resultados obtenidos por estos artículos son mostrados en el capítulo 7.

Además, se realizó un artículo del estado del arte sobre modelos de negociación de turnos para interacciones conversacionales que contiene los principales hallazgos de la investigación.

Page 38: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

38

5 MARCO TEÓRICO

5.1 ¿QUÉ ES UN TURNO?

De acuerdo a Edelsky (1981), definiciones de turno pueden ser agrupadas en dos campos principales: mecánico e interaccional. El primer grupo trata los turnos como unidades de conversación en la interacción, sin tener en cuenta el contexto social. En este grupo están los estudios de Jaffe y Feldstein (1970) y Duncan y Fiske (1985), porque para ellos el turno consiste simplemente en hablar con un límite final. Los turnos se atribuyen a un solo orador y se definen en términos del comportamiento de otras partes en la conversación (un turno termina cuando alguien demanda el foco de la conversación). Goffman (1981) dice que un turno es la oportunidad de sostener la palabra.

Por otro lado, las definiciones interaccionales se refieren a lo que ocurre durante la interacción, y toman en consideración la intención de la toma de turnos. Edelsky (1981) señala que los hablantes están más preocupados por completar temas que por unidades estructurales. Por lo tanto, define el turno como instancias de habla grabada, con la intención de transmitir un mensaje48.

5.2 TIEMPO

Otra señal asociada con la toma de turnos es la del tiempo. Dentro de la toma de turnos, el tiempo puede utilizarse como señal del oyente a saber que tienen un turno para hablar. Debido a la naturaleza misma de la toma de turnos y que depende del contexto , el tiempo varía dentro de un turno y puede ser subjetivo dentro de la conversación. Los patrones vocales, como el tono , específicos para el individuo también indican al oyente que sepa cómo se desarrollará el tiempo en la toma de turnos49.

Deborah Tannen también muestra las diferencias temporales en relación con la toma de turnos. Para un estudio en particular, utilizó una grabación de una conversación entre un grupo de sus amigos en la cena. El grupo incluía hombres y

48 McCleary, L. E., & Leite, T. de A. (2013). Turn-taking in Brazilian Sign Language: Evidence from overlap. Journal of Interactional Research in Communication Disorders, p.123–154. [En línea]. Disponible en http://doi.org/10.1558/jircd.v4i1.123.

49 Cowley, S. J. (1998). Of Timing, Turn-Taking, and Conversations. Journal of Psycholinguistic Research, p. 541–571. [En línea]. Disponible en http://doi.org/10.1023/a:1024948912805.

Page 39: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

39

mujeres de Estados Unidos de etnias mixtas. Ella concluyó que mientras la cantidad de espacio que queda entre los hablantes puede ser diferente, difiere de manera más dramática entre las personas de diferentes regiones. Por ejemplo, los neoyorquinos tienden a superponerse en la conversación, mientras que los californianos tienden a dejar más espacio entre turnos y oraciones50.

5.3 SUPERPOSICIÓN

Cuando más de una persona está participando en una conversación, existe la posibilidad de superposición o interrupción durante una conversación de dos o muchas partes que se encuentren hablando al mismo tiempo. La superposición de turnos puede ser un problema para las personas involucradas. Hay cuatro tipos de solapamiento entre ellos solapamientos terminales (significa que el discurso del oyente está a punto de terminar), continuadores (confirmación del orador, para dar turno al siguiente hablador), solapamiento condicional (significa que el orador invita a proponer o responder una pregunta) y cordal (significa que el oyente y el orador dicen algo simultáneamente como, por ejemplo, reír juntos)51.

5.4 ESTRATEGIAS PARA LA TOMA DE TURNOS

Los seres humanos utilizan diferentes tipos de estrategias, durante una conversación.

Schegloff definió cuatro conceptos importantes en la toma de turnos52:

● Par de adyacencia, significa que se necesitan de dos personas para realizar una conversación.

● Pre-secuencia, predecir la respuesta que el orador espera. ● Organización de preferencia, preferir un tipo de respuesta a una pregunta. ● Reparar, corregir errores cometidos durante la conversación.

50 Tannen, D. (2012). Turn-Taking and Intercultural Discourse and Communication. In The Handbook of Intercultural Discourse and Communication, p. 135–157. Chichester, UK: John Wiley & Sons, Ltd. [En línea]. Disponible en http://doi.org/10.1002/9781118247273.ch8.

51 Schegloff, E. A. (2000). Overlapping talk and the organization of turn-taking for conversation. Language in Society, p.1–63. [En línea]. Disponible en http://doi.org/10.1017/S0047404500001019.

52 Khoddamy Pour, F., & Yazd, A. L. (2015). Turn Taking in Conversation Analysis. International Journal of Educational Investigations. [En línea]. Disponible en Www.ijeionline.com.

Page 40: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

40

Schegloff, definió cuatro tipos de superposiciones en una conversación53:

● Superposiciones de terminales. Significa que el discurso del oyente está a punto de terminar.

● Continuadores. Confirmación del orador, para dar turno al siguiente hablador.

● Superposiciones condicionales. Significa que el orador invita a proponer o responder una pregunta.

● Cordal. Significa que el oyente y el orador dicen algo simultáneamente como, por ejemplo, reír juntos.

5.5 TOMA DE TURNOS CONVERSACIONALES

Debido a que las conversaciones necesitan realizarse organizadamente, existen reglas o principios para establecer quién habla primero y quién habla a continuación; a este proceso se le denomina toma de turnos54.

Hay dos principios rectores en una conversación55:

1. Sólo debe hablar una persona a la vez.

2. No deben existir silencios prolongados.

Mantener una conversación es una actividad humana básica. Requiere de coordinación entre los participantes, algo que no se tiene muy en cuenta. Las personas necesitan saber cuándo escuchar, cuándo pueden empezar a hablar, y cuándo ceder el turno. Los mecanismos de conversación facilitan la coordinación de las conversaciones ayudando a las personas a saber cómo y cuándo comenzar y dejar de hablar. Estos mecanismos permiten a la gente negociar efectivamente la

53 Khoddamy Pour, F., & Yazd, A. L. (2015). Turn Taking in Conversation Analysis. International Journal of Educational Investigations. [En línea]. Disponible en Www.ijeionline.com.

54 englishonline, “Turn Taking / The Language of Conversation / Exploring language / Planning for my students’ needs / English Online / English - ESOL - Literacy Online website - English - ESOL - Literacy Online,” 2009. [En línea]. Disponible en http://englishonline.tki.org.nz/English-Online/Planning-for-my-students-needs/Exploring-language/The-Language-of-Conversation/Turn-Taking. 55 Ibíd., p.1.

Page 41: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

41

toma de turnos necesaria para llevar a cabo una conversación56.

Los principios subyacentes de la toma de turnos fueron descritos por primera vez por los sociólogos Harvey Sacks, Emanuel Schegloff, y Gail Jefferson, quienes desarrollaron un modelo que se centra en explicar cómo las personas gestionan la toma de turnos en las conversaciones, sus investigaciones se enfocaron en crear un marco que se pueda utilizar en culturas y contextos diferentes estableciendo una estructura general y dinámica para las conversaciones57.

El modelo general, está compuesto por las tres reglas básicas que rigen la transición de turnos en una conversación58.

Estas reglas son:

1. El orador actual selecciona al siguiente orador haciendo una pregunta o haciendo una petición.

2. Si el orador no selecciona al próximo orador, entonces otra persona puede autoseleccionarse para comenzar a hablar.

3. El hablante puede decidir continuar hablando si ninguna otra persona se autoselecciona para comenzar a hablar.

56 J. Terra, “Technology / Culture / Design / Experience: ID FMP: Conversation Turn-Taking Model,” 2009. [En línea]. Disponible en http://julioterrany.blogspot.com.co/2009/03/id-fmp-conversation-turn-taking-model.html. 57 Ibíd., p.1. 58 Ibíd., p.1.

Page 42: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

42

Figura 8. Principios de la toma de turnos

Fuente: https://www.slideshare.net/turnercom/com120-08-conversation13edpart1

5.6 LA MIRADA EN LA TOMA DE TURNOS

Kendon, demostró que los oradores miran hacia otro lado al empezar el turno y miran a sus compañeros hacia el final de turno. Kendon también identificó la mirada de los oyentes en el hablante como una señal de atención y desviar la mirada como una señal de acuerdo59.

Bavelas, encontró que los patrones de mirada utilizados para coordinar las respuestas colaborativas en el diálogo son a menudo precedidos por el orador mirando al oyente, dando lugar a cortos períodos de mirada recíproca (en su artículo denominado ventanas de la mirada)60. Un enfoque similar para estudiar la mirada en la interacción fue adoptado por Cummins, quién encontró que muchos de los patrones de la mirada varían sustancialmente de un par de oradores a otro y debe ser considerado "una característica dinámica de una situación de conversación específica". Sus resultados están en línea con estudios anteriores sobre la

59 Oertel, C., Włodarczak, M., Edlund, J., Wagner, P., & Gustafson, J. (2012). Gaze patterns in turn-taking. In Proceedings of Interspeech 2012 p. 1–4.

60 Ibíd., p.1.

Señal orador

Mantenimiento del turno

Señal orador

Turno flexible

Señal oyente

Peticion de turno

Interrupciones

Señal oyente

Señal Backchannel

Señales de negacion de

turno

Page 43: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

43

coordinación de la mirada en el diálogo, que demostraron su dependencia de factores tales como el terreno común establecido y el conocimiento mutuo61. En los últimos años, tales hallazgos se han aplicado a la interacción humano-robot para hacer que los avatares se asemejen más a los más humanos62.

Kendon argumentó que la toma de turnos se realiza cuando un orador de cerca observa el oyente para una señal de toma de turnos y el oyente observa de cerca al orador como aceptación de esta señal63.Kendon describe que la mirada en la conversación diádica sirve para proporcionar retroalimentación visual, para regular el flujo de la conversación, para comunicar las emociones y las relaciones, así como para mejorar la concentración mediante la restricción de la entrada visual64. Argyle y Cook proporcionan una serie de datos útiles sobre las mediciones de la mirada en diferentes situaciones65. En la conversación diádica la gente se ve casi el doble de la que escucha mientras habla.

5.7 MOVIMIENTOS DE LA CABEZA EN LA TOMA DE TURNOS

Se evidenció que en conversaciones multipartita los movimientos de la cabeza son importantes porque puede funcionar como una señal más visible del foco de atención del hablante y la voluntad de tomar, mantener o ceder el turno66.

Algunas obras utilizaron con éxito señales de atención simples como la orientación del torso. Sin embargo, los investigadores se han beneficiado de los avances en la visión por computadora y han considerado principalmente la postura de la cabeza

61 Ibíd., p.2. 62 Ibíd., p.3. 63 Sato, R., & Takeuchi, Y. (2014). Coordinating turn-taking and talking in multi-party conversations by controlling robot’s eye-gaze. In The 23rd IEEE International Symposium on Robot and Human Interactive Communication (Vol. 2014–Octob, pp. 280–285). IEEE.[En línea].Disponible en http://doi.org/10.1109/ROMAN.2014.6926266.

64 Jan, D., Herrera, D., Martinovski, B., Novick, D., & Traum, D. (2007). A Computational Model of Culture-Specific Conversational Behavior. In Intelligent Virtual Agents (pp. 45–56). Berlin, Heidelberg: Springer Berlin Heidelberg. [En línea].Disponible en http://doi.org/10.1007/978-3-540-74997-4_5

65 Bavelas, J. B., & Gerwing, J. (2007). Conversational Hand Gestures and Facial Displays in Face-to-Face Dialogue. Social Communication, p. 283–308. [En línea].Disponible en http://doi.org/10.4324/9780203837702.

66 Jokinen, K. (2011). Turn taking, utterance density, and gaze patterns as cues to conversational activity. In Proceedings of ICMI 2011 Workshop Multimodal Corpora for Machine Learning: Taking Stock and Road mapping the Future p. 31–36. [En línea].Disponible en http://www.thesect.se/nomco/pubs/Jokinen - Turn taking, Utterance Density.pdf.

Page 44: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

44

como una aproximación de la mirada67.

Hadar y colaboradores han estudiado también los aspectos motores de los movimientos de la cabeza durante el habla. Paralelamente a la relación de los gestos de las manos con el habla, parece que la cabeza se mueve casi constantemente durante el habla mientras que permanece inmóvil durante las pausas y mientras se escucha. También encontraron que los movimientos rápidos de la cabeza estaban acompañados por picos primarios de sonoridad del habla68.

Se puede encontrar que los movimientos de la cabeza tienen muchas funciones, algunas se utilizan para69:

● Señalar si o no.

● Señalar interés o impaciencia.

● Mejorar la atención comunicativa.

● Señalar la intención de continuar.

● Controlar y organizar la interacción.

● Comunicar el grado de entendimiento, acuerdo o apoyo que un oyente está experimentando.

● Presentación de alternativas.

● Acompañamientos de los aspectos rítmicos de habla.

5.8 GESTOS EN LA TOMA DE TURNOS

Los estudios observados en la conversación multipartidista también han descrito el papel del gesto, más allá de la mirada, en el proceso de interacción. Por ejemplo, los gestos de los oradores, tanto la cabeza como la mano, parecen ser una función

67 Sheikhi, S., & Odobez, J.-M. (2015). Combining dynamic head pose–gaze mapping with the robot conversational state for attention recognition in human–robot interactions. Pattern Recognition Letters, 66,p. 81–90.[En línea].Disponible en http://doi.org/10.1016/j.patrec.2014.10.002.

68 Heylen, D. (2006). Head gestures, gaze and the principles of conversational structure. International Journal of Humanoid Robotics, 3(3), p. 241–267.[En línea].Disponible en http://doi.org/10.1142/S0219843606000746.

69 Ibíd., p.242.

Page 45: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

45

del papel conversacional del orador y del estado de70.

La investigación sobre gestos (ver figura 9), debe combinar métodos empíricos, teóricos y de simulación para investigar la forma, el contenido y la función de los gestos en relación con el habla71.

Bavelas, propone una distinción entre "gestos temáticos" y "gestos interactivos": Los gestos temáticos representan información semántica directamente relacionada con el tema del discurso, mientras que los gestos interactivos se refieren a algún aspecto del proceso de conversación con otra persona. Los gestos interactivos incluyen gestos de entrega (por ejemplo, marcar el estado de información como nuevo, compartido, digresión), citar gestos (reconocer las contribuciones previas de otros), buscar gestos (buscar un acuerdo o ayudar a encontrar una palabra) (Por ejemplo, tomar o dar el turno)72.

Los mecanismos de la selección del siguiente hablante, como se propone en la investigación clásica de CA (análisis conversacional), por ejemplo, apuntando al

torso del otro, se usan a menudo como un medio para indicar al próximo orador73.En

la retroalimentación se utilizan gestos especialmente icónicos para transmitir el contenido de la propuesta74. Un destinatario puede indicar la necesidad de una interrupción rápida usando un apuntamiento para exigir una aclaración. Por el contrario, un orador actual puede evitar la interrupción incipiente del destinatario utilizando un gesto de palma dirigido contra el intruso, configurando así una "valla"75. Hay gestos bastante característicos que indican la confianza que un hablante tiene en la información que puede transmitir76. Las secuencias de interacción que consisten en intentos de otros oradores de interrumpir y frustrar esta intención por el orador actual o darle paso muestran cómo los participantes del discurso manejan movimientos no icónicos77.Los oradores proporcionan una evaluación de qué información es central y cuál quieren considerar subsidiaria78.Una indicación de la información tópica con respecto al tiempo, al lugar u objetos es dada

70 Novick, D., & Gris, I. (2013). Grounding and Turn-Taking in Multimodal Multiparty Conversation. In Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) ,Vol. 8007 LNCS, p. 97–106.[En línea].Disponible en http://doi.org/10.1007/978-3-642-39330-3_11.

71 Bergmann, K., Rieser, H., & Kopp, S. (2011). Regulating dialogue with gestures: towards an empirically grounded simulation with conversational agents. Proceedings of the SIGDIAL 2011 …, p. 88–97. [En línea].Disponible en: http://dl.acm.org/citation.cfm?id=2132902.

72 Ibíd., p.89. 73 Ibíd., p.91. 74 Ibíd., p.92. 75 Ibíd., p.94. 76 Ibíd., p.95. 77 Ibíd., p.96. 78 Ibíd., p.97.

Page 46: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

46

frecuentemente apuntando o "colocando objetos" en el espacio del gesto79.

Figura 9. Agente personificado Greta

Fuente: http://doi.org/10.1142/S0219843606000746.

5.9 RESPIRACIÓN EN LA TOMA DE TURNOS

Para hablar, hay que exhalar, y tenemos que tomar respiraciones para seguir hablando durante mucho tiempo. Al iniciar un enunciado, el siguiente orador inhala profundamente. Por otra parte, la actitud de una persona acerca de un enunciado es frecuentemente representado figurativamente como respirar (ver figura 10). Por ejemplo, cuando alguien trata de mantener un perfil tan bajo como sea posible a fin de no ceder el turno, a menudo se denomina metafóricamente como contener la respiración o el ahorro de la propia respiración80.

79 Ibíd., p.98. 80 Ishii, R., Otsuka, K., Kumano, S., & Yamato, J. (2016). Prediction of Who Will Be the Next Speaker and When Using Gaze Behavior in Multiparty Meetings. ACM Transactions on Interactive Intelligent Systems, 6(1),p. 1–31. [En línea].Disponible en http://doi.org/10.1145/2757284.

Page 47: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

47

Figura 10. Respiración toma de turnos

Fuente: http://www.kecl.ntt.co.jp/openhouse/2015/exhibition/23/poster_en.pdf.

5.10 ENTONACIÓN EN LA TOMA DE TURNOS

La intención de ceder el turno se puede hacer a través de la sintaxis (por ejemplo, terminando con una pregunta directa), también en los cambios de entonación o la tasa de habla81.La entonación funciona para predecir una pausa y afirmar que el turno a un no ha terminado82.

Un incremento en el tono descendente al final de un segmento tiende a ser una liberación del turno, mientras un tono plano tiende a significar que se mantiene su turno en la conversación, la intensidad de la voz tiende a ser más baja cuando se libera el turno83.

Los niños de 3 años de edad y adultos anticipan más turnos con la entonación normal que con la entonación aplanada, mientras que los niños de primer año de edad no muestran este efecto84.

81 van Schendel, J. A., & Cuijpers, R. H. (2015). Turn-yielding cues in robot-human conversation. In New Frontiers in Human-Robot Interaction. p. 85.[En línea].Disponible en http://www.mahasalem.net/AISB2015/NF-HRI-2015-full_proceedings.pdf#page=86.

82 Magyari, L., & de Ruiter, J. P. (2012). Prediction of Turn-Ends Based on Anticipation of Upcoming Words. Frontiers in Psychology, 3(OCT).[En línea].Disponible en http://doi.org/10.3389/fpsyg.2012.00376.

83 Adrián Moreno, “Toyota ha creado un robot compañero para adultos - Voltaico,” 2016. [En línea]. Dispnible en: https://voltaico.lavozdegalicia.es/2016/10/toyota-robot-companero-adultos/. 84 A. Keitel and M. M. Daum, “The use of intonation for turn anticipation in observed conversations without

Page 48: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

48

5.11 EDAD Y GÉNERO EN LA TOMA DE TURNOS

Los niños empiezan a desarrollar habilidades para tomar turnos en la infancia, pero tardan varios años en asimilar su creciente conocimiento del lenguaje con esta habilidad85. La toma de turnos se desarrolla de los 3 a los 18 meses, pero a partir

de los 9 meses se vuelve más lento, a medida que el chico va comprendiendo más el lenguaje86.

Adultos toman turnos en brechas más cortos aproximadamente 250 ms, en los niños es más larga 1,5 a 2 segundos. Estas brechas se acortan con la edad, a medida que los niños aprenden mejor las señales de toma de turnos. Los investigadores también han comparado la interacción del niño con la interacción niño adulto. Típicamente, los niños que conversan con adultos permiten al adulto regular la interacción, y luego recogen estos comportamientos reguladores y los emplean cuando hablan con otros niños. Así, se puede esperar que la interacción entre los niños sea más equilibrada que la interacción entre adultos y niños87.

Las diferencias entre las conductas masculinas y femeninas en la toma de turnos han sido objeto de varios estudios. Los hombres tienden a seguir el modelo estándar de Sacks et al. (Minimizar las lagunas y las superposiciones), en mayor medida, mientras que una mayor cantidad de superposición se ha encontrado en las conversaciones entre las mujeres88.

El estilo de conversación entre las mujeres se ha caracterizado por lo tanto como "cooperativo", mientras que la conversación entre los hombres es más "competitivo”. A pesar de ser más hablador en general, en los contextos de sexo mixto, se ha encontrado que las mujeres hablan menos que los hombres, y los hombres parecen interrumpir a las mujeres más que al contrario89.

Estudios sobre niños demostraron que las chicas jóvenes parecen ser más habladoras y fluidas que los niños (tanto con sus madres como con otros niños), pero que los chicos tienden a dominar las conversaciones mixtas a una edad relativamente temprana.

visual signals as source of information.,” Front. Psychol., vol. 6, no. FEB, p. 108, Feb. 2015. 85 Ibíd., p.198. 86 Holler, J., Kendrick, K. H., Casillas, M., & Levinson, S. C. (2015a). Editorial: Turn-Taking in Human Communicative Interaction. Frontiers in Psychology, 6(DEC).[En línea]. Disponible en http://doi.org/10.3389/fpsyg.2015.01919.

87 Ibíd., p.199. 88 Ibíd., p.200. 89 Ibíd., p.201.

Page 49: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

49

En las interacciones entre niños y adultos, los padres parecen interrumpir a los niños más que las madres y ambos padres interrumpen a las niñas más que a los niños90.

5.12 ESTADOS EMOCIONALES EN LA TOMA DE TURNOS

Las emociones desempeñan un papel positivo en varias aplicaciones, como los entornos de aprendizaje y de entretenimiento, lo que permite a los usuarios tener una experiencia más fructífera y divertida con el sistema. La interacción es por naturaleza bidireccional. El aspecto emocional de estos nuevos paradigmas de interacción hombre-máquina necesita ser abordado desde el punto de vista del usuario (detección y reconocimiento de signos emocionales (acústicos, visuales, textuales, fisiológicos)) y del sistema (reacción y adaptación a los usos del signo emocional)91.

5.13 MÁQUINAS DE ESTADO FINITO EN LA TOMA DE TURNOS

En la década de 1960 y principios de 1970, varios investigadores propusieron modelos para explicar los patrones rítmicos de la toma de turnos en la conversación humana. En particular, Jaffe y Feldstein (1970) estudiaron la duración media de las pausas, las pausas de conmutación (cuando un orador diferente toma la palabra), el habla simultánea y las vocalizaciones de un solo hablante en las conversaciones diádicas registradas. Basados en su observación de que estas duraciones siguientes distribuciones exponenciales, propusieron modelos de Markov de primer orden para captar la alternancia de la palabra y el silencio en el diálogo. Su modelo inicial tenía cuatro estados: sólo el participante A está hablando; sólo el participante B está hablando; ambos participantes hablan; y ninguno de los participantes está hablando. Sin embargo, este modelo no distingue las pausas de conmutación de A a B de las pausas de conmutación de B a A. Con base en esta observación, amplían su modelo a un modelo de seis estados que encontraron que encajaba mejor con sus datos que el modelo de cuatro estados. Alrededor del mismo tiempo, Brady (1969) desarrolló un modelo de seis estados muy similar.

90 Ibíd., p.202. 91 Pelachaud, C. (2005). Multimodal expressive embodied conversational agents. In Proceedings of the 13th annual ACM international conference on Multimedia - MULTIMEDIA ’05 . p. 683. New York, New York, USA: ACM Press.[En línea]. Disponible en http://doi.org/10.1145/1101149.1101301.

Page 50: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

50

Entrenó los parámetros en una conversación grabada y comparó las conversaciones generadas con la original real a lo largo de varias dimensiones (duración de las pausas y del segmento de voz, solapamientos, etc.), encontrando que su modelo generalmente producía un buen ajuste de los datos92.

Mientras que Jaffe, Feldstein y Brady se interesaron principalmente en el análisis de las conversaciones humano-humano, más recientemente, varios investigadores han propuesto máquinas de estado finito para controlar los agentes de conversación. Por ejemplo, Cassell, desarrolló un modelo el estado conversacional de un agente inmobiliario personificado como una máquina de cinco estados. Dos estados indican si un usuario está presente o no, mientras que los otros tres indican quién tiene el foco de la conversación entre el usuario y el agente, o si el foco conversacional está libre. Los conflictos del conversacional no son capturados por esta máquina y son presumiblemente resueltos a través de reglas simples (por ejemplo, cuando el usuario habla, el agente cede el foco conversacional)93.

Kronild propone un método mucho más complejo, basado en los diagramas de estado de Harel, que son una extensión de máquinas de estado finito para modelar y visualizar el control abstracto94.

La arquitectura de Ymir de Thorisson es un intento de modelar los procesos cognitivos involucrados en la conversación. Cuenta con estados de diálogo, capturando, por ejemplo, quién tiene el foco de la conversación y reglas que gobiernan la transición de un estado a otro basado en "condiciones booleanas de características perceptivas". Todos estos modelos son deterministas. En cualquier punto en el tiempo, el agente sabe quién posee el piso y utiliza reglas fijas para tomar las acciones apropiadas. Estos enfoques suponen 1) que el sistema puede obtener información perfectamente fiable sobre el estado del mundo, y 2) que el propio estado es inequívoco95.

5.14 SEÑALES NO VERBALES EN LA TOMA DE TURNOS

Basado en el trabajo de Duncan y Fiske a principios de los años setenta, se conoce que hay señales de "toma de turnos" involucradas al hablar con otra persona o en un grupo. Cuando una persona está hablando y quiere que otra persona hable, su

92 Raux, A., & Eskenazi, M. (2009a). A finite-state turn-taking model for spoken dialog systems. Proceedings of Human Language Technologies The 2009 Annual Conference of the North American Chapter of the Association for Computational Linguistics on NAACL 09, (June), p. 629–637. [En línea] Disponible en http://doi.org/10.3115/1620754.162084. 93 Ibíd., p.630. 94 Ibíd., p.631. 95 Ibíd., p.632.

Page 51: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

51

entonación cambia. Hay un aumento o disminución en el tono de voz al final de la última frase. La última sílaba se extiende y una caída en el tono de la voz cuando se utiliza una frase como por ejemplo "sabes".

También hay indicadores de turno como mirar a los ojos. Cuando el orador está listo para terminar su turno, el mirará a la otra persona para indicarle que tome el turno. Muchas veces la mirada del ojo indica quién será el próximo orador, pero otra indicación es también girar la cabeza. En algunos casos, el giro de la cabeza es una señal más obvia de quién hablará a continuación. Cuando alguien quiere hablar, voltea toda su cabeza hacia el orador como una indicación de que quieren un turno. Para rechazar un turno, una persona miraría lejos o en otra persona. Si un orador realiza una pregunta a una audiencia y busca una respuesta, mira hacia diferentes miembros de la audiencia. Aquellos que no quieren contestar miran hacia abajo o miran hacia otro lado menos al orador.

Estas señales, que son una forma de comunicación no verbal, permiten a la gente saber cuándo usted quiere hablar y cuando usted no lo hace. Les dice a los demás cuando quieren que hablen y cuando no lo hagan. El uso de estas señales puede proporcionar una transición de turno eficaz de un orador a otro, pero a veces, no funcionan porque la otra persona no es consciente de ellos96.

5.15 TECNOLOGÍA DE BOTS CONVERSACIONALES

Los agentes conversacionales clásicos suelen tender a conversaciones demasiado lineales y rígidas. Para una mayor sensación de naturalidad y evitar el rechazo de los usuarios, es necesario que el sistema pueda manejar cambios inesperados de contexto y ser capaz de manejar varios objetivos de forma asincrónica. Un enfoque de este tipo de sistemas con gran éxito tanto en el ámbito académico como empresarial es el de los bots (ver marco conceptual) conversacionales. Actualmente los chatbots se utilizan en diferentes ámbitos de aplicación, como pueden ser el marketing, la educación o el entretenimiento. Uno de los más destacados es ELIZA, que es considerado el pionero de los chatterbots actuales. Debido a la escasa información disponible acerca de su funcionamiento y a la inexistencia de transcripciones públicas de alguna conversación, los chatterbots más exitosos parecen ser los basados en el lenguaje de marcas para Inteligencia Artificial, Intelligence Markup Language (AIML)97.

En 1950, Alan Turing propuso un método para determinar si una máquina puede ser considerada inteligente. Esta prueba se denomina Test de Turing y se basa en

96 Talley, L. (2012). Nonverbal Turn Taking Signals. Retrieved May 29, 2017. [En línea].Disponible en http://www.lindatalley.com/nonverbal-turn-taking-signals/.

97 Santos Pérez, M. (2014). Análisis y Optimización de Agentes Conversacionales 3D para Sistemas Empotrados,p. 185.[En línea].Disponible en http://doi.org/10.1098/rstb.2004.1476.

Page 52: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

52

asumir que si una máquina es capaz de comportarse como un ser humano, entonces dicha máquina es inteligente. El desafío consiste en hacer conversar a un interrogador o juez humano mediante un programa informático de chat con otro agente desconocido. El juez debe adivinar si la identidad del agente desconocido pertenece a un ser humano o a una máquina98.

5.16 ROBOTS EN LA TOMA DE TURNOS

A medida que se crean robots más avanzados (véase figura 11), pueden ayudarnos en múltiples áreas de nuestras vidas. Un área de interés es, por ejemplo, el cuidado de ancianos, ya que los costos de la salud en los países europeos están en aumento.

Pero no importa el tipo de trabajo, los robots asistentes deben ser no sólo capaces de realizar con éxito sus tareas, sino que traten con los seres humanos de una manera apropiada, respetuosa y productiva. Esto requiere una manera de comunicarse naturalmente con ellos, lo que implica tomar turnos en una conversación de la manera más apropiada99.

La comunicación humano-humano contiene incertidumbre y errores. Incluso con excelentes capacidades perceptivas, la gente sigue siendo víctima de interrupciones involuntarias, el discurso superpuesto, y silencios incómodos. Al moverse a la comunicación humano-robot, los problemas se intensifican por los datos de los sensores ruidosos y limitados100.

98 Ibíd., p.185. 99 van Schendel, J. A., & Cuijpers, R. H. (2015). Turn-yielding cues in robot-human conversation. In New Frontiers in Human-Robot Interaction . p. 85. [En línea].Disponible en http://www.mahasalem.net/AISB2015/NF-HRI-2015-full_proceedings.pdf#page=86.

100 Chao, C. (2012). Timing multimodal turn-taking for human-robot cooperation. In Proceedings of the 14th ACM international conference on Multimodal interaction - ICMI ’12 (p. 309). New York, New York, USA: ACM Press. [En línea].Disponible en http://doi.org/10.1145/2388676.2388744.

Page 53: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

53

Figura 11. Agente personificado NAO

Fuente: http://doi.org/10.1145/2559636.2559666.

5.17 LA TOMA DE TURNOS EN AGENTES CONVERSACIONALES

PERSONIFICADOS

Los primeros ejemplos de agentes de conversación personificados (véase figura 12) que llevan a cabo el diálogo multimodal con un usuario humano son Gandalf que puede responder preguntas sobre el sistema solar, o REA, que proporciona descripciones de la casa en el dominio inmobiliario101.

El canal visual proporcionado por la ECA puede transmitir diferentes tipos de información. Puede ofrecer redundancia sobre el mensaje hablado, haciendo hincapié en las palabras o gesticular ciertas características del significado que transmiten las palabras, también puede proporcionar información que complementa el discurso (como apuntar en una cierta dirección). Luego, también complementar el mensaje hablado con el contenido emocional transmitido por las expresiones faciales. Todos estos elementos pueden ser explorados para mejorar la robustez del diálogo.

101 N. Leßmann, A. Kranstedt, and I. Wachsmuth, “Towards a cognitively motivated processing of turn-taking signals for the embodied conversational agent Max,” in Proceedings Workshop W12, 2004, p. 57–65.

Page 54: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

54

La mirada, entonación y postura del cuerpo juegan un importante papel al crear un comportamiento conversacional adecuado al iniciar y terminar el diálogo, tomar turnos, manejar las interrupciones, proporcionar retroalimentación y corregir errores. Los ECA se han utilizado, para la satisfacción de los usuarios, para mejorar la gestión de turnos en aplicaciones que mantienen al usuario en espera durante largos períodos de tiempo. se han creado estrategias de sincronización que se superponen al gesto y al habla que pueden ser ideadas para satisfacer al usuario, Breazcal et al subraya la importancia de la comunicación no verbal para reducir la confusión del usuario con respecto al estado del flujo del diálogo y Marsi & Van Rooden ha demostrado que el usuario prefiere señales visuales sobre las verbales.

La toma de turnos y el manejo de la interrupción del usuario se realiza mejor con la regeneración facial y verbal apropiada, el lenguaje corporal y la expresividad se han utilizado, más allá de reforzar el mensaje hablado, para ayudar a regular el flujo del diálogo102.

Figura 12. Agente personificado Érica

Fuente: http://doi.org/10.1145/2993148.2998528.

102 Perez-Marin Universidad Rey Juan Carlos, D. (2011). Conversational Agents and Natural Language Interaction: Techniques and Effective Practices. [En línea].Disponible en http://psychology.unt.edu/~tparsons/PDF/Parsons_Embodied_Conversational_Virtual_Patients.pdf

Page 55: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

55

6 RESULTADOS

6.2 CONCEPTOS RELACIONADOS CON LA TOMA DE TURNOS

El presente estudio proporcionó una colección de estudios empíricos experimentales y observacionales que utilizan enfoques cualitativos y cuantitativos, complementados por artículos que aportan revisiones, que se puede observar en el artículo103, En base a una serie de investigaciones, realizan un resumen muy breve y técnico de la literatura.

En la literatura se encontró que en las conversaciones diádicas y multipartita, la conversación es altamente estructurada y organizada de acuerdo a un conjunto de principios104. En la mayoría de los casos, sólo una persona tiende a hablar a la vez y cada contribución usualmente suele recibir una respuesta. Lo que es notable es el tiempo preciso de estas contribuciones secuenciales, lo que da lugar a brechas entre los turnos de oraciones alrededor de un promedio alrededor de unos 200 ms105, de experimentos psicolingüísticos se sabe que el tiempo para producir solo una palabra de una declaración como por ejemplo: “aha”, es de mínimo 600 ms (según Indefrey and Levelt, 2004) por mucho excede la duración promedio en las brechas, esto da a pensar en la complejidad de los procesos cognitivos.

Todo lo que involucra como se realiza la toma de turnos en una conversación se ha investigado durante décadas, los investigadores han comenzado a preguntarse cómo y cuándo los procesos cognitivos y sociales requeridos maduran en los niños, así cómo se comparan con los de otras especies. Levinson (2006) propuso que los seres humanos son inherentemente una interacción social e interactiva, argumenta que desde niño se comienza a desarrollar la toma de turnos y se va perfeccionando con el tiempo. Torreira estudia cómo la respiración trabaja para detectar tiempos entre turnos y respuestas, con solamente mirar que tanto inhala ya puede decir que tanto se va a demorar para dar una respuesta. Stevanovic and Perakyla establecen dos formas de organizar la conversación, una forma formal donde todas se 103 Holler, J., Kendrick, K. H., Casillas, M., & Levinson, S. C. (2015a). Editorial: Turn-Taking in Human Communicative Interaction. Frontiers in Psychology, 6(DEC).[En línea].Disponible en http://doi.org/10.3389/fpsyg.2015.01919.

104 Sacks, H., Schegloff, E., & Jefferson, G. (1974). A Simplest Systematics for the Organization of Turn-Taking for Conversation. Language, 50(4), p. 696–735.[En línea].Disponible en http://doi.org/10.2307/412243.

105 Stivers, T., Enfield, N. J., Brown, P., Englert, C., Hayashi, M., Heinemann, T., … Levinson, S. C. (2009). Universals and cultural variation in turn-taking in conversation. Proceedings of the National Academy of Sciences of the United States of America, 106(26), p. 10587–10592.[En línea].Disponible en http://doi.org/10.1073/pnas.0903616106.

Page 56: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

56

organizan para hablar y la otra espontánea, interactiva en la cual todos participan, se nota por el contagio emocional de la conversación en la toma de turnos. En el lenguaje de señas son muy parecidos estos modelos de toma de turnos en comparación a una toma de turnos en una conversación hablada.

La toma de turnos se desarrolla de los 3 a los 18 meses, pero a partir de los 9 meses se vuelve más lento, a medida que el chico va comprendiendo más el lenguaje106.

6.3 MODELOS DE TOMA DE TURNOS, ANÁLISIS DE LAS CARACTERÍSTICAS DE LA MIRADA, MOVIMIENTOS DE LA CABEZA, RESPIRACIÓN Y AGENTES CONVERSACIONALES

El artículo107, investigó diferentes señales de turno de rendimiento que se implementó en un robot, para conversaciones Humano-Robot, se realizó un experimento con un cuestionario que midieron el desempeño y clasificación de las señales de rendimiento (señal de parar el brazo, giro de la cabeza, condición de silencio, ojos de destello).

Los resultados demuestran que el uso de una señal de rendimiento de turno (señales que el robot ejecutaba para ceder el turno al humano), puede conducir a tiempos de respuesta más rápidos en el oyente. Una de las señales son los ojos de destello (el robot producía luces en los ojos como señal de ceder el turno para que el humano continuará), tuvo como resultado, tiempos más bajos de respuesta por parte del humano y fue clasificada como la mejor señal implementada por el robot, para indicar el cambio de turno, entonces se confirma la hipótesis de que las señales de rendimiento por turnos en un robot pueden mejorar la conversación humano-robot , porque la comunicación es más coordinada y fluida.

Pero el artículo implementó un modelo de toma de turno, que se basa en cómo los humanos se percatan de las señales de un robot, pero sería más interesante, para nuestro propósito que el modelo estudie los comportamientos humanos, en la toma de turno para ser implementados en el diseño de un modelo, en el cual el robot

106 Holler, J., Kendrick, K. H., Casillas, M., & Levinson, S. C. (2015a). Editorial: Turn-Taking in Human Communicative Interaction. Frontiers in Psychology, 6(DEC). [En línea].Disponible en http://doi.org/10.3389/fpsyg.2015.01919.

107 van Schendel, J. A., & Cuijpers, R. H. (2015). Turn-yielding cues in robot-human conversation. In New Frontiers in Human-Robot Interaction . p. 85.[En línea].Disponible en http://www.mahasalem.net/AISB2015/NF-HRI-2015-full_proceedings.pdf#page=86.

Page 57: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

57

identifique las señales correctas, para tomar el turno en una conversación con humanos, se podría mejorar la investigación para trabajos relacionados a futuro.

En el artículo108 después de analizar un corpus de diálogos holandeses, se observó que la mirada de los oradores variaba, según si una negociación de turno resulta en un cambio de orador o una continuación del turno y si coincide con un solapamiento o una brecha, además de confirmar las teorías de Kendon, en las cuales se observó que los oradores miran hacia otro lado al empezar el turno y miran a sus oyentes cuando están a punto de liberar su turno.

En los solapamientos se produce un fuerte aumento de la mirada hacia el oyente poco después del inicio del solapamiento y este nivel se mantiene hasta la resolución de un completo solapamiento.

Los patrones de mirada en los solapamientos cuando hay un cambio de orador (cuando el orador que comienza un discurso intercambia su rol de orador, con el de un oyente que solapa la conversación) hay un aumento de la mirada de los oradores anteriores, directamente después del inicio de la superposición, esto se da posiblemente coincidiendo con el momento en que los oradores notan el solapamiento.

En brechas con cambio de orador (comienza un orador un discurso, en un momento dado hace una pausa y después de esta pausa el oyente toma el rol de orador), se observa que los oradores anteriores comienzan a desviar la mirada tan pronto como dos segundos antes del comienzo de un silencio.

La investigación analiza patrones de mirada en solapamientos y pausas, aunque esto es importante, se debería complementar su análisis en todos los momentos de la conversación, al estudiar el comportamiento de las miradas en la toma de turnos entre humanos para establecer nuevas teorías acerca de los patrones de mirada en un futuro.

El artículo109, describe que se han creado muchos robots de comunicación, estos robots deben adaptarse a diálogos personales cara a cara para realizar la comunicación robot –humano porque los diálogos cara a cara son la forma de 108 Oertel, C., Włodarczak, M., Edlund, J., Wagner, P., & Gustafson, J. (2012). Gaze patterns in turn-taking. In Proceedings of Interspeech 2012 .p. 1–4.

109 Sato, R., & Takeuchi, Y. (2014). Coordinating turn-taking and talking in multi-party conversations by controlling robot’s eye-gaze. In The 23rd IEEE International Symposium on Robot and Human Interactive Communication (Vol. 2014–Octob, p. 280–285. IEEE.[En línea].Disponible en http://doi.org/10.1109/ROMAN.2014.6926266.

Page 58: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

58

comunicación más natural para los seres humanos. Es difícil realizar una toma de turnos eficaz entre los seres humanos y los robots en los diálogos hablados, algunos estudios analizan esta problemática, pero no tienen en cuenta los entornos interactivos.

En esta investigación se comprobó la veracidad de dos hipótesis que tratan sobre, las diferentes percepciones que tienen los humanos al mirar un robot, la primera hipótesis es que si el robot gira los ojos al orador mientras escucha atentamente el discurso del orador, los seres humanos al mirar esta escena, piensan que el robot tiene una impresión positiva sobre la opinión del hablante entonces el siguiente orador adapta su opinión, en el caso contrario si el robot gira sus ojos al oyente mientras escucha el discurso del orador , los seres humanos al mirar esta escena, piensan que el robot tiene una impresión negativa del orador, esto se evidencia en la conversaciones reales ya que la desatención en una conversación puede estar asociada a falta de interés o percepción negativa sobre el tema que se discute.

La segunda hipótesis es que cuanto más gira la mirada del robot hacia los humanos, ellos juzgan que los robots están hablando con los humanos, cuando más el robot gira sus ojos a los demás, más los humanos juzgan que el robot está hablando con los demás, esto se puede observar en una conversación multipartita en la que pueden estar presentes varios robots y personas, entonces el humano toma en cuenta la atención de la mirada del robot como el centro de atención de la conversación y a quien está dirigiendo la conversación el robot. En esta investigación se utilizó un laboratorio, pero a futuro piensan realizar un estudio de campo y mejorar su análisis.

En particular el artículo centra la atención en las percepciones que tienen los humanos sobre algunas particularidades de los robots en las conversaciones multipartita, que son importantes para entender los comportamientos de las interacciones humano robot, pero el estudio puede mejorar sus resultados si en un futuro analizan más datos, porque los resultados son pocos sobre los patrones de las miradas en conversaciones multipartita entre humanos y robots.

La mirada es un importante comportamiento no verbal para la interacción social110. La aversión de la mirada permite que los robots alcancen una serie de funciones sociales positivas en las conversaciones con los seres humanos, además se utiliza en las conversaciones para lograr tres funciones primarias, la cognitiva, gestión del

110 Andrist, S., Tan, X. Z., Gleicher, M., & Mutlu, B. (2014). Conversational gaze aversion for humanlike robots. In Proceedings of the 2014 ACM/IEEE international conference on Human-robot interaction - HRI ’14 (pp. 25–32). New York, New York, USA: ACM Press.[En Línea].Disponible en http://doi.org/10.1145/2559636.2559666.

Page 59: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

59

foco y la modulación de la intimidad. En la función cognitiva los oradores pasan más tiempo evitando su mirada que los oyentes para poder atender mejor a la planificación y entrega de sus enunciados. La gestión del foco, permite mirar hacia otro lugar, cuando se realiza una pausa durante la conversación, se utiliza para indicar que el foco del diálogo se está manteniendo y el orador no debe ser interrumpido. En la modulación de la intimidad, las aversiones periódicas de la mirada, durante el habla o escucha, pueden servir para modular el nivel general de intimidad en la conversación.

El artículo111, también menciona que, durante una conversación, se observa un patrón en la cual el primer orador termina de hablar, mira al oyente y se efectúa una mirada momentánea, después de realizada esta acción el oyente evita su mirada y empieza a hablar. La utilización de las funciones primarias en los robots, determinó en la investigación que los robots que ejecutan versiones de mirada, durante pausas, son percibidos como manteniendo el turno, mientras que al hacer contacto visual durante la pausa es posible que el robot sea interrumpido. Esta investigación se podría complementar analizando otros patrones de conversación en la toma de turnos, tales como movimientos de la cabeza o gestos.

El artículo112, la mirada efectúa muchas funciones en la interacción cara a cara, se investigó la relación entre la mirada y la toma de turno, en especial la forma en que la mirada muestra la intención del orador de prepararse para dar el turno. Describe una colección de datos de rastreo ocular y experimentos preliminares acerca de la relación entre observación y toma de turnos en conversaciones naturales humano-humano, como estas observaciones pueden extenderse a interacciones multimodales hombre-máquina. El ojo tiene un papel importante en la coordinación de la toma de turno en una conversación, aspectos como mirar al compañero de la conversación o mirar hacia al lado, proporcionan indicios indirectos de la voluntad del compañero de continuar con la conversación. Sería interesante estudiar, cómo se comporta la mirada en una conversación con personas que no son de nuestro agrado, en la toma de turno.

En los diálogos multipartita parece ser que el movimiento de la cabeza juega un papel crucial en la intención de tomar, mantener o ceder el turno. Es importante analizar cuál factor influye de una forma significativa en una conversación multipartita, la mirada o el movimiento de la cabeza.

111 Ibíd., p.27. 112 Jokinen, K., Harada, K., Nishida, M., & Yamamoto, S. (2010). Turn-alignment using eye-gaze and speech in conversational interaction. Interspeech-2010, (September), p. 2018–2021.

Page 60: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

60

Kendon113, en las conversaciones diádicas, buscar o evitar mirar la cara de la pareja durante la conversación (es decir la mirada), proporcionan cuatro funciones: retroalimentación visual, regular el flujo de la conversación, comunicar emociones y relaciones, mejorar la concentración mediante la restricción de la entrada visual. A principios de los setenta, Argyle114, estimó que cuando dos personas están hablando, alrededor del 60% de la conversación involucra la mirada, y cerca del 30% implica mirar mutuamente (o contacto visual).

La mirada está sujeta a las diferencias individuales tales como factores de personalidad y diferencias culturales. Los patrones de la mirada parecen estar relacionados estrechamente con el habla. Kendon confirma algo que ya se había mencionado anteriormente, la persona A tiende a apartar la vista cuando comienza a hablar, y a observar a su interlocutor B, cuando el final del enunciado se acerca. Argyle y Cook115, para preparar sus enunciados los oradores necesitan mirar hacia otro lado para evitar ser distraídos por el aporte visual.

Los resultados del artículo116, indican que cuando alguien está escuchando a un individuo, existe una probabilidad del 88% de que la persona que observa es la persona que escucha. Cuando alguien está hablando con un individuo, hay un 77% de probabilidad, que la persona a la que se mire es la persona dirigida. El comportamiento de la mirada, se considera como un factor importante, en la predicción de la atención en la conversación con un humano.

En el artículo117, tuvo como objetivo comprender mediante el seguimiento de la mirada del ojo, como los espectadores no involucrados siguen una conversación entre dos personas, ofrecieron a cierto 19 participantes de Finlandia ver videos de 5.5 minutos de conversaciones entre dos personas, estos se los mostraba con y sin video con el fin de comprobar las diferencias entre señales verbales y no verbales que los participantes observaban, se analizó a cada participante, los resultados obtenidos muestran que el tiempo que un participante gasta mirando al habitual orador fue en promedio el 74%, el cual se asemeja demasiado al comportamiento

113 Vertegaal, R., Slagter, R., Van Der Veer, G., & Nijholt, A. (2001). Eye Gaze Patterns in Conversations : There is More to. In Proceedings of the SIGCHI conference on Human factors in computing systems .p. 301–308. New York, New York, USA: ACM Press.[En línea].Disponible en http://doi.org/10.1145/365024.365119.

114 Ibíd., p.301. 115 Ibíd., p.302. 116 Ibíd., p.303. 117 Hirvenkari, L., Ruusuvuori, J., Saarinen, V. M., Kivioja, M., Peräkylä, A., & Hari, R. (2013). Influence of Turn-Taking in a Two-Person Conversation on the Gaze of a Viewer. PLoS ONE, 8(8). [En línea].Disponible en http://doi.org/10.1371/journal.pone.0071569.

Page 61: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

61

de una conversación diádica en el cual el oyente mira al orador en promedio el 75% del tiempo, la mayor parte de los cambios de mirada se produjeron 0,5 segundos después del cambio del turno y alrededor de 0,3 segundos después del comienzo del habla, en base a los resultados también se determinó que ni las señales verbales así como las no verbales pueden dar la misma precisión en la conversación que se alcanza cuando ambas señales están presentes simultáneamente.

Algo para debatir es que, la organización de turnos es conocida por dirigir la mirada de los participantes en la conversación y lo resultados que obtuvieron se extienden al efecto de la mirada a espectadores pasivos, ya que los participantes se tienen en cuenta como espectadores pasivos en la conversación según este estudio, una crítica constructiva es que en próximos experimentos los espectadores pasivos tendrían que hacer parte del entorno de la conversación con las otras dos personas para que fuera más real a una conversación de tres personas en físico y así obtener mejores resultados.

La mirada ofrece diferentes patrones sobre el discurso conversacional en la toma de turnos118 . Los gestos del ojo, en una interacción con un agente personificado, plantea un enfoque no intrusivo basado en la visión, donde se estimule la mirada del ojo del oyente y de esta forma reconocer los gestos.

Realizaron un estudio compuesto por seis participantes, 2 hombres y 4 mujeres, entre 25 y 35 años de edad, en el cual interactuaban con un avatar, que se encargaba de realizar preguntas. En promedio los seis participantes hicieron gestos de aversión de mirada 12 veces por interacción con una desviación estándar de 6,8. Durante el experimento en promedio un 12% del tiempo, las personas realizaron un gesto de aversión de la mirada La mayoría de gestos que se realizaron de aversión de la mirada, correspondían cuando el participante estaba pensando en su respuesta.

El objetivo de analizar conversaciones para comparar los asentimientos en las conversaciones diádicas y multipartita , además de comparar las diferencias en el uso de un artefacto en las conversaciones de varias culturas analizando la toma de turnos se evidencio en el artículo119, En el que se analizó un corpus que comprende aproximadamente 20 horas de interacciones audiovisuales entre conversaciones

118 Morency, L.-P., Christoudias, C. M., & Darrell, T. (2006). Recognizing gaze aversion gestures in embodied conversational discourse. Proceedings of the 8th International Conference on Multimodal Interfaces - ICMI ’06, p. 287.[En Línea].Disponible en http://doi.org/10.1145/1180995.1181051. 119 Novick, D., & Gris, I. (2013). Grounding and Turn-Taking in Multimodal Multiparty Conversation. In Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) (Vol. 8007), p. 97–106.[En línea]Disponible en http://doi.org/10.1007/978-3-642-39330-3_11.

Page 62: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

62

diádicas y de cuatro personas entre hablantes nativos árabes, inglés americano y español mexicano, habían dos modos de conversaciones con artefacto (un orador tenía un muñeco de felpa en la mano), y sin artefacto (no había muñeco).

Los resultados obtenidos muestran que, para los hablantes de inglés americano, los conversantes en conversaciones diádicas se miraban menos frecuentemente que los conversantes en conversaciones multipartita. Sin artefacto, los conversantes parecían preferir solapar la conversación en la toma de turnos.

En relación con la conversación sin artefacto, los conversantes utilizan menos gestos, tal vez porque el foco común de los conversantes en el artefacto desvía su atención de las posibles muestras gestuales de sus interlocutores.

Las pruebas, que incluye un mayor solapamiento en los límites de turno, sugieren que los conversantes en la conversación multipartita no dependen tanto de la mirada como de una señal de cambio, a diferencia de los conversantes en la conversación diádica. Más bien, los conversantes en las conversaciones multipartita se solapaban repetidamente en los límites de cambio de turno, especialmente cuando una de las partes tomaba el turno, posiblemente porque el conversante no podía atraer la mirada del hablante.

Los resultados también sugieren que la presencia de un artefacto atrae la mirada de los conversantes, reduciendo así la cantidad de tiempo que los oyentes miran al orador. Esto puede contribuir al fenómeno de que los hablantes tendían a no usar los cambios de la mirada en cambio señalaban con la cabeza como un comportamiento asentimiento.

Comparando con los estudios de gestos y las expresiones faciales, los movimientos de cabeza han recibido mucha menos atención según el artículo120 , en esta investigación etiquetan algunos movimientos de cabeza como se observa a continuación:

D: Inclinar cabeza hacia abajo.

U: Inclinar cabeza hacia arriba.

F: Llevar toda la cabeza hacia adelante.

120 Heylen, D. (2006). Head gestures, gaze and the principles of conversational structure. International Journal of Humanoid Robotics, 3(3), p. 241–267.[En línea].Disponible en http://doi.org/10.1142/S0219843606000746.

Page 63: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

63

B: Llevar toda la cabeza hacia atrás.

R: Girar a la derecha del modelo.

J: Inclinar la cabeza en sentido anti horario (alrededor de la nariz).

DR: Inclina la cabeza hacia abajo con un movimiento hacia la derecha.

UR: Inclina la cabeza hacia arriba con un movimiento hacia la derecha.

DL: Inclina la cabeza hacia abajo con un movimiento hacia la izquierda.

UL: Inclina la cabeza hacia arriba con un poco de movimiento hacia la izquierda.

TL: Inclinación hacia la derecha con movimiento de cabeza hacia abajo.

TR: Inclinar hacia la izquierda con movimiento de cabeza hacia abajo.

Para cada una de estos movimientos de cabeza etiquetados determinaron una serie de funciones para cada uno de ellos que son las siguientes:

D: indicador general de énfasis.

U: indica una perspectiva más amplia.

F: indica la necesidad de una mirada más cercana.

B: indicador de estar sorprendido.

R: indica que hay más información.

L: indica que hay más información.

J: indica la expectativa del compromiso del compañero.

DR: Combina el significado de D y R.

UR: Combina el significado de U y R.

DL: Combina el significado de D y L.

UL: Combina el significado de U y L.

TL: Indica contraste de temas relacionados.

TR: quizás indica contraste de temas relacionados.

También argumenta algunas particularidades de las sonrisas, como por ejemplo en la sonrisa de vergüenza la mirada se dirige hacia abajo, en la sonrisa coqueta la cabeza se gira a los lados, en la sonrisa de vergüenza se quiere evitar la mirada y la sonrisa.

Además, el autor realiza una crítica a la mayoría de las implementaciones de modelos de mirada en la comunidad ECA (agentes conversacionales personificados) ya que estos confían en la literatura psicológica y conversacional para definir las reglas que rigen el comportamiento de la mirada de la ECA, a menudo combinadas con los datos obtenidos para el entorno particular.

Page 64: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

64

El inconveniente potencial de estas fuentes de datos es que las reglas y patrones que se encuentran en un estudio son específicos de la situación que se ha investigado. Por ejemplo, el hecho de que un estudio pueda decir que en las conversaciones diádicas los oyentes miran más a los hablantes que viceversa, puede ser invertido en una situación en la que alguien está dando instrucciones a alguna otra persona usando un mapa. En el último tipo de situación, un oyente pondrá la atención en el mapa durante la mayor parte del tiempo, y el orador mirará al oyente para comprobar si está prestando atención.

Analizaron que mirar lejos se usa para evitar distracción, para concentrarse o para indicar que la persona no quiere ser interrumpido en una conversación.

En el artículo121, se realizó una interacción cara a cara con un agente personificado y un interlocutor humano, el agente personificado realizaba movimientos independientes con la cabeza y los ojos, para un juego de cartas con diferentes niveles de ayuda y orientación. Se analizó el rendimiento y la calidad de la asistencia prestada por el agente durante la conversación. En el juego de cartas participaron 6 hombres y 4 mujeres, los cuales tenían una edad de 23 y 33 años, la mayoría eran estudiantes. Durante el experimento en la mayoría de los casos el ojo dominante fue el derecho, excepto en un caso. Además, los participantes evaluaron diferentes aspectos del agente conversacional, tales como, calidad del clon, estimación del rendimiento personal y condición experimental.

Para lograr la coordinación en la interacción humano–robot, el robot debe ser capaz de obtener y atender a la retroalimentación del usuario122. Realizaron un experimento en el cual el robot instruye a un ser humano sobre como dibujar una ruta en un mapa. En la generación y progresión de tareas, aquí se trata de discriminar entre reconocimientos, con cuatro funciones diferentes, que una actividad esté a punto de iniciarse (antes de dibujar), que está en curso (mientras dibuja), que tiene (después del dibujo), que ya se ha completado en un paso anterior (sin dibujo).

121 Raidt, & Raidt Elisei, F., & Bailly, G., S. (2005). Face-to-Face Interaction with a Conversational Agent: Eye-Gaze and Deixis. International Conference on Autonomous Agents and Multiagent Systems.[En línea].Disponible en http://hal.archives-ouvertes.fr/docs/00/41/92/99/PDF/ACM_05.pdf%5Cnhttp://hal.archives-ouvertes.fr/hal-00419299/.

122 Skantze, G., Hjalmarsson, A., & Oertel, C. (2014). Turn-taking, feedback and joint attention in situated human-robot interaction. Speech Communication, 65, 50–66. [En línea]. Disponible en http://doi.org/10.1016/j.specom.2014.05.005.

Page 65: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

65

Erickson dice lo siguiente, las personas de piel blanca en su mayoría siguen la mirada mutua o el patrón de ruptura mutua mirando al orador, mientras escuchan, pero las personas de piel negra miran hacia otro lado cuando escuchan123. Vertegaal, encontró que la mirada estaba altamente relaciona con la atención124. Si la gente naturalmente mira a la última persona en hablar, entonces esa persona está en una ventaja de hablar primero, cuando el próximo cambio de orador se aproxima125.

Diseñaron un agente conversacional llamado Max, del tamaño humano que emplea el habla sintética, el gesto, la mirada y la visualización facial para actuar en tareas de construcción cooperativa que tiene lugar en la realidad virtual126 Max es capaz de interpretar la entrada multimodal (habla y gesto) de un instructor humano, por otro lado, tiene la capacidad de producir una salida multimodal que implica un discurso sintético, exhibición facial y gesto. También puede emplear expresiones faciales para el feedback y los movimientos gestuales de su cuerpo simultáneamente mientras que explica un paso de la construcción por el discurso.

En el artículo127 , se investiga como la respiración puede utilizarse como señal para la toma de turno. McFarland analizó la respiración en los diálogos espontáneos escritos y encontró que las exhalaciones del oyente tendieron a aumentar en la duración antes del cambio de turno. Se encontró, entre otras cosas, que las inhalaciones previas a las transiciones de toma de turnos, se caracterizaban por una duración de inhalación más corta, un nivel de inicio de inhalación ligeramente más alto y una pendiente de inhalación más alta, comparada con las que producían la toma de turnos. Cuanto más corta sea la duración y el retraso, más probable será que el habla sea como resultado. La amplitud del modelo de silencio y el nivel de inicio de la inhalación, contribuyen significativamente a la predicción del habla.

Han desarrollado un modelo para predecir el próximo orador en la toma de turno y el tiempo de la siguiente declaración del orador en reuniones multipartita , se puede

123 Novick, D. (2005). Models of gaze in multi-party discourse. Proceedings of Computer Human Interface (CHI) …, 1–3. [En línea].Disponible en http://www.cs.utep.edu/novick/papers/gaze.chi05.pdf. 124 Ibíd., p.1. 125 Ibíd., p.2. 126 Leßmann, N., Kranstedt, A., & Wachsmuth, I. (2004). Towards a cognitively motivated processing of turn-taking signals for the embodied conversational agent Max. In Proceedings Workshop W12 .p. 57–65. [En línea].Disponible en http://perso.telecom-paristech.fr/~pelachau/AAMAS04/FinalPaper/turnTaking.pdf.

127 Włodarczak, M., & Heldner, M. (2016). Respiratory Turn-Taking Cues. In Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH (Vol. 08–12–Sept).p. 1275–1279). [En línea].Disponible en http://doi.org/10.21437/Interspeech.2016-346.

Page 66: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

66

apreciar en el artículo128, demostraron cómo el comportamiento efectivo de la mirada y la respiración son útiles para predecir el siguiente orador que debe tomar el turno y la medida del tiempo de la próxima declaración, encontraron de los resultados del comportamiento del análisis de la mirada que el siguiente orador y la medida del tiempo de la próxima declaración varían dependiendo de los patrones de transición de la mirada de los participantes.

En cambio, el resultado del análisis de la respiración reveló que un orador inhala más rápidamente justo después del final de una unidad del enunciado en mantener el turno que en tomar el turno. El siguiente orador toma una más grande respiración en preparación para hablar que los oyentes que no se convertirán en el próximo orador en la toma de turno.

En el futuro planean explorar un modelo de predicción de alto rendimiento multimodal con el objetivo de lograr una predicción precisa.

Un gran inconveniente al incluir señales como la respiración en modelo de toma de turnos es que hay que utilizar sensores de respiración junto a su cuerpo de los conversantes, para poder analizar cada una de sus respiraciones lo que vuelve el tema aún más complejo.

Como parte del proyecto ERATO desarrollaron un robot humanoide, llamado ERICA un robot realista que se comporta como un compañero humano conversacional esto incluye no solo producir un discurso apropiado al contexto, sino también ser consciente de su entorno y producir apropiadas conductas no verbales como por ejemplo la mirada del ojo, asentimientos y risas, esto se encuentra en el artículo129, ERICA cuenta con reconocimiento de voz, capacidad que le permite conversar con los usuarios, además tiene 30 temas diferentes relacionados con su personalidad que se compone de lo que le gusta y no le gusta, otra modalidad es la mirada de ERICA, que utiliza para indicar la atención hacia el usuario.

Se Utiliza un modelo basado en SVM para estimar si su respuesta es una pregunta o una declaración, declaraciones en las que el usuario responde con una pregunta

128 Ishii, R., Otsuka, K., Kumano, S., & Yamato, J. (2016). Prediction of Who Will Be the Next Speaker and When Using Gaze Behavior in Multiparty Meetings. ACM Transactions on Interactive Intelligent Systems, 6(1), p.1–31. [En línea].Disponible en http://doi.org/10.1145/2757284.

129 Lala, D., Milhorat, P., Inoue, K., Zhao, T., & Kawahara, T. (2016). Multimodal interaction with the autonomous Android ERICA. In Proceedings of the 18th ACM International Conference on Multimodal Interaction - ICMI 2016. p. 417–418. New York, New York, USA: ACM Press. [En línea].Disponible en http://doi.org/10.1145/2993148.2998528.

Page 67: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

67

que está en la lista de temas preestablecidos, entonces ERICA continuará con el diálogo, si la pregunta no coincide con algún tema predefinido en el sistema, ERICA dirá un backchannel pequeño como por ejemplo “eh” para indicar que ella no entiende la pregunta.

ERICA tiene dos tipos de comportamientos de la mirada. El primero indica la conciencia del hablante, rastrea a los usuarios en el espacio conversacional por un sensor kinect. ERICA mira hacia cualquier usuario de quien ella detecta la actividad del habla. Si no se detecta ninguna actividad de voz durante un tiempo, ERICA mirará a la persona más cercana a ella.

El segundo comportamiento es facilitar la toma de turnos durante una conversación. El modelo utilizado se basa en investigaciones previas, Lo que sugiere un patrón de aversión a la mirada al principio del cambio de turno del hablante y mirada recíproca al pasar el turno a su compañero de conversación. ERICA mostrará aversiones de la mirada a través de movimientos leves del ojo y de la cabeza.

En el siguiente artículo diseñaron un controlador de mirada que puede generar comportamiento de aversión de las miradas temporalmente apropiadas para agentes, esto puede ver en el artículo, después analizar los datos de los experimentos llegaron a la conclusión de que los agentes virtuales que exponen miradas de aversión durante pausas serán percibidas como que están manteniendo el turno de la conversación y serán menos interrumpidas que agentes que no exponen miradas de aversión, también que agentes virtuales que exponen aversiones de mirada periódicas mientras escuchan incrementara la comodidad del interlocutor humano y provocará más revelaciones que agentes que no exhiben aversiones de la mirada, además de que un agente virtual que evita mirar a una persona mientras no esté hablando en el momento será percibido como pensante, mientras que un agente que no evita su mirada no provocará esta impresión en los demás participantes de la conversación.

Algunos estudios que se han presentado como el anterior nos conducen, a que en nuestros modelos de predicción de toma de turnos es de gran importancia tener en cuenta características o rasgos tales como la aversión de la mirada ya que mejoran la toma de turno de las conversaciones humano-agente.

Page 68: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

68

6.4 CONVERSACIÓN DINÁMICA EN LA TOMA DE TURNOS

El objetivo es lograr una conversación humano robot130, para ello exhibieron un robot en un museo donde brinda información acerca de las obras de arte de cada cuadro, los humanos utilizan cámaras vicon en su interacción dinámica. También se presentó otro caso en el cual el robot realiza preguntas a un grupo de personas en comportamientos dinámicos. Lograron determinar un modelo capaz de interactuar en una conversación dinámica.

6.5 ANALIZAR Y DEFINIR ESTRATEGIAS EN LA CONVERSACIÓN PARA LA TOMA DE TURNOS EN HUMANOS

En el artículo131, cuyo objetivo fue identificar cuando el sistema debe tomar el turno utilizando un algoritmo con árboles de decisión, se obtuvieron los siguientes resultados:

● Se diseñó un algoritmo llamado Julios el cual se encargaba del reconocimiento de lo expresado por la persona, también un algoritmo NTTC, que sintetiza el diálogo del sistema para una conversación coherente.

● El algoritmo de línea de base tuvo la precisión de toma de turno con una tasa del 63,7%. La precisión de toma de turno para el sistema de grabación fue del 76,2%. Por otro lado, la de este modelo fue del 83,9%.

● La información prosódica, no es suficiente para decidir el momento de la toma

de turno.

En el artículo132, se analiza la toma de turno “push to talk (PTT)” y “free turn taking (FTT)” para determinar cuál es más eficiente en una conversación con un agente

130 Sheikhi, S., & Odobez, J.-M. (2015). Combining dynamic head pose–gaze mapping with the robot conversational state for attention recognition in human–robot interactions. Pattern Recognition Letters, 66, p. 81–90.[En línea].Disponible en http://doi.org/10.1016/j.patrec.2014.10.002.

131 Sato, R., Higashinaka, R., Tamoto, M., Nakano, M., & Aikawa, K. (2002). Learning decision trees to determine turn-taking by spoken dialogue systems. In Proceedings of ICSLP 02, Denver, Colorado. [En línea].Disponible en http://www.speech.kth.se/prod/publications/files/100510.pdf.

132 Fernández, R., Lucht, T., Rodríguez, K., & Schlangen, D. (2006). Interaction in task-oriented human-human dialogue: The effects of different turn-taking policies. In 2006 IEEE ACL Spoken Language Technology Workshop, SLT 2006, Proceedings.p. 206–209.[En línea].Disponible en http://doi.org/10.1109/SLT.2006.326791.

Page 69: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

69

personificado. La toma de turnos con los sistemas de diálogo en algunas ocasiones resulta difícil, y a menudo se introducen técnicas para simplificar los errores. En una conversación con un SDS (Sistema de diálogo hablado), la conversación no debe ser de manera natural en todas las ocasiones, es decir interactiva puesto que no siempre es la más eficiente u óptima. En la toma de turno presione para hablar con los sistemas personificados ayudaría a mejorar la comunicación en la toma de turnos.

En el artículo133, tiene como objetivo cubrir algunos conceptos relacionados con la conversación, análisis y toma de turnos, que son componentes de una conversación. Schegloff definió cuatro conceptos importantes en la toma de turnos:

● Par de adyacencia, Significa que se necesitan de dos personas para realizar una conversación.

● Pre-secuencia, Predecir la respuesta que el orador espera.

● Organización de preferencia, Preferir un tipo de respuesta a una pregunta.

● Reparar, Corregir errores cometidos durante la conversación. Sack, afirma que la toma de turnos en una conversación puede mejorar durante el tiempo de forma ilimitada134.

Analizar y determinar cómo los humanos pueden predecir la toma de turnos de forma rápida135, durante la conversación, los oyentes deben realizar varias tareas simultáneamente, como comprender el turno de su interlocutor, mientras que también tiene que preparar el turno siguiente136.

● Los resultados sugieren que la simbólica (léxico-sintáctico) desempeña un papel importante en la predicción de los turnos finales.

● Un breve silencio antes de una respuesta puede ser un signo de desacuerdo

en la próxima respuesta.

● La entonación funciona para predecir una pausa y afirmar que el turno a un no ha terminado.

133 Khoddamy Pour, F., & Yazd, A. L. (2015). Turn Taking in Conversation Analysis. International Journal of Educational Investigations.[En línea]. Disponible en www.ijeionline.com, 2(6), p. 58–63.

134 Ibíd., p.60. 135 Magyari, L., & de Ruiter, J. P. (2012). Prediction of Turn-Ends Based on Anticipation of Upcoming Words. Frontiers in Psychology, 3(OCT).[En línea].Disponible en http://doi.org/10.3389/fpsyg.2012.00376.

136 Ibíd., p.4.

Page 70: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

70

● Las predicciones se pueden hacer en muchos niveles lingüísticos, durante el

procesamiento del lenguaje. Los oyentes requieren de dos procesos para comprender la toma de turnos, cuando el orador va a terminar su turno137:

1) Comprender, pronunciar y planear lo que van a responder.

2) La comprensión y predicción deben ocurrir en paralelo hacia el turno final.

Los humanos pueden predecir, cuando un turno va a terminar y el tempo para su pronunciación correcta. La semántica y el contenido sintáctico es un papel importante para la predicción de toma de turno.

Como las personas interpretan de manera eficaz el mensaje en tiempos muy cortos138, Las respuestas negativas suelen tener un tiempo de respuesta más largo en comparación a las respuestas afirmativas139. En las conversaciones se pueden ejecutar acciones que traten de evadir una respuesta esperada (Gisladottir et al., 2012). En una conversación el oyente reconoce de forma automática las acciones que ejecuta el orador140.

Las diferentes estrategias de toma de turnos de un agente influyeron en la impresión que la gente tiene sobre los sistemas personificados141. Se evidenciaron los siguientes resultados:

● Durante las sesiones, quedó claro que no sólo las máquinas tienen problemas para predecir el final del turno del usuario correctamente. Especialmente con la estrategia inicial es probable que haya ocasiones en que el usuario no había terminado el turno y quería comenzar otra oración, pero fue interrumpido por el entrevistador142.

● La voz del agente puede influir en la conversación con el humano.

137 Ibíd., p.5. 138 Gisladottir, R. S., Chwilla, D., Schriefers, H., & Levinson, S. C. (2012). Speech Act Recognition in

Conversation : Experimental Evidence. Proceedings of the 34th Annual Meeting of the Cognitive

Science Society (CogSci 2012), p.1596–1601.

139 Ibíd., p.1597. 140 Ibíd., p.1598. 141 er Maat, M., Truong, K. P., & Heylen, D. (2010). How Turn-Taking Strategies Influence Users’ Impressions of an Agent. Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 6356 LNAI, p. 441–453.[En línea].Disponible en http://doi.org/10.1007/978-3-642-15892-6_48. 142 Ibíd., p.442.

Page 71: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

71

● Los seres humanos son más influenciados por estrategias, que cuando están

activamente involucrados143.

● Comenzar demasiado pronto (es decir, interrumpir) se asocia principalmente con atributos de personalidad negativos y fuertes, los agentes son percibidos como menos agradables y más asertivos. Dejar pausas entre turnos tiene asociaciones contrarias, se percibe como más agradable, menos asertivo, y crea la sensación de tener más relación144.

6.6 TOMA DE TURNOS CON EL NIVEL DE ENTONACIÓN

En los sistemas de diálogos generalmente tienen una toma de turnos rígida, en la que el usuario y el sistema no se superponen y cambian de dirección marcados inequívocamente por prolongados períodos de silencio. El diálogo humano-humano no es así: la toma de turnos es más rápida y flexible, gracias en gran parte al uso de indicaciones prosódicas de intenciones de toma de turno, por esto se entrenó un predictor de red neuronal que además tenía en cuenta patrones de prosodia para predecir la toma de turno en una conversación, esto se puede encontrar en el artículo145, se argumenta que un sistema de predicción de toma de turno debe hacer predicciones constantemente, en lugar de hacerlo en puntos claves (como puntos de pausa del usuario u otros puntos de tiempo que cumplan ciertos criterios) con el fin de mejorar la rapidez de respuesta , debe predecir cierta distancia a futuro.

Un predictor debe predecir directamente las propias acciones del sistema. Si se tiene un corpus de diálogos, donde se obtiene acceso a ambos lados, predecir las acciones futuras de un hablante no es más difícil que predecir las acciones futuras del otro. Así se puede predecir las acciones de ambos interlocutores, no sólo los del usuario, sino los del propio sistema. Se puede hacer que tales predicciones del comportamiento del sistema se hagan realidad haciendo que el sistema, se comporte para satisfacer esas predicciones. Si estas predicciones están basadas en el corpus, entonces el sistema se comportará de acuerdo con los patrones de comportamiento comunes en el corpus. Esto es algo novedoso, ya que los predictores previos predicen generalmente sólo las acciones del usuario, requiriendo un razonamiento adicional para determinar cómo debe comportarse el

143 Ibíd., p.443. 144 Ibíd., p.445. 145 Ward, N. G., Fuentes, O., & Vega, A. (2010). Dialog Prediction for a General Model of Turn-Taking. Interspeech-2010, (October).

Page 72: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

72

sistema en respuesta a una declaración por parte de los de más oradores.

Una predicción para una región de habla con un tono y una energía inicialmente alta y una velocidad lenta, seguida de una menor energía, de hecho, es una predicción para tomar el turno. Los resultados muestran que el modelo predictor está por encima de la línea base.

Un procesamiento prosódico adecuado es fundamental para conseguir una comprensión del habla apropiada o una síntesis del habla natural en aplicaciones relativas a expresiones de conversación diaria. Como se aprecia en el artículo, En japonés, el tono de las frases finales, tienen importantes papeles de modalidad (como pregunta, declaración, e instando a), la indicación de los límites semánticos, y la toma de turnos. El término "frase de tono final" se utiliza en este artículo para indicar la tónica de la última sílaba y morfema de una frase.

Las funciones realizadas por la frase en los tonos finales dependen de la presencia o ausencia de una partícula final (partículas que se producen en la posición final de oración, como "ka", "yo", "ne" y "wa").

En las oraciones que no terminan con partículas finales, aumenta la posibilidad de pregunta, en donde los tonos se utilizan para solicitar una respuesta o una reacción, o para solicitar una vez más, mientras que los tonos altos se utilizan para expresar un reclamo fuerte o persistencia. Los tonos planos no tienen ninguna función específica, pero pueden expresar varias modalidades (como una declaración, el orden, la volición, y el deseo) de acuerdo con la partícula o el verbo auxiliar puesto a la frase final de tono. Tonos de ascenso y descenso también se utilizan a menudo en el límite de frases o en el medio de una frase, como indicativo de una puntuación semántica, lo que indica que la expresión no terminó aún. Esta estrategia no sólo aumenta el discurso de la comprensión, haciendo que la semántica tenga límites claros, sino que también permite al orador insertar una pausa durante su enunciado, manteniendo a su vez el discurso.

Además, las partículas finales "ne" y "sa" tienen la función de llamar la atención del oyente, cuando se inserta en el final de una frase, por ejemplo, "Saikin-ne, konna hyougenga-ne, hayatteiruyo." esto se conoce como "el uso interjectivo" de partículas final. Por lo tanto, el uso de información de tono en aplicaciones de síntesis o de reconocimiento de voz requeriría el conocimiento sobre la relación entre los tonos y la información lingüística, como parte de la oración.

Concluyen que el reconocimiento de los morfemas es útil antes de la utilización de la información de tono para la toma de turnos o decisiones acto de diálogo. Una limitación de este estudio es que se basa en el idioma japonés, entonces sus resultados no pueden ser tenidos en cuenta para conversaciones de otros países.

Page 73: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

73

En el artículo146, se encontró que cuando los adultos se involucran en una conversación, se identifican las transiciones de turno sin gran esfuerzo. Se pueden usar una variedad de señales para hacerlo: (1) el contenido semántico de una vez, o información de léxico-sintáctica, indica que se requiere una respuesta (señales de contenido), (2) el contenido hablado es modulada por señales prosódicas, tales como la entonación, para indicar el límite de un turno (señales prosódicas), y (3) la información visual acompaña periféricamente el habla, tales como la apertura de la boca o gestos ( pistas visuales ), En el artículo147 , se investigó cómo se desarrolla a medida del tiempo la habilidad para anticipar el turno en una conversación usando la señales prosódicas y la mirada.

El principal hallazgo fue que los niños de 3 años de edad y adultos anticipan más turnos con la entonación normal, que la entonación aplanada, mientras que los niños de 1 año de edad no mostraron este efecto. El efecto de los datos de los niños réplica hallazgos previos de que los niños de 3 años de edad, se benefician de la entonación, pero no los de 1 año de edad. Cuando faltaban señales visuales, tanto los adultos como los niños de 3 años se beneficiaron de la disponibilidad de la entonación.

Además, demostraron otras diferencias de desarrollo en la percepción de las conversaciones: los niños de un año mostraron generalmente más cambios en la mirada cuando observaban conversaciones que los niños de 3 años y adultos.

Este análisis reveló que la anticipación de turnos era fiable sólo en niños de 3 años de edad y adultos. Los niños más pequeños cambiaron su mirada entre los oradores en su mayoría de forma independiente del turno de palabra. Estos hallazgos sugieren que los niños necesitan un sofisticado nivel de comprensión del lenguaje para anticipar las conversaciones de una manera similar a los adultos, que se adquiere en torno a la edad de 3 años.

146 Keitel, A., & Daum, M. M. (2015). The use of intonation for turn anticipation in observed conversations without visual signals as source of information. Frontiers in Psychology, 6(FEB), p.108. [En línea].Disponible en http://doi.org/10.3389/fpsyg.2015.00108.

147 . Keitel and M. M. Daum, “The use of intonation for turn anticipation in observed conversations without visual signals as source of information.,” Front. Psychol., vol. 6, no. FEB, p. 108, Feb. 2015.

Page 74: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

74

6.7 MODELO DE TOMA DE TURNOS EN UNA CONVERSACIÓN MULTIPARTITA

Identificar la toma de turnos en conversaciones multipartita148, en el artículo se presenta un sistema de diálogo que fue exhibido en el Museo Nacional Sueco de Ciencia Y tecnología, durante nueve días, en la cual el sistema interactuaba en conversaciones multipartita en un juego, los resultados que se registraron fueron los siguientes:

● Debido a que el escenario fue en un museo, el conjunto de datos contiene

grupos mixtos de usuarios: adultos jugando entre sí (40%), niños jugando con adultos (27%) y niños jugando entre sí (33%). Después de completar un juego, los jugadores pueden optar por seguir jugando. El 58% de las parejas que completaron el primer juego eligieron hacerlo (61% para los niños y 64% para los adultos junto con los niños), lo que indica que el juego fue divertido.

● Es importante estudiar el efecto de las señales que producen el turno del sistema en el diálogo que implica referencias a objetos en el espacio compartido.

● Mediante la manipulación sistemática del comportamiento del robot y el

análisis de los datos recogidos en el museo, se encontraron que las señales de toma de turnos humanas pueden utilizarse efectivamente para indicar que el sistema está reclamando el turno.

En el artículo149 , elaboraron un sistema de reconocimiento multipartita, capaz de mantener de forma natural una conversación, presentaron un estudio empírico de un modelo de toma de turnos de un sistema de diálogo, con datos subjetivos y medidas objetivas de rendimiento. Diseñaron un sistema computacional de diálogo, el cual analiza la mirada, gestos y comportamientos durante el discurso. El sistema rastrea de manera dinámica la conversación, recopila la información y la expresa a través de la mirada y los gestos.

148 Skantze, G., Johansson, M., & Beskow, J. (2015). Exploring Turn-taking Cues in Multi-party Human-robot Discussions about Objects. In Proceedings of the 2015 ACM on International Conference on Multimodal Interaction - ICMI ’15 (pp. 67–74). New York, New York, USA: ACM Press.[En línea].Dispobible en http://doi.org/10.1145/2818346.2820749.

149 Bohus, D., & Horvitz, E. (2011). Multiparty turn taking in situated dialog: Study, lessons, and directions. Proceedings of the SIGDIAL 2011 Conference, (1974), 98–109. [En línea].Disponible en http://dl.acm.org/citation.cfm?id=2132903.

Page 75: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

75

6.8 ANALIZAR LA DENSIDAD DE UNA CONVERSACIÓN EN LA TOMA DE TURNOS

En el artículo150, cuyo objetivo central fue evaluar si las medidas de "densidad" bastante simples pueden producir información útil relativa a la actividad conversacional de los participantes y utilizarse en el análisis de la comunicación, obtuvieron como resultados que los interlocutores tienden a evitar mirar al compañero cuando están hablando, pero cuando no están hablando, tienden a mirar al compañero. Esto se puede interpretar porque los interlocutores muestran su interés en el orador dirigiendo su atención y conciencia al hablante observándolos, mientras que cuando ellos mismos están hablando, su atención se centra en su propia planificación y producción de lo que quieren decir. Esto parece indicar que la mirada funciona de manera diferente a la mano y los movimientos del cuerpo: mientras que los segundos apoyan la gestión de la comunicación propia del hablante, mirar es el principal canal para recibir la entrada de la pareja y, utilizado mientras se escucha a la pareja.

Con el fin de estudiar la actividad conversacional y los detalles del tiempo, se realizó la expresión de densidad o la actividad relativa del habla por unidad de tiempo. Esto se calcula dividiendo cada duración del enunciado por la suma de las duraciones de pausa anteriores y siguientes.

6.9 LA PROXÉMICA EN LA TOMA DE TURNOS

En el artículo151, cuyo objetivo central fue crear un modelo que puede expresar las diferencias culturales en la proxémica del agente, mirada y solapamiento en la toma de turnos, después simularon estos modelos en un mundo virtual y se lo expusieron a varias personas de varias culturas para identificar si la interacción era realista en su cultura, encontraron que:

Los árabes juzgaron que la proxémica árabe era más realista que la proxémica americana y mexicana. Los sujetos árabes también juzgaron la animación árabe más realista en general que la animación estadounidense.

150 Jokinen, K. (2011). Turn taking, utterance density, and gaze patterns as cues to conversational activity. In Proceedings of ICMI 2011 Workshop Multimodal Corpora for Machine Learning: Taking Stock and Road mapping the Future (pp. 31–36). [En línea].Disponible en http://www.thesect.se/nomco/pubs/Jokinen - Turn taking, Utterance Density.pdf.

151 Jan, D., Herrera, D., Martinovski, B., Novick, D., & Traum, D. (2007). A Computational Model of Culture-Specific Conversational Behavior. In Intelligent Virtual Agents (pp. 45–56). Berlin, Heidelberg: Springer Berlin Heidelberg.[En línea].Disponible en http://doi.org/10.1007/978-3-540-74997-4_5.

Page 76: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

76

Los sujetos árabes no juzgaron que las proxémicas americanas difieran de las proxémicas mexicanas. Y los juicios de sujetos árabes sobre la mirada y la pausa no mostraron diferencias significativas entre culturas, lo que se esperaba porque estos parámetros no difirieron significativamente entre las animaciones.

Los juicios de los sujetos mexicanos y norteamericanos no mostraron diferencias entre ninguna de las culturas con respecto a la proxémica o el realismo general. En conjunto, los sujetos vieron diferencias significativas entre algunas de las animaciones individuales, incluso si no veían diferencias significativas entre los conjuntos de animaciones que representaban los diferentes parámetros culturales.

6.10 MODELO DE PREDICCIÓN DE TOMA DE TURNOS EN BASE AL TIEMPO

En el artículo152, cuyo objetivo fue discutir un modelo de predicción y en el que propusieron para predecir la expresión del orador, el destinatario intente determinar la intención del hablante y utilice esa intención de predecir lo que diría el orador. Los dos aspectos que se tienen que considerar son, (1) que el destinatario combina interpretación del contexto y la imitación encubierta de la locución anterior del hablante para estimar la intención; y (2) que el destinatario utiliza la intención de predecir la finalización del hablante de la misma manera que el destinatario podría predecir su propia unidad de habla, entonces según el contexto de la conversación se puede predecir la expresión del orador y por lo tanto se puede prever la toma de turnos.

El artículo153 que tuvo como objetivo analizar la toma de turnos en tres idiomas diferentes, llegaron a los siguientes resultados:

● La cantidad de transferencias que son solapamientos es del 48%. La situación es muy diferente en cabecear: la longitud media de transferencia del foco conversacional es de 332 ms (mediana 229 ms), y sólo el 23% de las transferencias de foco conversacional son solapamientos.

● Fongbe tiene la curva más estrecha y más equilibrada, con un promedio

positivo de longitud de transferencia de suelo de 91 ms (mediana 91 ms) y 64% de transferencias de foco conversacional en el lado positivo (brechas).

152 Garrod, S., & Pickering, M. J. (2015). The use of content and timing to predict turn transitions. Frontiers in Psychology, 6(JUN), 751.[En línea].Disponible en http://doi.org/10.3389/fpsyg.2015.00751.

153 Kousidis, S., Schlangen, D., & Skopeteas, S. (2013). A cross-linguistic study on turn-taking and temporal alignment in verbal interaction. In Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH. p. 803–807.

Page 77: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

77

Comparado con los otros dos idiomas.

● El porcentaje de transferencias de foco conversacional que se superponen en georgiano (51%) parece muy alto.

En el artículo154, cuyo objetivo fue analizar el tiempo en una conversación humano -robot, En el que hubo dos fases, la primera fue fase de juego y otra fase de negociación, con características de configuración diferente en las que se obtuvieron los siguientes resultados:

El acuerdo de codificador fue 100% para eventos de fase de juego, y la diferencia promedio en tiempo codificado fue de 123 milisegundos.

El acuerdo del codificador fue del 94,2% para los eventos de la fase de negociación y la diferencia promedio en el tiempo codificado fue de 368 milisegundos.

En el artículo155, cuyo objetivo fue analizar el tiempo en la toma de turnos, se obtuvieron los siguientes resultados:

· Se comparan las similitudes de parejas y las semejanzas de pareja no asociadas con un test, lo que muestra que, en promedio, los hablantes son más parecidos en latencia media a sus parejas que a sus no parejas (t = 23) = 4.04, p = 0.00051), Lo que nos lleva a concluir que los interlocutores no arrastran en este aspecto de la conducta de toma de turno.

· El arrastre sobre la latencia media es independiente.

Localmente, se encontró alguna evidencia de que la latencia de un turno dado está relacionada con la latencia del turno anterior del orador opuesto. Las latencias normalizadas de los oradores de sesión de los turnos alternos de los oradores opuestos están débilmente correlacionadas (r = 0.037, df = 2404, p = 0.067).

154 Casillas, M., & Frank, M. C. (2017). The development of children’s ability to track and predict turn structure in conversation. Journal of Memory and Language, 92,p. 234–253. [En línea].Disponible en http://doi.org/10.1016/j.jml.2016.06.013.

155 Levitan, R., Beňuš, Š., Gravano, A., & Hirschberg, J. (2015). Entrainment and Turn-Taking in Human-Human Dialogue. In AAAI Spring Symposium on Turn-taking and Coordination in Human- Machine Interaction (pp. 44–51).[En línea].Disponible en https://pdfs.semanticscholar.org/af4d/9048f781c3315bd7491e20aa366c051a9f77.pdf.

Page 78: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

78

6.11 MODELO DE TOMA DE TURNOS ANALIZANDO EL CONTEXTO

En el artículo156, cuyo objetivo fue demostrar cómo el contexto visual influye en las conversaciones, lograron concluir que, el contexto visual puede determinar el éxito de una conversación y que los participantes en el experimento observaron el contexto visual y podrían predecir el tema en las escenas de diálogos.

6.12 TOMA DE TURNOS EN UNA CONVERSACIÓN EN UNA CONVERSACIÓN TELEFÓNICA

El artículo157, cuyo objetivo fue analizar la toma de turno en conversaciones telefónicas, lograron los siguientes resultados:

● Los resultados ponen de manifiesto que en los diálogos humano-humano libres, los hablantes adaptan su comportamiento de turno al comportamiento del interlocutor.

● Los resultados indican que los diálogos hombres-hombres muestran mayor superposición de turno que las mujeres.

● Algunas teorías de toma de turno, suponen que los diálogos se adhieren,

esencialmente a un protocolo de comunicación semidúplex. En el cual los interlocutores ceden y toman el turno, guiados por señales de toma de turno.

● Sacks, definió un conjunto de reglas en la cual los hablantes de una

conversación se adhieren. Los llamados lugares de relevancia de transición. La alteración suave en un diálogo son roles naturales del orador y oyente, con el fin de reducir los lapsos de tiempo entre turnos.

● El término “alineamiento” se utiliza para referirse al proceso, esencialmente

inconsciente e interactivo. Suaviza la comunicación entre el hablante y el oyente, permitiendo una toma de turnos eficiente y contribuye a facilitar la comprensión mutua.

156 Richardson, D. C., Dale, R., & Tomlinson, J. M. (2009). Conversation, Gaze Coordination, and Beliefs About Visual Context. Cognitive Science, 33(8),p. 1468–1482.[En línea].Disponible en http://doi.org/10.1111/j.1551-6709.2009.01057.x.

157 Bosch, L., Oostdijk, N., & Ruiter, J. (2004). Turn-taking in social talk dialogues: Temporal, formal, and functional aspects. In 9th International Conference Speech and Computer . p. 454–461. [En línea].Disponible en http://www.isca-speech.org/archive_open/specom_04/spc4_454.html.

Page 79: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

79

● Las propiedades sintácticas desempeñan un papel importante en el mecanismo de toma de turnos.

● Diez Busch, demostró que las conversaciones telefónicas tienen silencios,

entre turnos muchos más cortos que las conversaciones cara a cara.

● Un análisis de las duraciones de diversos tipos de pausas en 93 diálogos telefónicos ha demostrado que los hablantes adaptan su comportamiento de turno y, como resultado, existe una alta correlación entre la duración media de la pausa en el habla producida por los dos oradores.

6.13 MODELO DE TOMA DE TURNOS, BASADO EN MÁQUINAS DE ESTADO FINITO

En el artículo158, tiene como objetivo proponer un modelo flexible y práctico para la toma de turnos que se basa en trabajos previos sobre modelos de estados finitos del foco de la conversación y se fundamenta en teoría de la decisión se enfoca a la detección de final de turno, obtuvieron como resultado:

El FSTTM (Denominado modelo máquina de estado finito para la toma de turnos) supera a todos los otros modelos (aunque sólo ligeramente comparado con el modelo de Ferrer.), mejorando la línea de base del umbral fijo en hasta 29,5%.

6.14 MODELOS DE TOMA DE TURNOS QUE TIENEN EN CUENTA LA EDAD Y EL GÉNERO

Varios estudios que encuentran diferencias importantes en el comportamiento de la toma de turnos entre adultos y niños, además de encontrar diferencias entre los hombres y las mujeres, tales diferencias podrían llevar a niveles diferentes de igualdad de participación, se estudiaron los efectos de estas variables en el comportamiento de la toma de turnos como se puede apreciar en el artículo159,

158 Raux, A., & Eskenazi, M. (2009a). A finite-state turn-taking model for spoken dialog systems. Proceedings of Human Language Technologies The 2009 Annual Conference of the North American Chapter of the Association for Computational Linguistics on NAACL 09, (June), p. 629–637. [En línea].Disponible en http://doi.org/10.3115/1620754.1620846.

159 Skantze, G. (2017). Predicting and Regulating Participation Equality in Human-robot Conversations. Proceedings of the 2017 ACM/IEEE International Conference on Human-Robot Interaction - HRI ’17, (March), p. 196–204.[En línea].Disponible en http://doi.org/10.1145/2909824.3020210.

Page 80: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

80

adicionalmente se buscaba que el robot estableciera un balance (un equilibrio entre el tiempo que habla el robot y el tiempo en el que un participante humano habla) en la conversación con humanos.

Atravesé de la investigación llegaron a la conclusión que no existía otro ensayo donde se explicara este tipo de estudio, donde el robot tratara de llevar un balance en una conversación con humanos. Realizaron un modelo lineal para explicar mediante el coeficiente de correlación que cuando se basaban en solo las miradas, para predecir el desbalance esto no era suficiente, pero en cambio, si tomaba en cuenta la mirada y además los datos de edad y género, el robot puede hacer una predicción más efectiva del desbalance en una conversación y tratar de balancear la conversación.

Elaboraron una fórmula de desbalance en los tiempos de conversación o habla:

Desbalance = 1 −𝑠𝑡𝑚𝑖𝑛

𝑠𝑡𝑚𝑎𝑥 (1)

Donde 𝑠𝑡𝑚𝑎𝑥, denota el tiempo de conversación total para el orador que habla más, y 𝑠𝑡𝑚𝑖𝑛 , denota el tiempo de conversación total para el otro orador.

Si (1), se aproxima más a cero quiere decir que la conversación es más balanceada, pero si se aproxima más a uno quiere decir que está muy desbalanceada.

Comprobaron varias teorías tales como, que los niños que conversan con adultos permiten al adulto regular la interacción, después recogen estos comportamientos reguladores y los emplean cuando hablan con otros niños. Adicionalmente, el estilo de conversación entre las mujeres se ha caracterizado por lo tanto como "cooperativo", mientras que la conversación entre los hombres es más "competitivo”. Se ha encontrado que las mujeres hablan menos que los hombres, y los hombres parecen interrumpir a las mujeres más que al revés.

Mencionan que la investigación es única con respecto a otros estudios porque el robot denominado Furhat, actúa no como un tutor, sino como otro participante, además las preguntas no son dirigidas hacia una persona, sino que son abiertas y se involucra el uso de objetos en la interacción.

Buen articulo ya que está muy completo, tiene muchas novedades que pueden ser útiles para el desarrollo de modelos de predicción de toma de turno, además se puede observar que un buen modelo de predicción tiene que tener en cuenta las miradas en conjunto con los datos de la edad y el género para que el robot pueda realizar conversaciones más equilibradas.

Page 81: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

81

Las diferencias de género en la conversación han sido el centro de atención para los investigadores debido a los problemas de sondeo con respecto a los estereotipos, género, sociedad y cultura por esta razón en el artículo160, Analizaron varios programas de televisión y radio así como conversaciones de estudiantes universitarios para identificar cuáles de los géneros femeninos y masculinos toman más turnos en una conversación, los resultados son concretos en afirmar que las mujeres tomaron más turnos que los hombres en las tres modalidades.

Los resultados indican que las mujeres son más propensas a tomar turnos en la conversación, esto se puede atribuir a la sensibilidad interpersonal en lugar de la falta de asertividad. A pesar que los resultados son contundentes, existe la limitación porque el experimento se realizó en Pakistán, por lo tanto, no se puede asegurar que esto también ocurra en otros países, porque la cultura y el contexto pueden alterar los resultados, el experimento se podría mejorar si tuviera en cuenta culturas de otros países y llegar a generalizar los resultados tendría un mejor aporte investigativo a la toma de turnos.

En el artículo161, se analiza la toma de turnos en edades tempranas, Los niños empiezan a desarrollar habilidades para la toma de turnos en la infancia, pero tardan varios años en asimilar su creciente conocimiento del lenguaje con esta habilidad. El resultado del estudio destaca lo siguiente:

● La toma de turno de un bebé es diferente a la toma de turno de un adulto.

● Resultados experimentales y modelos actuales de producción de habla, sugieren que se necesita aproximadamente 600 ms para producir una palabra de contenido y más tiempo para producir un enunciado.

● Un estudio de 10 idiomas encontró un promedio consistente de tiempo de

transición de 0 -200 ms en los puntos de cambio de orador.

● Los adultos tienen mucha información a su disposición para ayudar a hacer predicciones precisas sobre el próximo contenido de turno (información léxica, sintáctica y prosódica).

● Las señales no verbales (por ejemplo, la mirada, postura y apuntador), suelen

aparecer en los límites de los turnos y pueden a veces actuar como indicadores tardíos de un cambio de orador próximo.

160 Ghilzai, S. A. (2015). Conversational Analysis of Turn taking Behavior and Gender Differences in Multimodal Conversation Shazia Akbar Ghilzai December 2015. Perspectives in Language, Linguistics and Media.

161 Casillas, M., & Frank, M. C. (2017). The development of children’s ability to track and predict turn structure in conversation. Journal of Memory and Language, 92,p. 234–253.[En línea].Disponible en http://doi.org/10.1016/j.jml.2016.06.013

Page 82: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

82

● Entre los 4 y 9 meses los niños comienzan a reducir el número de turnos en

que ocurre la superposición, mientras que también mejoran su respuesta promedio.

● Los niños de 6 meses siguen a los oradores conversacionales más con su

mirada que cuando al menos un orador está mirando a otro.

● A los 10 meses los bebés esperan que la gente observe y hable con otras personas, y no con objetos.

● A los 12 meses, los bebés esperan ver respuestas a los enunciados verbales (pero no al habla), en los contextos cara a cara.

6.15 ESTADOS EMOCIONALES EN LAS CONVERSACIONES HUMANO-ROBOT

Elaborar un modelo de expresiones de actitud162, para los comportamientos explícitos e implícitos en una conversación humana, definir estados emocionales del robot durante las conversaciones. En este estudio, se discute una novedosa expresión y el modelo de comprensión de la actitud de expresión de hablar y oír durante las conversaciones. Con respecto a la aplicación de este modelo a las interacciones hombre-agente, este modelo contribuye al diseño de robots de conversación y agentes que no sólo transmiten información, sino también sentimientos o pensamientos como los seres humanos. Para leer estos sentimientos o pensamientos, estos robots y agentes, necesitan tener la capacidad de tratar comportamientos, no sólo explícitos, sino también comportamientos implícitos, como sentimientos o pensamientos, que se espera sean notados por otros. Las expresiones pueden clasificar en dos tipos: sutil implícito expresivo, comportamientos que se espera sean notados por otros y comportamientos explícitos directos que controlan intencionalmente.

Se presenta la creación de un modelo de expresividad multimodal, un agente llamado Greta, que exhibe comportamientos no verbales sincronizados con el habla. Se realizaron dos pruebas perspectivas para evaluar el modelo de expresividad. La primera prueba consistió en medir cada dimensión del modelo de expresividad que ha sido implementada, la segunda prueba es comprobar si las seis dimensiones de

162 Yuasa, M., Mukawa, N., Kimura, K., Tokunaga, H., & Terai, H. (2010). An utterance attitude model in human-agent communication. In Proceedings of the 28th of the international conference extended abstracts on Human factors in computing systems - CHI EA ’10 (p. 3919). New York, New York, USA: ACM Press.[En línea].Disponible en http://doi.org/10.1145/1753846.1754079.

Page 83: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

83

expresividad podían simular comportamientos realizados de diferentes formas. Los participantes reconocieron los mejores parámetros de la extensión facial y extensión temporal. Los parámetros de fluidez y potencia tuvieron menores resultados. Los parámetros de repetición y potencia fueran a menudo malinterpretados entre sí.

Page 84: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

84

CONCLUSIONES

En primera instancia, se presenta un conjunto de conclusiones acerca del proceso de realización de la revisión sistemática:

● El presente trabajo de grado tuvo como objetivo, realizar una revisión sistemática sobre los modelos de toma o negociación de turnos, mediante la utilización de un protocolo que se siguió en cada una de sus etapas para establecer el estado de arte, logrando evaluar los modelos para establecer las características predominantes, ayudando a investigadores, compañías y universidades en la mejora de los modelos existentes.

● Adaptar y seguir un protocolo de revisión sistemático ayudó a la selección de artículos científicos fueran relevantes para identificar modelos de negociación de turnos, utilizados en interacciones conversacionales, porque contribuye a la mejora de la investigación.

● Realizar un asentamiento bibliográfico en el formato RAE, fue útil para resumir los artículos y extraer los hallazgos más importantes de la investigación, porque la cantidad de información era difícil de manipular y analizar.

En segunda instancia, se presentan las conclusiones relacionadas directamente con el objeto de estudio de la revisión realizada:

● Un agente debe hacer uso de un conjunto de características que le permita la toma de turnos en las conversaciones con humanos favoreciendo una interacción fluida y coordinada.

● En la comunicación cara a cara, los seres humanos comparten el mismo tiempo y espacio; y puede obtener no sólo información verbal sino también información no verbal a través del sentido visual, auditivo y táctil. Con tal información no verbal como posición, tiempo de emisión, miradas y gestos, los seres humanos pueden transmitir intenciones, emociones y expresiones.

● Con base en los resultados encontrados, se puede concluir que un agente

que utiliza una determinada estrategia de toma de turno puede de hecho influir en la impresión que un usuario tiene del agente.

● La teoría es clara al argumentar que un modelo agente-adulto funciona de manera diferente que cuando se tiene un modelo agente-niño ya que tienden a romper las reglas que siguen los adultos para tomar el turno, por lo tanto,

Page 85: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

85

parece que se debería utilizar un modelo diferente para las interacciones con niños.

● La proxémica puede ser información útil en los modelos culturales para analizar la toma de turno en las conversaciones, y lograr simular un entorno lo más real posible mediante rasgos culturales.

● Para modelos de toma de turnos de conversaciones multipartita, el movimiento de la cabeza puede funcionar como una señal más visible del foco de atención del hablante y la voluntad de tomar turno. En los diálogos de dos personas, el ojo puede ser suficiente para señalar la intención del compañero de tomar el turno o dar el turno, pero en los diálogos multipartita, los participantes pueden no compartir el contexto completamente y el foco de la atención que el orador necesita puede expresarse de manera más visible.

● Es importante para la toma de turnos considerar los gestos icónicos, el gesto en específico y de quién provenga, puede tener significados diferentes en el modelo de negociación de turnos.

● En un modelo se debería tener en cuenta las señales verbales y no verbales en conjunto y no por separado porque se obtienen mejores resultados en la predicción de la toma de turnos.

● La aversión de la mirada es una señal de conversación poderosa que debe ser aprovechada con el fin de crear eficaces y naturales interacciones humano – agente.

● Rasgos como la prosodia, la mirada, movimientos de cabeza, gestos, respiración, proxémica deben ser tenidos por los modelos para una eficaz predicción.

● Máquinas de estado finito y árboles de decisión son herramientas que

muestran buenos resultados en comparación con otros métodos y que pueden ser implementados en la toma de turnos humano-agente.

● La información recolectada y evaluada, se pretende utilizar para mejorar los

modelos existentes humano-agente.

Page 86: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

86

BIBLIOGRAFÍA

A. Hoyos, “Proceso de Revisión Sistemática,” 2011. [En línea]. Disponible en

https://es.slideshare.net/GAlbertoHoyos/proceso-de-revision-sistematica.

A. Keitel and M. M. Daum, “The use of intonation for turn anticipation in observed

conversations without visual signals as source of information.,” Front. Psychol., vol.

6, no. FEB, p. 108, Feb. 2015.

Adrián Moreno, “Toyota ha creado un robot compañero para adultos - Voltaico,”

2016. [En línea]. Disponible en https://voltaico.lavozdegalicia.es/2016/10/toyota-

robot-companero-adultos/.

Adrián Moreno, “Toyota ha creado un robot compañero para adultos - Voltaico,”

2016. [En línea]. Dispnible en: https://voltaico.lavozdegalicia.es/2016/10/toyota-

robot-companero-adultos/.

Alejandro Murillo. (2012). ¿Qué es el dispositivo Kinect? | Kinect for Developers.

Retrieved May 29, 2017. [En línea]. Disponible en

http://www.kinectfordevelopers.com/es/2012/11/06/que-es-el-dispositivo-kinect/.

Alejandro Murillo. (2012). ¿Qué es el dispositivo Kinect? | Kinect for Developers.

Retrieved May 29, 2017. [En línea]. Disponible en

http://www.kinectfordevelopers.com/es/2012/11/06/que-es-el-dispositivo-kinect/.

Andrist, S., Tan, X. Z., Gleicher, M., & Mutlu, B. (2014). Conversational gaze

aversion for humanlike robots. In Proceedings of the 2014 ACM/IEEE international

conference on Human-robot interaction. New York, New York, USA: ACM Press. [En

Línea]. Disponible en http://doi.org/10.1145/2559636.2559666.

Page 87: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

87

Basharin, Gely P, Langville, Amy N, Naumov, V. A. (2004). Editorial note. Linear

Algebra and Its Applications. [En línea]. Disponible

http://doi.org/10.1016/j.laa.2004.04.001.

Bavelas, J. B., & Gerwing, J. (2007). Conversational Hand Gestures and Facial

Displays in Face-to-Face Dialogue. Social Communication. [En línea]. Disponible en

http://doi.org/10.4324/9780203837702.

Benward, B., & Saker, M. (2008). Music in theory and practice. McGraw-Hill.

McGraw-Hill. [En línea]. Disponible en http://www.getcited.org/pub/103017394.

Bergmann, K., Rieser, H., & Kopp, S. (2011). Regulating dialogue with gestures:

towards an empirically grounded simulation with conversational agents. Proceedings

of the SIGDIAL 2011. [En línea]. Disponible en:

http://dl.acm.org/citation.cfm?id=2132902.

Bohus, D., & Horvitz, E. (2011). Multiparty turn taking in situated dialog: Study,

lessons, and directions. Proceedings of the SIGDIAL 2011 Conference, (1974). [En

línea]. Disponible en http://dl.acm.org/citation.cfm?id=2132903.

Bohus, D., Raux, A., Harris, T. K., Eskenazi, M., & Rudnicky, A. I. (2007). Olympus.

In Proceedings of the Workshop on Bridging the Gap Academic and Industrial

Research in Dialog Technologies.

Bono, M. (2004). What is a Multiparty Interaction? Analysis 1: Facing formation and

Participation Framework Analysis 2: Schisming in Multiparty and Sign Language

Conversation. [En línea]. Disponible en

http://research.nii.ac.jp/~bono/media/poster/IAB.pdf.

Bosch, L., Oostdijk, N., & Ruiter, J. (2004). Turn-taking in social talk dialogues:

Temporal, formal, and functional aspects. In 9th International Conference Speech

and Computer. [En línea]. Disponible en http://www.isca-

Page 88: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

88

speech.org/archive_open/specom_04/spc4_454.html.

Briz, A. (2000a). Las unidades de la conversación. Revista Del Instituto de Lengua

Y Cultura Españolas.

Briz, A. (2000b). Turno y alternancia de turno en la conversación. Revista Argentina

de Lingüística.

C. I. Hovland, “Social Communication,” 1948. [en línea]. Disponible en

http://socialcommunication.truman.edu/hidden-social-dimensions/turn-taking/.

Casillas, M., & Frank, M. C. (2017). The development of children’s ability to track

and predict turn structure in conversation. Journal of Memory and Language. [En

línea]. Disponible en http://doi.org/10.1016/j.jml.2016.06.013.

Casillas, M., & Frank, M. C. (2017). The development of children’s ability to track

and predict turn structure in conversation. Journal of Memory and Language. [En

línea]. Disponible en http://doi.org/10.1016/j.jml.2016.06.013.

Chao, C. (2012). Timing multimodal turn-taking for human-robot cooperation. In

Proceedings of the 14th ACM international conference on Multimodal interaction -

ICMI. New York, New York, USA: ACM Press. [En línea]. Disponible en

http://doi.org/10.1145/2388676.2388744.

conceptodefinicion, “¿Qué es Semantica? - Su Definición, Concepto y Significado,”

2014. [En línea]. Disponible en http://conceptodefinicion.de/semantica/.

conceptodefinicion., “¿Qué es Léxico? - Su Definición, Concepto y Significado,”

2014. [En línea]. Disponible en http://conceptodefinicion.de/lexico/.

Cowley, S. J. (1998). Of Timing, Turn-Taking, and Conversations. Journal of

Psycholinguistic Research. [En línea]. Disponible en

http://doi.org/10.1023/a:1024948912805.

Page 89: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

89

Definición ABC, “Definición de Genética» Concepto en Definición ABC, Lenguaje

corporal,” Definición de Genética, 2017. [En Línea]. Disponible en

https://www.definicionabc.com/comunicacion/lenguaje-corporal.php.

Definición.De, “Definición de sintaxis - Qué es, Significado y Concepto,”

Definicion.de©, 2008. [En línea]. Disponible en http://definicion.de/sintaxis/.

Diaz, M. (2013). La comunicación verbal - SELVV. Recuperado May 29, 2017. [En

línea]. Disponible en https://selvv.com/comunicacion-verbal/.

EcuRed, “Robot,” 2017. [En líena]. Disponible en https://www.ecured.cu/Robot.

englishonline, “Turn Taking / The Language of Conversation / Exploring language /

Planning for my students’ needs / English Online / English - ESOL - Literacy Online

website - English - ESOL - Literacy Online,” 2009. [En línea]. Disponible en

http://englishonline.tki.org.nz/English-Online/Planning-for-my-students-

needs/Exploring-language/The-Language-of-Conversation/Turn-Taking.

Maat, M., Truong, K. P., & Heylen, D. (2010). How Turn-Taking Strategies Influence

Users’ Impressions of an Agent. Lecture Notes in Computer Science (Including

Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in

Bioinformatics), 6356 LNAI. [En línea]. Disponible en http://doi.org/10.1007/978-3-

642-15892-6_48.

Varela Iglesias J L, Tadeo Monge FT, Carreño Rujillo G, Doménech Colón F, Abad

León A, “Real Academia Española. Conversación,” Edición del Tricentenario. 2014.

[En línea]. Disponible en http://dle.rae.es/srv/fetch?id=AgW2atc.

Varela Iglesias J L, Tadeo Monge FT, Carreño Rujillo G, Doménech Colón F, Abad

León A, “Real Academia Española. Diccionario Usual.Entonación,” Edición del

Tricentenario. 2014. [En línea]. Disponible en http://dle.rae.es/srv/fetch?id=FilFwSN.

Varela Iglesias J L, Tadeo Monge FT, Carreño Rujillo G, Doménech Colón F, Abad

Page 90: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

90

León A, “Real Academia Española. Diccionario Usual.Inhalar,” Edición del

Tricentenario. [En línea]. Disponible en

http://dle.rae.es/srv/search?m=30&w=inhalar.

Varela Iglesias J L, Tadeo Monge FT, Carreño Rujillo G, Doménech Colón F, Abad

León A, “Real Academia Española. Conversación,” Edición del Tricentenario. 2014.

[En línea]. Disponible en http://dle.rae.es/srv/fetch?id=AgW2atc.

Fernández, R., Lucht, T., Rodríguez, K., & Schlangen, D. (2006). Interaction in task-

oriented human-human dialogue: The effects of different turn-taking policies. In 2006

IEEE ACL Spoken Language Technology Workshop, SLT 2006. [En línea].

Disponible en. http://doi.org/10.1109/SLT.2006.326791

Fernández, R., Lucht, T., Rodríguez, K., & Schlangen, D. (2006). Interaction in task-

oriented human-human dialogue: The effects of different turn-taking policies. In 2006

IEEE ACL Spoken Language Technology Workshop, SLT 2006, Proceedings. [En

línea]. Disponible en http://doi.org/10.1109/SLT.2006.326791.

Gabriel D, “Definición de Orador» Concepto en Definición ABC,” Definición ABC,

2008. [En línea]. Disponible en

https://www.definicionabc.com/comunicacion/orador.php

Garrod, S., & Pickering, M. J. (2015). The use of content and timing to predict turn

transitions. Frontiers in Psychology, 6(JUN). [En línea]. Disponible en

http://doi.org/10.3389/fpsyg.2015.00751.

Gatica, J. (2014). Lo icónico se relaciona con imágenes (representación gráfica de

jaime gatica en Prezi. Retrieved May 23. [En línea]. Disponible en

https://prezi.com/sqmvcjaitt1v/lo-iconico-se-relaciona-con-imagenes-

representacion-grafic/.

Page 91: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

91

Ghilzai, S. A. (2015). Conversational Analysis of Turn taking Behavior and Gender

Differences in Multimodal Conversation Shazia Akbar Ghilzai December 2015.

Perspectives in Language, Linguistics and Media.

Griol, D., Molina, J. M., Callejas, Z., & López-Cózar, R. (2011). La plataforma

EDUCAGENT: Agentes Conversacionales Inteligentes y Entornos Virtuales

aplicados a la Docencia. Informática Educativa Comunicaciones. [En línea].

Disponible en http://hdl.handle.net/10016/18278.

Guerri, M. (2017). La comunicación no verbal, el arte de expresarse sin hablar.

Recuperado May 29, 2017. [En línea]. Disponible en

https://www.psicoactiva.com/blog/la-comunicacion-no-verbal-el-arte-de-

expresarse-sin-hablar/.

Hayashi, M. (2012). Turn Allocation and Turn Sharing. In The Handbook of

Conversation Analysis. Chichester, UK: John Wiley & Sons, Ltd. [En línea].

Disponible en http://doi.org/10.1002/9781118325001.ch9.

Heldner, M., & Edlund, J. (2010). Pauses, gaps and overlaps in conversations.

Journal of Phonetics. [En línea]. Disponible en

http://doi.org/10.1016/j.wocn.2010.08.002

Heylen, D. (2006). Head gestures, gaze and the principles of conversational

structure. International Journal of Humanoid Robotics. [En línea]. Disponible en

http://doi.org/10.1142/S0219843606000746.

Heylen, D. (2006). Head gestures, gaze and the principles of conversational

structure. International Journal of Humanoid Robotics, 3(3). [En línea]. Disponible

en http://doi.org/10.1142/S0219843606000746.

Hirvenkari, L., Ruusuvuori, J., Saarinen, V. M., Kivioja, M., Peräkylä, A., & Hari, R.

(2013). Influence of Turn-Taking in a Two-Person Conversation on the Gaze of a

Page 92: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

92

Viewer. PLoS ONE, 8(8). [En línea]. Disponible en

http://doi.org/10.1371/journal.pone.0071569.

Holler, J., Kendrick, K. H., Casillas, M., & Levinson, S. C. (2015a). Editorial: Turn-

Taking in Human Communicative Interaction. Frontiers in Psychology, 6(DEC). [En

línea]. Disponible en http://doi.org/10.3389/fpsyg.2015.01919.

Holler, J., Kendrick, K. H., Casillas, M., & Levinson, S. C. (2015a). Editorial: Turn-

Taking in Human Communicative Interaction. Frontiers in Psychology, 6(DEC). [En

línea]. Disponible en http://doi.org/10.3389/fpsyg.2015.01919.

Holler, J., Kendrick, K. H., Casillas, M., & Levinson, S. C. (2015a). Editorial: Turn-

Taking in Human Communicative Interaction. Frontiers in Psychology, 6(DEC). [En

línea]. Disponible en http://doi.org/10.3389/fpsyg.2015.01919.

Ishii, R., Otsuka, K., Kumano, S., & Yamato, J. (2016). Prediction of Who Will Be the

Next Speaker and When Using Gaze Behavior in Multiparty Meetings. ACM

Transactions on Interactive Intelligent Systems. [En línea]. Disponible en

http://doi.org/10.1145/2757284.

Ishii, R., Otsuka, K., Kumano, S., & Yamato, J. (2016). Prediction of Who Will Be the

Next Speaker and When Using Gaze Behavior in Multiparty Meetings. ACM

Transactions on Interactive Intelligent Systems, 6(1). [En línea]. Disponible en

http://doi.org/10.1145/2757284.

J. Perez Porto and A. Gardey, “Definición de oyente - Qué es, Significado y

Concepto,” 2008. [en línea]. Disponible en http://definicion.de/oyente/.

J. Terra, “Technology / Culture / Design / Experience: ID FMP: Conversation Turn-

Taking Model,” 2009. [En línea]. Disponible en

http://julioterrany.blogspot.com.co/2009/03/id-fmp-conversation-turn-taking-

model.html.

Page 93: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

93

Jan, D., Herrera, D., Martinovski, B., Novick, D., & Traum, D. (2007). A

Computational Model of Culture-Specific Conversational Behavior. In Intelligent

Virtual Agents. Berlin, Heidelberg: Springer Berlin Heidelberg. [En línea]. Disponible

en http://doi.org/10.1007/978-3-540-74997-4_5

Jan, D., Herrera, D., Martinovski, B., Novick, D., & Traum, D. (2007). A

Computational Model of Culture-Specific Conversational Behavior. In Intelligent

Virtual Agents. Berlin, Heidelberg: Springer Berlin Heidelberg. [En línea]. Disponible

en http://doi.org/10.1007/978-3-540-74997-4_5.

Jokinen, K. (2011). Turn taking, utterance density, and gaze patterns as cues to

conversational activity. In Proceedings of ICMI 2011 Workshop Multimodal Corpora

for Machine Learning: Taking Stock and Road mapping the Future. [En línea].

Disponible en http://www.thesect.se/nomco/pubs/Jokinen - Turn taking, Utterance

Density.pdf.

Jokinen, K. (2011). Turn taking, utterance density, and gaze patterns as cues to

conversational activity. In Proceedings of ICMI 2011 Workshop Multimodal Corpora

for Machine Learning: Taking Stock and Road mapping the Future. [En línea].

Disponible en http://www.thesect.se/nomco/pubs/Jokinen - Turn taking, Utterance

Density.pdf.

Jokinen, K., Harada, K., Nishida, M., & Yamamoto, S. (2010). Turn-alignment using

eye-gaze and speech in conversational interaction. Interspeech-2010, (September).

Keitel, A., & Daum, M. M. (2015). The use of intonation for turn anticipation in

observed conversations without visual signals as source of information. Frontiers in

Psychology, 6(FEB). [En línea]. Disponible en

http://doi.org/10.3389/fpsyg.2015.00108.

Page 94: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

94

Khoddamy Pour, F., & Yazd, A. L. (2015). Turn Taking in Conversation Analysis.

International Journal of Educational Investigations. [En línea]. Disponible en

Www.ijeionline.com.

Khoddamy Pour, F., & Yazd, A. L. (2015). Turn Taking in Conversation Analysis.

International Journal of Educational Investigations. [En línea]. Disponible en

Www.ijeionline.com.

Khoddamy Pour, F., & Yazd, A. L. (2015). Turn Taking in Conversation Analysis.

International Journal of Educational Investigations. [En línea]. Disponible en

www.ijeionline.com, 2(6).

Kousidis, S., Schlangen, D., & Skopeteas, S. (2013). A cross-linguistic study on turn-

taking and temporal alignment in verbal interaction. In Proceedings of the Annual

Conference of the International Speech Communication Association,

INTERSPEECH.

L. D. R. Díaz, “RAE - Resumen Analítico Especializado,” 2014. [En línea]. Disponible

en http://competenciascomunicativas2033.blogspot.com.co/2014/06/rae-resumen-

analitico-especializado.html.

Lala, D., Milhorat, P., Inoue, K., Zhao, T., & Kawahara, T. (2016). Multimodal

interaction with the autonomous Android ERICA. In Proceedings of the 18th ACM

International Conference on Multimodal Interaction - ICMI 2016. New York, New

York, USA: ACM Press. [En línea]. Disponible en

http://doi.org/10.1145/2993148.2998528.

Leßmann, N., Kranstedt, A., & Wachsmuth, I. (2004). Towards a cognitively

motivated processing of turn-taking signals for the embodied conversational agent

Max. In Proceedings Workshop W12. [En línea]. Disponible en http://perso.telecom-

paristech.fr/~pelachau/AAMAS04/FinalPaper/turnTaking.pdf.

Page 95: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

95

Levitan, R., Beňuš, Š., Gravano, A., & Hirschberg, J. (2015). Entrainment and Turn-

Taking in Human-Human Dialogue. In AAAI Spring Symposium on Turn-taking and

Coordination in Human- Machine Interaction. [En línea]. Disponible en

https://pdfs.semanticscholar.org/af4d/9048f781c3315bd7491e20aa366c051a9f77.p

df.

Magyari, L., & de Ruiter, J. P. (2012). Prediction of Turn-Ends Based on Anticipation

of Upcoming Words. Frontiers in Psychology. [En línea]. Disponible en

http://doi.org/10.3389/fpsyg.2012.00376.

Magyari, L., & de Ruiter, J. P. (2012). Prediction of Turn-Ends Based on Anticipation

of Upcoming Words. Frontiers in Psychology, 3(OCT). [En línea]. Disponible en

http://doi.org/10.3389/fpsyg.2012.00376.

Martínez, L. (2014). ¿Qué es proxemica? Muy Interesante. [En línea]. Disponible en

http://www.muyinteresante.es/cultura/arte-cultura/articulo/ique-es-la-proxemica.

McCleary, L. E., & Leite, T. de A. (2013). Turn-taking in Brazilian Sign Language:

Evidence from overlap. Journal of Interactional Research in Communication

Disorders. [En línea]. Disponible en http://doi.org/10.1558/jircd.v4i1.123.

medciclopedia. (2008). comunicación interpersonal diádica | Diccionario Médico.

Retrieved May 29, 2017. [en línea]. Disponible en

https://diccionario.medciclopedia.com/c/comunicacion-interpersonal-diadica/.

Morency, L.-P., Christoudias, C. M., & Darrell, T. (2006). Recognizing gaze aversion

gestures in embodied conversational discourse. Proceedings of the 8th International

Conference on Multimodal Interfaces – ICMI. [En Línea]. Disponible en

http://doi.org/10.1145/1180995.1181051.

Morristown, NJ, USA: Association for Computational Linguistics. [En línea].

Disponible en http://doi.org/10.3115/1556328.1556333.

Page 96: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

96

N. Leßmann, A. Kranstedt, and I. Wachsmuth, “Towards a cognitively motivated

processing of turn-taking signals for the embodied conversational agent Max,” in

Proceedings Workshop W12, 2004.

Nordquist, R. (2017). Back-Channel Signal Definition and Examples. Retrieved May

29, 2017. [En línea]. Disponible en https://www.thoughtco.com/back-channel-signal-

communication-1689153

Novick, D. (2005). Models of gaze in multi-party discourse. Proceedings of Computer

Human Interface (CHI. [En línea]. Disponible en

http://www.cs.utep.edu/novick/papers/gaze.chi05.pdf.

Novick, D., & Gris, I. (2013). Grounding and Turn-Taking in Multimodal Multiparty

Conversation. In Lecture Notes in Computer Science (including subseries Lecture

Notes in Artificial Intelligence and Lecture Notes in Bioinformatics),Vol. 8007

LNCS.[En línea].Disponible en http://doi.org/10.1007/978-3-642-39330-3_11.

Novick, D., & Gris, I. (2013). Grounding and Turn-Taking in Multimodal Multiparty

Conversation. In Lecture Notes in Computer Science (including subseries Lecture

Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) (Vol. 8007). [En

línea]. Disponible en http://doi.org/10.1007/978-3-642-39330-3_11.

Oertel, C., Włodarczak, M., Edlund, J., Wagner, P., & Gustafson, J. (2012). Gaze

patterns in turn-taking. In Proceedings of Interspeech 2012.

Oertel, C., Włodarczak, M., Edlund, J., Wagner, P., & Gustafson, J. (2012). Gaze

patterns in turn-taking. In Proceedings of Interspeech 2012.

Ovocomunicacionesoficia. (2015). Los gestos icónicos o no deícticos... -

Comunicación NO Verbal. Retrieved May 29, 2017. [En línea]. Disponible en

https://www.facebook.com/ovocomunicacionesoficial/posts/912944305466373.

Pelachaud, C. (2005). Multimodal expressive embodied conversational agents. In

Page 97: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

97

Proceedings of the 13th annual ACM international conference on Multimedia -

MULTIMEDIA. New York, New York, USA: ACM Press. [En línea]. Disponible en

http://doi.org/10.1145/1101149.1101301.

Perez-Marin Universidad Rey Juan Carlos, D. (2011). Conversational Agents and

Natural Language Interaction: Techniques and Effective Practices. [En línea].

Disponible en

http://psychology.unt.edu/~tparsons/PDF/Parsons_Embodied_Conversational_Virt

ual_Patients.pdf.

Raidt, & Raidt Elisei, F., & Bailly, G., S. (2005). Face-to-Face Interaction with a

Conversational Agent: Eye-Gaze and Deixis. International Conference on

Autonomous Agents and Multiagent Systems. [En línea]. Disponible en

http://hal.archives-

ouvertes.fr/docs/00/41/92/99/PDF/ACM_05.pdf%5Cnhttp://hal.archives-

ouvertes.fr/hal-00419299/.

Raux, A., & Eskenazi, M. (2009a). A finite-state turn-taking model for spoken dialog

systems. Proceedings of Human Language Technologies The 2009 Annual

Conference of the North American Chapter of the Association for Computational

Linguistics on NAACL 09, (June). [En línea]. Disponible en

http://doi.org/10.3115/1620754.162084.

Raux, A., & Eskenazi, M. (2009a). A finite-state turn-taking model for spoken dialog

systems. Proceedings of Human Language Technologies The 2009 Annual

Conference of the North American Chapter of the Association for Computational

Linguistics on NAACL 09, (June). [En línea]. Disponible en

http://doi.org/10.3115/1620754.1620846.

Richardson, D. C., Dale, R., & Tomlinson, J. M. (2009). Conversation, Gaze

Coordination, and Beliefs About Visual Context. Cognitive Science, 33(8). [En línea],

Page 98: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

98

Disponible en http://doi.org/10.1111/j.1551-6709.2009.01057.x.

Richardson, D. C., Dale, R., & Tomlinson, J. M. (2009). Conversation, Gaze

Coordination, and Beliefs About Visual Context. Cognitive Science. [En línea].

Disponible en http://doi.org/10.1111/j.1551-6709.2009.01057.x.

Ruiz, C. A., Susana, M., Autor, B., Damián: & Matich, J. (2001). Universidad

Tecnológica Nacional Facultad Regional Rosario Departamento de Ingeniería

Química Grupo de Investigación Aplicada a la Ingeniería Química (GIAIQ) Redes

Neuronales: Conceptos Básicos y Aplicaciones. [En línea]. Disponible en

https://www.frro.tn.edu.ar/repositorio/catedras/quimica/5_anio/orientadora1/monogr

aias/matich-redesneuronales.pdf.

S. Nadella, “¿Qué son los bots y por qué llegarán en un futuro a todas tus

conversaciones? | tecno.americaeconomia.com | AETecno - AméricaEconomía,”

2016. [En línea]. Disponible en http://tecno.americaeconomia.com/articulos/que-

son-los-bots-y-por-que-llegaran-en-un-futuro-todas-tus-conversaciones.

Sacks, H., Schegloff, E., & Jefferson, G. (1974). A Simplest Systematics for the

Organization of Turn-Taking for Conversation. Language. [En línea]. Disponible en

http://doi.org/10.2307/412243.

Sánchez Anzola, N. (2016). Máquinas de soporte vectorial y redes neuronales

artificiales en la predicción del movimiento USD/COP spot intradiario. ODEON. [En

líena]. Disponible en http://doi.org/10.18601/17941113.n9.04.

Santos Pérez, M. (2014). Análisis y Optimización de Agentes Conversacionales 3D

para Sistemas Empotrados. [En línea]. Disponible en

http://doi.org/10.1098/rstb.2004.1476.

Page 99: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

99

Santos Pérez, M. (2014). Análisis y Optimización de Agentes Conversacionales 3D

para Sistemas Empotrados. [En línea]. Disponible en

http://doi.org/10.1098/rstb.2004.1476.

Sato, R., & Takeuchi, Y. (2014). Coordinating turn-taking and talking in multi-party

conversations by controlling robot’s eye-gaze. In The 23rd IEEE International

Symposium on Robot and Human Interactive Communication (Vol. 2014–October).

IEEE. [En línea].Disponible en http://doi.org/10.1109/ROMAN.2014.6926266.

Sato, R., & Takeuchi, Y. (2014). Coordinating turn-taking and talking in multi-party

conversations by controlling robot’s eye-gaze. In The 23rd IEEE International

Symposium on Robot and Human Interactive Communication (Vol. 2014–Octob,

IEEE. [En línea]. Disponible en http://doi.org/10.1109/ROMAN.2014.6926266.

Sato, R., Higashinaka, R., Tamoto, M., Nakano, M., & Aikawa, K. (2002). Learning

decision trees to determine turn-taking by spoken dialogue systems. In Proceedings

of ICSLP 02, Denver, Colorado. [En línea]. Disponible en

http://www.speech.kth.se/prod/publications/files/100510.pdf.

Schegloff, E. A. (2000). Overlapping talk and the organization of turn-taking for

conversation. Language in Society. [En línea]. Disponible en

http://doi.org/10.1017/S0047404500001019.

Sheikhi, S., & Odobez, J.-M. (2015). Combining dynamic head pose–gaze mapping

with the robot conversational state for attention recognition in human–robot

interactions. Pattern Recognition Letters. [En línea].Disponible en

http://doi.org/10.1016/j.patrec.2014.10.002.

Sheikhi, S., & Odobez, J.-M. (2015). Combining dynamic head pose–gaze mapping

with the robot conversational state for attention recognition in human–robot

interactions. Pattern Recognition Letters, 66. [En línea]. Disponible en

http://doi.org/10.1016/j.patrec.2014.10.002.

Page 100: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

100

Skantze, G. (2017). Predicting and Regulating Participation Equality in Human-robot

Conversations. Proceedings of the 2017 ACM/IEEE International Conference on

Human-Robot Interaction - HRI ’17, (March). [En línea]. Disponible en

http://doi.org/10.1145/2909824.3020210.

Skantze, G. (2017). Predicting and Regulating Participation Equality in Human-robot

Conversations. Proceedings of the 2017 ACM/IEEE International Conference on

Human-Robot Interaction-HRI ’17, (March).[En línea]. Disponible en

http://doi.org/10.1145/2909824.3020210.

Skantze, G., Hjalmarsson, A., & Oertel, C. (2014). Turn-taking, feedback and joint

attention in situated human-robot interaction. Speech Communication. [En línea].

Disponible en http://doi.org/10.1016/j.specom.2014.05.005.

Skantze, G., Johansson, M., & Beskow, J. (2015). Exploring Turn-taking Cues in

Multi-party Human-robot Discussions about Objects. In Proceedings of the 2015

ACM on International Conference on Multimodal Interaction - ICMI ’15. New York,

New York, USA: ACM Press. [En línea]. Dispobible en

http://doi.org/10.1145/2818346.2820749.

Stivers, T., Enfield, N. J., Brown, P., Englert, C., Hayashi, M., Heinemann, T., …

Levinson, S. C. (2009). Universals and cultural variation in turn-taking in

conversation. Proceedings of the National Academy of Sciences of the United States

of America. [En línea]. Disponible en http://doi.org/10.1073/pnas.0903616106.

Streeck, P. J. (1995). Conversation Analysis, (1994). [en línea]. Disponible en

http://doi.org/10.4324/9780203798874.ch5.

T. Tamayo, “Tesina Tamayo 2009 FADU UNL: Comunicación Multimodal,” 2009. [en

línea]. Disponible en

http://vaccaritesinatamayo2009.blogspot.com.co/2009/09/comunicacion-

multimodal.html.

Page 101: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

101

Talley, L. (2012). Nonverbal Turn Taking Signals. Retrieved May 29, 2017. [En

línea]. Disponible en http://www.lindatalley.com/nonverbal-turn-taking-signals/.

Tannen, D. (2012). Turn-Taking and Intercultural Discourse and Communication. In

The Handbook of Intercultural Discourse and Communication. Chichester, UK: John

Wiley & Sons, Ltd. [En línea]. Disponible en

http://doi.org/10.1002/9781118247273.ch8.

Universidad Autónoma de Barcelona. (1999). Estudios de linguistica del espanol.

Universidad Autónoma de Barcelona. [En línea]. Disponible en

http://elies.rediris.es/elies15/cap21.html.

UTM. (2014). Árbol de decisión. Universidad de México. [En línea]. Disponible en

http://www.utm.mx/~jahdezp/archivos estructuras/DESICION.pdf.

Van Schendel, J. A., & Cuijpers, R. H. (2015). Turn-yielding cues in robot-human

conversation. In New Frontiers in Human-Robot Interaction. [En línea]. Disponible

en http://www.mahasalem.net/AISB2015/NF-HRI-2015-

full_proceedings.pdf#page=86.

Van Schendel, J. A., & Cuijpers, R. H. (2015). Turn-yielding cues in robot-human

conversation. In New Frontiers in Human-Robot Interaction. [En línea]. Disponible

en http://www.mahasalem.net/AISB2015/NF-HRI-2015-

full_proceedings.pdf#page=86.

Van Schendel, J. A., & Cuijpers, R. H. (2015). Turn-yielding cues in robot-human

conversation. In New Frontiers in Human-Robot Interaction. [En línea]. Disponible

en http://www.mahasalem.net/AISB2015/NF-HRI-2015-

full_proceedings.pdf#page=86.

Vertegaal, R., Slagter, R., Van Der Veer, G., & Nijholt, A. (2001). Eye Gaze Patterns

in Conversations : There is More to. In Proceedings of the SIGCHI conference on

Page 102: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

102

Human factors in computing systems. New York, New York, USA: ACM Press. [En

línea]. Disponible en http://doi.org/10.1145/365024.365119.

Ward, N. G., Fuentes, O., & Vega, A. (2010). Dialog Prediction for a General Model

of Turn-Taking. Interspeech-2010, (October).

Włodarczak, M., & Heldner, M. (2016). Respiratory Turn-Taking Cues. In

Proceedings of the Annual Conference of the International Speech Communication

Association, INTERSPEECH (Vol. 08–12–Sept). [En línea]. Disponible en

http://doi.org/10.21437/Interspeech.2016-346.

Wordpress, “AFND | Interpolados,” 2017. [en línea]. Disponible en

https://interpolados.wordpress.com/tag/afnd/.

Yuasa, M., Mukawa, N., Kimura, K., Tokunaga, H., & Terai, H. (2010). An utterance

attitude model in human-agent communication. In Proceedings of the 28th of the

international conference extended abstracts on Human factors in computing

systems - CHI EA ’10. New York, New York, USA: ACM Press. [En línea]. Disponible

en http://doi.org/10.1145/1753846.1754079.

Page 103: REVISIÓN SISTEMÁTICA DE MODELOS DE NEGOCIACIÓN DE …

103