conversor texto voz

3
Conversor texto-voz 1 Conversor texto-voz La conversión texto-voz es la generación de redes inalámbricas por medios automáticos de una voz artificial que genera el sonido producido por una persona al leer un texto cualquiera en voz alta o una voz artificial. Es decir, son sistemas que permiten la conversión de textos en voz sintética. Los conversores de texto-voz son conocidos también con las siglas CTV o por las siglas en inglés TTS (Text To Speech). Requisitos de los conversores CTV/TTS 1. Debe producir una voz sintética (artificial) que resulte natural y sea inteligible. 2. La síntesis del habla ha de ser completamente automática, sin que se tenga que introducir ningún tipo de reajuste manual en ninguna parte del proceso. 3. El texto introducido en el sistema ha de ser un texto arbitrario cualquiera, no puede estar amañado en ningún sentido. Fases de la conversión texto-voz En la primera fase se realiza una representación lingüística simbólica, para ello se siguen tres procesos consecutivos: 1. Normalización del texto. Se convierte la totalidad del texto a una forma textual convencional. Esto afecta principalmente a las cifras, abreviaturas, etc. A la normalización del texto también se la denomina pre-procesado o tokenización. 2. Conversión fonética. Una vez normalizado el texto se asignan transcripciones fonéticas a cada palabra. El proceso de convertir las transcripciones fonéticas en palabras se denomina «conversión texto-fonema» (TTP en sus siglas en inglés de text-to-phoneme) o «conversión grafema-fonema» (GTP en sus siglas en inglés de grapheme-to-phoneme). 3. División prosódica. Se divide el texto en unidades prosódicas, tales como unidades sintagmáticas, proposiciones y frases. En la segunda fase, la que forma el sintetizador propiamente dicho, toma como entrada la representación lingüística simbólica y la transforma en voz sintética. Algunos ejemplos de software Algunos ejemplos de estos programas son Verbio TTS [1] Solución de síntesis de voz en Español de España, español de Argentina, español de México, español latinoamericano neutro, Portugués de Brasil y Portugal, Inglés, Francés, Catalán, Gallego, Vasco y otros idiomas. VozMe Dspeech Loquendo TTS [2] El software sintetizador de voz de Loquendo ofrece una amplia gama de características distintivas y un conjunto de herramientas de gran valor a la hora de asegurar que tus mensajes textos peech y prompts se realicen exactamente como se desea: Vocabulario del usuario te permite definir la pronunciación de siglas, nombres, abreviaturas, etc .Controles Audio te consienten añadir efectos y eco, ajustar el equilibrio estéreo, modificar los niveles de frecuencia vía un 30-band graphic EQ incorporado, o añadir música y efectos de sonido. Estos también se pueden mezclar con la velocidad y variar de intensidad. Los usos potenciales en la formación son varios: Audio-guía didáctica, traducción de textos a otros idiomas y explicación en audio, etc... En este link está la explicación y la demostración de cómo funciona:

Upload: angel-marquez

Post on 22-Oct-2015

17 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Conversor Texto Voz

Conversor texto-voz 1

Conversor texto-vozLa conversión texto-voz es la generación de redes inalámbricas por medios automáticos de una voz artificial quegenera el sonido producido por una persona al leer un texto cualquiera en voz alta o una voz artificial. Es decir, sonsistemas que permiten la conversión de textos en voz sintética. Los conversores de texto-voz son conocidos tambiéncon las siglas CTV o por las siglas en inglés TTS (Text To Speech).

Requisitos de los conversores CTV/TTS1. Debe producir una voz sintética (artificial) que resulte natural y sea inteligible.2. La síntesis del habla ha de ser completamente automática, sin que se tenga que introducir ningún tipo de reajuste

manual en ninguna parte del proceso.3. El texto introducido en el sistema ha de ser un texto arbitrario cualquiera, no puede estar amañado en ningún

sentido.

Fases de la conversión texto-voz• En la primera fase se realiza una representación lingüística simbólica, para ello se siguen tres procesos

consecutivos:1. Normalización del texto. Se convierte la totalidad del texto a una forma textual convencional. Esto afecta

principalmente a las cifras, abreviaturas, etc. A la normalización del texto también se la denominapre-procesado o tokenización.

2. Conversión fonética. Una vez normalizado el texto se asignan transcripciones fonéticas a cada palabra. Elproceso de convertir las transcripciones fonéticas en palabras se denomina «conversión texto-fonema» (TTPen sus siglas en inglés de text-to-phoneme) o «conversión grafema-fonema» (GTP en sus siglas en inglés degrapheme-to-phoneme).

3. División prosódica. Se divide el texto en unidades prosódicas, tales como unidades sintagmáticas,proposiciones y frases.

• En la segunda fase, la que forma el sintetizador propiamente dicho, toma como entrada la representaciónlingüística simbólica y la transforma en voz sintética.

Algunos ejemplos de software

Algunos ejemplos de estos programas son• Verbio TTS [1] Solución de síntesis de voz en Español de España, español de Argentina, español de México,

español latinoamericano neutro, Portugués de Brasil y Portugal, Inglés, Francés, Catalán, Gallego, Vasco y otrosidiomas.

•• VozMe•• Dspeech• Loquendo TTS [2] El software sintetizador de voz de Loquendo ofrece una amplia gama de características

distintivas y un conjunto de herramientas de gran valor a la hora de asegurar que tus mensajes textos peech yprompts se realicen exactamente como se desea:

Vocabulario del usuario te permite definir la pronunciación de siglas, nombres, abreviaturas, etc .Controles Audio – te consienten añadir efectos y eco, ajustar el equilibrio estéreo, modificar los niveles de frecuencia vía un 30-band graphic EQ incorporado, o añadir música y efectos de sonido. Estos también se pueden mezclar con la velocidad y variar de intensidad. Los usos potenciales en la formación son varios: Audio-guía didáctica, traducción de textos a otros idiomas y explicación en audio, etc... En este link está la explicación y la demostración de cómo funciona:

Page 2: Conversor Texto Voz

Conversor texto-voz 2

Demo [3]. Como ejemplo práctico de este programa TTS, sería el uso en una aplicación móvil de explicacionesaudio-guiadas de cualquier teoría escrita , introducida por escrito previamente , para poder hacer uso de ella demanera práctica (reparación de electrodomésticos tutorizados mediante audio que han sido previamente convertidosde manuales )•• TextAloud•• Sodelscot

Enlaces externos• Descargar voces de otros idiomas [4] (Microsoft)• eSpeak [5]

• YAKiToMe [6], con voces naturales.• Algunas muestras de textos reproducidos mediante un conversor de texto voz pueden encontrar en la sección de

audiolibros leídos por sintetizador del habla de la biblioteca del proyecto gutenberg [7]

• Conversor texto-voz de artículos de Wikipedia en español (Pediaphon [8])• http:/ / www. educacontic. es/ blog/ convertir-texto-voz-para-leer-mientras-hacemos-otras-cosas#comment-20570• 19 herramientas de texto-a-voz para profesores [9]

Referencias[1] http:/ / www. verbio. com/ webverbio3/ es/ tecnologia/ verbio-tts. html[2] http:/ / www. loquendo. com/ es/[3] http:/ / www. loquendo. com/ es/ demo-center/ demo-tts-interactiva/[4] http:/ / office. microsoft. com/ en-us/ word-help/ using-the-speak-feature-with-multilingual-tts-HA101825279. aspx#_Toc272757143[5] http:/ / espeak. sourceforge. net/[6] http:/ / www. yakitome. com/ tts/ text_to_speech#[7] http:/ / www. gutenberg. org/ audio/ thelist_computer[8] http:/ / www. pediaphon. org/ ~bischoff/ radiopedia/ index_es. html[9] http:/ / elearningindustry. com/ 19-free-text-to-speech-tools-educators-tts-teachers

Page 3: Conversor Texto Voz

Fuentes y contribuyentes del artículo 3

Fuentes y contribuyentes del artículoConversor texto-voz  Fuente: http://es.wikipedia.org/w/index.php?oldid=69627671  Contribuyentes: A Jaen, Amadís, Deleatur, Diamondland, Edub, Hasier.inan, Humberto, Igna, Jvillane,LeCire, Maldoror, Marb, Matdrodes, Oscar ., Osmaga, Pablopperea, Raul Rios H, Tomatejc, Visitorsama, 29 ediciones anónimas

LicenciaCreative Commons Attribution-Share Alike 3.0//creativecommons.org/licenses/by-sa/3.0/