Características principales de VoiceTranslator & MouseReader

VoiceTranslator utiliza el motor de reconocimiento del habla de Microsoft Speech que se distribuye gratuitamente con Windows XP y Vista (el rendimiento y la precisión se vio notablemente mejorado en la versión de Vista)

El motor de dictado de Dragon Naturallyspeaking v9 todavía no está soportado internamente por el programa. El programa puede utilizarse con ese software de reconocimiento del habla de un modo equivalente al tecleo manual de texto en la caja de entrada, y el proceso de traducción puede lanzarse automáticamente cada vez que cambie el texto de la caja (sin tener que pulsar ninguna tecla), pero la caja de entrada tiene que mantener el foco de entrada de usuario, y por lo tanto el programa no podrá reconocer frases con este software mientras esté en segundo plano o minimizado.


VoiceTranslator utiliza 3 populares servicios de traducción web (Google, Babelfish y FreeTranslation)*

Además, principalmente para su uso offline, VoiceTranslator también incluye soporte para ficheros de texto con "diccionarios locales", esencialmente orientados para la traducción de palabras aisladas, locuciones idiomáticas y frases sueltas (normalmente cortas), o combinaciones simples de ellas (el programa no tiene un auténtico "motor de traducción" offline, que por ejemplo analice la estructura gramatical de las frases)

Los diccionarios locales son fácilmente ampliables, por el propio usuario y mediante la colaboración con el resto de usuarios del programa. Incluso se puede añadir nuevas traducciones a los diccionarios locales cómodamente mientras se leen documentos o páginas web (mediante una combinación de teclas rápidas), sin ni siquiera tener que alternar entre el documento que se está leyendo y el programa. Puedes seleccionar la opción de subir las nuevas traducciones a la base de datos global de traducciones para compartirlas con la comunidad y ayudar en la mejora de los diccionarios online y locales.

También puedes buscar traducciones en los diccionarios online y por supuesto colaborar para mejorarlos, añadiendo nuevas traducciones, reglas o pistas para la traducción, frases de ejemplo..., y votando las ya existentes en la base de datos.

*He visto varios programas y "widgets" por ahí que utilizan esos servicios webs de traducción, pero puede que estén violando alguno de sus Términos De Servicio, no lo sé. El programa intenta evitar los abusos (por ejemplo, para la traducción en tiempo real de las "hipótesis de reconocimiento del habla", el programa sólo permite el uso de los diccionarios locales) y sólo pretende ofrecer un interface de usuario más cómodo para esos servicios. En cualquier caso, si alguna de las compañías anteriores se queja por ello, puede que me vea obligado a quitarlos de futuras distribuciones del programa. Espero que no les importe, o mejor aún, que alguna de ellas me contrate. :-)


VoiceTranslator y MouseReader utilizan el motor Texto a Voz (Text To Speech o TTS) que se distribuye gratuitamente con Windows XP y Windows Vista. Aparte del motor, necesitas instalar voces compatibles.

Aunque existen varias voces TTS gratuitas (principalmente del propio Microsoft y de L&H), te recomendamos la adquisición de un paquete de voz de terceras compañías como Loquendo, ATT Natural Voices o Nuance Realspeak, las cuales probablemente te proporcionaran una mejor calidad de sonido, además de estar disponibles para un número de idiomas mucho mayor.

Aquí he recopilado una lista (no exhaustiva) de voces TTS compatibles gratuitas y comerciales.

 

A largo plazo, puede que los diccionarios online se conviertan en la parte más importante de este proyecto. Sus principales características son:

- Las traducciones son aportadas por los propios usuarios (como en el ejemplo de la wikipedia)

- Los usuarios pueden votar las traducciones, y aquellas con las mejores puntuaciones aparecerán antes en los resultados de búsqueda (como en el ejemplo de digg)

- Uso del concepto de "pistas de traducción" para ayudar en la selección de la traducción correcta dependiendo del contexto. Estas pistas también pueden ser votadas.

- Una extensa lista de pares de idiomas (que puede que crezca en un futuro) en la búsqueda de la máxima universalidad de los diccionarios.

TRUCOS & RECOMENDACIONES


- En Windows Vista puedes instalar paquetes de idiomas adicionales y así obtendrás reconocimiento de voz en otros idiomas diferentes al de la instalación inicial (existen paquetes disponibles para inglés USA , inglés UK, francés, alemán, español, japonés, chino tradicional y chino simplificado)

- En Windows XP existen motores de reconocimiento de voz (bastante antiguos) para inglés USA, japonés y chino simplificado. Con Office 2003 (versión en inglés) y Windows XP Tablet Edition se incluyó una versión más actualizada del motor de inglés USA (6.1 en lugar de 5.1). De cualquier modo, la precisión del reconocimiento de voz es mucho peor que en Vista.

- Me las he ingeniado para poder usar VoiceTranslator con Dragon Naturallyspeaking 9 mientras trabajo con otras aplicaciones "simplemente" emulando una copia de Windows bajo VMware y manteniendo el programa VoiceTranslator en primer plano en el Sistema Operativo virtualizado (Lo sé, un truco muy cutre.... ¡¡¡necesito el SDK para Dragon NaturallySpeaking 9!!!)

- Puedes usar unos auriculares bluetooth para hablar y escuchar, y si bien su calidad del sonido suele ser horrible, especialmente la del micrófono* (perjudicando notablemente a la precisión del reconocimiento de voz), pueden resultar más cómodos de llevar y no llamarás tanto la atención como con unos cascos con micrófono normales. Por ejemplo si puedes usarlos en el trabajo, no parecerá que estés escuchando música o chateando.

*Si sabes cómo podría mejorar la calidad del micrófono usando el perfil de auriculares bluetooth (headset bluetooth profile), por favor comunícamelo. He probado varios auriculares, baratos y caros, en varios ordenadores y siempre me han dado pobres resultados. Creo que ni siquiera los auriculares bluetooth provistos del protocolo a2dp solucionarán esto, pues según he leído en la wikipedia la mayoría de ellos incluso desconectan el micrófono cuando se usa dicho protocolo (pues están pensados para escuchar música con calidad) Tal vez los auriculares provistos del chip de CSR con codec Auristream que se comercializarán próximamente mejoren la calidad del sonido de manera apreciable.

Por otra parte , con algunos auriculares y sticks bluetooth USB hay un retraso de tiempo entre el momento de activación del sonido en el PC, y cuando los auriculares empiezar a reproducir el sonido correctamente, problema que he podido "esquivar" con el truquillo de mantener la reproducción de sonido del PC constantemente activada, por ejemplo reproduciendo un archivo de audio repetidamente a volumen 0 (yo lo hago con el Winamp y con un .mp3 o un .wav vacío, pero vale cualquier otra solución similar). Intentaré resolver esta pega con una opción dentro del programa en un futuro.

- Con MouseReader, recuerda que en algunos programas (p.e. Internet Explorer) puedes seleccionar un párrafo entero de texto con "triple clicking". Algunas veces, dependiendo del formato del texto que se está leyendo, ese método puede ser mucho más cómodo que la selección de los párrafos haciendo click y arrastrando.

Puedes usar VoiceTranslator como una herramienta de aprendizaje de idiomas, pero también puede resultarte útil para otras situaciones:

- Puedes usarlo como una ayuda para entender mejor una charla en otro idioma.

Por ejemplo, puede ayudarte mientras asistes a charlas, conferencias y reuniones internacionales, en vivo u online.

Aunque el entrenamiento específico para cada orador mejora notablemente el reconocimiento de voz, tanto Microsoft Speech como Dragon Naturallyspeaking 9 permiten la creación de nuevos usuarios sin entrenamiento y adaptación específicos, por lo que en cierto modo puedes tener una herramienta de reconocimiento del habla "independiente del hablante", y aún así obtener resultados bastante aceptables si el habla es clara y el ruido de fondo es bajo. Te recuerdo que una selección correcta del acento inglés UK o US puede mejorar notablemente la precisión del reconocimiento de oradores en inglés.

Puede que sólo sea una percepción subjetiva, pero me parece que crear usuarios nuevos para cada nuevo orador produce mejores resultados (y siempre los puedes borrar después). Puede que el motor de reconocimiento de voz haga alguna adaptación sobre la marcha incluso sin entrenamiento específico previo.

- Relacionado con lo anterior, aparte de la entrada habitual del micrófono, muchas tarjetas de sonido tienen la opción de establecer como dispositivo de entrada para la grabación el "Stereo Mix" (o algo similar en tu sistema). Ello resulta interesante porque así es posible reconducir el sonido que reproduce tu PC directamente al motor de reconocimiento de voz, y así reconocer el habla de videos (locales y online), TV, radio, podcasts, películas, audiolibros, videoconferencia con skype, messenger... y más.

Cada vez que la apliación VoiceTranslator se cierra y se abre de nuevo, la fuente de entrada retornará automáticamente al dispositivo de entrada establecido por defecto para el reconocimiento de voz en tu sistema (habitualmente el micrófono). Así pues, si quieres usar una entrada diferente (por ejemplo el Stereo Mix) tendrás que establecerla como dispositivo de entrada por defecto para el reconocimiento de voz en el Panel de Control -> Voz o seleccionarlo otra vez cuando abras de nuevo la aplicación. Lo mismo se aplica para la voz TTS establecida por defecto en el sistema. Probablemente sea algo a mejorar en futuras versiones del programa.

Si tu tarjeta de sonido no soporta una opción de grabación al estilo del "Stereo Mix", podrías "cerrar el bucle" usando los altavoces de tu PC y un micrófono (suponiendo que estés en una habitación silenciosa) pero este paso intermedio normalmente empeorará mucho la precisión del reconocimiento de voz. Si tu PC tiene una entrada de LINE-IN, en principio podrías cerrar el bucle conectando la salida de auriculares a esa entrada LINE-IN con un cable de audio adecuado (Cuidado, NO al jack de entrada del micrófono, pues su nivel de señal es habitualmente mucho menor y podrías dañarla) y estableciendo el LINE-IN como el dispositivo de entrada para el reconocimiento de voz. El problema con este método es que entonces no podrás escuchar el audio, así que probablemente no te resulte demasiado útil (a no ser que utilices 2 ordenadores o un cable de audio con una bifuración en Y adecuada, como los que se usan para compartir un mismo reproductor mp3 entre 2 personas)

- VoiceTranslator tiene una opción llamada "Realimentación de la pronunciación". Cuando está activada, el texto reconocido se reproduce de nuevo (sin traducir) mediante la voz TTS seleccionada actualmente, de manera que puedes usarlo para pulir tu pronunciación en otro idioma (por supuesto, suponiendo que el programa haya reconocido correctamente lo que habías dicho aunque tu pronunciación no fuese perfecta. Si no, puede que aprendas nuevas palabras :-)

- VoiceTranslator también puede ser útil para juegos online, corriendo en segundo plano, para reconocer el habla de otros jugadores y también para ayudarte a contestar a la típica auto-reflexión de los no nativos en inglés: "¿Cómo se dice en inglés...?

- Actualmente, sólo los diccionarios Español-Inglés e Inglés-Español tienen "algo" de contenido significativo. Espero poder mejorar mucho más estos y el resto de diccionarios con la colaboración de los usuarios de la aplicación de escritorio y de los diccionarios online.

Te recuerdo que puedes acceder a los diccionarios online via voice-translator.com/searchtranslation.php y también via googl9.com que es más corto de teclear y quizás más fácil de recordar. Registré ese nombre de dominio para otro proyecto hace algún tiempo, pero no lo he acabado. No he registrado un nombre de dominio 2.0 al uso, tal como transvoizr.com o voiztranz.com, y puede que no me haga rico por eso. :-)

- La compatibilidad con Unicode no está completamente implementada y testada, así que es probable que el programa no funcione bien con idiomas con caracteres especiales.

- No hace falta decir que ni la pronunciación Texto A Voz, ni el reconocimiento de voz, ni el proceso de traducción funcionan siempre con un 100% de precisión.

Pero pienso que "algo" es mejor que "nada", más aún cuando ese "algo" está constantemente mejorando y acercándose más y más a la respuesta correcta (ya me gustaría poder hablar y entender inglés tan bien como mi ordenador)

Una demo del programa VoiceTranslator puede descargarse aquí.

Una demo del programa MouseReader puede descargarse aquí.

Ir al inicio