Secciones
Síguenos en:
EL TIEMPO DE VOCES DIGITALES

EL TIEMPO DE VOCES DIGITALES

A pesar de los problemas, el procesamiento de voz se está difundiendo, uniendo la simplicidad y omnipresencia del teléfono con la potencia del computador. Así como comunicándose a través del teléfono cualquier lector de EL TIEMPO puede enterarse de las principales noticias de día, la cartelera de TV, la de cine... también, por ejemplo, los clientes de un bancos podrían obtener el estado de sus cuentas, los de otra empresa ordenar pedidos, hacer reclamos, y sigue un largo etcétera.

Para eso, la información es leída por computadores equipados con programas especiales que, en lugar de exhibirla en una pantalla, la presentan como discurso digitalizado. Estos computadores están tan bien camuflados que hasta los que le tienen fobia a la tecnología (tecnofóbicos) los toleran.

Técnicamente la Línea T se compone de un computador con tarjeta maestra tipo Intel 386, disco duro de más de un Gigabyte, para almacenar las voces, y sistema operativo QNX, un sabor de Unix en el cual están los programas que procesan la voz. Los sonidos son capturados por tarjetas de conversión de señal análoga a digital, es decir, los códigos telefónicos se traducen a sistema binario. Complementan el equipo unos interesantes convertidores de señales de pulsos (los usados por teléfono de disco), a señales en forma de tonos (correspondientes a teléfonos de teclado).

Aunque los sistemas de información y transacción basados en el teléfono carecen de la sofisticación tecnológica de las redes de computadores, el procesamiento de voz se está convirtiendo en una herramienta importante para las empresas que están luchando por encontrar una forma efectiva de brindar servicios.

Otra posibilidad del servicio, que EL TIEMPO ofrecerá en breve, es el manejo de avisos clasificados por voz ; en ellos, el periódico publicará un aviso solicitado por el anunciante en el que se pide, por ejemplo, que quienes deseen aplicar para un cargo ofrecido, llamen a la Línea T y dejen la información requerida, en una de las casilla de voz disponibles. En cualquier momento del día el anunciante puede ingresar a su casilla y escuchar las propuestas dejadas por los aplicantes. Luego, llamará a los candidatos más prometedores y los citará a una entrevista.

Uno de los mayores atractivos de los avisos clasificados por voz es que el anunciante puede llamar a cancelar su casilla una vez haya logrado su objetivo. Como sucede en el momento, el anunciante coloca un aviso y espera llamadas, con el agravante de que si concreta su objetivo con el primer llamante tiene que aguantarse la llamadera hasta que su aviso deje de publicarse.

El giro más reciente de los sistemas de información basados en el teléfono es el fax-back. Con él, los solicitantes sencillamente indican que información desean con solo oprimir las teclas de su teléfono. Luego, teclean el número de su fax y aparece la información.

Un reto para los fabricantes de equipo electrónico especializado es la tecnología que convierte a los computadores de escritorio normales en sistemas de voz.

Los computadores que pueden entender la voz humana y responder ante ella han sido tema de ciencia ficción durante décadas. Aunque aun no existen conversadores versátiles como el computador HAL en la película 2001, odisea del espacio, los avances recientes hacen posible agregar formas más sencillas de reconocimiento de habla a tareas cotidianas de la oficina, el hogar, hospitales y fábricas.

El sueño de lograr que los computadores procesen el habla en la forma en que lo hacen los humanos ha exasperado a algunas de las mejores mentes del mundo. Ultimamente, muchos investigadores han concluido que no es verdaderamente imperativo crear computadores que puedan comprenderlo todo. En lugar de ello, están buscando una máquina que sepa todo acerca de una cosa.

Si se entrena a un computador para que entienda, por ejemplo, el vocabulario relacionado con las reservaciones en las aerolíneas, el problema se hace más sencillo. Eso ha disparado el mercado de equipos para reconocimiento del habla.

Además, los programas de reconocimiento de habla, que hace algunos años requerían de grandes computadores llamados mainframes, ahora pueden operarse en los de escritorio, que son potentes y poco costosos.

Hasta ahora, el mercado más grande ha sido para sistemas que remplazan la entrada de datos por medio de tecleo. Pero hay otras dos formas en que los sistemas de voz se generalizarán en los próximos años.

La primera es la de la automatización de tareas telefónicas, tales como la de brindar ayuda con el directorio o permitir a los clientes solicitar mercancía directamente por teléfono. La segunda es el dictado: convertir instantáneamente la voz de una persona en texto de computador.

En varios tipos de negocios, el reconocimiento de voz permitiría la reducción del fraude ya que se almacenará una huella de voz de cada cliente.

Cada voz es única, como lo son las huellas digitales. Aunque es posible que las aplicaciones telefónicas pronto se conviertan en la forma predominante del reconocimiento de voz, la tecnología que más llama la atención está relacionada con la capacidad de convertir el habla en texto.

Lo que se busca es un sistema que permitir a las personas tratar a su computador de escritorio como a un secretaria humana, pidiéndole verbalmente que tome un dictado y luego imprima copias de los documentos. Historia del procesamiento de voz La historia del procesamiento de voz lleva tres décadas. La compañía estadounidense AT&T estableció las bases a mediados de los 60 cuando inició el servicio de los teléfonos digitales.

Pocos usuarios lo sabían, pero los sonidos emitidos por sus teléfonos al marcar eran en realidad algo así como un código de computador, un tono diferente para cada número desde el cero hasta el nueve. Estos mismos tonos son los que actualmente hacen del teléfono un terminal de computador.

En 1966, antes de que los terminales de computador remotos en línea fueran comunes, IBM vendía un complejo dispositivo mecánico que permitía a los cajeros de las sucursales llamar para obtener información acerca de las cuentas desde el computador principal de un banco. El mecanismo, que estaba inmerso en aceite, tenía hasta 128 cabezas magnéticas de reproducción. En cada pista había una palabra o número, que se activaba para leer frases tales como saldo .

La industria solamente despegó en la década de los 80, cuando hubo disponibilidad de microprocesadores, chips de memoria poco costosos, y mejores sistemas de almacenamiento.

Los sistemas de voz necesitan computadores potentes porque el almacenamiento de grabaciones digitales requiere más de 200 veces la capacidad de memoria que el almacenamiento de las mismas palabras en forma de texto.

Llegaste al límite de contenidos del mes

Disfruta al máximo el contenido de EL TIEMPO DIGITAL de forma ilimitada. ¡Suscríbete ya!

Si ya eres suscriptor del impreso

actívate

* COP $900 / mes durante los dos primeros meses

Sabemos que te gusta estar siempre informado.

Crea una cuenta y podrás disfrutar de:

  • Acceso a boletines con las mejores noticias de actualidad.
  • Comentar las noticias que te interesan.
  • Guardar tus artículos favoritos.

Crea una cuenta y podrás disfrutar nuestro contenido desde cualquier dispositivo.