La Taberna del Grumete: Al Menú Taberna Grumete

telefonía Internet

Autor: Antonio Caravantes (ac@ctv.es), 07-97


 

Recientemente han aparecido varios productos de software que permiten comunicaciones de audio entre dos usuarios de Internet. La comunicación se establece "de viva voz" de forma similar a como funcionan los teléfonos convencionales. Por supuesto es necesario que ambos ordenadores incorporen tarjeta de sonido (con micrófono y altavoces o auriculares).

Además de esto, cuanto mejor sea la calidad/velocidad de la conexión Internet, tanto mejor será la comunicación; así, un módem lento, un servidor de acceso muy saturado, unas líneas de transmisión insuficientes... pueden dificultar gravemente la posible comunicación, o incluso llegar a imposibilitarla. Cuanto más óptimas sean las condiciones de conexión a Internet, tanto mejor.

En cuanto al módem, parece que no es posible utilizar uno de velocidad inferior a 14.400 bps. , siendo muy preferibles los de 28.800 o superiores. También es conveniente que el resto del hardware sea veloz, pero este punto es menos importante que el anterior. La agilidad / velocidad de la conexión es crítica para este tipo de programas que exigen a Internet unas prestaciones para las que no fue diseñada esta red. Ninguna de las pruebas que yo he realizado han logrado una comunicación buena: en el mejor de los casos he conseguido una conversación en la que solo se perdía audición durante una breve fracción de segundo cada cierto tiempo; en tal situación las frases siguen siendo comprensibles y el entendimiento general esta garantizado. Pero en otras circunstancias la calidad de sonido puede ser lamentable o puedes perder audición durante un segundo de cada dos, con lo que resulta imposible la comprensión del discurso. En cada caso concreto la situación puede variar, dependiendo de muchos factores.

Aún en los casos más favorables la calidad del sonido no es buena, raramente equiparable a la nitidez del teléfono, aunque suele apreciarse el timbre de voz del interlocutor, su acento, y deducir otros datos (como el sexo o la edad). La claridad de audio dependerá en gran medida de las condiciones de emisión del interlocutor: calidad del micro, ruido ambiental, distancia entre el micro y la boca, etc. Tus interlocutores agradecerán que cuides estos aspectos.

Existen varios programas que permiten este tipo de comunicaciones, cada uno con sus particularidades, y aquí describiré las características comunes o mayoritarias de los que yo he probado. Hay que mencionar que todavía no existe un método estándar definido para este tipo de comunicaciones, por lo que se hace necesario que los dos interlocutores utilicen el mismo programa (a veces, incluso se necesita la misma versión del programa).

En primer lugar, para establecer una conversación "de voz" es preciso activar la conexión Internet, puesto que esta conexión será el medio de transmisión de los datos. Luego hay que activar el programa de comunicación "por voz". Este programa conectara con el servidor de comunicaciones de la empresa fabricante, en la que se lleva un registro de los usuarios conectados en cada momento. Esta lista de usuarios conectados es visible, para facilitar la "llamada" a otro internauta que esté preparado para esa comunicación. Algunos programas muestran de diferente manera a los usuarios que ya están en una conversación frente a los que no se hallan ocupados; de esta forma es posible pedir una llamada a cualquier usuario libre. También varían las formas de agrupar o clasificar a los usuarios. Algunos programas te permiten seleccionar el servidor de comunicaciones que deseas utilizar, mientras que otros te permitirán agrupar a los usuarios bajo diferentes criterios.

Los diversos programas muestran esta lista de diversas formas, e - incluso- con diferentes demoras :-( . Los usuarios se identifican mediante un conjunto de datos personales que anotan en una ficha del propio programa. Estos datos son absolutamente libres e independientes de la conexión para acceder a Internet o al buzón de correo electrónico, y siempre es posible refugiarse tras un alias o falsear el nombre para mantener en el anonimato su verdadera identificación. Para iniciar una conversación uno de los usuarios "llama" a otro de los que se encuentran en la lista. El usuario que "recibe" una llamada normalmente ve el identificativo del que le solicita la conversación, pudiendo aceptar o rechazar el diálogo. En caso de aceptar, los dos interlocutores comienzan inmediatamente su charla.

Una dificultad importante para la utilización de estos programas es encontrar interlocutores que hablen "mi mismo idioma". Internet esta lleno de anglófonos y el inglés es un idioma utilizado por la mayoría de Internautas, incluso los que no tienen otro idioma materno. A veces no resulta fácil encontrar hispanohablantes, y en algunos casos para encontrar a ese alguien solo tenemos una lista de nombres, por lo que se hace mas complicado (no se les distingue bien). Si no encuentras a nadie a quien llamar, puedes estar un rato con el programa abierto esperando que sea otra persona la que te llame a tí. Yo he recibido muchas llamadas de norteamericanos que utilizan el castellano como segunda lengua :-O . Si usas una identificación que pueda dar a los demás alguna pista sobre tu idioma, pues mejor. Si te registras como "Pedro" tienes muchas más posibilidades de que te llamen los hispanohablantes; si te registras con el indicativo "Peter" recibirás muchas llamadas de angloparlantes.

Si ambos usuarios disponen de una buena velocidad de conexión y de una buena tarjeta de sonido la conversación puede establecerse en el modo completo (bidireccional simultánea o "Full-Duplex"), pudiendo hablar ambos al mismo tiempo, tal como se hace normalmente por teléfono. Si la velocidad de transmisión no es suficiente o la tarjeta de sonido es antigua, entonces solo se podrá comunicar en modo unidireccional alternativo o "Half-Duplex", de forma que solo uno de los dos puede hablar a la vez (tal como se hace con los "walkie-talkies"). Las tarjetas de sonido SoundBlaster de 16 bits y casi todas las compatibles o superiores permiten establecer la conexión bidireccional simultánea, Full-Duplex. Esto debe venir especificado en las características de la tarjeta, y casi todas las actuales cumplen ese requisito. Hasta el año 95 muy pocas tarjetas de sonido tenían características Full-Duplex; y en torno al año 96 se vendieron bastantes tarjetas que incorporaban hardware Full-Duplex, pero que no incluían de serie el software correspondiente (drivers o programas controladores de dispositivo); en tal caso se hará necesario conseguir ese software en la World Wide Web, en la dirección del fabricante. Aún así, el modo Full-Duplex es muy poco utilizado puesto que exige una transmisión de datos muy veloz, más de lo que normalmente permite la actual estructura de Internet.

Siempre es muy recomendable consultar las páginas Web del fabricante de la tarjeta de sonido. Seguramente podrás conseguir un software controlador de dispositivo más moderno y eficaz que el que acompañaba a la tarjeta que compraste. La comunicación por audio suele ser tan precaria que es preciso hacer todos los esfuerzos posibles para mejorar las posibilidades disponibles.

Cuando se utiliza el modo Half-D, cada interlocutor cede la palabra al otro indicándoselo expresamente mediante indicaciones como "cambio", "dime", "contéstame", o cualquier otra parecida, exactamente igual que se hace con los walkie-talkies. El programa puede cambiar el sentido de la comunicación cuando detecta que el usuario que tenía la palabra permanece callado durante un cierto tiempo (unos dos segundos seguidos, aproximadamente). Otros programas mantienen la emisión mientras el usuario mantiene apretada la tecla CTRL, dejando de emitir y comenzando la recepción cuando detectan que se libera esa tecla.

Los programas permiten ajustar ciertos parámetros, como el volumen de recepción de sonido. Entre estos parámetros es muy importante regular correctamente el nivel de activación del micrófono. Ello permitirá que cuando el usuario no este hablando no se envíe sonido, y cuando el usuario este hablando se active automáticamente la transmisión de sonido. El nivel de activación del micro debe ajustarse para que el sonido se transmita cuando el usuario habla (aunque sea en tono normal), pero no se transmitan los sonidos de fondo cuando el usuario esta callado (ruidos lejanos de la habitación, respiración del usuario, etc.). Esto funciona de diferente manera para los modos Full- D y Half-D.

En el modo Full-D los silencios del usuario son utilizados para evitar la transmisión de sonido, dejando toda la capacidad de la conexión destinada a la recepción. En cambio, cuando el usuario comienza a hablar, el programa lo detecta y reinicia automáticamente la transmisión de sonido, independientemente de que el otro interlocutor este hablando o se halle en silencio. Así, el nivel de activación del micro permite optimizar la velocidad/calidad de la transmisión.

En el modo Half-D esto se hace aun más crítico, porque cuando un usuario transmite sonido ello impide que el otro pueda hacerlo. Por esto es importante que la transmisión de sonido se active SOLO cuando el usuario hable. Si bajamos excesivamente el nivel de activación del micro, el programa interpretara como sonido-valido-para-transmitir cualquier leve sonido (ruidos inevitables de fondo o uso del teclado) incluso cuando el usuario esta callado, con lo que ese usuario nunca podrá escuchar a su interlocutor. Por el contrario, si el nivel de activación es muy alto, la voz solo será transmitida cuando el usuario GRITE y su volumen de voz rebase el nivel de activación del micro. Por todo ello es importante ajustar bien el nivel de activación del micro. Los programas tienen un regulador para ajustar este nivel y algunos añaden un test para calibrar y probar este aspecto. Si el usuario dispone de un micro con interruptor también puede desconectar el micro cuando no desea seguir hablando, aunque esto es más incómodo.

Además, algunos programas permiten emitir continuamente mientras se mantiene apretada la tecla CTRL, dedicándose a la recepción cuando esta tecla no esta pulsada. Pero es mucho más cómodo y eficaz ajustar correctamente el nivel de activación del micro. En modo Full-D es muy conveniente disponer de auriculares o cascos de audición que nos permitan escuchar sin que el sonido recibido llegue entre nuevamente al micrófono, puesto que ello podría producir un desagradable efecto de eco o de acoplamiento acústico: un fenómeno que se produce cuando el sonido recibido vuelve a ser emitido en el mismo instante, lo cual acaba generando un pitido creciente que es muy molesto e imposibilita la comunicación.

Cuanto más calidad y sensibilidad tengan los elementos de hardware utilizados, tanto mejor. Si disponemos de un buen micrófono y lo situamos cerca de la boca, mejor será la calidad del sonido emitido. Lo ideal seria emplear unos auriculares con micro incorporado, tipo astronauta, de forma que el micro pueda estar próximo a la boca aún si movemos la cabeza. El esmero en estos detalles y otros factores que afectan a la calidad de emisión será determinante para que los interlocutores nos escuchen en buenas condiciones.

Algunos programas permiten además una comunicación de texto, similar al IRC, de forma que lo que escribe uno de los usuarios es visto instantáneamente por el otro. Esto último es una ventaja importante cuando se trata de transmitir datos concretos como un numero de teléfono, una dirección de correo, un nombre raro, etc., especialmente si la calidad del audio no es buena. Además, puede servir como mecanismo de retorno (feed-bak) instantáneo para el caso Half-Duplex, de forma que el que no tiene la palabra puede contestar por escrito con palabras o pequeñas frases a las indicaciones verbales del otro. La transmisión de texto es muy rápida, siempre bidireccional, y no suele interferir con el audio. Por ultimo, el diálogo por teclado puede servir incluso para conectar cuando alguno de los dos carece de micrófono o tiene dificultades con el funcionamiento del audio.

Para finalizar una conversación será suficiente presionar el botón correspondiente con el puntero del ratón. Lógicamente, la comunicación también se acaba al cerrar el programa.

Ahora que ya se ha explicado el funcionamiento general de estos programas, hay que repasar y matizar el aspecto más dificultoso de estos programas: Para poder iniciar una conversación con otro usuario es totalmente imprescindible que ambas personas estén conectadas a Internet, y tengan funcionando el programa (el mismo programa).

La mayoría de los usuarios de telefonía Internet se conforman con hablar con cualquier otro usuario. Se conectan en el momento que les apetece, miran la lista de otros usuarios conectados e intentan el diálogo con cualquiera de ellos. Está bien como experimento o como divertimento, te enteras del clima que disfrutan a seis mil kilómetros y también oirás interesantes elogios sobre tu país. Si alguna conversación no funciona bien por algún problema técnico, pues intentas el diálogo con otra persona cualquiera. Pero esta actividad lúdica no tiene nada que ver con el interés que puedas tener en hablar con una persona concreta.

Puesto que la mayoría de internautas utiliza direcciones IP dinámicas (cambian en cada conexión) no es posible hacer una llamada directa. Haciendo un símil con el teléfono, diríamos que cada vez mi número de teléfono es distinto, por lo que no puedes saberlo ni llamarme directamente. Tampoco sirve saber la dirección de correo electrónico de la otra persona, porque el buzón de correo se halla alojado en otro ordenador distinto al que utiliza el usuario correspondiente.

Para evitar este grave inconveniente, los distintos programas utilizan un servidor de comunicaciones centralizado, en el que se mantiene una lista de los usuarios conectados. Cada vez que activas el software de telefonía, lo primero que intentará el programa será conectar con ese servidor de comunicaciones, para transmitirle tus datos (nombre, numero IP actual, etc). El servidor de comunicaciones almacena esos datos y los pone a disposición de cualquiera que los desee consultar. Otro internauta podrá acceder a esa lista, encontrar tu nombre e intentar el contacto personal contigo. Para ello, el otro usuario solo tendrá que hacer doble clic sobre tu nombre; en ese momento el servidor de comunicaciones le transmitirá tus datos y el programa del otro internauta ya podrá intentar la llamada directa hacia tu dirección IP. Una vez iniciada la conversación, ya no será imprescindible mantener el contacto con el servidor central; realmente, este servidor solo sirve para realizar el primer contacto.

Por otro lado, algunos programas permiten elegir el servidor de comunicaciones que deseas utilizar de entre una serie o gama muy diversa, de forma similar al IRC. Pero los diferentes servidores no se hallan interconectados ni hay una lista común de todos los usuarios. En estos casos, para concertar una cita de diálogo se hace imprescindible acordar el servidor de contacto que será utilizado. En otros programas es posible configurar el listado de usuarios en base a algunas preferencias personales.

Además de lo anterior, para mantener una conversación con un amigo concreto siempre se hace inevitable acordar la hora de la cita, aunque sea con cierto margen. Si uno de los dos sufre cualquier contratiempo y no consigue conectar, se necesita utilizar otro medio (correo electrónico o teléfono convencional) para acordar otra cita.

Hay otro tipo de programas orientados a facilitar el "encuentro espontáneo" entre internautas amigos. El software más popular para esta función es el llamado ICQ, de la marca Mirabilis. Básicamente sirve para saber si otra persona determinada está conectada a Internet en un momento dado, y también permite realizar un diálogo directo por teclado. Pero ICQ llega a ser una excelente herramienta para iniciar el contacto y también sirve para lanzar la comunicación audio sin utilizar el servidor de comunicaciones específico del programa telefónico. Existe una explicación más detallada en una página específica dedicada al ICQ.

En la sección de URLs (página de programas) se relacionan las páginas donde pueden encontrarse varios programas de telefonía Internet. Todos ellos son gratuitos o pueden probarse antes de comprarlos. Estos programas están en contínua evolución, añadiendo mejores prestaciones. Algunos incluso permiten la conversación con más de una persona (simultáneamente), o la videoconferencia. También suelen incorporar otras posibilidades, como la transmisión directa de ficheros. La mayoría de ellos no están disponibles para diferentes sistemas operativos.

En el futuro estos programas ofrecerán versiones para más sistemas, añadirán más funciones y operarán de una forma más cómoda para los usuarios. De momento es un sector incipiente que carece de "normativa", pero se prevé la adopción de unos estándares que permitan que unos programas se comuniquen con otros. Actualmente el volumen de conversaciones de audio que se cruzan en el mundo es muy bajo, prácticamente estamos en una fase experimental o de pruebas. Al fin y al cabo son pocos los usuarios de Internet que además tienen un módem rápido, tarjeta de sonido, micrófono y conocimientos suficientes para hacer que todo eso funcione bien. La mayoría de las conversaciones realizadas son de tipo lúdico y/o experimental: se trata de charlar con alguien lejano por el mero placer de utilizar esta nueva tecnología, sin que entre los parlantes haya ningún otro vínculo. La escasa agilidad de la red en las transmisiones actuales es un freno importante para estas prestaciones. De momento estas conversaciones apenas le están restando volumen de negocio a las compañías telefónicas. Sin embargo estos experimentos actuales resultan ya imparables y en el futuro esto comenzará a utilizarse cada vez con mayor frecuencia y por motivos personales. Conversaciones de negocios o de tipo familiar se desarrollarán por este medio al precio de la conexión a Internet.