Novedades

Noticias Voip

  • Por qué la voz humana ya no sirve para identificar a alguien
    por Elio Rojano el día 2 agosto, 2021 a las 10:41

    Hace unos años dí una conferencia en el VoIP2DAY sobre el uso de la Inteligencia Artificial en el campo de la VoIP en el que hablaba que existen bancos (HSBC por poner un ejemplo) que comprueba durante una llamada, si la persona con la que hablamos es realmente quien dice ser, aprovechando un análisis de la voz telefónica (Voice ID Fingerprinting). Esto hoy día ya no es una aplicación válida, ya que alguien le ha dado dos vueltas de tuerca a esto de la Inteligencia Artificial y ha conseguido que, aprovechando una conversación telefónica de 5 segundos, poder generar casi en tiempo real un modificador de audio para cambiar la voz de un TTS de forma que tenga exáctamente el mismo tono y el mismo timbre de voz que en la grabación de 5 segundos. Esto es, cualquiera con esa aplicación podría generar una conversación con nuestra voz y confundir y poder hacerse pasar por una persona. Hay soluciones comerciales que ya hacen esto y que nos permite generar locuciones con la voz que queramos (incluso con una propia) por lo que si necesitamos generar nuevas locuciones para nuestro sistema, aquí tendríamos todo lo necesario. No obstante, la aplicación «Real Time Voice Cloning» junto con toda la documentación de la tesis está disponible desde la página web del proyecto: https://github.com/CorentinJ/Real-Time-Voice-Cloning y un vídeo demostrativo de cómo funciona. Así que, si tenéis un rato aburrido, os recomiendo que lo probéis porque es una herramienta tan útil como curiosa para frikear un buen rato.

  • Demasiada información no es control, es desinformación
    por Elio Rojano el día 30 julio, 2021 a las 18:00

    Hace unos años, participé en el desarrollo de un proyecto piloto consistente en crear un producto desde cero, partiendo de una supuesta solución ante un determinado problema y orientado a un nicho muy concreto, aprovechamos algunos nuevos conceptos y metodología de diseño de productos que algunos compañeros habían aprendido, nos pusimos manos a la obra y a poner en práctica aquellas lecciones que más adelante pasaron a ser nuestras también. Entre estas metodologías para empezar a pensar en un producto viable, se encontraba uno bastante conocido llamado «Design Thinking» y basándonos en este sistema elaboramos una serie de características para un nuevo producto que, de no haber utilizado este sistema, y basándonos únicamente en nuestra experiencia y conocimientos, hubiera sido muy diferente. El resultado, años después, fue un software bastante bueno, utilizado por muchas empresas de todo el país y con una cuota de mercado mucho más grande de la que imaginábamos en un principio cualquiera de los que participamos en el desarrollo (tanto a nivel de programación, como comercialmente, y como a nivel de gestión y control). El uso de una metodología como Design Thinking nos enseñó a discernir entre «lo que nosotros creemos importante desarrollar» frente a lo que «el usuario considera importante». Esta diferencia la he visto antes y después en elementos y características de otros productos y debo decir que ha sido una constante, ya que productos y herramientas que no utilizan este sistema tienen un enfoque muy «técnico» o muy «personal» llevando al desarrollo de ciertas características que nos puede parecer vitales o super-importantes y que realmente el usuario que lo vaya a utilizar apenas le interesa, o todo lo contrario… le interesa pero apenas con la profundidad que esperaba. Ejemplo de esto que comento es una característica que seguramente os suena: la información de depuración. Alguien quiere un software para gestionar un servidor y cuando lo desarrollamos nos centramos en extraer toda la información posible, almacenarla en enormes tablas y bases de datos para que, llegado un momento determinado, el usuario pueda obtener cualquier información que pueda necesitar. Como técnicos y más concretamente como personal de sistemas, solemos estar acostumbrados a guardar logs de todo: llamadas, uso del procesador, memoria, disco duro, cantidad de información leída, escrita, número de hilos, número de procesos, recursos de cada proceso, destinos de llamadas, cuantas llamadas por minuto, y un larguísimo etcétera que se encarga de llenarnos el espacio de disco duro de información que «puede» que algún día nos sea necesaria. Si nuestro sistema tiene algún problema, nos alegramos de tenerlo todo guardado, poder sacar gráficas, estadísticas, analizar estos datos y descubrir por qué un proceso ha caído sin ningún motivo aparente pero que, coincidiendo con el elevado y puntual aumento del número de INSERTS en la base de datos, podemos elaborar una teoría consistente en que, cuando se escribe bastante en la base de datos, la aplicación deja de funcionar. No obstante, cuando un sistema está en producción y el comportamiento se considera «estable», esta cantidad

  • NFON compra el 25% de Meetecho
    por Elio Rojano el día 6 julio, 2021 a las 11:14

    El operador VoIP alemán NFON AG, se hace con el 24,9% de la empresa Meetecho, creadora de, entre otras cosas: Janus: Servidor y gateway WebRTC. En palabras de Klaus von Rottkay, CEO de NFON AG: «La asociación estratégica con Meetecho nos da acceso directo al conocimiento sobre WebRTC líder en la industria y acelera la implementación de nuestra propia estrategia de Comunicaciones Unificadas. Es un paso importante para reforzar nuestra independencia de la tecnología de terceros a largo plazo« NFON en uno de los operadores VoIP más grandes a nivel europeo (con más de 200 empleados) que lleva años posicionándose en cada país y Meetecho es una empresa muy prometedora gracias a la aplicación software libre: Janus (además de otras herramientas como el soporte de Opus para Asterisk). Particularmente me da un poco de miedo ciertas adquisiciones de empresas que desarrollan software libre, por otro lado hay que entender que como empresa, el desarrollo y publicación de herramientas útiles y liberadas con una licencia de software libre no es una razón para que no actúe como una empresa normal y corriente, además de muy prometedora, y que suscite el interés de grandes empresas que ya no pueden crecer más si no es adquiriendo otras empresas (véase Sangoma con la compra de Digium -creadora de Asterisk-). Uno intenta adelantarse al futuro y ve como este tipo de adquisiciones pueden llegar a hacer peligrar el futuro de ciertas aplicaciones, librerías y herramientas que sirven como apoyo a todo un ecosistema creado alrededor, todo depende de quién sea la empresa matriz y sus intenciones. Hay quien compra una empresa desarrolladora de software libre con la intención de protegerla de otros «tiburones» que lo único que quieren es destruirla para que deje de hacerle la competencia (referencia1, referencia2). No obstante, conozco a gente que trabaja en NFON y tengo una gran esperanza de que esta asociación/compra/participación sirva para impulsar aún más este software además de para que Lorenzo Miniero, Paolo Saviano y el resto del equipo de Meetecho puedan comprarse un barco para descansar estas vacaciones que bien merecido se lo tienen, además de para que NFON pueda seguir desarrollando su software de videoconferencia utilizando Janus y software libre. 😉

  • Lyra: El códec low-cost que podría sustituir a Opus
    por Elio Rojano el día 5 junio, 2021 a las 11:58

    Siempre se ha dicho que la burocracia va siempre uno o dos pasos por detrás, pero cuando hablamos de tecnología, podríamos decir que incluso va años por detrás. No hay más que ver que WebRTC ha tardado más de 10 años en convertirse en un protocolo estándar oficialmente y ha pasado por muchos cambios entre los que destacan varios campos de códecs que, a medida que han ido surgiendo y comprobandose mejores (más calidad y un ancho de banda menor) los desarrolladores se han visto «obligados por la tecnología» a incluirlos dentro de la especificación. No obstante, hay empresas como Google que corren dos carreras en paralelo y mientras apoyan ciertas prácticas avaladas por la comunidad y los estándares, juegan por otro lado a una liga propia en la que otras empresas compiten por ser la más rápida y la que primero ofrezca la mejor de las bondades a fin de conseguir adelantarse a la competencia y de paso, subir unos cuantos dólares el precio de sus acciones. Por esta razón, cuando aún los usuarios están descubriendo un códec como Opus, Google anuncia un nuevo códec llamado Lyra, orientado principalmente al envío y compresión del audio de conversación (justamente el que nos interesa en VoIP) y es que Opus es un códec que, podríamos decir que es la «evolución del MP3» mientras que Lyra nace para convertirse en la evolución del Alaw, del Speech o del G.722. Nota importante: El nombre «Lyra» es el nombre comercial de un software de Sangoma encargado de detectar máquinas de fax y contestadores automáticos (lo que se denomina AMD: Answer Machine Detector) pero no tiene nada que ver, por lo que si queremos descubrir más de este software, deberemos concretar y buscar «Lyrac códec» o algo así. Comparación de calidad y ancho de banda Sobre la calidad, es bastante mejor que la que ofrece el códec Opus con el doble del ancho de banda: Google ha desarrollado este códec pensando en sus propios servicios de comunicación para Android (Google Duo y similares) aunque el código fuente está publicado con licencia Apache 2.0, por lo que en cualquier momento alguien puede utilizarlo para integrarlo en su propio software o en Asterisk, aunque hay alguien que ya lo ha buscado, por el momento no hay nada. Parece que lo único importante es calidad de audio vs. ancho de banda, aunque en mi opinión el consumo de procesamiento también es importante. Existen muchos códecs que, siendo peores, son elegidos por consumir muy poco procesador y evitar que un móvil se caliente por llevar 10 minutos de conversación, pero de momento no hemos visto información sobre el consumo de procesamiento que tiene Lyra. Ejemplos de audio Aquí vamos a ver algunos ejemplos de audio: Nueva generación de códecs también para vídeo Google también ha anunciado que próximamente sacará un codec de video revolucionario llamado AV1 orientado a principalmente a videoconferencia y que cuenta con muchas características muy interesantes, aunque estas no serán accesible a todo el mundo ya

  • La CIA también retira los últimos Faxes
    por Elio Rojano el día 20 mayo, 2021 a las 08:30

    Hace unos días hablábamos sobre la noticia de que la Administración Pública Canaria había decidido eliminar más de 1500 terminales de Fax y líneas asociadas ahorrando más de 200.000€ al año en costes por utilizar esta tecnología arcaica. Eso no significa que no admitan faxes, simplemente que pasan a recibirlos de forma digital mediante Email gracias a la conversión que se hace mediante VoIP. Pues bien, la CIA acaba de anunciar que a partir de este verano, apagará las últimas máquinas de faxes que tenían y que utilizaban para comunicarse con sus contratistas privados. Los más de 100 proveedores que tiene la CIA ya se han apuntado a enviar sus documentos, propuestas y ofertas a través del nuevo sistema seguro de correo electrónico, un sistema cada vez más en auge debido a las grandes amenazas que tienen todos los organismos públicos y grandes empresas. Aclaración: Es importante destacar que (tal y como me ha parecido entender por varios mensajes de varios lectores) el protocolo FAX no deja de utilizarse de un día para otro, lo que se abandona es el hecho de enviar 0’s y 1’s a través de las líneas PSTN. Temporalmente, se utilizaría el protocolo de FAX vía T.38 (mediante VoIP) para poder recibir faxes vía VoIP y que la PBX se encargue automáticamente de digitalizar y enviarlo por email o guardarlo en un formato compatible. En el caso de la CIA, ni siquiera se utilizará Fax over IP, directamente se pasará a un sistema de email seguro propio para comunicaciones internas.

  • Cómo evitar las llamadas comerciales
    por Elio Rojano el día 19 abril, 2021 a las 14:04

    Hace unas semanas, estaba haciendo pruebas con varias tarjetas SIM nuevas recién-estrenadas (es decir, que no han tenido dueño ni nada por el estilo) y mientras hacía pruebas con un móvil empiezo a recibir llamadas procedentes de varios números móviles. El primer pensamiento que viene a mi mente en este momento es que alguien se ha podido equivocar al marcar y ha dado casualmente con el número móvil de esa tarjeta que jamás había sido dada de alta en ningún sitio, por lo que no descuelgo, no bloqueo, nada… simplemente dejo que suene y que se canse para que verifique el número para la próxima vez. Al día siguiente, a la misma hora vuelve a llamar el mismo número pero con otra terminación. Ummm. sospechoso… esta vez sí descuelgo y hablo con la persona que me llama. Rápidamente me respondió un comercial de una compañía eléctrica… -«Hola buenas tardes! ¿podría hablar con el titular de esta línea?» ¿cómo han conseguido este número? No ha sido dada de alta en ningún momento, tiene numeración nueva, por lo que no es posible que un anterior dueño la hubiera dado de alta en alguna empresa. Hablo con el agente y le explico que este número por casualidad no pertenece a nadie, que es un número interno de pruebas y que por favor, dejen de llamar ya que esta línea no tiene dueño. Muy amablemente terminamos la conversación y aún así, estuve más de dos semanas recibiendo llamadas todos los días desde prácticamente el mismo número (con diferente terminación) para venderme servicios de diferentes compañías: eléctricas, telefónicas, seguros,… vamos, alguna empresa de telemarketing había hecho un barrido de todos los números de teléfono y se había puesto a llamar a todos y cada uno de los números que no fuese rechazado. Desconozco de leyes lo suficiente como para no estar seguro de hasta qué punto eso es ilegal en España, aunque estoy seguro que la práctica de algunas empresas de llamar a todos los números y hacer una lista de qué números responden y qué números no, no debe ser muy legal, no obstante, lo que sí tengo es el sentido común para saber que la ética de esa empresa después de indicar que ese número no pertenecía a nadie y seguir llamando, les permitiría ser capaces de venderte a su mismísima abuela moribunda si con ello ganaban un contrato. La AEPD (Agencia Española de Protección de Datos) publica en su página web los expedientes y sanciones a las empresas que realizan prácticas ilegales tanto por publicidad indebida como por uso de datos no autorizados para la realización de campañas de marketing y es una manera como otra cualquiera de ganar entre 2000 y 2500€ por sanción ganada de media cada vez que te llama una empresa en la que no te has dado de alta. La Lista Robinson es un listado de números, cuentas de email, direcciones físicas, gestionado por Adigital (La Asociación Española de la Economía Digital) que se encarga de recoger

  • Administración Pública Canaria deja de utilizar el fax y ahorrará más de 200.000€ al año
    por Elio Rojano el día 14 abril, 2021 a las 14:09

    La Dirección General de Telecomunicaciones y Nuevas Tecnologías (DGTNT) de la Administración Pública Canaria acaba de anunciar que dejará de utilizar el Fax para modernizar el envío y recepción de documentos y de paso ahorrar más de 200.000€ al año (1.516 terminales, números geográficos y líneas asociadas a 12€/mes cada uno) que van a ser sustituidos por cuentas de email y un sistema temporal de Fax2Email lo que permitirá a los faxes recibidos en sus sistemas VoIP ser convertidos a PDF y enviados por email. Es más que evidente que el Fax debe morir tal y como lo conocemos ahora, y que esto no sólo redundará en un ahorro de costes si no en una mayor facilidad y productividad de los empleados públicos al agilizar las tareas de envío de documentos en lugar de enviarlos por fax. «Se espera que en dos meses se haya migrado la práctica totalidad de los terminales de los departamentos de la Administración, a excepción de los correspondientes al Servicio Canario de Salud, donde todavía no se ha comenzado esta implantación debido al exceso de trabajo que sufren los centros adscritos por la COVID-19.« Ahora solo falta que esto sirva de ejemplo para el resto de administraciones y organismos públicos que quieran ahorrarse tiempo y dinero a la hora de enviar documentos. ¿Quién será el último en usar el Fax?

  • InstantByte ofrece webinars, charlas y talleres sobre videovigilancia
    por Elio Rojano el día 31 marzo, 2021 a las 08:01

    Pese a que ya se empiezan a realizar algunos eventos profesionales muy concretos y muy puntuales, guardando las distancias, con medidas y todas las precauciones del mundo para evitar contagios y brotes por seguridad y responsabilidad, llevamos más de un año celebrando eventos virtuales. También acabamos de recibir la invitación para finales de octubre de un evento híbrido: la ClueCon 2021, que se celebrará del 25 al 29 de octubre, simultáneamente en el InterContinental Hotel Chicago y On-Line y que ya está todo disponible para registrarse.  A falta de eventos, nuestros amigos de InstantByte han decidido dedicar el mes de Abril al tema de la videovigilancia bajo el lema: En abril, ojos mil. con charlas, webinars, talleres y ofertas semanales para ayudar a implantar este tipo de soluciones. El calendario de los talleres y sus webinars son: 9 de Abril a las 10:00 : Primeros pasos para un proyecto de videovigilanciaWebinar sobre cómo afrontar desde 0 un proyecto de videovigilancia. (registro) 15 de Abril a las 10:00 : Webinar sobre como debería ser servicio de videovigilancia para particulares y comercios que incluye la cámara y los planes de almacenamiento. (registro) 16 de Abril a las 10:00 : Configuración de las distintas soluciones de videovigilanciaWebinar/taller sobre cómo configurar las cámaras: Hikvision, Dahua, Unividew y Hilook (registro) 23 de Abril a las 10:00 : Funciones de Inteligencia Artificial en los sistemas de videovigilancia.En este webinar veremos diferentes soluciones de videovigilancia con sistemas de Inteligencia Artificial: Reconocimiento facial, Lector de matrículas, Imágenes térmicas y Detección de movimiento. (registro) 29 de Abril a las 10:00 : Soluciones de Videovigilancia para un hogar inteligente de EzvizWebinar, impartido por María Simón, donde se verán qué soluciones de videovigilancia se pueden introducir en un hogar inteligente de la marca Ezviz, desde cámaras WiFi con audio bidireccional, hasta purificadores de aire, pasando por mirillas inteligentes y videoporteros. (registro) 30 de Abril a las 10:00 : Control de Acceso y Presencia: Puesta en marcha y configuraciónCómo poner en marcha diferentes dispositivos de control de acceso y presencia, además de la configuración de los mismos en base a los requerimientos de cada empresa: Hikvision y Dahua (registro) Toda la información sobre estos webinars la podéis encontrar en su página web: https://www.instantbyte.com/enmarcador.php?page=news&id=1592

  • WebRTC, Pandemia y Teletrabajo… ¿nuevo paradigma empresarial?
    por Elio Rojano el día 29 marzo, 2021 a las 18:04

    Hay ocasiones en las que podemos pensar que estamos en medio de una película de ciencia ficción cuando, en apenas 5 años hemos pasado de hablar por teléfono como una de las formas de comunicación más habituales, a tener reuniones por videoconferencia varias veces por semana con 5, 10 o incluso 20 personas de forma simultánea en un mosaico de pantalla donde poder ver a todos los participantes. ¿y qué ha ocasionado este cambio? Una pandemia… ¿realmente no os parece que es cosa de ciencia ficción? Lo cierto es que la pandemia no ha ocasionado nada… la tecnología estaba ahí, sólo que el miedo por avanzar, por probar cosas nuevas, por no cambiar la forma en la que hacemos las cosas hace que no nos atrevamos a dar el salto y probar cosas que realmente podrían potenciar mucho más las comunicaciones. Ha sido necesaria una pandemia, una obligación de quedarse en casa, de trabajar en remoto, la necesidad de hacer una reunión pero sin poder desplazarnos a unas instalaciones, las que hace que esta tecnología se convierta de «algo experimental» a «algo obligatorio», y han sido las empresas que apostaron por ellas desde un principio las grandes beneficiadas: Microsoft (con su Microsoft Teams), Zoom, 8×8 (con su Jitsi Meet), Google (con su Hangout, y ahora Meet) y otros servicios más personales como Whatsapp, Apple (con su FaceTime) o Amazon (con su Alexa) las que realmente han visto como sus cuentas de resultados han aumentado gracias a estos servicios, su popularidad se ha disparado y hoy día no hay empresa que no cuente con un servicio de videoconferencia propio para reuniones con proveedores o clientes. WebRTC puede no ser la panacea, pero ha conseguido ser el sistema más popular de comunicaciones gracias a la necesidad de una comunicación rápida, eficaz, seguro, adaptable al ancho de banda de los usuarios, compatible con cualquier dispositivo (escritorio, tablet, móvil, etc.) No obstante, a medida que la pandemia parece normalizarse y empiezan a llegar las vacunas, muchas empresas parecen haber vuelto a su antigua forma de trabajar. En esta gráfica de Google Trends sobre las búsquedas acerca del término «webrtc» se puede ver cómo a mediados de abril de 2020 (cuando la pandemia empezó a extenderse por todo el mundo) las búsquedas sobre esta forma de comunicarse se dispararon y durante varios meses mantuvo bastante el interés, pero con el tiempo vuelve a los niveles de los últimos años. ¿está todo dicho en cuanto esta forma de comunicarse? ¿ha sido el teletrabajo una moda pasajera y útil únicamente cuando los gobiernos obligaban al confinamiento? ¿se mantendrán las videoconferencias como un sustituto de las reuniones presenciales? ¿volveremos a las oficinas pese a que el teletrabajo ha demostrado su utilidad? Son muchas las preguntas que nos hacemos, cada uno tiene sus respuestas y me gustaría conocer vuestra opinión, por lo que os animo a que las escribáis en los comentarios, o en nuestro canal de telegram. En mi opinión, y por los casos que conozco, creo que

  • Probamos Vosk: un ASR gratuito, libre y que no necesita Internet
    por Elio Rojano el día 16 marzo, 2021 a las 08:21

    Hace unos días recibo por parte de el canal de anuncios de Issabel, la compatibilidad con Vosk, un ASR gratuito, libre y offline (no necesita internet para funcionar). Issabel vuelve a adelantarse a todas las distribuciones de comunicaciones esta vez con algo que mucha gente quiere y lo han incluido ya en sus sistemas. Leo el comunicado y pienso… ¿Cómo??? debe tener truco…Conozco varios sistemas que, aprovechando el boom de la inteligencia artificial y las redes neuronales, se han lanzado a crear modelos de reconocimiento de audio muy interesantes. Hace un par de años estuvimos en el Stand de Mozilla leyendo unos textos para ayudar a enseñar al motor. No obstante, este proyecto nos había pasado desapercibido y eso que posteriormente parecía haber pasado por delante en varias ocasiones sin haberme percatado de la joya que era. Efectivamente, no tiene truco, la gente de Issabel no solo ha estado muy atenta si no que ha incorporado, además de muchas herramientas con las que ya cuenta, un reconocedor de audio (ASR) completamente libre y gratuito y que, a diferencia de muchos otros, no depende de terceros como Google, Amazon, Microsoft, etc. Vosk es el motor, una aplicación escrita en Python y basada en redes neuronales que reconoce palabras en varios idiomas (según el diccionario que le cargues) y que funciona de forma independiente (no requiere conexiones a otros sistemas) por lo que instalas el servidor, cargas el diccionario del idioma que deseas, lo ejecutas y ya está el puerto listo para enviarle audio y que el motor lo convierta a texto. Investigando, me di cuenta que lo presentaron en la ClueCon 2020 (el año pasado) donde explicaron cómo funciona y qué ventajas tiene. Podéis ver la presentación aquí: He probado varios sistemas similares y por lo general, los ASR libres, en comparación con los sistemas comerciales, no eran muy competitivos, entiendo que un ASR es un sistema super-complejo y crear uno que funcione bien requiere de un gran esfuerzo económico que muchas veces sólo es posible si hay una empresa detrás, pero en esta ocasión la sorpresa ha sido mayúscula. Echándole un vistazo a su web, el proyecto es completamente transparente… publican todas las presentaciones, todas las fórmulas, ecuaciones y sistemas que utilizan para el entrenamiento y análisis de la voz y posterior conversión en palabras. También publican ejemplos y demos para que cualquiera pueda probarlo con varios comandos. Esto también lo conocía en otros sistemas, funciona muy bien en sus ejemplos pero luego uno prueba una conversación normal y no da con una traducción medianamente aceptable. Así que sin más… me he puesto manos a la obra y por probar una grabación mía: Ejecuto el comando que se conecta al servidor y devuelve lo siguiente: { "result" : [{ "conf" : 0.572926, "end" : 0.900000, "start" : 0.660000, "word" : "hola" }, { "conf" : 0.976447, "end" : 1.427432, "start" : 1.151597, "word" : "hola" }, { "conf" : 0.841578, "end" : 1.830000, "start" : 1.530000, "word" : "esto" },