Mientras que muchas empresas de inteligencia artificial se apresuran a encontrar formas de utilizar la tecnología para mejorar o incluso crear videos, Resemble AI se centra en la fidelidad del audio. La startup, que también ofrece un generador de voz de IA para que las empresas lo utilicen para crear voces en off realistas similares a las humanas, lanzó 'Resemble Enhance', una herramienta de código abierto diseñada para mejorar significativamente la calidad del audio histórico.
El nuevo servicio puede tomar una grabación distorsionada y borrosa de un discurso histórico perdido hace mucho tiempo y luego aplicar inteligencia artificial para que suene como si hubiera sido grabado o transmitido ayer.
La compañía canadiense dice que Resemble Enhance se distingue por su enfoque de módulo dual, que combina un sofisticado eliminador de ruido, que elimina los zumbidos y silbidos estáticos de fondo, y un potenciador del habla impulsado por IA. Esta combinación no sólo elimina el ruido no deseado sino que también enriquece la calidad general del audio.
Aunque existen otros productos de restauración de audio en el mercado, la combinación de técnicas de Resemble podría ser un diferenciador significativo.
¿Como funciona?
El eliminador de ruido Resemble AI utiliza UNet, un modelo de IA que ayuda a separar los diferentes tipos de sonidos que aparecen en una grabación. Destaca por filtrar el ruido no deseado de las pistas de audio, dejando solo el discurso como foco.
Una vez que UNet hace su trabajo, el módulo potenciador se activa, ampliando el ancho de banda de audio y corrigiendo las distorsiones. Esta doble funcionalidad, afirma la compañía, garantiza que el resultado final no sólo esté libre de ruido sino que también posea la riqueza de las grabaciones contemporáneas.
Como herramienta de código abierto, Resemble Enhance es accesible sin costo alguno, una opción atractiva en el mercado tradicionalmente costoso de servicios de restauración de medios. Los principales beneficiarios de Resemble Enhance son las industrias que dependen de una calidad de audio clara, como el podcasting, el entretenimiento y la educación. Además, esta herramienta ofrece una nueva vida a las grabaciones históricas, proporcionando potencialmente información más clara sobre el pasado.
El lanzamiento de la herramienta se produce cuando la demanda de contenido digital de alta calidad está en su punto más alto. Mientras tanto, la naturaleza de código abierto de Resemble Enhance lo posiciona como una fuerza potencialmente disruptiva en un mercado actualmente dominado por soluciones patentadas de alto costo.
La convergencia de la IA en la mejora de audio y vídeo probablemente allanará el camino para soluciones de restauración de medios más completas.
Al combinar esta herramienta con otros mejoradores de video que utilizan IA generativa u otros modelos para mejorar y mejorar imágenes y rostros, como GPEN o el conocido GFPGan, los usuarios ahora pueden lograr resultados profesionales con sus propias computadoras por una inversión mínima.
Para experimentar con Resemble Enhance, los usuarios pueden visitar el sitio web oficial de Resemble AI o descargar sus modelos desde la página oficial de Github del proyecto.
Editado por Ryan Ozawa.