Se parece a la IAuna plataforma que utiliza IA generativa para clonar voces que suenan realistas, anunció hoy que recaudó $8 millones en una ronda Serie A dirigida por Javelin Venture Partners, con contribuciones de Craft Ventures y Ubiquity Ventures.
El tramo, que eleva la puesta en marcha a $ 12 millones, se utilizará para desarrollar aún más los productos empresariales de Resemble y duplicar el tamaño de su equipo a más de 40 personas para fin de año, dice el cofundador y director ejecutivo Zohaib Ahmed.
“Algunas de las compañías de medios más grandes del mundo están utilizando la tecnología de Resemble para crear contenido que antes era imposible”, dijo Ahmed a TechCrunch en una entrevista por correo electrónico.
Resemble fue fundada en 2019 por Ahmed y Saqib Muhammad después de notar que las voces de los videojuegos no podían mantenerse al día con las frecuentes actualizaciones de versión de los juegos. Ahmed trabajó anteriormente en Magic Leap como ingeniero de software líder, recién salido de BlackBerry y Hipmunk.
Parezca comenzó poco a poco, centrándose principalmente en casos de uso de juegos. Pero la plataforma ha crecido para ofrecer tecnología de IA que puede “portar” voces a otros idiomas, generar mensajes personalizados de actores de voz y crear agentes conversacionales en tiempo real.
Resemble es solo un jugador en el mercado de inteligencia artificial de voz generativa de rápido crecimiento. Papercup, Deepdub, ElevenLabs, Respeecher, Acapela y Voice.ai son algunos de los proveedores de inicio más conocidos que brindan herramientas de IA para la generación y clonación de voz, sin mencionar los titulares de Big Tech como AWS, Azure y Google Cloud.
Sin embargo, es una tecnología controvertida, y por una buena razón.
tarjeta madre estoy escribiendo sobre cómo se les pide cada vez más a los actores de doblaje que renuncien a sus voces para que los clientes puedan usar IA para generar versiones sintéticas que eventualmente podrían reemplazarlas, a veces sin compensación.
Deepfake es otro problema.
Hay malos actores por La inteligencia artificial clona las voces de las personas, engañando a las víctimas haciéndoles creer que están hablando con un familiar o cliente. Y no es solo el potencial criminal lo que hace sonar las alarmas. En 2021, un documentalista se acercó fuego por contratar a una empresa para clonar póstumamente la voz de Anthony Bourdain, con el permiso de los herederos de Bourdain. En años pasados, profundas voces falsas se han apoderado de las redes sociales, en su mayoría inofensivas. efecto – pero a veces NO.
Ahmed afirma que Resemble, sin embargo, se destaca en el campo de la ética.
“Además de requerir el consentimiento explícito del usuario para la clonación de voz, se aplican pautas de uso estrictas para evitar el uso malicioso”, dijo.
Con este fin, Resemble requiere que los usuarios proporcionen una grabación de un “clip de consentimiento” en la voz que intentan clonar. Si la voz en un clip no coincide con otros clips, Semejar impide que el usuario cree una voz de IA.
Además, para evitar abusos durante la grabación, Resemble obliga a los usuarios a decir una serie de determinadas frases con su propia voz. Si se desvían del guión, Resemble marca la grabación como posible abuso.
“Una vez que se crea una voz, el usuario tiene todos los derechos sobre esa voz”, dijo Ahmed. “No utilizamos estos datos de voz para entrenar a otros modelos, ni revendemos los datos de voz a terceros… Para soluciones personalizadas, trabajamos con las empresas a través de un proceso riguroso para garantizar que puedan utilizar la voz clonada y tener las aprobaciones adecuadas con los actores de voz”.
Resemble también ha desarrollado el producto Resemble Detect, que está diseñado para validar la autenticidad de los datos de audio utilizando un modelo de IA entrenado para distinguir el audio falso del genuino. Básicamente, el modelo “ve” las diferentes frecuencias en las que los artefactos pueden deberse a la edición o la manipulación del audio, lo que hace una predicción de confianza del 0 % al 100 % de la “realidad” del clip.
Detect pretende complementar la tecnología de marca de agua de Resemble, PerTh Watermarker, que utiliza un modelo de inteligencia artificial para crear e insertar tonos de audio imperceptibles para el oído humano que contienen información de identificación. (Vale la pena señalar que PerTh Watermarker es un poco un juego de bloqueo de plataforma: solo puede marcar y detectar el habla generada por Resemble, y no es compatible con otras herramientas de generación de voz de IA, comerciales o de código abierto).
Ahmed ve estas herramientas como los principales contribuyentes al éxito de Resemble. La plataforma tiene más de un millón de usuarios, dice, que han generado 35 años de audio en los últimos 12 meses.
“Teniendo en cuenta la regulación de la IA para los funcionarios gubernamentales, Resemble proporciona información y recomendaciones para el uso responsable del audio generativo”, dijo Ahmed. “Con Resemble, crear contenido de voz en off atractivo y de alta calidad ahora es más fácil que nunca, lo que permite a los creadores de contenido agregar un nivel completamente nuevo de autenticidad a su trabajo y brindará un nuevo nivel de inmersión para los espectadores”.