idiota, una startup que utiliza inteligencia artificial para uso práctico en la edición de videos, ya está generando demanda antes de abrir al público. La empresa respaldada por Y Combinator tiene cientos de creadores de videos que prueban su producto, que utiliza IA para crear videos cortos a partir del contenido de YouTube, y Lista de espera con más de 20.000 prelanzamientos, dice. Usando una combinación de modelos de IA patentados y existentes, Dumme promete que no solo puede ahorrar tiempo de edición, sino también, y aquí está su gran reclamo, hacer un mejor trabajo que la mano de obra (humana) contratada, a la que a menudo se le asignan tareas más serviles relacionadas. hasta la edición de videos, como cortar contenido largo para publicarlo en plataformas cortas como YouTube Shorts, TikTok o Instagram Reels.
Fundada en enero de 2022 y participante del programa Winter 2022 de la aceleradora de startups Y Combinator, cofundadora y CEO de Dumme Drai de Merwane dijo que originalmente se centró en construir un motor de búsqueda de videos. Pero hace unos seis meses, el equipo se dio cuenta de que un mejor producto podría ser reutilizar los mismos modelos de IA que estaban desarrollando para editar videoclips.
Los cofundadores se unieron La villa de Dahlström (CPO) yo Jordán Brannan (CTO), todos con IA, Drai se dio cuenta de que Dumme podría haber encontrado el producto adecuado en el mercado después de que su aplicación se volviera viral y provocara la caída de sus servidores.
“Realmente no esperábamos que tuviera mucho agarre ni nada por el estilo, así que simplemente lanzamos algo allí”, explica Drai. “Entonces, lo que sucedió fue que de la noche a la mañana nos despertamos con servidores sobrecargados, nada funcionó realmente. Así que juntamos todo y creamos una especie de lista de espera”, continúa. “A la mañana siguiente probablemente nos despertamos con 5.000 personas, lo cual fue interesante”.
Más tarde, el equipo descubrió que el creador de TikTok publicó un video breve sobre el producto, lo que provocó una avalancha de tráfico en su sitio.
“Después de eso, nunca se calmó realmente”, señala Drai.
El producto, pronunciado como “ficticio”, gustó a los creadores, porque estaba destinado a simplificar y acelerar el trabajo relacionado con la edición de videos.
Usar Dumme es tan simple como sugiere su nombre. Para comenzar, el usuario pega un enlace a un video de YouTube, luego hace clic en “generar” y la IA mostrará varios videos cortos que destacan los aspectos más destacados del contenido procesado. La compañía afirma usar YouTube como fuente, en lugar de admitir contenido de video sin procesar, para subcontratar la moderación del contenido, es decir, si está permitido en YouTube, está permitido en Dumme.
El tiempo de procesamiento y la cantidad de clips resultantes dependerán de la duración del video original.
Pero, por ejemplo, un podcast de video de una hora de duración puede tardar unos 20 minutos, y comenzarás a recibir clips después de unos cinco minutos, dice Drai. Una vez hecho esto, los creadores pueden descargar videoclips, que tienen una duración predeterminada de menos de 60 segundos, y subirlos a cualquier plataforma que admita contenido corto, como YouTube Shorts, pero también a otras plataformas como Reels o TikTok.
La forma en que todo funciona en el backend es, por supuesto, mucho más compleja. La compañía dice inicialmente que Dumme aprenderá tanto como sea posible del video fuente a través de los metadatos. Luego transcribe el video y trata de entender la semántica de lo dicho mientras mira los fotogramas para tratar de descifrar las emociones de la persona que habla. Estos resultados se correlacionan y se introducen en un modelo de lenguaje que intenta determinar qué partes del video vale la pena recortar. Esto luego se pasa a otro modelo que rastrea a los oradores activos y maneja el recorte.
Dumme dice que funciona con modelos de IA existentes como GPT-4, una versión refinada de Whisper y otros que ha creado internamente, como un modelo que rastrea a los oradores activos en un cuadro de video. Uno de sus modelos también está capacitado en varios videos cortos de YouTube para descubrir qué es lo que hace que un buen comienzo atraiga a los espectadores. Y aunque el equipo aún no está disponible, también están experimentando con un modelo de código abierto, LaviLa con Facebook Research para comprender mejor el contexto del video.
El trabajo en inteligencia artificial se realiza en el proveedor GPU Cloud CoreWeaveen lugar de AWS porque es más asequible, nos dice la compañía.
Dado que Dumme depende de la IA para procesar las palabras habladas, la tecnología no es adecuada para cosas como videos largos de juegos u otros en los que las personas no hablan. Drai dice que la puesta en marcha inicialmente se dirige a los creadores, podcasters y agencias de YouTube, que creen que sería la mejor manera de monetizar el producto.
Las agencias, explica Drai, a menudo subcontratan este tipo de trabajo hoy en día, con resultados impredecibles.
“Solo están pagando a contratistas en jurisdicciones de bajo costo para editar su propio contenido. El problema es que sigue siendo bastante caro y lleva mucho tiempo, lleva semanas, no minutos”, dice.
Cuando se le preguntó qué pensaba sobre la creación de tecnología que dejaría a la gente sin trabajo, Drai no se preocupó.
“La forma en que lo pienso es que, en última instancia… creo que es como decirme que los profesores de matemáticas van a [be put] sin trabajo, porque existe la calculadora… – explica. “La gente se adaptará. Y luego habrá alguien que te enseñe a usar la calculadora, ¿no? Así que creo que solo es cuestión de adaptarse”, dice Drai.
Los precios que se están considerando actualmente incluyen niveles en los que la empresa pagaría $0.40 por minuto de video procesado, mientras que los creadores más pequeños pueden optar por una suscripción mensual, que tiene un límite de 10 horas de contenido por mes. (Estas cifras están sujetas a cambios). Durante las pruebas, el producto estaba disponible sin cargo.
Los primeros usuarios usaron Dumme para una variedad de ediciones, incluida la generación de clips de sus podcasts de video para publicar en Shorts, así como para cortar otros videos nuevos y ver sus catálogos anteriores.
El producto parece ser competitivo con otras tecnologías de inteligencia artificial disponibles en el mercado, incluso del creador de Jellysmack, que fue explotación La IA convierte los videos de YouTube más largos en videos más cortos recortándolos, redimensionándolos y optimizándolos para plataformas específicas, lo que da como resultado Kamua 2021 adquisición. Otras herramientas que hacen un trabajo similar incluyen cosas como clip de obra, Vidyo.ai, Detalle, TubeBuddy, inteligente, y otros. Hasta qué punto Dumme tendrá éxito o fracasará dependerá de vencer a sus competidores en términos de calidad de trabajo y costo, métricas que aún no se han determinado.
Pero algunos inversores están apostando por Dumme. Antes del lanzamiento, la startup recaudó una ronda semilla de $3.4 millones de Y Combinator, Caffeinated Capital, Max y Nellie Levchin (a través de SciFi VC), Suhail Doshi, Nico Chinot, Protocol Labs, Chris Puscasiu y otros inversionistas ángeles.
Dada la demanda y la gran lista de espera, Dumme dice que planea atender a unas 500 personas por semana. Los lectores de TechCrunch pueden saltar la línea con un código de invitación TECNOLOGÍA hasta agotar los cupos.