Meta (anteriormente conocida como Facebook) acaba de lanzar Voicebox, un modelo de inteligencia artificial (IA) generativa de última generación que está revolucionando la generación de voz.
Es una herramienta de IA de texto a voz multilingüe y la calidad es increíblemente buena.
¿Qué puedes hacer con Voicebox?
1. Síntesis de texto a voz en contexto
Imagina esto como un loro que ha aprendido a imitar tu voz. Todo lo que necesita es un clip de tu discurso. Luego, puedes escribir cualquier cosa que quieras, y lo leerá en tu voz.
2. Edición de voz y reducción de ruido
Imagina que has grabado un hermoso mensaje de cumpleaños para un amigo, pero un auto tocó la bocina ruidosamente en el fondo. En lugar de volver a grabar todo, Voicebox simplemente puede "borrar" ese toque de bocina de tu mensaje.
De manera similar, si te tropiezas con una palabra o dices algo mal, no necesitas empezar de nuevo. Voicebox puede corregir esos errores en tu voz original.
3. Transferencia de estilo entre idiomas diferentes
Supón que hablas inglés, pero quieres sorprender a tu amigo que habla español con un mensaje de cumpleaños en su idioma. Puedes escribir tu mensaje en español, y Voicebox lo leerá en voz alta en tu voz, aunque la grabación original que proporcionaste estaba en inglés.
4. Muestreo de voz diverso
La gente en todo el mundo habla diferente, ¿verdad? Con diferentes acentos, tonos y estilos. Voicebox aprende de una amplia gama de estos patrones de habla en seis idiomas.
Por lo tanto, puede generar una voz realista que suena como un hablante nativo en inglés, francés, español, alemán, polaco o portugués. Esto podría hacer que cosas como tu GPS o asistente virtual suenen mucho más naturales y familiares.
¿Quién podría utilizar esta herramienta?
Las aplicaciones de Voicebox son diversas y se extienden a diversas audiencias.
Creadores de contenido: Voicebox puede ser una herramienta poderosa para la edición y creación de audio. Puede ayudar a los creadores a producir pistas de audio de alta calidad para videos sin necesidad de volver a grabar segmentos completos debido a disturbios o errores menores.
Individuos con discapacidad visual: Voicebox puede transformar mensajes escritos de amigos en audio de alta calidad leído en sus voces, lo que hace que la comunicación digital sea más accesible.
Podcasters: Con sus capacidades de edición de voz y reducción de ruido, los podcasters pueden editar sin problemas sus episodios grabados. Ya sea para eliminar ruidos de fondo o corregir palabras mal pronunciadas, Voicebox puede asegurar un podcast limpio y con un sonido profesional sin necesidad de volver a grabar.
¿Está Voicebox disponible para el público?
Hasta ahora, Meta no ha hecho público el modelo o el código de Voicebox.
Esto se debe principalmente a preocupaciones sobre el posible mal uso de la tecnología. ¿Puedes imaginar cómo serán las llamadas de broma en el futuro?
Por esa razón, el acceso público a Voicebox aún no está disponible.
Quiero aprender más sobre IA
Si quieres mantenerte actualizado sobre las últimas herramientas y actualizaciones de IA (y cómo usarlas a tu favor), asegúrate de suscribirte al boletín de Recursos AI.