Resumen
Meta ha presentado Audiobox, una herramienta de generación de audio que permite crear voces y efectos sonoros a partir de instrucciones verbales y textos descriptivos.
Generado por Inteliegenica Artifical (OpenAI)Meta revela Audiobox, un innovador modelo de investigación para la generación de audio, que permite la creación de voces y efectos sonoros a partir de instrucciones verbales y textos descriptivos. Con un audaz avance respecto a su predecesor Voicebox, Audiobox integra funcionalidades de generación y edición tanto de habla como de efectos sonoros cortos y paisajes sonoros, aumentando el control para cada caso de uso específico.
Al describir con lenguaje natural el sonido o estilo de habla que deseen generar, los usuarios pueden dar vida a escenarios sonoros como un río fluyendo o pájaros piando. Adicionalmente, Audiobox restiliza voces simulando distintos ambientes y emociones, sobrepasando a modelos previos en pruebas de calidad y relevancia.
Para democratizar la creación de audio y facilitar el trabajo de creadores de contenido, Meta busca innovar y hacer accesible su tecnología. Los investigadores y las instituciones académicas con experiencia en el campo del habla podrán solicitar acceso para colaborar en la investigación de seguridad y responsabilidad del uso de Audiobox.
Distinguiéndose también por sus avances en edición de sonido, Audiobox aprovecha técnicas de infilling generativo, lo que permite refinar efectos sonoros existentes o añadir nuevos. Además, todas las creaciones a través del demo interactivo de Audiobox están protegidas por un sistema de marca de agua auditiva imperceptible, lo que garantiza la posibilidad de rastrear su origen.