La nueva herramienta permite editar audio y video en segundos, sin software especializado, con aplicaciones que van de la música, al podcasting y el cine
17.12.2025 • 15:30hs • Edición 4.0
Edición 4.0
Cómo funciona SAM Audio, la IA de Meta que elimina ruidos y separa voces
Meta lanzó SAM Audio, un modelo de inteligencia artificial(IA) que permite separar sonidos, voces o instrumentos en archivos de audio y video mediante indicaciones de texto, imágenes o marcas de tiempo.
La herramienta, disponible de forma abierta y gratuita, fue presentada por Mark Zuckerberg como una evolución del proyecto Segment Anything, que hasta ahora se enfocaba en segmentar elementos dentro de imágenes y videos.
El modelo introduce un enfoque multimodal, donde los usuarios pueden indicar qué sonido quieren aislar o eliminar a través de texto, referencias visuales o intervalos de tiempo.
En concreto esto significa que alguien puede subir un video o una grabación y pedirle al sistema que elimine un ruido, separe la voz de un cantante o aisle el sonido de un instrumento, entre otras acciones.
La plataforma gratuita y abierta, algo que permite que tanto profesionales como aficionados puedan probar sus capacidades. Además, es fácil de usar por lo que no requiere conocimientos técnicos avanzados.
Funciones que antes necesitaban software especializado y procesos complejos, ahora pueden realizarse en segundos, solo es necesario subir un archivo y dar una instrucción clara para que el sistema ejecute la tarea.
Aplicaciones de SAM Audio
Zuckerberg destacó el potencial de la herramienta para transformar la edición de audio y video en distintos campos: desde la producción musical y el podcasting, hasta la industria del cine y la televisión, la creación de contenido digital, la investigación científica y el desarrollo de herramientas de accesibilidad.
Una de las principales innovaciones del modelo es la incorporación de las indicaciones de intervalo.
Estos indicardores permiten señalar segmentos de tiempo específicos en los que aparece el sonido que se busca aislar.
Esta función imita la manera en que las personas reconocen y procesan los sonidos en la vida cotidiana, y ofrece un enfoque más natural y preciso.
El sistema ya está disponible para pruebas en el Segment Anything Playground, la plataforma de experimentación de Meta que permite a cualquier usuario cargar sus propios archivos o utilizar materiales provistos por la compañía.
Además, el modelo puede descargarse para ser evaluado de manera independiente.