Connect with us
Weather Data Source: pronóstico del tiempo

Tecnología

Meta lanza la IA generativa AudioCraft, diseñada para generar audio y música a partir de texto

Publicado

el

Meta ha creado una herramienta de Inteligencia Artificial (IA) generativa llamada AudioCraft, que está diseñada para generar audio y música a partir de entradas de texto y que se entrena con señales de audio sin procesar.

AudioCraft engloba tres modelos de lenguaje: EnCodec, AudioGen y MusicGen, siendo esta última la que presentó el pasado mes de junio como un modelo simple de lenguaje desarrollado bajo un enfoque de una sola etapa de patrones de tokens eficientes entrelazados.

En este caso, Meta ha recordado que MusicGen es un modelo entrenado con música propiedad de la compañía y con licencia específica, que genera música a partir de entradas de usuario basadas en texto.

AudioGen, por su parte, se entrenó con efectos de sonido de uso público y genera audio a partir de entradas de usuario basadas en texto. Finalmente, el decodificador EnCodec, permite “generar música de mayor calidad con menos artificios”. Todos estos modelos están disponibles para fines de investigación.

Meta ha reconocido que, si vien los modelos de lenguaje de IA generativa han generado expectación y demostrado “habilidades excepcionales”, no se ha mostrado el mismo interés por la IA generativa de audio.

Esto podría deberse a “que la música es el tipo de audio más difícil de generar porque se compone de patrones locales y de largo alcance, desde un conjunto de notas hasta una estructura musical global con múltiples instrumentos”, según ha comentado en el anuncio de AudioCraft.

Además de porque “la música es el tipo de audio más difícil de generar porque se compone de patrones locales y de largo alcance”, los enfoques con los que se ha abordado su creación a través de IA generativa han sido “incapaces de captar completamente los matices expresivos y los elementos estilísticos”.

En este sentido, la familia de modelos AudioCrafy es capaz de producir audio de alta calidad con consistencia a largo plazo y ofrece una interfaz “natural” con un diseño simplificado para mejorar la experiencia de usuario.

Esta herramienta de IA generativa de música y sonido de código abierto, que también ofrece la capacidad de compresión, permite que los usuarios trabajen sobre la misma base de código bien construir sobre lo que otros han hecho.

De ese modo, estos creadores pueden ampliar estos modelos y adaptarlos a sus casos de uso para la investigación, para lo que Meta ofrece “posibilidades casi ilimitadas”, según este documento.

CÓMO FUNCIONA

Meta ha reconocido que “generar audio a partir de señales sin procesar es un desafío”, debido a que requiere modelar secuencias “extremadamente largas”. Como respuesta a este desafío, la compañía emplea tokens de audio sin procesar utilizando EnCodec, que le brina un nuevo vocabulario para las muestras de música.

“Luego, podemos entrenar modelos de lenguaje autorregresivos sobre estos tokens de audio discretos para generar nuevos tokens y nuevos sonidos y música al convertirlos nuevamente al espacio de audio con el decodificador”, ha aclarado la compañía.

La compañía utiliza un solo modelo de lenguaje autorregresivo para modelar los tokens de audio y los entrelaza, modelando así “eficientemente las secuencias de audio, capturando simultáneamente las dependencias a largo plazo en el audio”, lo que le permite generar sonido de alta calidad.

AudioGen, por su parte, genera el sonido ambiental correspondiente a la descripción del texto, con aspecto realista, mientras que MusicGen se encarga de generar las pistas de música, que son más complejas que los sonidos ambientales que ofrece AudioGen.

Meta ha matizado finalmente que AudioCraft es una herramienta de código abierto que responde a su concepto de innovación responsable, que “no puede ocurrir de forma aislada” y debe garantizar que todos los investigadores tengan acceso a ella.

Tecnología

OpenAI lanza GPT-4o mini, un modelo más ligero y económico

Publicado

el

OpenAI ha lanzado una versión más ligera y económica de su modelo GPT-4o destinada a los desarrolladores que tendrá soporte para entradas y salidas de archivos de diferentes formatos.

La oferta de modelos de lenguaje de OpenAi ha crecido este jueves con GPT-4o mini, un modelo ideado para hacer tareas pequeñas y dirigido a desarrolladores que no pueden permitirse recurrir a modelos más caros.

Con GPT-4o mini, la firma se introduce en el mercado de los modelos ligeros y económicos, para facilitar el acceso a esta tecnología a más personas, como ha explicado a The Verge.

Este modelo sustituye a GPT-3.5 Turbo en los planes de suscripción Gratuito, Plus y Team, y llegará al de empresa en los próximos días. GPT-3.5, por su parte, pasará a estar disponible para los desarrolladores a través de la API.

La compañía también ha indicado que GPT-4o mini admite texto y visión y próximamente tendrá soporte para entradas y salidas de archivos de diferentes formatos, también de audio y vídeo.

Continue Reading

Tecnología

Google anuncia limpieza de apps en Play Store: retirará las que no cumplan unos mínimos de funcionalidad y contenido

Publicado

el

Google realizará a finales de agosto una limpieza de aplicaciones en Play Store para eliminar todas aquellas que no cumplan con sus requisitos mínimos de funcionalidad, contenido y experiencia de usuario.

La compañía tecnológica ha actualizado su política de funcionalidad mínima para dejar de permitir aplicaciones que no tengan contenido suficiente o que muestren un comportamiento inestable, que impida su uso en el ‘smartphone’.

El objetivo es asegurarse de que los usuarios acceden a un catálogo de aplicaciones que “ofrece una experiencia de usuario estable, interactiva y atractiva”, y por ello, a partir del 31 de agosto, la compañía tecnológica retirará las que no pasen la revisión.

En concreto, se centrará en dos tipos de aplicaciones: aquellas que tengan una funcionalidad y contenidos limitados, y las que muestren una funcionalidad rota, como detalla en su página de Soporte.

Por las primeras entiende que son aquellas que no tienen una función específica, poco contenido o que han sido diseñadas para no hacer nada. E incluye en esta categoría aplicaciones de solo texto, de archivos PDF o con un solo fondo de pantalla.

Por su parte, las aplicaciones con funcionalidad rota son aquellas que se congelan, fuerzan el cierre o directamente muestran un comportamiento anómalo. Como ejemplos, Google refiere las aplicaciones que no se instalan, o que una vez instaladas no cargan o no responden.

Continue Reading

Tecnología

Files de Google permitirá comprimir carpetas y archivos

Publicado

el

La aplicación de Archivos (Files) de Google tendrá nuevas funciones que permitirá gestionar las distintas carpetas con la posibilidad de comprimilarlas y de agruparlas en colecciones.

Una próxima actualización de la ‘app’ Files de Google permitirá a los usuarios fijar cualquier carpeta a una de las colecciones disponibles, Favoritos y Carpeta segura.

Este cambio que llegará acompañado de una reordenación de las distintas pestañas, ya que Colecciones pasará a estar encima de Categorías.

Esta novedad está ya presente en la beta de la ‘app’ Files (v1.4237.652465286.1), como ha comprobado el analista Assemble Debug y recogido el portal especializado Android Authority.

La aplicación también incorporar una función para comprimir carpetas o archivos, con la que se podrán crear archivos Zip sin salir de ella. Por el momento, solo permite la extracción de los archivos.

Continue Reading

Trending