Connect with us
Weather Data Source: pronóstico del tiempo

Tecnología

La nueva IA de Nvidia Fugatto genera o transforma música, voces y sonidos de forma flexible a partir de texto

Publicado

el

Nvidia ha presentado un nuevo modelo de Inteligencia Artificial llamado Fugatto que es capaz de crear o transformar cualquier mezcla de voces (acentos), música y sonidos de forma totalmente personalizada y flexible a partir de descripciones y empleando cualquier combinación de archivos de texto y audio.

Fugatto es la abreviatura de Foundational Generative Audio Transformer Opus 1 y se ha presentado como “una navaja suiza para el sonido” que ofrece características que no se han dado hasta ahora en otros modelos de IA, según ha explicado en una nota de prensa.

A pesar de que otras tecnologías generativas pueden componer una canción o modificar una voz “ninguno tiene la destreza de la nueva oferta”, debido a que Fugatto es capaz de generar o transformar elementos como voces, sonidos o música descritos con indicaciones de texto.

Por ejemplo, con esta IA es posible crear un fragmento de música basado en un determinado texto, eliminar o añadir instrumentos de una cancón existente, cambiar el acento o la emoción de una voz e, incluso “permitir que los usuarios produzcan sonidos nunca antes escuchados”.

El gerente de investigación de audio aplicado en Nvidia, Rafael Valle, ha matizado que esta herramienta es la primera que muestra propiedades emergentes, esto es, capacidades que surgen de la interacción de sus habilidades entrenadas, así como la capacidad de combinar instrucciones de formato libre.

Este modelo utiliza una técnica denominada ComposableART para combinar instrucciones que se le hayan proporcionado por separado durante el entrenamiento, de manera que una combinación de ellas podría solicitar un texto hablado con acento francés y tono de tristeza. Esto significa que el usuario puede detallar lo cerrado o abierto que sea el acento o el grado de la emoción de lo que narre.

Para ofrecer esa flexibilidad en su uso, también genera sonidos que cambian con el tiempo, lo que Nvidia ha denominado ‘interpolación temporal’. De esta manera, se pueden crear los sonidos de una tormenta que se desplaza por una zona concreta con ‘crescendos’ de truenos que se desvanecen en la distancia.

La compañía también ha indicado que, a diferencia de la mayoría de los modelos, “que solo pueden recrear los datos de entrenamiento a los que han sido expuestos”, Fugatto puede crear paisajes sonoros que transformen el contexto de una tormenta eléctrica que se transforme en el amanecer con el sonido de pájaros cantando.

Fugatto se podrá emplear, por ejemplo, en campañas de marketing, para orientarlas a múltiples regiones o contextos, aplicando diferentes acentos y emociones a las voces en ‘off’ que narren los anuncios. Asimismo, los desarrolladores de videojuegos podrán usarlo para modificar los recursos pregrabados de sus títulos y que se puedan adaptar a la acción de éste a medida que transcurren las partidas, entre otros casos de uso.

Tecnología

Gemini ya puede hacer llamadas y enviar mensajes sin desbloquear la pantalla

Publicado

el

El asistente de inteligencia artificial generativa de Google, Gemini, ha adquirido una nueva función en la pantalla bloqueada con la que podrá realizar llamadas y enviar mensajes sin tener que desbloquearla.

Google ha actualizado la aplicación Gemini para incorporar nuevas extensiones que amplían las funciones que puede realizar sin tener que recurrir a Asistente, que actualmente están en pleno despliegue.

En concreto, se trata de la posibilidad de realizar llamadas y de enviar mensajes en la pantalla bloqueada sin tener que desbloquearla, como ha informado el portal especializado 9to5Google, que ha advertido esta novedad en la beta de la app de Google (v15.48).

La nueva función se encuentra en el apartado de configuración para usar Gemini en la pantalla bloqueada, donde ya están habilitadas la obtención de respuestas rápidas y el establecimiento de recordatorios.

Continue Reading

Tecnología

Gmail permite arrastrar emails entre los campos de destinatario en la app para Android

Publicado

el

Google ha actualizado la aplicación para Android de Gmail para facilitar la redacción de los correos electrónicos, permitiendo arrastrar los contactos entre los distintos campos de dirección.

Los usuarios del conjunto de soluciones de productividad Workspace ya pueden arrastrar las direcciones de correo electrónico con el dedo entre los campos de destinatario: ‘Para’, Con copia (‘cc’) y Con copia oculta (‘cco’).

Esta novedad está disponible dentro de la aplicación de Gmail para Android desde el viernes, y con ella Google busca facilitar la redacción de un correo electrónico, como explica en el blog oficial de Workspace.

También está disponible para los suscriptores individuales de Workspace y los usuarios con cuentas personales de Google, como parte de una serie de lanzamientos rápidos.

Continue Reading

Tecnología

Bluesky ahora prioriza las respuestas según su popularidad

Publicado

el

Bluesky ha actualizado su plataforma para introducir un cambio en la manera en que se muestran las respuestas, que ahora lo hacen priorizando las más populares en lugar del orden cronológico.

La actualización de ‘software’ v1.95 de Bluesky ha introducido un cambio que no ha gustado a una parte de sus usuarios: la posibilidad de priorizar las respuestas según el interés frente a las más recientes.

“Ahora puedes mostrar las respuestas por ‘interés’, lo que pondera más las respuestas que reciben ‘Me gusta’ y que son más recientes”, explica en un comunicado compartido en la cuenta oficial de Bluesky.

Esta novedad se ha implementado por defecto en las cuentas nuevas y en las que no habían establecido una configuración, de tal forma que los usuarios que quieran cambiar a otra forma de mostrar las respuestas tienen que hacerlo manualmente, pudiendo optar por las más antiguas, las más recientes, las que tienen más ‘Me gusta’ y aleatoriedad.

Esta configuración no ha gustado a una parte de sus usuarios, que prefieren el orden cronológico, priorizando las más recientes. Incluso, alguno ha indicado que mostrar primero las respuestas populares es replicar ubo de los principales problemas de otras redes sociales.

“Los algoritmos que favorecen las publicaciones que generan más reacciones alientan a las personas a actuar de una manera que genera una reacción; las plataformas anteriores han demostrado que las publicaciones altamente reactivas suelen ser un cebo para la ira”, ha expresado un usuario identificado como CrossRoad Art-Bear Pettigrew.

Continue Reading

Trending