Connect with us
Weather Data Source: pronóstico del tiempo

Tecnología

Meta presenta Video Seal, una herramienta de marca de agua para los vídeos generados por IA

Publicado

el

Meta ha presentado un nuevo modelo diseñado para resolver problemas centrados en el movimiento humano y una herramienta que inserta una marca de agua en los vídeos generados por inteligencia artificial para ayudar a identificar su origen.

Motivo, Video Seal y CLIP 1.2 son solo tres de las novedades en inteligencia artificial generativa que Meta FAIR ha presentado este jueves, con los que busca destacar sus «innovaciones recientes en el desarrollo de agentes, robustez y seguridad, y arquitecturas que facilitan el aprendizaje automático».

Motivo es un modelo fundamental desarrollador para controlar el comportamiento de agentes virtuales encarnados, esto es, exhibir una amplia variedad de comportamientos más parecidos a los humanos.

Para ello, el equipo de Meta FAIR ha recurrido a un conjunto de datos de movimientos sin etiquetar y al aprendizaje de refuerzo no supervisado para entrenar un algoritmo y hacer que aprenda «comportamientos similares a los humanos»

«La novedad técnica clave de nuestro algoritmo es aprender una representación que se puede utilizar para incorporar estados, movimientos y recompensas en el mismo espacio latente», explican en el blog de Meta. El modelo, además, adapta su movimiento a los cambios del entorno, , como la gravedad, el viento o perturbaciones directas, «a pesar de no haber sido entrenado para ellos».

Los investigadores confían en que este avance puede ayudar a crear personajes no jugables (NPC, por sus siglas en inglés) «más realistas» y a democratizar tanto la animación de personajes como la creación de nuevas experiencias inmersivas.

Meta FAIR ha lanzado Video Seal, una marca de agua que se añade a un vídeo generador por IA, imperceptible a simple vista. Se añade «como un mensaje oculto», que permite trazar el origen del vídeo, y que resiste a la edición y a los algoritmos de comprensión que se usan para subir contenido ‘online’.

Junto a esta herramienta, la compañía tecnológica también ha lanzado Meta Omni Seal Bench, una tabla de clasificación que compara el rendimiento de distintos métodos de marca de agua. Y ha anunciado la disponibilidad de CLIP 1.2, un modelo básico de codificación de visión y lenguaje de alto rendimiento.

A ello se suman los trabajos en el paradigma generativo Flow Matching, que reemplaza la difusión clásica y mejora el rendimiento y la eficiencia al tiempo que permite una generalización fácil a datos complejos.

En lo que respecta a los agentes, Meta FAIR ha presentado Explore Theory-of-Mind (Explorar la teoría de la mente), una generación de datos adversarios guiada por programas para el razonamiento de la teoría de la mente que permite la generación de datos diversos, desafiantes y escalables tanto para el entrenamiento como para la evaluación de los modelos de lenguaje de gran tamaño.

Otra novedad es el modelo de concepto grande, que se inspira en la inspirado en la forma en que los humanos pueden planificar pensamientos de alto nivel para comunicarse. Asimismo, ha avanzado los trabajos en el transformador latente de bytes meta dinámicos y en capas de meta memoria.

Tecnología

Apple trabaja en una función de traducción en tiempo real para sus auriculares AirPods

Publicado

el

Apple está trabajando en el desarrollo de una función de traducción en tiempo real para sus auriculares AirPods, de manera que podrá utilizarse para traducir conversaciones en otros idiomas de forma automática e instantánea, y que llegará como una actualización de ‘software’ a finales de este año.

La tecnológica continúa desarrollando opciones que mejoren la experiencia de los usuarios con sus auriculares, como es el caso de las funciones de salud auditiva de los AirPods Pro 2, que ofrecen pruebas de audición y funciones de asistencia.

En este sentido, la compañía planea integrar nuevas opciones en sus auriculares que mejoren la relación y comunicación entre personas, independientemente del idioma en el que hablen.

Para ello, Apple implementará una nueva función en sus auriculares AirPods de traducción en tiempo real, con la que permitirá traducir conversaciones en otros idiomas de forma automática de cara a facilitar la comunicación con otras personas.

Así lo han detallado fuentes cercanas a la compañía en declaraciones a Bloomberg, quienes han señalado que esta función se lanzará a finales de año como parte de una actualización de ‘software’ vinculada a la próxima versión de sistema operativo iOS 19.

En concreto, en una conversación en la que se esté hablando en otro idioma, la función será capaz de identificar de forma automática el idioma que se esté hablando en cuestión y, tras ello, traducir lo que se esté diciendo al idioma nativo del usuario en tiempo real a través de los auriculares.

De la misma forma, todo lo que diga el usuario será recogido por los auriculares, de manera que se traducirá al idioma de la conversación y se podrá reproducir en dicho idioma a través del iPhone.

Con todo ello, según las fuentes, esta función forma parte de otras mejoras que en las que está trabajando la tecnológica para las capacidades de traducción de la próxima iteración de su sistema operativo iOS 19.

Continue Reading

Tecnología

Gemini admitirá la carga directa de vídeos para su análisis

Publicado

el

Google está trabajando en la carga de vídeos en Gemini, una característica que aprovechará las capacidades multimodales de este asistente para analizar su contenido y responder a las preguntas del usuario sobre ellos.

Gemini es capaz de gestionar y analizar textos, imágenes, páginas webs y vídeos de YouTube por medio de las ‘url’. Sin embargo, todavía no admite la carga directa de vídeos, algo que va a cambiar próximamente.

La nueva característica ha aparecido en la última beta de la ‘app’ de Google (v16.9.39.sa.arm64), en una serie de hilos ocultos que hacen referencia a la carga de vídeos en el ‘chat’ del asistente, como informan en Android Authority.

Actualmente, el medio citado solo ha podido adjuntar un vídeo, del que indica la duración, sin que Gemini haya desplegado sus capacidades para analizar el contenido, debido a que Google está actualmente trabajando en su soporte.

Sin embargo, la finalidad de esta característica es que Gemini pueda trabajar con vídeo, atendiendo a las peticiones del usuario, por ejemplo, para obtener un resumen o revisar determinados momentos de la grabación.

Google también ha anunciado recientemente nuevas capacidades de Gemini Live, el modo de voz del ‘chatbot’, para que pueda analizar el mundo real a través de un vídeo en directo con la cámara del móvil y de la compartición de pantalla.

Continue Reading

Tecnología

Samsung reafirma la importancia del S-Pen en Galaxy S Ultra

Publicado

el

Samsung considera que el lápiz óptico S-Pen es «una parte clave» de su catálogo, una afirmación que busca poner fin a los rumores que insinuaban la retirada de este accesorio de la gama alta de ‘smartphones’.

S-Pen acompaña a los terminales Galaxy desde 2011, con el lanzamiento de Galaxy Note. Y tras la desaparición de este producto, ha sido el accesorio por excelencia de Galaxy S Ultra, a partir de 2021 con ,la serie S21.

Este lápiz óptico es también el compañero del ‘smartphone’ de gama alta más reciente de la marca coreana, Galaxy S25 Ultra, pero la retirada el soporte para Bluetooth Low Energy (BLE) de último S-Pen ha llamado la atención sobre los posibles planes de Samsung para este elemento.

La vicepresidenta de Producto y Marketing de Mobile Experience (MX) de Samsung en Reino Unido, Annika Bizon, ha asegurado que para la marca, la multimodalidad es «muy importante» y que el S-Pen tiene un papel en esta forma de usar la tecnología.

«Así es como la gente usa su teléfono, ya sea que estén hablando, escribiendo o en una reunión. La gente usa sus S-Pen en las reuniones para escribir notas. Por lo tanto, no veo un espacio en el que el S Pen no sea una parte clave de nuestra cartera», ha afirmado en declaraciones hechas a TechRadar en el marco de Mobile World Congress 2025.

El S-Pen es, además, «algo clave para la experiencia Ultra en este momento», ha señalado Bizon, despejando las dudas que les plantea la gente sobre el futuro de estos dos dispositivos.

Continue Reading

Trending