Connect with us
Weather Data Source: pronóstico del tiempo

Tecnología

CM3leon es la nueva IA de Meta para crear imágenes a partir de texto y viceversa utilizando menos recursos

Publicado

el

Meta ha presentado este viernes CM3leon, el primer modelo multimodal de IA generativa capaz de crear imágenes a partir de texto y viceversa, con una “receta adaptada” de lenguaje multimodal que, además, se entrena con “cinco veces menos recursos”.

La compañía liderada por Mark Zuckerberg continúa investigando en modelos generativos de IA, introduciendo avances en el procesamiento del lenguaje natural, en este caso, para permitir que las páginas entiendan y expresen lenguaje, así como sistemas que pueden generar imágenes basadas en entradas de texto.

En este marco, Meta ha presentado su nuevo modelo de IA CM3leon -pronunciado ‘camaleón’- capaz de ofrecer “el más alto rendimiento” en la conversión de texto a imagen y viceversa que, además, se entrena con cinco veces menos recursos que los modelos anteriores y genera secuencias de texto e imágenes en base a “secuencias arbitrarias de otro contenido de imagen y texto”.

Tal y como ha explicado la compañía en un comunicado en su blog, se trata de una solución innovadora porque es “primer modelo multimodal” que está entrenado con una adaptación de modelos de lenguaje de solo texto. Es decir, los modelos generativos de solo texto se ajustan a instrucciones multitarea, comprendiendo distintas gamas de acciones a la hora de seguir indicaciones. Sin embargo, los modelos de generación de imágenes están especializados, por norma general, solo en tareas concretas.

Al aplicar las multitareas a gran escala de los modelos de solo texto para la generación de imágenes y texto, se ha mejorado el rendimiento en otras tareas como, por ejemplo, la generación de texto a partir de imágenes para escribir una leyenda de estas.

Además, aunque es un modelo entrenado con una cantidad de recursos cinco veces menor que los modelos anteriores, CM3leon es capaz de ofrecer un rendimiento “de última generación” para crear imágenes a partir de texto y viceversa. De hecho, Meta ha subrayado que CM3leon tiene la “versatilidad y efectividad de los modelos autorregresivos”. Como consecuencia, es un modelo que mantiene bajos costos de entrenamiento y es eficiente.

Con todo ello, la compañía ha matizado que se trata de un modelo causal enmascarado mixto-modal (CM3) ya que puede generar secuencias de texto e imágenes condicionadas a “secuencias arbitrarias de otro contenido de imagen y texto”. Tal y como ha sentenciado la compañía, “esto amplía enormemente la funcionalidad de los modelos anteriores que eran solo de texto a imagen o solo de imagen a texto”.

Siguiendo esta línea, CM3Leon también muestra una capacidad “impresionante” para generar objetos compositivos complejos, es decir, imágenes con distintos componentes que no tienen que ver entre sí o que son complicados de encajar juntos.

Igualmente, la empresa matriz de Instagram ha destacado que CM3leon se desempeña bien en una “amplia variedad de tareas de visión y lenguaje”, incluida la respuesta visual a preguntas y subtítulos de formato largo.

CAPACIDADES DE CM3LEON

Gracias a todas sus características, CM3leon puede proceder a la generación y edición de imágenes guiadas por texto. En concreto, la edición modificada por texto es “un desafío” ya que es necesario que el modelo comprenda tanto las instrucciones de texto como la propia imagen generada para editarla posteriormente.

Al hilo, este nuevo modelo de Meta también puede editar imágenes siguiendo instrucciones de estructura. Esto es una opción que permite crear ediciones “visualmente coherentes y contextualmente apropiadas” para una imagen que se adhieren a las pautas de diseño ya descritas previamente.

Otra de las capacidades que desempeña CM3leon es la de generar una imagen a partir de un texto con descripciones. Pero, en concreto, a partir de un texto que describa una imagen “potencialmente muy compositiva”, lo que pone a prueba al modelo para seguir de forma coherente las indicaciones del texto.

CM3leon también es capaz de llevar a cabo tareas de texto. En este sentido, puede seguir distintas indicaciones para, a partir de una imagen, generar subtítulos cortos o largos, incluso, puede responder preguntas sobre una imagen.

Dentro de sus habilidades para generar imágenes, el usuario puede redactar una descripción que incluya la localización exacta de dónde se han de situar los objetos que se hayan incluido en la descripción, dentro de un espacio delimitado.

Igualmente, CM3leon también es capaz de ofrecer resultados de “súper resolución”, esta opción agrega una etapa entrenada por separado para introducir imágenes de mayor resolución a los resultados del modelo original.

Tecnología

OpenAI lanza GPT-4o mini, un modelo más ligero y económico

Publicado

el

OpenAI ha lanzado una versión más ligera y económica de su modelo GPT-4o destinada a los desarrolladores que tendrá soporte para entradas y salidas de archivos de diferentes formatos.

La oferta de modelos de lenguaje de OpenAi ha crecido este jueves con GPT-4o mini, un modelo ideado para hacer tareas pequeñas y dirigido a desarrolladores que no pueden permitirse recurrir a modelos más caros.

Con GPT-4o mini, la firma se introduce en el mercado de los modelos ligeros y económicos, para facilitar el acceso a esta tecnología a más personas, como ha explicado a The Verge.

Este modelo sustituye a GPT-3.5 Turbo en los planes de suscripción Gratuito, Plus y Team, y llegará al de empresa en los próximos días. GPT-3.5, por su parte, pasará a estar disponible para los desarrolladores a través de la API.

La compañía también ha indicado que GPT-4o mini admite texto y visión y próximamente tendrá soporte para entradas y salidas de archivos de diferentes formatos, también de audio y vídeo.

Continue Reading

Tecnología

Google anuncia limpieza de apps en Play Store: retirará las que no cumplan unos mínimos de funcionalidad y contenido

Publicado

el

Google realizará a finales de agosto una limpieza de aplicaciones en Play Store para eliminar todas aquellas que no cumplan con sus requisitos mínimos de funcionalidad, contenido y experiencia de usuario.

La compañía tecnológica ha actualizado su política de funcionalidad mínima para dejar de permitir aplicaciones que no tengan contenido suficiente o que muestren un comportamiento inestable, que impida su uso en el ‘smartphone’.

El objetivo es asegurarse de que los usuarios acceden a un catálogo de aplicaciones que “ofrece una experiencia de usuario estable, interactiva y atractiva”, y por ello, a partir del 31 de agosto, la compañía tecnológica retirará las que no pasen la revisión.

En concreto, se centrará en dos tipos de aplicaciones: aquellas que tengan una funcionalidad y contenidos limitados, y las que muestren una funcionalidad rota, como detalla en su página de Soporte.

Por las primeras entiende que son aquellas que no tienen una función específica, poco contenido o que han sido diseñadas para no hacer nada. E incluye en esta categoría aplicaciones de solo texto, de archivos PDF o con un solo fondo de pantalla.

Por su parte, las aplicaciones con funcionalidad rota son aquellas que se congelan, fuerzan el cierre o directamente muestran un comportamiento anómalo. Como ejemplos, Google refiere las aplicaciones que no se instalan, o que una vez instaladas no cargan o no responden.

Continue Reading

Tecnología

Files de Google permitirá comprimir carpetas y archivos

Publicado

el

La aplicación de Archivos (Files) de Google tendrá nuevas funciones que permitirá gestionar las distintas carpetas con la posibilidad de comprimilarlas y de agruparlas en colecciones.

Una próxima actualización de la ‘app’ Files de Google permitirá a los usuarios fijar cualquier carpeta a una de las colecciones disponibles, Favoritos y Carpeta segura.

Este cambio que llegará acompañado de una reordenación de las distintas pestañas, ya que Colecciones pasará a estar encima de Categorías.

Esta novedad está ya presente en la beta de la ‘app’ Files (v1.4237.652465286.1), como ha comprobado el analista Assemble Debug y recogido el portal especializado Android Authority.

La aplicación también incorporar una función para comprimir carpetas o archivos, con la que se podrán crear archivos Zip sin salir de ella. Por el momento, solo permite la extracción de los archivos.

Continue Reading

Trending