Connect with us
Weather Data Source: pronóstico del tiempo

Tecnología

Apple presenta sus nuevas herramientas de accesibilidad para las personas con discapacidad del habla

Published

on

MADRID, 16 May. (Portaltic/EP) –

Las herramientas y funciones de accesibilidad de Apple incluirán con iOS 17 novedades para las personas que no pueden hablar o están en riesgo de perder el habla, quienes podrán usar un dispositivo iPhone o iPad para expresarse con Live Speech y mediante la creación de una voz personalizada.

La nueva herramienta ‘Live Speech’ se dirige a las personas que no pueden hablar para que puedan comunicarse durante las llamadas y videollamadas con ayuda del teclado del iPhone o del iPad. Para ello, podrán escribir lo que quieran decir y este texto se reproducirá en voz alta posteriormente, para mantener la conversación.

‘Live Speech’ también permitirá guardar frases que el usuario utilice de forma habitual para responder más rápido, como informa la compañía tecnológica en su blog oficial. También puede utilizarse en conversaciones en persona.

Junto a esta herramienta, Apple también ha anunciado ‘Personal Voice’, con la que aquellas personas que estén perdiendo la capacidad de hablar puedan recrear su voz a partir de un entrenamiento breve, para que funcione de forma conjunta con ‘Live Speech’.

Para ello, deberán leer conjunto al azar de propuesta de texto para grabar 15 minutos de audio con su voz en iPhone o iPad. A partir de esta información el modelo de aprendizaje automático del dispositivo recreará su voz en las llamadas.

Las novedades en accesibilidad se extienden a las herramientas para las personas con discapacidades cognitivas. Para ellas, Apple ha anunciado ‘Assistive Access’, que personaliza algunas de las ‘apps’ de la compañía para ofrecer una interfaz de usuario simplificada, con iconos y textos grandes.

La finalidad de ‘Assistive Access’ es personalizar la experiencia de iPhone y FaceTime, y para ello incluye opciones de configuración para los colaboradores de confianza. También se puede optar por un diseño más visual basado en cuadrículas para la pantalla de inicio y las aplicaciones, u otro en filas, en el que se destaca el texto.

Los usuarios con discapacidades visuales también tendrán una novedad en la lupa, una nueva función ‘Apuntar y hablar’, que utiliza el escáner LiDAR, la cámara y el aprendizaje automático del dispositivo para explicarle al usuario las etiquetas de texto que muestra el objeto que tiene delante y pueda interactuar con él

Por ejemplo, el usuario puede apuntar con la cámara del móvil a un microondas, y una voz le indicará los distintos botones que tiene el electrodoméstico, para que pueda utilizarlo. Apple ha matizado que estará disponible en inglés, francés, italiano, alemán, español, portugués, chino, cantonés, coreano, japonés y ucraniano.

Aunque esta función de ‘apuntar y hablar’ se encuentra dentro de la Lupa, también es compatible con el lector ‘VoiceOver’ y con otras funciones presentes en Lupa, como la detección de personas, la detección de puertas y la descripciones de imágenes.

Todas estas herramientas de accesibilidad están disponibles en una vista previa, y llegarán a finales de año, junto con la personalización de velocidad de Siri en ‘VoiceOver’ o la posibilidad de emparejar dispositivos auditivos Made for iPhone directamente con Mac y personalizarlos para la comodidad de los usuarios sordos o con problemas de audición.

Tecnología

Google extiende las marcas de agua de SynthID a vídeos y textos generados por IA

Published

on

Google ha extendido las marcas de agua de su herramienta SynthID a los textos y vídeos creados por Inteligencia Artificial (IA) generativa, incluidos los de su nuevo modelo Veo, capaz de generar vídeo en alta calidad (1.080p) a partir de texto.

A medida que el uso de herramientas de IA generativa y los grandes modelos de lenguaje tras ellas aumenta entre los usuarios, también crecen los riesgos de que el contenido generado por IA no sea identificado adecuadamente.

En este marco, la tecnológica presentó SynthID en agosto del pasado año, un conjunto de herramientas con las que permite añadir marcas de agua digitales a los píxeles de las imágenes generadas por IA y, de esta forma, diferenciarlas con respecto a las imágenes reales.

Según detalló el equipo de Google DeepMind en aquel momento, la marca de agua es detectable con la tecnología adecuada “incluso después de modificaciones”, como los filtros o el cambio de colores. Asimismo, para su funcionamiento SynthID utiliza dos modelos de aprendizaje profundo, uno para crear las marcas de agua y otro para su identificación en imágenes.

Ahora, Google ha anunciado que está ampliando las capacidades de SynthID para permitir añadir marcas de agua a contenido de texto generado por IA en la aplicación y experiencia de web de Gemini, así como en los vídeos generados por el nuevo modelo Veo.

Tal y como ha señalado la compañía en un comunicado en su blog, SynthID “no es una solución milagrosa”, pero ayuda a desarrollar herramientas de identificación de IA “más confiables” y a que las personas puedan tomar decisiones informadas sobre cómo interactúan con el contenido generado por IA.

En este sentido, Google ha explicado que las marcas de agua para texto se agregan introduciendo información adicional en la distribución de tokens cuando se está generando el texto. Todo ello sin comprometer la calidad, precisión o velocidad de generación de texto.

Así, el patrón final de puntuaciones para las elecciones de palabras del modelo, combinado con las puntuaciones de probabilidad ajustadas se considera la marca de agua. Para identificar esta marca de agua SynthID compara el patrón de puntuaciones con el patrón esperado de puntuaciones para texto, lo que permite detectar si una IA generó este contenido.

Al igual que con las imágenes, Google ha asegurado que esta herramienta funciona bien “incluso bajo algunas transformaciones”, como recortar fragmentos de texto o modificar algunas palabras. No obstante, sus puntuaciones se pueden ver afectadas si el texto generado por IA se traduce completamente a otro idioma.

Además de todo ello, Google ha señalado que, a finales de este verano abrirá SynthID para marcas de agua de texto, con lo que los desarrolladores podrán “construir con esta tecnología” incorporándola en sus propios modelos.

SYNTHID EN VÍDEOS GENERADOS CON VEO

Por su parte, las marcas de agua de SynthID también se han ampliado para vídeos generados por IA, en concreto, creados por el nuevo modelo de generación de vídeo en alta calidad (1080p) a partir de texto, Veo, que Google presentó este martes en el marco de su evento anual de desarrolladores Google I/O.

Concretamente, las marcas de agua de SynthID para vídeos se implementan con una técnica inspirada en el mismo sistema que utiliza la herramienta de Google para las imágenes. Es decir, al componerse de fotogramas individuales o imágenes fijas, SynthID introduce una marca de agua directamente en los píxeles de cada cuadro de vídeo.

Este método también es “imperceptible” para el ojo humano y en ningún momento afecta a la calidad, precisión, creatividad o velocidad del proceso de generación de video. Con todo ello, Google ha adelantado que todos los vídeos generados por Veo en VideoFX tendrán una marca de agua de SynthID.

Continue Reading

Tecnología

La aplicación para escritorio ChatGPT llega a macOS para usuarios de la versión Plus

Published

on

OpenAI ha anunciado el lanzamiento de la aplicación de escritorio de ChatGPT para equipos macOS, que primeramente estará disponible para usuarios de la versión de pago (Plus), y ha comentado novedades que el nuevo modelo GPT-4o ofrecerá a los usuarios de la cuenta gratuita.

La compañía ha avanzado las mejoras de su aplicación durante una presentación ‘online’ este lunes, en la que se ha presentado también el nuevo modelo de lenguaje GPT-4o, capaz de comprender y generar entradas de texo, imagen y audio.

En este marco, OpenAI ha explicado que cada semana “más de cien millones de personas utilizan GPT” y que tiene la misión de “hacer que las herramientas avanzadas de IA estén disponibles para la mayor cantidad de personas posible”.

Para seguir llevando la IA a más usuarios, ha anunciado la llegada de la aplicación de ChatGPT a macOS, con una nueva aplicación de escritorio para usuarios de la versión de pago (ChatGPT Plus).

Con esta ‘app’ también es posible iniciar conversaciones de voz directamente desde el ordenador. Para ello, solo es necesario hacer clic sobre el botón de los auriculares, situado en la parte inferior derecha de la interfaz de la aplicación de escritorio para iniciar una conversación de voz, según ha adelantado en este comunicado.

OpenAI ampliará el acceso a la aplicación a más usuarios en las próximas semanas cuando esté disponible para la modalidad gratuita, y planea lanzar una versión de la ‘app’ de ChatGPT para equipos con sistema operativo Windows a finales de este año.

Por otra parte, la compañía tecnológica ha avanzado que implementará más funciones impulsadas por Inteligencia Artificial (IA) para los usuarios de la versión gratuita de ChatGPT en las próximas semanas.

De este modo, cuando su nuevo GPT-4o llegue a estas cuentas, los usuarios podrán obtener respuestas del modelo y de la web; analizar fotos y crear gráficos; subir archivos para que la herramienta los resuma, escriba o analice; y descubrir y utilizar tanto GPT como la tienda en la que estos están disponibles, GPT Store.

En este sentido, ha dicho que habrá un límite en la cantidad de mensajes que podrán enviar con GPT-4o los usuarios gratuitos, en función del uso y la demanda. Esto significa que, una vez se haya alcanzado ese máximo, ChatGPT cambiará automáticamente a GPT-3.5 para que los usuarios puedan continuar sus conversaciones.

Por último, ha comentado algunas novedades relacionadas con la apariencia de esta herramienta de IA en su versión web, que ha introducido una nueva pantalla de inicio y rediseñado la forma en que se muestran los mensajes.

Continue Reading

Tecnología

MediaTek busca impulsar los videojuegos y las tareas de IA con el procesador Dimensity 8250

Published

on

MediaTek ha diseñado su nuevo procesador Dimensity 8250 para impulsar los videojuegos móviles en dispositivos de gama premium y el procesamiento de tareas basadas en inteligencia artificial (IA).

Dimensity 8250 es un procesador de 4 nanómetros compuesto por una CPU de 64 bit de ocho núcleos (uno Arm Cortex-A78 a 3,1GHz, tres Arm Cortex-A78 a 3,0GHz y cuatro Arm Cortex-A55 a 2,0GHz) y una GPU Arm Mali-G610 MC6.

Con esta configuración, MediaTek busca que los usuarios “se benefician de velocidades de juego con velocidades de fotogramas rápidas y fluidas en títulos populares e impresionantes, rendimiento en aplicaciones y actividades cotidianas”, como recoge en la web de producto.

Además de las opciones de optimización de recursos que ofrece el conjunto con tecnologías MediaTek HyperEngine, la compañía también ha incorporado tecnologías de juego adaptativo, ofrecer una alta velocidad de fotogramas que permita jugar de manera fluida y extender la autonomía de la batería.

Este chip soporta conectividad 5G, bluetooth 5.3, Wifi 6E 2×2 y Bluetooth LE Audio on audio estéreo inalámbrico, y es compatible con pantallas “ultrarrapidas y nítidas” que alcanzan una resolución WQHD+ con una tasa de refresco de 120Hz (o Full HD a 180Hz).

En fotografía, Dimensity 8250 integra un procesador de señal de imagen HDR de 14 bits con capacidad para capturar fotografías de 320 MP y grabar vídeo en 4K a 60 fotogramas por segundo. Utiliza la inteligencia artificial para reducir el ruido en las instantáneas y admite un zoom de dos aumentos sin pérdida.

MediaTek también ha destacado las capacidades de este procesador para las tareas de IA, lo que abre la puerta a “nuevas experiencias, imágenes mejoradas y un rendimiento mejorado”. Lo dirige a teléfonos inteligentes 5G de la gama premium.

La firma tecnológica presentó recientemente el procesador Dimensity 9300+ para los ‘smartphones’ insignia, en los que mejora la velocidad y el rendimiento e introduce el soporte para modelos de lenguaje grande que se ejecutan en el dispositivo además de acelerar el procesamiento de la IA.

Continue Reading

Trending