Connect with us
Weather Data Source: pronóstico del tiempo

Tecnología

ChatGPT incorpora el procesamiento de vídeo en tiempo real en el Modo de voz avanzado

Publicado

el

OpenAI ha anunciado una nueva característica para el Modo de voz avanzado de ChatGPT, que va a integrar el procesamiento de vídeo en tiempo real, lo que permitirá a su ‘chatbot’ ofrecer respuestas más concretas a las solicitudes de los usuarios según su contexto y lo que pueda identificar a través de las cámaras del dispositivo.

La compañía anunció hace una semana que inauguraría una serie de 12 días de novedades, en la que ya ha anunciado el lanzamiento del modelo de Inteligencia Artificial (IA) o1, un nuevo nivel de ChatGPT Pro y la disponibilidad general de la herramienta de vídeo Sora.

En estas sesiones, también ha hecho referencia al Modo de voz avanzado, una funcionalidad que anunció con la presentación de su modelo GPT-4o y que permite elegir entre una serie de voces para personalizar la interacción con el ‘chatbot’.

Si bien esta característica se iba a probar con un grupo de usuarios en julio, OpenAI anunció que retrasaba su lanzamiento para seguir probando su fiabilidad. Así, fue en septiembre cuando finalmente la empezó a implementar para los usuarios suscritos a la versión Plus y Teams, aunque quedaron excluidos los de la Unión Europea, Suiza, Islandia, Liechtenstein y Noruega.

La compañía ahora ha anunciado la incorporación de la entrada de vídeo de vídeo en el Modo de voz avanzado, lo que permitirá al modelo multimodal procesar en tiempo real las imágenes, así como acceder a las aplicaciones que se estén utilizando en el dispositivo mediante la opción ‘Share Screen’ o ‘Compartir pantalla’.

Como resultado de esta integración, «las conversaciones con Modo de voz avanzado tendrán un ritmo mucho más natural» y podrá profundizar en aspectos como el ritmo o el tono de la voz en más de 50 idiomas, según han explicado los responsables de la firma en un vídeo.

Gracias a esta funcionalidad, que se puede utilizar bien con la cámara delantera o bien con la trasera, ChatGPT podrá indicar a una persona cuáles son los pasos que debe dar para preparar un café con los elementos que identifique y que estén situados frente al objetivo.

Asimismo, con ‘Compartir Pantalla’, el usuario podrá solicitar al ‘chatbot’ ayuda para ejecutar acciones. Por ejemplo, para responder a un mensaje desde la aplicación de Mensajes del ‘smartphone’, de modo que le dará las indicaciones pertinentes para contestar con el tono elegido.

OpenAI ha confirmado que llevará esta función a Europa «tan pronto como pueda» y que ofrecerá acceso anticipado a suscriptores de los planes Enterprise y Edu antes de 2025. Asimismo, ha anunciado que ha personalizado el Modo de voz avanzado de ChatGPT con un modo Papá Noel con motivo de las fiestas de Navidad.

El modo Santa Claus se puede activar durante todo el mes de diciembre pulsando sobre el icono de un copo de nieve, que aparece junto a la barra de mensajes, o bien a través de la Configuración de voz. Esta característica funciona en aplicaciones móviles, iOS, Android y la versión web de ChatGPT.

Tecnología

Apple trabaja en una función de traducción en tiempo real para sus auriculares AirPods

Publicado

el

Apple está trabajando en el desarrollo de una función de traducción en tiempo real para sus auriculares AirPods, de manera que podrá utilizarse para traducir conversaciones en otros idiomas de forma automática e instantánea, y que llegará como una actualización de ‘software’ a finales de este año.

La tecnológica continúa desarrollando opciones que mejoren la experiencia de los usuarios con sus auriculares, como es el caso de las funciones de salud auditiva de los AirPods Pro 2, que ofrecen pruebas de audición y funciones de asistencia.

En este sentido, la compañía planea integrar nuevas opciones en sus auriculares que mejoren la relación y comunicación entre personas, independientemente del idioma en el que hablen.

Para ello, Apple implementará una nueva función en sus auriculares AirPods de traducción en tiempo real, con la que permitirá traducir conversaciones en otros idiomas de forma automática de cara a facilitar la comunicación con otras personas.

Así lo han detallado fuentes cercanas a la compañía en declaraciones a Bloomberg, quienes han señalado que esta función se lanzará a finales de año como parte de una actualización de ‘software’ vinculada a la próxima versión de sistema operativo iOS 19.

En concreto, en una conversación en la que se esté hablando en otro idioma, la función será capaz de identificar de forma automática el idioma que se esté hablando en cuestión y, tras ello, traducir lo que se esté diciendo al idioma nativo del usuario en tiempo real a través de los auriculares.

De la misma forma, todo lo que diga el usuario será recogido por los auriculares, de manera que se traducirá al idioma de la conversación y se podrá reproducir en dicho idioma a través del iPhone.

Con todo ello, según las fuentes, esta función forma parte de otras mejoras que en las que está trabajando la tecnológica para las capacidades de traducción de la próxima iteración de su sistema operativo iOS 19.

Continue Reading

Tecnología

Gemini admitirá la carga directa de vídeos para su análisis

Publicado

el

Google está trabajando en la carga de vídeos en Gemini, una característica que aprovechará las capacidades multimodales de este asistente para analizar su contenido y responder a las preguntas del usuario sobre ellos.

Gemini es capaz de gestionar y analizar textos, imágenes, páginas webs y vídeos de YouTube por medio de las ‘url’. Sin embargo, todavía no admite la carga directa de vídeos, algo que va a cambiar próximamente.

La nueva característica ha aparecido en la última beta de la ‘app’ de Google (v16.9.39.sa.arm64), en una serie de hilos ocultos que hacen referencia a la carga de vídeos en el ‘chat’ del asistente, como informan en Android Authority.

Actualmente, el medio citado solo ha podido adjuntar un vídeo, del que indica la duración, sin que Gemini haya desplegado sus capacidades para analizar el contenido, debido a que Google está actualmente trabajando en su soporte.

Sin embargo, la finalidad de esta característica es que Gemini pueda trabajar con vídeo, atendiendo a las peticiones del usuario, por ejemplo, para obtener un resumen o revisar determinados momentos de la grabación.

Google también ha anunciado recientemente nuevas capacidades de Gemini Live, el modo de voz del ‘chatbot’, para que pueda analizar el mundo real a través de un vídeo en directo con la cámara del móvil y de la compartición de pantalla.

Continue Reading

Tecnología

Samsung reafirma la importancia del S-Pen en Galaxy S Ultra

Publicado

el

Samsung considera que el lápiz óptico S-Pen es «una parte clave» de su catálogo, una afirmación que busca poner fin a los rumores que insinuaban la retirada de este accesorio de la gama alta de ‘smartphones’.

S-Pen acompaña a los terminales Galaxy desde 2011, con el lanzamiento de Galaxy Note. Y tras la desaparición de este producto, ha sido el accesorio por excelencia de Galaxy S Ultra, a partir de 2021 con ,la serie S21.

Este lápiz óptico es también el compañero del ‘smartphone’ de gama alta más reciente de la marca coreana, Galaxy S25 Ultra, pero la retirada el soporte para Bluetooth Low Energy (BLE) de último S-Pen ha llamado la atención sobre los posibles planes de Samsung para este elemento.

La vicepresidenta de Producto y Marketing de Mobile Experience (MX) de Samsung en Reino Unido, Annika Bizon, ha asegurado que para la marca, la multimodalidad es «muy importante» y que el S-Pen tiene un papel en esta forma de usar la tecnología.

«Así es como la gente usa su teléfono, ya sea que estén hablando, escribiendo o en una reunión. La gente usa sus S-Pen en las reuniones para escribir notas. Por lo tanto, no veo un espacio en el que el S Pen no sea una parte clave de nuestra cartera», ha afirmado en declaraciones hechas a TechRadar en el marco de Mobile World Congress 2025.

El S-Pen es, además, «algo clave para la experiencia Ultra en este momento», ha señalado Bizon, despejando las dudas que les plantea la gente sobre el futuro de estos dos dispositivos.

Continue Reading

Trending