Tecnología

ChatGPT incorpora el procesamiento de vídeo en tiempo real en el Modo de voz avanzado

Publicado

Hace 12 meses

diciembre 14, 2024

OpenAI ha anunciado una nueva característica para el Modo de voz avanzado de ChatGPT, que va a integrar el procesamiento de vídeo en tiempo real, lo que permitirá a su ‘chatbot’ ofrecer respuestas más concretas a las solicitudes de los usuarios según su contexto y lo que pueda identificar a través de las cámaras del dispositivo.

La compañía anunció hace una semana que inauguraría una serie de 12 días de novedades, en la que ya ha anunciado el lanzamiento del modelo de Inteligencia Artificial (IA) o1, un nuevo nivel de ChatGPT Pro y la disponibilidad general de la herramienta de vídeo Sora.

En estas sesiones, también ha hecho referencia al Modo de voz avanzado, una funcionalidad que anunció con la presentación de su modelo GPT-4o y que permite elegir entre una serie de voces para personalizar la interacción con el ‘chatbot’.

Si bien esta característica se iba a probar con un grupo de usuarios en julio, OpenAI anunció que retrasaba su lanzamiento para seguir probando su fiabilidad. Así, fue en septiembre cuando finalmente la empezó a implementar para los usuarios suscritos a la versión Plus y Teams, aunque quedaron excluidos los de la Unión Europea, Suiza, Islandia, Liechtenstein y Noruega.

La compañía ahora ha anunciado la incorporación de la entrada de vídeo de vídeo en el Modo de voz avanzado, lo que permitirá al modelo multimodal procesar en tiempo real las imágenes, así como acceder a las aplicaciones que se estén utilizando en el dispositivo mediante la opción ‘Share Screen’ o ‘Compartir pantalla’.

Como resultado de esta integración, «las conversaciones con Modo de voz avanzado tendrán un ritmo mucho más natural» y podrá profundizar en aspectos como el ritmo o el tono de la voz en más de 50 idiomas, según han explicado los responsables de la firma en un vídeo.

Gracias a esta funcionalidad, que se puede utilizar bien con la cámara delantera o bien con la trasera, ChatGPT podrá indicar a una persona cuáles son los pasos que debe dar para preparar un café con los elementos que identifique y que estén situados frente al objetivo.

Asimismo, con ‘Compartir Pantalla’, el usuario podrá solicitar al ‘chatbot’ ayuda para ejecutar acciones. Por ejemplo, para responder a un mensaje desde la aplicación de Mensajes del ‘smartphone’, de modo que le dará las indicaciones pertinentes para contestar con el tono elegido.

OpenAI ha confirmado que llevará esta función a Europa «tan pronto como pueda» y que ofrecerá acceso anticipado a suscriptores de los planes Enterprise y Edu antes de 2025. Asimismo, ha anunciado que ha personalizado el Modo de voz avanzado de ChatGPT con un modo Papá Noel con motivo de las fiestas de Navidad.

El modo Santa Claus se puede activar durante todo el mes de diciembre pulsando sobre el icono de un copo de nieve, que aparece junto a la barra de mensajes, o bien a través de la Configuración de voz. Esta característica funciona en aplicaciones móviles, iOS, Android y la versión web de ChatGPT.

Relacionado

Tecnología

OpenAI asegura que no hay anuncios en ChatGPT y aclara que se trata de una prueba de la integración de aplicaciones

Publicado

Hace 2 horas

diciembre 8, 2025

Gustavo Salas

OpenAI ha asegurado que no están haciendo pruebas para introducir anuncios en su asistente de inteligencia artificial (IA) ChatGPT, tras la aparición sugerencias de compra directamente desde la conversación con el ‘chatbot’, sino que se trata de una prueba de la integración de aplicaciones, que ya han sido desactivadas hasta mejorar los resultados.

Recientemente, algunos usuarios han mostrado preocupación por la posible implementación de anuncios en la experiencia de chat del asistente de OpenAI, con opciones para comprar productos sugeridos en algunos comercios ‘online’, tal y como mostró el exempleado de xAI Benjamin De Kraker en una publicación en la red social X.

En concreto, incluyó una captura de pantalla donde se puede ver una opción para comprar productos del hogar en el comercio Target, dentro de una conversación con ChatGPT sobre un tema completamente distinto, como es el caso de Windows BitLocker. Todo ello, a través de una cuenta de suscripción a ChatGPT Plus.

De la misma forma, otros usuarios han mencionado una experiencia similar con el ‘chatbot’ en la que se muestra una opción para comprar en Peloton, en este caso, con una suscripción a ChatGPT Pro.

Sin embargo, el director de ChatGPT, Nick Turley, ha aclarado al respecto que no están realizando pruebas para introducir anuncios en el asistente y que, las capturas de pantalla que se han estado compartiendo recientemente «no son reales o no son anuncios», como ha compartido en una publicación en X.

Concretamente, el empleado de OpenAI Daniel McAuley ha explicado que este tipo de experiencias de compra ‘online’ no son un anuncio, sino que son una prueba de la experiencia de integración de aplicaciones anunciada en octubre, de la mano de algunos de sus socios piloto como Devday y Target, y que están trabajando para que «el mecanismo de descubrimiento de aplicaciones sea más orgánico dentro de ChatGPT».

Asimismo, ha detallado que la intención es que las aplicaciones «mejoren la experiencia de usuario cuando sean relevantes para una conversación» y que todavía están trabajando para mejorar esta integración, al tiempo que ha matizado que cualquier empresa puede crear aplicaciones utilizando el SDK para ello y que planean abrir esta opción y el directorio de aplicaciones «pronto».

De la misma forma, el director de investigación de OpenAI, Mark Chen, también respondió a las preocupaciones de los usuarios en otra publicación en X alegando que reconoce que «todo lo que parezca publicidad debe manejarse con cuidado» y que, en este caso, admite no haberlo logrado.

Como resultado, OpenAI ha desactivado este tipo de sugerencias mientras mejoran la precisión del modelo para incorporarlas en la experiencia de conversación. Igualmente, ha adelantado que trabajan para implementar «mejores controles», de manera que los usuarios puedan escoger si reducir este tipo de sugerencias en sus chats o desactivarlas por completo si no les resultan útiles.

Con todo ello, Turley ha asegurado que, en caso de que implementen anuncios, lo harán «con mucho cuidado». «La gente confía en ChatGPT y todo lo que hagamos estará diseñado para respetar esa confianza», ha explicado el directivo.

Relacionado

Tecnología

Garmin presenta su nuevo comunicador satelital para mensajes de voz, mensajes de texto y fotos

Publicado

Hace 12 horas

diciembre 7, 2025

Gustavo Salas

Garmin ha ampliado su gama de comunicadores satelitales compactos con el nuevo inReach Mini 3 Plus, que permite intercambiar mensajes de voz, mensajes de texto y fotos desde zonas donde no alcanza la cobertura móvil.

inReach Mini 3 Plus es un dispositivo satelital compacto con pantalla a color y altavoz y micrófono integrados, que está diseñado para funcionar en temperaturas extremas y cuenta con un diseño resistente a impactos y una clasificación de resistencia al agua IP67.

Permite a los usuarios mantenerse conectados mientras se aventuran en lugares sin cobertura móvil a través de mensajes de voz de hasta 30 segundos -que pueden transcribirse-, mensajes de texto de hasta 1.600 caracteres y fotos, como informa Garmin en una nota de prensa.

También permite compartir la ubicación en LiveTrack, siempre que el usuario cuente con una suscripción satelital activa de inReach.

Los usuarios también pueden activar un mensaje SOS interactivo al centro Garmin Response en caso de que ocurra una emergencia. Y con hasta 330 horas de autonomía de la batería en modo de seguimiento de 10 minutos, el inReach Mini 3 Plus puede usarse en viajes de varios días.

inReach Mini 3 Plus ya está disponible y tiene un precio de venta sugerido de 499,99 euros.

Relacionado

Tecnología

Microsoft Teams estrenará autocorrección y gestión multiinquilino desde una misma cuenta en 2026

Publicado

Hace 13 horas

diciembre 7, 2025

Gustavo Salas

Microsoft está desarrollando dos nuevas funciones de productividad para su servicio de Teams, con una nueva opción para autocorrección de texto y la posibilidad de ver y responder a la actividad de varios inquilinos sin necesidad de cambiar de cuenta.

La plataforma de comunicación para organizaciones continúa trabajando para mejorar la experiencia de los usuarios aumentando la productividad y facilitando la comunicación, en concreto, con nuevas funciones que comenzarán a desplegarse durante los próximos meses de enero y febrero.

Así, entre estas novedades, Microsoft Teams comenzará el año 2026 implementando una nueva función de autocorrección en la redacción de Teams, con la que, al escribir un texto, los usuarios verán corregidas automáticamente las palabras que estén mal escritas, eliminando la necesidad de revisar el texto para encontrar errores.

De esta forma lo ha adelantado la compañía a través de la página de Hoja de ruta de Microsoft 365, donde detalla las últimas actualizaciones que están por llegar o se están lanzando para sus aplicaciones de productividad y servicios inteligentes en la nube.

En concreto, esta función de autocorrección, que se identifica con el ID 534487, se ha incluido en el sistema Compose y llegará para la versión de escritorio de Teams y para ordenadores Mac durante el mes de enero, primero como versión preliminar y, posteriormente, se lanzará a todos los usuarios a nivel global.

Por otra parte, Microsoft también implementará una nueva función para facilitar la gestión de notificaciones y mensajes de varios inquilinos en Teams, es decir, las instancias dedicadas a una organización específica en la plataforma.

Esta novedad, reconocida con el ID 534490, permitirá a los usuarios ver y responder a la actividad de varios inquilinos sin necesidad de cambiar de cuenta para cada uno de ellos. Es decir, desde una misma cuenta de Teams, se podrá interactuar con distintos inquilinos, clasificar sus notificaciones y responder a todos los chats.

Esta opción mejora el flujo de trabajo para, por ejemplo, aquellos usuarios que son miembros o invitados de varios inquilinos o instancias, que podrán responder a los mensajes y participar en los chats grupales de todos ellos desde una misma interfaz.

Microsoft ha detallado que esta nueva función para gestionar la actividad de varias cuentas y organizaciones se lanzará a nivel mundial para la versión de escritorio de Teams en febrero.

Relacionado

TecnologíaHace 3 años

Xiaomi lanza en España el Redmi Note 12 Pro + 5G desde 499,99 euros con cámara de 200MP y carga rápida de 120W

BoliviaHace 5 años

ROSITA POCHI, JERARQUÍA Y RITUALIDAD GUARANÍ

TecnologíaHace 1 año

Meta agrega voz y nuevas capacidades de generación de imágenes a su asistente Meta AI en WhatsApp, Instagram y Facebook

EconomíaHace 3 años

Seis tips para organizar tu viaje de vacaciones sin gastar de más

EconomíaHace 2 años

Representantes de CAINCO se reúnen con el presidente Luis Arce para manifestar su preocupación por la situación económica del país y trabajar en soluciones conjuntas.

EconomíaHace 2 años

La UE invertirá 45.000 millones de euros en América Latina y el Caribe

EconomíaHace 2 años

CAF cerró el 2023 con récord de USD 16.201 millones en aprobaciones

EconomíaHace 2 años

CAF emite en Europa el bono más grande en su historia por EUR 1.500 millones

LA VOZ DIGITAL

ChatGPT incorpora el procesamiento de vídeo en tiempo real en el Modo de voz avanzado

Tecnología

ChatGPT incorpora el procesamiento de vídeo en tiempo real en el Modo de voz avanzado

Relacionado

Tecnología

OpenAI asegura que no hay anuncios en ChatGPT y aclara que se trata de una prueba de la integración de aplicaciones

Relacionado

Tecnología

Garmin presenta su nuevo comunicador satelital para mensajes de voz, mensajes de texto y fotos

Relacionado

Tecnología

Microsoft Teams estrenará autocorrección y gestión multiinquilino desde una misma cuenta en 2026

Relacionado

Trending

LA VOZ DIGITAL

ChatGPT incorpora el procesamiento de vídeo en tiempo real en el Modo de voz avanzado

Comparte esto:

Relacionado

You may like

Tecnología

OpenAI asegura que no hay anuncios en ChatGPT y aclara que se trata de una prueba de la integración de aplicaciones

Comparte esto:

Relacionado

Tecnología

Garmin presenta su nuevo comunicador satelital para mensajes de voz, mensajes de texto y fotos

Comparte esto:

Relacionado

Tecnología

Microsoft Teams estrenará autocorrección y gestión multiinquilino desde una misma cuenta en 2026

Comparte esto:

Relacionado

Trending