Connect with us
Weather Data Source: pronóstico del tiempo

Tecnología

ChatGPT incorpora el procesamiento de vídeo en tiempo real en el Modo de voz avanzado

Publicado

el

OpenAI ha anunciado una nueva característica para el Modo de voz avanzado de ChatGPT, que va a integrar el procesamiento de vídeo en tiempo real, lo que permitirá a su ‘chatbot’ ofrecer respuestas más concretas a las solicitudes de los usuarios según su contexto y lo que pueda identificar a través de las cámaras del dispositivo.

La compañía anunció hace una semana que inauguraría una serie de 12 días de novedades, en la que ya ha anunciado el lanzamiento del modelo de Inteligencia Artificial (IA) o1, un nuevo nivel de ChatGPT Pro y la disponibilidad general de la herramienta de vídeo Sora.

En estas sesiones, también ha hecho referencia al Modo de voz avanzado, una funcionalidad que anunció con la presentación de su modelo GPT-4o y que permite elegir entre una serie de voces para personalizar la interacción con el ‘chatbot’.

Si bien esta característica se iba a probar con un grupo de usuarios en julio, OpenAI anunció que retrasaba su lanzamiento para seguir probando su fiabilidad. Así, fue en septiembre cuando finalmente la empezó a implementar para los usuarios suscritos a la versión Plus y Teams, aunque quedaron excluidos los de la Unión Europea, Suiza, Islandia, Liechtenstein y Noruega.

La compañía ahora ha anunciado la incorporación de la entrada de vídeo de vídeo en el Modo de voz avanzado, lo que permitirá al modelo multimodal procesar en tiempo real las imágenes, así como acceder a las aplicaciones que se estén utilizando en el dispositivo mediante la opción ‘Share Screen’ o ‘Compartir pantalla’.

Como resultado de esta integración, «las conversaciones con Modo de voz avanzado tendrán un ritmo mucho más natural» y podrá profundizar en aspectos como el ritmo o el tono de la voz en más de 50 idiomas, según han explicado los responsables de la firma en un vídeo.

Gracias a esta funcionalidad, que se puede utilizar bien con la cámara delantera o bien con la trasera, ChatGPT podrá indicar a una persona cuáles son los pasos que debe dar para preparar un café con los elementos que identifique y que estén situados frente al objetivo.

Asimismo, con ‘Compartir Pantalla’, el usuario podrá solicitar al ‘chatbot’ ayuda para ejecutar acciones. Por ejemplo, para responder a un mensaje desde la aplicación de Mensajes del ‘smartphone’, de modo que le dará las indicaciones pertinentes para contestar con el tono elegido.

OpenAI ha confirmado que llevará esta función a Europa «tan pronto como pueda» y que ofrecerá acceso anticipado a suscriptores de los planes Enterprise y Edu antes de 2025. Asimismo, ha anunciado que ha personalizado el Modo de voz avanzado de ChatGPT con un modo Papá Noel con motivo de las fiestas de Navidad.

El modo Santa Claus se puede activar durante todo el mes de diciembre pulsando sobre el icono de un copo de nieve, que aparece junto a la barra de mensajes, o bien a través de la Configuración de voz. Esta característica funciona en aplicaciones móviles, iOS, Android y la versión web de ChatGPT.

Tecnología

Brave y AdGuard bloquean la herramienta Recall de Windows para asegurar la privacidad de los usuarios

Publicado

el

El navegador Brave y el bloqueador de anuncios AdGuard han decidido bloquear la herramienta de «memoria fotográfica» Windows Recall con el objetivo de asegurar la privacidad de los usuarios impidiendo las capturas de pantalla en segundo plano.

Anunciada en mayo del pasado año como una de las funciones impulsadas por inteligencia artificial (IA), que estaría disponible para los ordenadores Copilot+ de Microsoft, Recall es una herramienta que lleva a cabo capturas de pantalla de manera periódica en segundo plano para crear una «memoria fotográfica», con la que el usuario puede desplazarse a través de una línea cronológica para encontrar el contenido que ha buscado anteriormente en cualquier aplicación, documento o sitio web.

Aunque Microsoft tenía previsto lanzar Recall en junio de 2024, junto con los Copilot+, la función generó desconfianza entre los usuarios, ya que podía poner en riesgo su información privada y que, en un primer momento, las capturas no se almacenaban de forma cifrada.

Como resultado, la tecnológica canceló la llegada de Recall en varias ocasiones para incorporar medidas de privacidad y seguridad, como la obligatoriedad de utilizar Windows Hello y la posibilidad de desactivar Recall del sistema operativo. Finalmente, lanzó una vista previa de la herramienta en abril, que se espera que llegue al Espacio Económico Europeo a finales de este año.

En este marco y a pesar de las mejoras en seguridad, el navegador basado en privacidad Brave ha anunciado que desactivará por defecto esta herramienta para los usuarios de Windows 11, pero ofrecerá la opción de volver a activarla para quienes lo crean conveniente, tal y como ha recogido en una publicación en su página web.

Esto se debe a que, según ha explicado, la función aún se encuentra en una versión preliminar y se desconoce cómo será exactamente cuándo Microsoft la lance para todos los usuarios de Windows 11. Asimismo, ha detallado que considera que el anuncio inicial de Recall fue «poco convincente y no inspira confianza».

Así, como medida preventiva, el navegador bloqueará de manera predeterminada las acciones de Recall indicándole al sistema operativo del dispositivo que cada ventana «es de navegación privada», ya que para este tipo de navegación la herramienta no guarda las instantáneas.

Por su parte, el bloqueador de anuncios AdGuard ha anunciado que tomará la misma decisión y activará una nueva función para desactivar Recall en el apartado de Configuración, ya que «la sola idea de las capturas de pantalla en segundo plano es inquietante».

La compañía ha comentado que los métodos de autenticación añadidos a Recall, a través de Windows Hello, así como el filtrado de datos confidenciales, no son suficientes y que «dejar las puertas traseras abiertas y esperar que todo funcione como está previsto o que Microsoft siempre actúe de buena fe, no es una estrategia de privacidad sólida», tal y como ha explicado en una publicación en su página web.

SIGNAL EMPRENDIÓ EL MISMO CAMINO EN MAYO

Con todo ello, Brave ha manifestado que se han inspirado en el bloqueo llevado a cabo por la red social Signal el pasado mes de mayo, que anunció que impediría los intentos del ordenador de realizar capturas de pantalla de los mensajes de los usuarios, ante la llegada de la nueva función de Microsoft en Windows 11.

La compañía argumentó que, aunque Microsoft realizó varios ajustes en el último año en respuesta al primer anuncio que suscitó las dudas entre los usuarios, la versión renovada de Recall que publicó en abril «aún pone en riesgo el contenido que se muestra en aplicaciones que protegen la privacidad».

A pesar de ello, Signal reconoció que al impedir capturas de pantalla, los programas de accesibilidad como lectores de pantalla o herramientas de ampliación para personas con discapacidad visual podían verse afectadas.

Continue Reading

Tecnología

Microsoft prepara la llegada de GPT-5, prevista para agosto, con un nuevo ‘Modo inteligente’ en Copilot

Publicado

el

Microsoft trabaja en la llegada del próximo modelo de inteligencia artificial (IA) GPT-5 de OpenAI, que está previsto para el próximo mes de agosto, y que implementará en su asistente Copilot mediante un nuevo ‘Modo Inteligente’.

El siguiente modelo de lenguaje de gran tamaño (LLM) de la compañía dirigida por Sam Altman, GPT-5, se lanzará durante este verano, tal y como confirmó en junio el propio Altman, y aprovechará los avances en razonamiento y los hechos en multimodalidad de las dos principales series de modelos de la tecnológica, GPT y o.

Concretamente, está previsto que OpenAI lance GPT-5 a principios del próximo mes de agosto, según adelantaron recientemente fuentes internas de la compañía en declaraciones a The Verge y, frente a su inminente llegada, Microsoft prepara su integración en el asistente Copilot, con un nuevo ‘Modo Inteligente’.

Así lo ha compartido el analista Alexéi Shabanov en una publicación en su web, donde ha detallado que, tras analizar el código de Copilot, ha identificado una nueva opción de ‘Modo Inteligente’ que se basa en las capacidades de GPT-5 para «pensar con rapidez o profundidad».

En concreto, este nuevo modo, se une a las opciones ya disponibles en Copilot de Respuesta Rápida, Pensar Más a Fondo o Investigación Profunda. Asimismo, incluye una etiqueta que hace referencia al uso de GPT-5, junto a una descripción que detalla que es capaz de pensar de forma rápida o profunda.

De esta manera, se confirma la capacidad del modelo de unificar tanto las características de la serie de modelos de razonamiento como las capacidades de la serie GPT. Además, según el analista, el Modo Inteligente de Copilot gestionará automáticamente la forma de ejecutar su respuesta, en base a las necesidades de las solicitudes de los usuarios. Es decir, escogerá entre ofrecer una respuesta rápida o una respuesta razonada.

Con todo, el ‘Modo Inteligente’ basado en GPT-5 para Copilot está en desarrollo y se mantiene oculto para los usuarios en el código base del asistente. Por tanto, se espera que esté disponible tras el lanzamiento oficial de GPT-5.

Continue Reading

Tecnología

GitHub lanza la versión preliminar de GitHub Spark, su herramienta para crear aplicaciones de IA con lenguaje natural

Publicado

el

GitHub ha lanzado la versión preliminar de GitHub Spark, su herramienta impulsada por Inteligencia Artificial (IA) que permite a los desarrolladores crear aplicaciones personalizadas describiendo sus características a través de lenguaje natural, sin necesidad de utilizar código.

La herramienta fue presentada por la plataforma en octubre del año pasado, en el marco de su conferencia anual para desarrolladores GitHub Universe 2024, destinada a facilitar la creación de ‘apps’ personalizadas y funcionales.

Ahora GitHub, que pertenece a Microsoft, ha lanzado la versión preliminar de GitHub Spark, con el fin de ayudar a crear aplicaciones inteligentes a través de lenguaje natural, utilizando como base el modelo Claude Sonnet 4 de Anthropic para procesar las solicitudes de los usuarios y transformarlas en código funcional, tal y como ha recogido la compañía en una publicación en su blog.

Así, los desarrolladores podrán describir sus ideas de aplicaciones para que Spark las haga realidad al completo, con capacidades ‘frontend’ y ‘backend’, es decir, que permite crear tanto la parte visual de la aplicación, como su lógica interna y manejo de datos.

Además, GitHub ha asegurado que no requiere una configuración previa, así como tampoco el uso datos ni la inferencia de grandes modelos de lenguaje (LLM), alojamiento o implementaciones. La autenticación de GitHub también estará incluida.

Siguiendo esta línea, los desarrolladores podrán añadir funciones inteligentes impulsadas por modelos de otras compañías como OpenAI, Meta o DeepSeek sin necesidad de administrar claves API, según ha apuntado la plataforma, que también ha señalado que la aplicación se podrá publicar «con un solo clic».

La plataforma ofrece igualmente un repositorio con GitHubs Actions y Dependabot integrados, y los desarrolladores podrán abrir espacios de código directamente desde Spark para iterar con el modo de agente de Copilot, así como asignar un problema al agente de codificación Copilot.

Así, Spark ya está disponible en versión preliminar pública para los usuarios de Copilot Pro+, y próximamente se implementará para clientes adicionales, según ha advertido GitHub.

Continue Reading

Trending