Connect with us
Santa Cruz de la Sierra
20°C
+20
+20
+20
+20
+19
+19
+19
+19
+21
+22
+24
+25
+26
+26
+27
+26
+26
+26
+25
+23
+23
+22
+21
+21
Mi
27°C
19°C
+22
+22
+22
+22
+21
+20
+20
+20
+21
+22
+23
+24
+24
+25
+27
+27
+27
+27
+25
+24
+24
+23
+23
+23
Ju
27°C
20°C
+23
+23
+22
+22
+22
+22
+22
+22
+22
+23
+24
+25
+25
+26
+27
+26
+26
+25
+24
+24
+23
+23
+23
+23
Vi
27°C
22°C
+22
+22
+22
+22
+22
+22
+22
+22
+22
+22
+23
+23
+24
+24
+24
+24
+24
+24
+23
+23
+23
+22
+22
+22
24°C
22°C
+22
+22
+21
+21
+21
+21
+21
+22
+22
+22
+23
+24
+25
+25
+26
+26
+25
+24
+24
+23
+23
+22
+22
+21
Do
26°C
21°C
+21
+21
+20
+21
+21
+21
+22
+22
+22
+23
+24
+25
+26
+26
+27
+27
+26
+25
+25
+24
+24
+23
+23
+23
Lu
27°C
20°C
+23
+22
+22
+22
+22
+22
+23
+23
+23
+23
+24
+25
+26
+27
+28
+27
+26
+26
+25
+25
+24
+24
+23
+23
Ma
28°C
22°C
+23
+22
+22
+22
+22
+22
+22
+22
+22
+23
+24
+24
+25
+26
+26
+26
+25
+25
+24
+24
+23
+23
+23
+23
+22
+22
+22
+22
+22
+22
+22
+22
+22
+23
+23
+24
+24
+24
+25
+24
+24
+24
+23
+23
+25
+25
+25
+24
+24
+24
+24
+23
+24
+23
+23
+24
+23
+25
+25
+25
+25
+25
+27
+26
+26
+26
+24
+25
+26
+26
+27
+26
Weather Data Source: pronóstico del tiempo

Tecnología

OpenAI advierte que el modelo GPT-4o tiene un riesgo «medio» de seguridad y puede generar dependencia emocional

Publicado

el

OpenAI ha advertido que su modelo GPT-4o registra un riesgo «medio» en relación a su capacidad de persuasión -sobre todo, en interacciones de texto- y que puede generar dependencia emocional en los usuarios, debido a sus avances de voz y audio.

La compañía dirigida por Sam Altman lanzó el modelo GPT-4o en el mes de mayo, cuando destacó sus habilidades para aceptar cualquier combinación de texto, audio e imagen y su capacidad para responder a una entrada de voz en solo 232 milisegundos, con un promedio de 320 milisegundos, que es similar a un tiempo de respuesta humana.

La tecnológica ha compartido ahora un informe interno denominado ‘Tarjeta de Sistema de su modelo GPT-4o’ (‘GPT-4o System Card’), en el que detalla los resultados de la investigación sobre la seguridad de este modelo de IA generativa. En este estudio se explica que se ha evaluado este modelo «exhaustivamente» para detectar posibles riesgos y, en base a ello, incorporar medidas de seguridad adecuadas, antes de implementarlo en ChatGPT o en la API.

En concreto, la firma ha destacado como resultado de la investigación un riesgo «medio» en las capacidades de persuasión del modelo, así como ha advertido sobre el riesgo de antropomorfización, que puede causar dependencia emocional para los usuarios, al facilitar que depositen su confianza en la IA por tener características similares a las de un humano.

De entre las cuatro categorías generales de riesgo, que comprenden ciberseguridad, amenazas biológicas, autonomía del modelo y persuasión, OpenAI ha detectado dicho nivel de riesgo en esta última. Sobre todo, en el formato de texto del modelo, donde los investigadores han detallado que GPT-4o puede influir en las opiniones de los usuarios.

El estudio también ha puesto sobre la mesa cómo los resultados de GPT-4o pueden influir más en los lectores que un texto escrito propiamente por un humano, incluso, comparándolo con artículos escritos por profesionales.

Por su parte la persuasión en la modalidad de voz fue calificada como de bajo riesgo, tanto para las conversaciones interactivas de múltiples turnos como para los clips de audio más largos.

DEPENDENCIA EMOCIONAL

Otro de los riesgos que detalla OpenAI en el informe es la antropomorfización y, por tanto, dependencia emocional que puede ocasionar GPT-4o. La antropomorfización implica atribuir comportamientos y características similares a los humanos en entidades no humanas, como son los modelos de IA. En el caso de GPT-4o, este riesgo se ve acentuado por las capacidades de audio que ofrece, que facilitan interacciones más parecidas a las humanas con el modelo.

Esta familiaridad y alta fidelidad a la voz y expresiones humanas, puede generar problemas como que los usuarios adquieran una confianza «descalibrada» en las interacciones con el modelo y, por tanto, dependencia emocional. Por ejemplo, los investigadores observaron que GPT-4o utilizaba lenguaje que expresa vínculos compartidos con los usuarios, como «este es nuestro último día juntos».

Si bien estos casos pueden resultar útiles para personas que se encuentren en situaciones de soledad, OpenAI subraya la necesidad de continuar investigando los efectos de estas relaciones entre modelo y usuarios en periodos más prolongados.

De hecho, la tecnológica ha advertido que la socialización similar a la humana con un modelo de IA «puede producir externalidades que afecten las interacciones entre humanos». Un ejemplo de ello, es que los usuarios podrían reducir su necesidad de interacción humana, afectando a las relaciones saludables.

MITIGACIÓN DE RIESGOS DE GPT-4o

El equipo de investigación que firma el estudio, formado por empleados de OpenAI y por evaluadores externos, analizaron cuestiones como la generación de voces no autorizadas, la creación de contenido de audio no permitido, de discurso erótico y violento o las inferencias sin fundamento. Tras ello, implementaron medidas para mitigar estos riesgos.

En lo relativo a la generación de voces no autorizadas, OpenAI hace referencia a la capacidad de generar audio con una voz sintética que imita a la de una persona en concreto y que se basa en un clip de entrada de ejemplo. Esta característica puede facilitar daños como un aumento en el fraude debido a la suplantación de identidad e, incluso, aprovechar esta facilidad para difundir información falsa. No obstante, la tecnológica ha compartido que, tras abordar los riesgos de generación de voz no autorizada, han determinado que el riesgo residual de «es mínimo».

Cabe recordar que OpenAI ya ha tenido problemas con este tipo de acciones, como es el caso de la actriz Scarlett Johansson, quien acusó a la compañía de utilizar una voz muy parecida a la suya para la versión de voz Sky para ChatPGT.

Igualmente, también se ha mitigado el riesgo de identificar al hablante a la hora de interactuar por medio de la voz, de manera que la IA no pueda reconocer a una persona por sus interacciones con la voz, lo que puede resultar en un problema de privacidad.

Siguiendo esta línea, la compañía ha evaluado y contrarrestado los riesgos de las inferencia sin fundamentos y la atribución de rasgos sensibles que llevaba a cabo la IA, lo que puede ocasionar que GPT-4o ofrezca resultados potencialmente sesgados sobre los hablantes.

Lo mismo ha ocurrido con el contenido violento y erótico, que ya identificaron que GPT-4o era susceptible de aceptar órdenes para generarlo. Como resultado, OpenAI ha señalado que ha restringido la generación de este tipo de resultados del modelo.

Con todo ello, como parte del proceso de implementación iterativo, OpenAI ha señalado que continuará monitorizando y actualizando las mitigaciones de acuerdo con el panorama en evolución del modelo GPT-4o.

Tecnología

Ya disponible la capacidad de utilizar Gemini Live desde la cámara del ‘smartphone’ y compartiendo pantalla

Publicado

el

Google ha lanzado oficialmente las nuevas funciones para compartir pantalla o vídeo en directo en las conversaciones con Gemini Live, que ya están implementadas para los suscriptores de Gemini Advanced en dispositivos Android y que se han comenzado a extender para los usuarios de la versión gratuita en dispositivos Pixel 9 y Samsung S25.

La tecnológica anunció estas nuevas capacidades para su aplicación de chat de voz del asistente de Inteligencia Artificial (IA) el pasado mes de marzo en el marco del Mobile World Congress (MWC), cuando detalló que, basadas en el prototipo de investigación presentado en Google I/O el pasado año, Project Astra, permiten utilizar la cámara del ‘smartphone’ para mostrarle al asistente un vídeo en directo y preguntarle sobre lo que se ve en la imagen.

La compañía comenzó a desplegar estas opciones para Gemini Live con algunos usuarios a finales de marzo y, hora, Google ha indicado que estas novedades para Gemini Live ya están totalmente integradas en los dispositivos Android de los usuarios suscritos a Gemini Advanced.

Igualmente, Google también ha anunciado que se han comenzado a extender a todos los usuarios que utilizan la aplicación Gemini Live de forma gratuita, pero solo en los dispositivos Pixel 9 y Samsung Galaxy S25.

De esta forma, tal y como ha explicado Google en un comunicado, los usuarios pueden compartir la cámara o la pantalla del teléfono con Gemini y hablar sobre ello en tiempo real, con lo que permite compartir «aún más contexto», al tiempo que se habla sobre ello de forma natural en más de 45 idiomas.

Por ejemplo, con estas capacidades los usuarios podrán apuntar la cámara de su ‘smartphone’ a un cajón desordenado o a una estantería llena de libros y, a continuación, solicitar a Gemini sugerencias para clasificar dichos objetos optimizando el espacio. Incluso, el asistente puede ayudar a decidir qué objetos se pueden tirar o donar.

De la misma forma, Gemini Live también podrá ayudar con proyectos creativos al compartir la pantalla del ‘smartphone’ con el asistente de IA para mostrarle fotos de ideas o inspiración. Tras ello, Gemini ofrecerá diseños e ideas para escribir o crear «manualidades originales».

Google también ha compartido que otra de las opciones que presentan estas funciones es utilizar Gemini Live como un asesor personal a la hora de llevar a cabo compras online. Esto se debe a que los usuarios podrán solicitar que compare ciertos productos o consejos para, por ejemplo, elegir ropa y conjuntos, mostrando las diferentes prendas a través de la cámara.

Siguiendo esta línea, los usuarios también pueden compartir la pantalla de su ‘smartphone’ con Gemini Live para que el asistente ofrezca comentarios prácticos sobre los últimos proyectos en los que se esté trabajando. Así, puede ofrecer consejos ya sea sobre el contenido, el diseño o la composición.

Finalmente, también permite solicitar ayuda para arreglar objetos con solo enfocar la cámara con Gemini Live sobre el problema que se desee solucionar. Así, se enviarán sugerencias en tiempo real para arreglar el problema.

Con todo ello, Google ha señalado que esta experiencia representa «un paso importante» hacia un asistente de IA universal que «realmente entienda e interactúe» con el mundo que rodea a los usuarios. Así, estas nuevas funciones desbloquean «un nuevo nivel de ayuda intuitiva que puede simplificar y enriquecer diferentes áreas y ofrecer posibilidades en el día a día».

Continue Reading

Tecnología

Microsoft actualiza Copilot para que tenga memoria, realice investigación profunda y genere pódcast

Publicado

el

Microsoft ha actualizado Copilot para que sea un asistente más personal a partir de nuevas capacidades y funciones que le permitirán realizar una investigación profunda, facilitar la explicación sobre un tema en formato pódcast e buscar información en el mundo real con la cámara del móvil.

La compañía tecnológica ya no quiere que Copilot sea un simple compañero de inteligencia artificial, sino el compañero para cada uno de los usuarios, más personal, «diseñado según las necesidades, valores y expectativas individuales».

Para conseguirlo, Microsoft ha actualizado Copilot con nuevas capacidades, como la memoria, por la que puede «recordar» detalles y preferencias del usuario, que luego utiliza para ofrecer recomendaciones, recordatorios y soluciones personalizadas, como explica en su blog oficial.

También las acciones en nombre del usuario. A través de ‘Actions’, y mediante unas indicaciones previas, Copilot podrá realizar tareas en segundo plano, como comprar entradas para un espectáculos y reservar una mesa en un restaurante.

Y aunque por el momento es solo una idea, Copilot podrá tener una apariencia, modelada por el usuario, para que la interacción con el asistente sea «divertida».

NUEVAS FUNCIONES

Copilot ha integrado la investigación profunda, una forma de «realizar tareas de investigación complejas de varios pasos de forma más eficiente, ahorrando tiempo», y se ha introducido la Búsqueda de Copilot en Bing, con la que «compara información de múltiples sitios para ofrecer respuestas detalladas y completas», con fuentes citadas y sugerencias.

Copilot es multimodal y una muestra de ello es la herramienta Vision, una función que ofrece resultados basados en el contenido mostrado en la pantalla del navegador Edge. Microsoft comenzó las pruebas a finales del año pasado, y ahora ha anunciado su extensión a móviles y Windows.

En los móviles, utilizará la cámara del dispositivo para «experiencia interactiva con el mundo real» a partir del vídeo en tiempo real o las fotografías almacenadas en el dispositivo. En lo que respecta a Windows, Copilot verá las aplicaciones, las pestañas del navegador y los archivos con los que está trabajando el usuario.

Copilot también generará pódcast, al estilo Audio Overview de Google, para ofrecer contenido de audio personalizado en el que se explica un tema o se ofrece una comparación de opciones, por ejemplo, sobre un plan de viaje. Admite la interacción del usuario con Copilot mientras se escucha.

A ello se unen las Páginas, para organizar las notas y los contenidos del usuario que formen parte de un trabajo o investigación; y las Compras, que convierten a Copilot en un «comprador personal», que investiga, compara y asesora al usuario.

Continue Reading

Tecnología

Vimeo ofrece a los creadores una plataforma para compartir sus contenidos al estilo Netflix

Publicado

el

Vimeo ha anunciado un servicio para los creadores que les permitirá tener su propia «experiencia de streaming al estilo Netflix», a través de un canal en el que podrán personalizar y usar para distribuir su contenido y monetizarlos.

Vimeo Streaming es una plataforma para creadores de contenido que permite desplegar un servicio de suscripción sin necesidad de tener conocimientos en programación, y que da acceso a herramientas de monetización.

La compañía considera que este servicio beneficiará principalmente a creadores y empresas del entretenimiento, que podrán personalizar el canal y llegar a audiencias en móvil, aplicaciones web y aplicaciones para TV.

Esta «experiencia de streaming profesional al estilo Netflix» incluye protecciones contra las descargas ilegales de los contenidos y la tecnología de geobloqueo para restringir el acceso, como explica Vimeo en su blog oficial.

Vimeo Streaming también ofrece vídeo en 4K, retransmisión en directo, traducciones de subtítulos con inteligencia artificial en 36 idiomas. Y en lo que respecta a la monetización, la posibilidad de introducir anuncios, membresías, alquiler de vídeo y herramientas de análisis y gestión de audiencias.

Continue Reading

Trending