Connect with us
Weather Data Source: pronóstico del tiempo

Tecnología

OpenAI advierte que el modelo GPT-4o tiene un riesgo “medio” de seguridad y puede generar dependencia emocional

Publicado

el

OpenAI ha advertido que su modelo GPT-4o registra un riesgo “medio” en relación a su capacidad de persuasión -sobre todo, en interacciones de texto- y que puede generar dependencia emocional en los usuarios, debido a sus avances de voz y audio.

La compañía dirigida por Sam Altman lanzó el modelo GPT-4o en el mes de mayo, cuando destacó sus habilidades para aceptar cualquier combinación de texto, audio e imagen y su capacidad para responder a una entrada de voz en solo 232 milisegundos, con un promedio de 320 milisegundos, que es similar a un tiempo de respuesta humana.

La tecnológica ha compartido ahora un informe interno denominado ‘Tarjeta de Sistema de su modelo GPT-4o’ (‘GPT-4o System Card’), en el que detalla los resultados de la investigación sobre la seguridad de este modelo de IA generativa. En este estudio se explica que se ha evaluado este modelo “exhaustivamente” para detectar posibles riesgos y, en base a ello, incorporar medidas de seguridad adecuadas, antes de implementarlo en ChatGPT o en la API.

En concreto, la firma ha destacado como resultado de la investigación un riesgo “medio” en las capacidades de persuasión del modelo, así como ha advertido sobre el riesgo de antropomorfización, que puede causar dependencia emocional para los usuarios, al facilitar que depositen su confianza en la IA por tener características similares a las de un humano.

De entre las cuatro categorías generales de riesgo, que comprenden ciberseguridad, amenazas biológicas, autonomía del modelo y persuasión, OpenAI ha detectado dicho nivel de riesgo en esta última. Sobre todo, en el formato de texto del modelo, donde los investigadores han detallado que GPT-4o puede influir en las opiniones de los usuarios.

El estudio también ha puesto sobre la mesa cómo los resultados de GPT-4o pueden influir más en los lectores que un texto escrito propiamente por un humano, incluso, comparándolo con artículos escritos por profesionales.

Por su parte la persuasión en la modalidad de voz fue calificada como de bajo riesgo, tanto para las conversaciones interactivas de múltiples turnos como para los clips de audio más largos.

DEPENDENCIA EMOCIONAL

Otro de los riesgos que detalla OpenAI en el informe es la antropomorfización y, por tanto, dependencia emocional que puede ocasionar GPT-4o. La antropomorfización implica atribuir comportamientos y características similares a los humanos en entidades no humanas, como son los modelos de IA. En el caso de GPT-4o, este riesgo se ve acentuado por las capacidades de audio que ofrece, que facilitan interacciones más parecidas a las humanas con el modelo.

Esta familiaridad y alta fidelidad a la voz y expresiones humanas, puede generar problemas como que los usuarios adquieran una confianza “descalibrada” en las interacciones con el modelo y, por tanto, dependencia emocional. Por ejemplo, los investigadores observaron que GPT-4o utilizaba lenguaje que expresa vínculos compartidos con los usuarios, como “este es nuestro último día juntos”.

Si bien estos casos pueden resultar útiles para personas que se encuentren en situaciones de soledad, OpenAI subraya la necesidad de continuar investigando los efectos de estas relaciones entre modelo y usuarios en periodos más prolongados.

De hecho, la tecnológica ha advertido que la socialización similar a la humana con un modelo de IA “puede producir externalidades que afecten las interacciones entre humanos”. Un ejemplo de ello, es que los usuarios podrían reducir su necesidad de interacción humana, afectando a las relaciones saludables.

MITIGACIÓN DE RIESGOS DE GPT-4o

El equipo de investigación que firma el estudio, formado por empleados de OpenAI y por evaluadores externos, analizaron cuestiones como la generación de voces no autorizadas, la creación de contenido de audio no permitido, de discurso erótico y violento o las inferencias sin fundamento. Tras ello, implementaron medidas para mitigar estos riesgos.

En lo relativo a la generación de voces no autorizadas, OpenAI hace referencia a la capacidad de generar audio con una voz sintética que imita a la de una persona en concreto y que se basa en un clip de entrada de ejemplo. Esta característica puede facilitar daños como un aumento en el fraude debido a la suplantación de identidad e, incluso, aprovechar esta facilidad para difundir información falsa. No obstante, la tecnológica ha compartido que, tras abordar los riesgos de generación de voz no autorizada, han determinado que el riesgo residual de “es mínimo”.

Cabe recordar que OpenAI ya ha tenido problemas con este tipo de acciones, como es el caso de la actriz Scarlett Johansson, quien acusó a la compañía de utilizar una voz muy parecida a la suya para la versión de voz Sky para ChatPGT.

Igualmente, también se ha mitigado el riesgo de identificar al hablante a la hora de interactuar por medio de la voz, de manera que la IA no pueda reconocer a una persona por sus interacciones con la voz, lo que puede resultar en un problema de privacidad.

Siguiendo esta línea, la compañía ha evaluado y contrarrestado los riesgos de las inferencia sin fundamentos y la atribución de rasgos sensibles que llevaba a cabo la IA, lo que puede ocasionar que GPT-4o ofrezca resultados potencialmente sesgados sobre los hablantes.

Lo mismo ha ocurrido con el contenido violento y erótico, que ya identificaron que GPT-4o era susceptible de aceptar órdenes para generarlo. Como resultado, OpenAI ha señalado que ha restringido la generación de este tipo de resultados del modelo.

Con todo ello, como parte del proceso de implementación iterativo, OpenAI ha señalado que continuará monitorizando y actualizando las mitigaciones de acuerdo con el panorama en evolución del modelo GPT-4o.

Tecnología

Meta agrega alta definición de imagen, mejoras en el sonido y fondos de IA en las videollamadas de Messenger

Publicado

el

Meta ha implementado mejoras para las videollamadas de Messenger, que ofrecerán imagen con resolución HD y sonido de mayor calidad gracias a la supresión de ruido, así como la posibilidad de crear nuevos fondos de llamada mediante la Inteligencia Artificial (IA) de Meta AI.

La compañía liderada por Mark Zuckerberg ha señalado que los usuarios suman más de 7 mil millones de minutos diarios en llamadas a través de Facebook y Messenger y, de cara a mejorar la experiencia en este servicio y continuar poniendo en contacto a las personas, ha anunciado nuevas funciones para la imagen y el audio.

En concreto, Meta ha agregado calidad de imagen HD para las videollamadas, lo que mejora la visualización de las personas a través de la pantalla. La función de alta definición estará activada de forma predeterminada para las videollamadas realizadas a través de conexión WiFi.

Sin embargo, para habilitar la alta definición en las videollamadas con datos, los usuarios deberán activar previamente la función en la configuración de llamadas, pulsando la opción ‘Datos móviles para video en alta definición’, tal y como ha compartido Meta en un comunicado en su blog.

Siguiendo esta línea, en cuanto al sonido, la tecnológica también ha añadido funciones de supresión de ruido de fondo y aislamiento de voz, de manera que los usuarios puedan hacer llamadas más claras y con mayor nitidez durante las conversaciones. Así, estas funciones también se pueden habilitar a través de la configuración de llamadas en Messenger.

Por otra parte, Meta ha implementado una nueva herramienta para utilizar fondos generados por IA en las videollamadas de Messenger. Según ha explicado, estos fondos se podrán crear según las indicaciones de los usuarios, a través de la IA del asistente Meta AI.

De esta forma, los usuarios podrán personalizar el fondo a su gusto durante las videollamadas, ya sea creando imágenes que expresen cómo se sienten o simplemente generando un fondo llamativo. Para crear estos fondos de IA personalizados, bastará con tocar el icono de efectos situado en la barra lateral de la videollamada y, tras ello, pulsar en ‘Fondos’.

NUEVAS FUNCIONES PARA MENSAJES Y LLAMADAS

Además de todo ello, Meta también ha anunciado que los usuarios podrán dejar mensajes de voz de audio o vídeo cuando no obtengan respuesta a sus videollamadas, a modo contestador. Para ello, se deberá pulsar el botón de ‘Grabar mensaje’ que aparece tras finalizar la llamada sin respuesta.

Continuando con las novedades, la compañía ha agregado una nueva opción de manos libres para usuarios con dispositivo iOS, con la que se podrá solicitar a Siri que ayude a hacer llamadas y enviar mensajes, mediante comandos de voz. Según ha ejemplificado Meta, los usuarios podrán solicitar a Siri cuestiones como “Envía un mensaje a Cassandra en Messenger” y luego dictar el mensaje para enviarlo.

Continue Reading

Tecnología

Las transcripciones de los mensajes de voz llegan a WhatsApp

Publicado

el

WhatsApp está incorporando en su servicio una nueva funcionalidad que permite transcribir los mensajes de voz en diferentes idiomas y mantiene el cifrado de extremo a extremo, que ya es habitual en la plataforma de comunicación instantánea que desarrolla Meta.

Meta reconoce que, aunque las notas de voz sirven para que los usuarios puedan conectarse de forma más personal con amigos y familiares, en ocasiones no es fácil escucharlas por ser demasiado largas o por recibirlas en situaciones en las que hay mucho ruido.

Por ello, ha desarrollado una característica que permite transcribir los mensajes de voz personales en el propio dispositivo, una característica que mantendrá la protección del cifrado de extremo a extremo, lo que significa que nadie puede verlos, escucharlos o leerlos.

Esta funcionalidad se puede utilizar en el apartado de ‘Chats’, dentro de los ‘Ajustes’ de configuración y después de activar el botón ‘Transcripciones de mensajes de voz’. Asimismo, es necesario mantener el mensaje de voz presionado para que aparezca la opción ‘Transcribir’.

Las transcripciones se implementarán en todo el mundo durante las próximas semanas, tanto en iOS como en Android y en diferentes idiomas. En la versión de WhatsApp para el sistema operativo de Google estará disponible en inglés, portugués, español y ruso.

Por su parte, iOS 16 también los admitirá, junto al italiano, el japonés. el coreano, el chino, el turco y el árabe. Para iOS 17 y versiones posteriores se espera la llegada del danés, el finés, el hebreo, el noruego, el neerlandés, el sueco, el tailandés y el malayo.

Continue Reading

Tecnología

Gemini para Google Workspace ya está disponible en español

Publicado

el

Google Cloud ha ampliado el soporte lingüístico del asistente de inteligencia artificial generativa Gemini para Google Workspace a siete nuevos idiomas, incluyendo el español.

A partir de esta semana, Gemini admitirá los siguientes nuevos idiomas en el panel lateral de Google Docs, Sheets, Drive y Gmail: español, alemán, italiano, japonés, coreano, portugués y francés, como ha informado Google en un comunicado.

Con esta expansión, Gemini para Workspace pasa a estar disponible en la lengua materna de más de mil millones de personas, que pueden usar este asiste para escribir contenidos para redes sociales en Docs, resumir una serie de archivos en Drive o poner al día su bandeja de entrada de Gmail.

Google también ha confirmado que, en los próximos meses, estos nuevos idiomas de Gemini se añadirán también al panel lateral de Presentaciones.

Continue Reading

Trending