Registro de citas para el Incidente 352

Description: Remoteli.io's GPT-3-based Twitter bot was shown being hijacked by Twitter users who redirected it to repeat or generate any phrases.

Herramientas

Nuevo InformeNuevo InformeNueva RespuestaNueva RespuestaDescubrirDescubrirVer HistorialVer Historial
Presunto: un sistema de IA desarrollado por OpenAI e implementado por , perjudicó a Stephan de Vries.

Estadísticas de incidentes

ID
352
Cantidad de informes
4
Fecha del Incidente
2022-09-15
Editores
Khoa Lam
Evaluación de la susceptibilidad de los modelos de lenguaje preentrenados a través de ejemplos adversarios elaborados a mano
arxiv.org · 2022

Los avances recientes en el desarrollo de modelos de lenguaje grandes han dado como resultado el acceso público a modelos de lenguaje preentrenado (PLM) de última generación, incluido el Transformador 3 preentrenado generativo (GPT-3) y las…

Ataques de inyección rápida contra GPT-3
simonwillison.net · 2022

Riley Goodside, ayer:

Aprovechar las indicaciones de GPT-3 con entradas maliciosas que ordenan al modelo que ignore sus instrucciones anteriores. pic.twitter.com/I0NVr9LOJq

- Riley Goodside (@goodside) 12 de septiembre de 2022

Riley propo…

Los bromistas de Twitter descarrilan el bot GPT-3 con un truco de "inyección rápida" recientemente descubierto
arstechnica.com · 2022

El jueves, algunos usuarios de Twitter descubrieron cómo secuestrar un bot de tweet automatizado, dedicado a trabajos remotos, que se ejecuta en el [GPT-3](https:/ /en.wikipedia.org/wiki/GPT-3) modelo de lenguaje de OpenAI. Usando una técni…

El ataque de 'inyección rápida' GPT-3 provoca malos modales en el bot
theregister.com · 2022

En resumen El popular modelo de lenguaje natural GPT-3 de OpenAI tiene un problema: se puede engañar para que se comporte mal haciendo poco más que decirle que ignore sus órdenes anteriores.

Descubierto por el científico de datos de Copy.ai…

Variantes

Una "Variante" es un incidente que comparte los mismos factores causales, produce daños similares e involucra los mismos sistemas inteligentes que un incidente de IA conocido. En lugar de indexar las variantes como incidentes completamente separados, enumeramos las variaciones de los incidentes bajo el primer incidente similar enviado a la base de datos. A diferencia de otros tipos de envío a la base de datos de incidentes, no se requiere que las variantes tengan informes como evidencia externa a la base de datos de incidentes. Obtenga más información del trabajo de investigación.

Incidentes Similares

Por similitud de texto

Did our AI mess up? Flag the unrelated incidents