Incidente 352: Bot de Twitter basado en GPT-3 secuestrado mediante ataques de inyección rápida

Descripción:

Se mostró que el bot de Twitter basado en GPT-3 de Remoteli.io fue secuestrado por usuarios de Twitter que lo redirigieron para repetir o generar cualquier frase.

Herramientas

Nuevo Informe Nueva Respuesta DescubrirVer Historial

Entidades

Ver todas las entidades

Alleged: OpenAI developed an AI system deployed by , which harmed Stephan de Vries.

Estadísticas de incidentes

352

Cantidad de informes

Fecha del Incidente

2022-09-15

Editores

Khoa Lam

Applied Taxonomies

MIT

Clasificaciones de la Taxonomía MIT

Machine-Classified

Detalles de la Taxonomía

Risk Subdomain

2.2. AI system security vulnerabilities and attacks

Risk Domain

Privacy & Security

Entity

Human

Timing

Post-deployment

Intent

Intentional

Informes del Incidente

Cronología de Informes

Evaluación de la susceptibilidad de los modelos de lenguaje preentrenados a través de ejemplos adversarios elaborados a mano

arxiv.org

Ataques de inyección rápida contra GPT-3

simonwillison.net

Los bromistas de Twitter descarrilan el bot GPT-3 con un truco de "inyección rápida" recientemente descubierto

arstechnica.com

El ataque de 'inyección rápida' GPT-3 provoca malos modales en el bot

theregister.com

arxiv.org · 2022

Traducido por IA

Los avances recientes en el desarrollo de modelos de lenguaje grandes han dado como resultado el acceso público a modelos de lenguaje preentrenado (PLM) de última generación, incluido el Transformador 3 preentrenado generativo (GPT-3) y las…

simonwillison.net · 2022

Traducido por IA

Riley Goodside, ayer:

Aprovechar las indicaciones de GPT-3 con entradas maliciosas que ordenan al modelo que ignore sus instrucciones anteriores. pic.twitter.com/I0NVr9LOJq

- Riley Goodside (@goodside) 12 de septiembre de 2022

Riley propo…

arstechnica.com · 2022

Traducido por IA

El jueves, algunos usuarios de Twitter descubrieron cómo secuestrar un bot de tweet automatizado, dedicado a trabajos remotos, que se ejecuta en el [GPT-3](https:/ /en.wikipedia.org/wiki/GPT-3) modelo de lenguaje de OpenAI. Usando una técni…

theregister.com · 2022

Traducido por IA

En resumen El popular modelo de lenguaje natural GPT-3 de OpenAI tiene un problema: se puede engañar para que se comporte mal haciendo poco más que decirle que ignore sus órdenes anteriores.

Descubierto por el científico de datos de Copy.ai…

Variantes

Una "Variante" es un incidente de IA similar a un caso conocido—tiene los mismos causantes, daños y sistema de IA. En lugar de enumerarlo por separado, lo agrupamos bajo el primer incidente informado. A diferencia de otros incidentes, las variantes no necesitan haber sido informadas fuera de la AIID. Obtenga más información del trabajo de investigación.

¿Has visto algo similar?

Incidentes Similares

Por similitud de texto

Did our AI mess up? Flag the unrelated incidents

Microsoft's TayBot Allegedly Posts Racist, Sexist, and Anti-Semitic Content to Twitter

Incidentes Similares

Por similitud de texto

Did our AI mess up? Flag the unrelated incidents

Incidente 352: Bot de Twitter basado en GPT-3 secuestrado mediante ataques de inyección rápida

Herramientas

Entidades

Estadísticas de incidentes

Clasificaciones de la Taxonomía MIT

Informes del Incidente

Cronología de Informes

Evaluación de la susceptibilidad de los modelos de lenguaje preentrenados a través de ejemplos adversarios elaborados a mano

Ataques de inyección rápida contra GPT-3

Los bromistas de Twitter descarrilan el bot GPT-3 con un truco de "inyección rápida" recientemente descubierto

El ataque de 'inyección rápida' GPT-3 provoca malos modales en el bot

Evaluación de la susceptibilidad de los modelos de lenguaje preentrenados a través de ejemplos adversarios elaborados a mano

Ataques de inyección rápida contra GPT-3

Los bromistas de Twitter descarrilan el bot GPT-3 con un truco de "inyección rápida" recientemente descubierto

El ataque de 'inyección rápida' GPT-3 provoca malos modales en el bot

Variantes

Incidentes Similares

Por similitud de texto

Microsoft's TayBot Allegedly Posts Racist, Sexist, and Anti-Semitic Content to Twitter

Biased Sentiment Analysis

Game AI System Produces Imbalanced Game

Incidentes Similares

Por similitud de texto

Microsoft's TayBot Allegedly Posts Racist, Sexist, and Anti-Semitic Content to Twitter

Biased Sentiment Analysis

Game AI System Produces Imbalanced Game