Incident 352: Un robot Twitter basé sur GPT-3 détourné à l'aide d'attaques par injection rapide

Description:

Le bot Twitter basé sur GPT-3 de Remoteli.io a été montré comme étant détourné par des utilisateurs de Twitter qui le redirigeaient pour répéter ou générer des phrases.

Outils

Nouveau rapport Nouvelle Réponse DécouvrirVoir l'historique

Entités

Voir toutes les entités

Alleged: OpenAI developed an AI system deployed by , which harmed Stephan de Vries.

Statistiques d'incidents

352

Nombre de rapports

Date de l'incident

2022-09-15

Editeurs

Khoa Lam

Applied Taxonomies

MIT

Classifications de taxonomie MIT

Machine-Classified

Détails de la taxonomie

Risk Subdomain

2.2. AI system security vulnerabilities and attacks

Risk Domain

Privacy & Security

Entity

Human

Timing

Post-deployment

Intent

Intentional

Rapports d'incidents

Chronologie du rapport

Évaluation de la sensibilité des modèles de langage pré-formés via des exemples contradictoires fabriqués à la main

arxiv.org

Attaques par injection rapide contre le GPT-3

simonwillison.net

Les farceurs de Twitter font dérailler le bot GPT-3 avec un piratage "d'injection rapide" récemment découvert

arstechnica.com

L'attaque "d'injection rapide" de GPT-3 cause de mauvaises manières aux bots

theregister.com

arxiv.org · 2022

Traduit par IA

Les progrès récents dans le développement de grands modèles de langage ont permis au public d'accéder à des modèles de langage pré-formés (PLM) de pointe, y compris Generative Pre-trained Transformer 3 (GPT-3) et les représentations d'encod…

simonwillison.net · 2022

Traduit par IA

Riley Goodside, hier:

Exploiter les invites GPT-3 avec des entrées malveillantes qui ordonnent au modèle d'ignorer ses directions précédentes. pic.twitter.com/I0NVr9LOJq

- Riley Goodside (@goodside) 12 septembre 2022

Riley a fourni plusie…

arstechnica.com · 2022

Traduit par IA

Jeudi, quelques utilisateurs de Twitter ont découvert comment détourner un tweet bot automatisé, dédié aux travaux à distance, fonctionnant sur le [GPT-3](https:/ /en.wikipedia.org/wiki/GPT-3) modèle de langage par OpenAI. En utilisant une …

theregister.com · 2022

Traduit par IA

En bref Le populaire modèle de langage naturel GPT-3 d'OpenAI a un problème : il peut être trompé pour qu'il se comporte mal en faisant un peu plus que lui dire d'ignorer ses commandes précédentes.

Découvert par Riley Goodside, spécialiste …

Variantes

Une "Variante" est un incident de l'IA similaire à un cas connu—il a les mêmes causes, les mêmes dommages et le même système intelligent. Plutôt que de l'énumérer séparément, nous l'incluons sous le premier incident signalé. Contrairement aux autres incidents, les variantes n'ont pas besoin d'avoir été signalées en dehors de la base de données des incidents. En savoir plus sur le document de recherche.

Vous avez vu quelque chose de similaire ?

Incidents similaires

Par similarité textuelle

Did our AI mess up? Flag the unrelated incidents

Microsoft's TayBot Allegedly Posts Racist, Sexist, and Anti-Semitic Content to Twitter

Incidents similaires

Par similarité textuelle

Did our AI mess up? Flag the unrelated incidents

Incident 352: Un robot Twitter basé sur GPT-3 détourné à l'aide d'attaques par injection rapide

Outils

Entités

Statistiques d'incidents

Classifications de taxonomie MIT

Rapports d'incidents

Chronologie du rapport

Évaluation de la sensibilité des modèles de langage pré-formés via des exemples contradictoires fabriqués à la main

Attaques par injection rapide contre le GPT-3

Les farceurs de Twitter font dérailler le bot GPT-3 avec un piratage "d'injection rapide" récemment découvert

L'attaque "d'injection rapide" de GPT-3 cause de mauvaises manières aux bots

Évaluation de la sensibilité des modèles de langage pré-formés via des exemples contradictoires fabriqués à la main

Attaques par injection rapide contre le GPT-3

Les farceurs de Twitter font dérailler le bot GPT-3 avec un piratage "d'injection rapide" récemment découvert

L'attaque "d'injection rapide" de GPT-3 cause de mauvaises manières aux bots

Variantes

Incidents similaires

Par similarité textuelle

Microsoft's TayBot Allegedly Posts Racist, Sexist, and Anti-Semitic Content to Twitter

Biased Sentiment Analysis

Game AI System Produces Imbalanced Game

Incidents similaires

Par similarité textuelle

Microsoft's TayBot Allegedly Posts Racist, Sexist, and Anti-Semitic Content to Twitter

Biased Sentiment Analysis

Game AI System Produces Imbalanced Game