Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer

Incident 352: GPT-3-Based Twitter Bot Hijacked Using Prompt Injection Attacks

Description: Remoteli.io's GPT-3-based Twitter bot was shown being hijacked by Twitter users who redirected it to repeat or generate any phrases.

Outils

Nouveau rapportNouveau rapportNouvelle RéponseNouvelle RéponseDécouvrirDécouvrirVoir l'historiqueVoir l'historique

Entités

Voir toutes les entités
Alleged: OpenAI developed an AI system deployed by , which harmed Stephan de Vries.

Statistiques d'incidents

ID
352
Nombre de rapports
4
Date de l'incident
2022-09-15
Editeurs
Khoa Lam
Applied Taxonomies
MIT

Classifications de taxonomie MIT

Machine-Classified
Détails de la taxonomie

Risk Subdomain

A further 23 subdomains create an accessible and understandable classification of hazards and harms associated with AI
 

2.2. AI system security vulnerabilities and attacks

Risk Domain

The Domain Taxonomy of AI Risks classifies risks into seven AI risk domains: (1) Discrimination & toxicity, (2) Privacy & security, (3) Misinformation, (4) Malicious actors & misuse, (5) Human-computer interaction, (6) Socioeconomic & environmental harms, and (7) AI system safety, failures & limitations.
 
  1. Privacy & Security

Entity

Which, if any, entity is presented as the main cause of the risk
 

Human

Timing

The stage in the AI lifecycle at which the risk is presented as occurring
 

Post-deployment

Intent

Whether the risk is presented as occurring as an expected or unexpected outcome from pursuing a goal
 

Intentional

Rapports d'incidents

Chronologie du rapport

Évaluation de la sensibilité des modèles de langage pré-formés via des exemples contradictoires fabriqués à la mainAttaques par injection rapide contre le GPT-3Incident OccurrenceLes farceurs de Twitter font dérailler le bot GPT-3 avec un piratage "d'injection rapide" récemment découvertL'attaque "d'injection rapide" de GPT-3 cause de mauvaises manières aux bots
Évaluation de la sensibilité des modèles de langage pré-formés via des exemples contradictoires fabriqués à la main

Évaluation de la sensibilité des modèles de langage pré-formés via des exemples contradictoires fabriqués à la main

arxiv.org

Attaques par injection rapide contre le GPT-3

Attaques par injection rapide contre le GPT-3

simonwillison.net

Les farceurs de Twitter font dérailler le bot GPT-3 avec un piratage "d'injection rapide" récemment découvert

Les farceurs de Twitter font dérailler le bot GPT-3 avec un piratage "d'injection rapide" récemment découvert

arstechnica.com

L'attaque "d'injection rapide" de GPT-3 cause de mauvaises manières aux bots

L'attaque "d'injection rapide" de GPT-3 cause de mauvaises manières aux bots

theregister.com

Évaluation de la sensibilité des modèles de langage pré-formés via des exemples contradictoires fabriqués à la main
arxiv.org · 2022
Traduit par IA

Les progrès récents dans le développement de grands modèles de langage ont permis au public d'accéder à des modèles de langage pré-formés (PLM) de pointe, y compris Generative Pre-trained Transformer 3 (GPT-3) et les représentations d'encod…

Attaques par injection rapide contre le GPT-3
simonwillison.net · 2022
Traduit par IA

Riley Goodside, hier:

Exploiter les invites GPT-3 avec des entrées malveillantes qui ordonnent au modèle d'ignorer ses directions précédentes. pic.twitter.com/I0NVr9LOJq

- Riley Goodside (@goodside) 12 septembre 2022

Riley a fourni plusie…

Les farceurs de Twitter font dérailler le bot GPT-3 avec un piratage "d'injection rapide" récemment découvert
arstechnica.com · 2022
Traduit par IA

Jeudi, quelques utilisateurs de Twitter ont découvert comment détourner un tweet bot automatisé, dédié aux travaux à distance, fonctionnant sur le [GPT-3](https:/ /en.wikipedia.org/wiki/GPT-3) modèle de langage par OpenAI. En utilisant une …

L'attaque "d'injection rapide" de GPT-3 cause de mauvaises manières aux bots
theregister.com · 2022
Traduit par IA

En bref Le populaire modèle de langage naturel GPT-3 d'OpenAI a un problème : il peut être trompé pour qu'il se comporte mal en faisant un peu plus que lui dire d'ignorer ses commandes précédentes.

Découvert par Riley Goodside, spécialiste …

Variantes

Une "Variante" est un incident qui partage les mêmes facteurs de causalité, produit des dommages similaires et implique les mêmes systèmes intelligents qu'un incident d'IA connu. Plutôt que d'indexer les variantes comme des incidents entièrement distincts, nous listons les variations d'incidents sous le premier incident similaire soumis à la base de données. Contrairement aux autres types de soumission à la base de données des incidents, les variantes ne sont pas tenues d'avoir des rapports en preuve externes à la base de données des incidents. En savoir plus sur le document de recherche.

Incidents similaires

Par similarité textuelle

Did our AI mess up? Flag the unrelated incidents

TayBot

Danger, danger! 10 alarming examples of AI gone wild

Mar 2016 · 28 rapports
Biased Sentiment Analysis

Google's sentiment analysis API is just as biased as humans

Oct 2017 · 7 rapports
Game AI System Produces Imbalanced Game

6 goof-ups that show AI is still in its diapers

Jun 2016 · 11 rapports
Incident précédentProchain incident

Incidents similaires

Par similarité textuelle

Did our AI mess up? Flag the unrelated incidents

TayBot

Danger, danger! 10 alarming examples of AI gone wild

Mar 2016 · 28 rapports
Biased Sentiment Analysis

Google's sentiment analysis API is just as biased as humans

Oct 2017 · 7 rapports
Game AI System Produces Imbalanced Game

6 goof-ups that show AI is still in its diapers

Jun 2016 · 11 rapports

Recherche

  • Définition d'un « incident d'IA »
  • Définir une « réponse aux incidents d'IA »
  • Feuille de route de la base de données
  • Travaux connexes
  • Télécharger la base de données complète

Projet et communauté

  • À propos de
  • Contacter et suivre
  • Applications et résumés
  • Guide de l'éditeur

Incidents

  • Tous les incidents sous forme de liste
  • Incidents signalés
  • File d'attente de soumission
  • Affichage des classifications
  • Taxonomies

2024 - AI Incident Database

  • Conditions d'utilisation
  • Politique de confidentialité
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • ecd56df