Journal des citations pour l'incident 352

Description: Remoteli.io's GPT-3-based Twitter bot was shown being hijacked by Twitter users who redirected it to repeat or generate any phrases.

Outils

Nouveau rapportNouveau rapportNouvelle RéponseNouvelle RéponseDécouvrirDécouvrirVoir l'historiqueVoir l'historique
Présumé : un système d'IA développé par OpenAI et mis en œuvre par , endommagé Stephan de Vries.

Statistiques d'incidents

ID
352
Nombre de rapports
4
Date de l'incident
2022-09-15
Editeurs
Khoa Lam
Évaluation de la sensibilité des modèles de langage pré-formés via des exemples contradictoires fabriqués à la main
arxiv.org · 2022

Les progrès récents dans le développement de grands modèles de langage ont permis au public d'accéder à des modèles de langage pré-formés (PLM) de pointe, y compris Generative Pre-trained Transformer 3 (GPT-3) et les représentations d'encod…

Attaques par injection rapide contre le GPT-3
simonwillison.net · 2022

Riley Goodside, hier:

Exploiter les invites GPT-3 avec des entrées malveillantes qui ordonnent au modèle d'ignorer ses directions précédentes. pic.twitter.com/I0NVr9LOJq

- Riley Goodside (@goodside) 12 septembre 2022

Riley a fourni plusie…

Les farceurs de Twitter font dérailler le bot GPT-3 avec un piratage "d'injection rapide" récemment découvert
arstechnica.com · 2022

Jeudi, quelques utilisateurs de Twitter ont découvert comment détourner un tweet bot automatisé, dédié aux travaux à distance, fonctionnant sur le [GPT-3](https:/ /en.wikipedia.org/wiki/GPT-3) modèle de langage par OpenAI. En utilisant une …

L'attaque "d'injection rapide" de GPT-3 cause de mauvaises manières aux bots
theregister.com · 2022

En bref Le populaire modèle de langage naturel GPT-3 d'OpenAI a un problème : il peut être trompé pour qu'il se comporte mal en faisant un peu plus que lui dire d'ignorer ses commandes précédentes.

Découvert par Riley Goodside, spécialiste …

Variantes

Une "Variante" est un incident qui partage les mêmes facteurs de causalité, produit des dommages similaires et implique les mêmes systèmes intelligents qu'un incident d'IA connu. Plutôt que d'indexer les variantes comme des incidents entièrement distincts, nous listons les variations d'incidents sous le premier incident similaire soumis à la base de données. Contrairement aux autres types de soumission à la base de données des incidents, les variantes ne sont pas tenues d'avoir des rapports en preuve externes à la base de données des incidents. En savoir plus sur le document de recherche.

Incidents similaires

Par similarité textuelle

Did our AI mess up? Flag the unrelated incidents