Journal des citations pour l'incident 357

Description: OpenAI's GPT-2 reportedly memorized and could regurgitate verbatim instances of training data, including personally identifiable information such as names, emails, twitter handles, and phone numbers.

Outils

Nouveau rapportNouveau rapportNouvelle RéponseNouvelle RéponseDécouvrirDécouvrirVoir l'historiqueVoir l'historique
Présumé : Un système d'IA développé et mis en œuvre par OpenAI, endommagé OpenAI and people having personal data in GPT-2's training data.

Statistiques d'incidents

ID
357
Nombre de rapports
3
Date de l'incident
2019-02-14
Editeurs
Khoa Lam
Extraction de données d'entraînement à partir de grands modèles de langage
arxiv.org · 2020

Il est devenu courant de publier de grands modèles de langage (milliards de paramètres) qui ont été entraînés sur des ensembles de données privés. Cet article démontre que dans de tels contextes, un adversaire peut effectuer une attaque d'e…

GPT-2 connaît-il votre numéro de téléphone ?
bair.berkeley.edu · 2020

Préférablement pas. Pourtant, le modèle de langage GPT-2 d'OpenAI sait comment joindre un certain Peter W--- (nom expurgé pour des raisons de confidentialité). Lorsque vous y êtes invité avec un court extrait de texte Internet, le modèle gé…

Que se passe-t-il lorsque votre énorme réseau neuronal générateur de texte commence à cracher les numéros de téléphone des gens ? Si vous êtes OpenAI, vous créez un filtre
theregister.com · 2021

Rapport spécial OpenAI construit un filtre de contenu pour empêcher GPT-3, son dernier et plus grand réseau neuronal générateur de texte, de révéler par inadvertance les informations personnelles des personnes alors qu'il se prépare à comme…

Variantes

Une "Variante" est un incident qui partage les mêmes facteurs de causalité, produit des dommages similaires et implique les mêmes systèmes intelligents qu'un incident d'IA connu. Plutôt que d'indexer les variantes comme des incidents entièrement distincts, nous listons les variations d'incidents sous le premier incident similaire soumis à la base de données. Contrairement aux autres types de soumission à la base de données des incidents, les variantes ne sont pas tenues d'avoir des rapports en preuve externes à la base de données des incidents. En savoir plus sur le document de recherche.

Incidents similaires

Par similarité textuelle

Did our AI mess up? Flag the unrelated incidents