Incident 357: GPT-2 capable de réciter des informations personnelles identifiables dans les données de formation

Description:

Selon certaines informations, le GPT-2 d'OpenAI mémoriserait et pourrait régurgiter des instances textuelles de données de formation, y compris des informations personnellement identifiables telles que des noms, des e-mails, des identifiants Twitter et des numéros de téléphone.

Outils

Nouveau rapport Nouvelle Réponse DécouvrirVoir l'historique

Entités

Voir toutes les entités

Présumé : Un système d'IA développé et mis en œuvre par OpenAI, a endommagé OpenAI et people having personal data in GPT-2's training data.

Statistiques d'incidents

357

Nombre de rapports

Date de l'incident

2019-02-14

Editeurs

Khoa Lam

Applied Taxonomies

MIT

Classifications de taxonomie MIT

Machine-Classified

Détails de la taxonomie

Risk Subdomain

2.1. Compromise of privacy by obtaining, leaking or correctly inferring sensitive information

Risk Domain

Privacy & Security

Entity

Timing

Post-deployment

Intent

Unintentional

Rapports d'incidents

Chronologie du rapport

Extraction de données d'entraînement à partir de grands modèles de langage

arxiv.org

GPT-2 connaît-il votre numéro de téléphone ?

bair.berkeley.edu

Que se passe-t-il lorsque votre énorme réseau neuronal générateur de texte commence à cracher les numéros de téléphone des gens ? Si vous êtes OpenAI, vous créez un filtre

theregister.com

arxiv.org · 2020

Traduit par IA

Il est devenu courant de publier de grands modèles de langage (milliards de paramètres) qui ont été entraînés sur des ensembles de données privés. Cet article démontre que dans de tels contextes, un adversaire peut effectuer une attaque d'e…

bair.berkeley.edu · 2020

Traduit par IA

Préférablement pas. Pourtant, le modèle de langage GPT-2 d'OpenAI sait comment joindre un certain Peter W--- (nom expurgé pour des raisons de confidentialité). Lorsque vous y êtes invité avec un court extrait de texte Internet, le modèle gé…

theregister.com · 2021

Traduit par IA

Rapport spécial OpenAI construit un filtre de contenu pour empêcher GPT-3, son dernier et plus grand réseau neuronal générateur de texte, de révéler par inadvertance les informations personnelles des personnes alors qu'il se prépare à comme…

Variantes

Une "Variante" est un incident de l'IA similaire à un cas connu—il a les mêmes causes, les mêmes dommages et le même système intelligent. Plutôt que de l'énumérer séparément, nous l'incluons sous le premier incident signalé. Contrairement aux autres incidents, les variantes n'ont pas besoin d'avoir été signalées en dehors de la base de données des incidents. En savoir plus sur le document de recherche.

Vous avez vu quelque chose de similaire ?

Incidents similaires

Par similarité textuelle

Did our AI mess up? Flag the unrelated incidents

OpenAI's GPT-3 Associated Muslims with Violence

Incidents similaires

Par similarité textuelle

Did our AI mess up? Flag the unrelated incidents

Incident 357: GPT-2 capable de réciter des informations personnelles identifiables dans les données de formation

Outils

Entités

Statistiques d'incidents

Classifications de taxonomie MIT

Rapports d'incidents

Chronologie du rapport

Extraction de données d'entraînement à partir de grands modèles de langage

GPT-2 connaît-il votre numéro de téléphone ?

Que se passe-t-il lorsque votre énorme réseau neuronal générateur de texte commence à cracher les numéros de téléphone des gens ? Si vous êtes OpenAI, vous créez un filtre

Extraction de données d'entraînement à partir de grands modèles de langage

GPT-2 connaît-il votre numéro de téléphone ?

Que se passe-t-il lorsque votre énorme réseau neuronal générateur de texte commence à cracher les numéros de téléphone des gens ? Si vous êtes OpenAI, vous créez un filtre

Variantes

Incidents similaires

Par similarité textuelle

OpenAI's GPT-3 Associated Muslims with Violence

High-Toxicity Assessed on Text Involving Women and Minority Groups

Gender Biases in Google Translate

Incidents similaires

Par similarité textuelle

OpenAI's GPT-3 Associated Muslims with Violence

High-Toxicity Assessed on Text Involving Women and Minority Groups

Gender Biases in Google Translate