Incident 473: Les invites initiales de Bing Chat révélées par les premiers testeurs grâce à l'injection d'invites

Description:

Les premiers testeurs de Bing Chat ont utilisé avec succès l'injection rapide pour révéler ses instructions initiales intégrées, qui contiennent une liste d'instructions régissant l'interaction de ChatGPT avec les utilisateurs.

Outils

Nouveau rapport Nouvelle Réponse DécouvrirVoir l'historique

Entités

Voir toutes les entités

Alleged: OpenAI developed an AI system deployed by , which harmed Microsoft.

Statistiques d'incidents

473

Nombre de rapports

Date de l'incident

2023-02-08

Editeurs

Khoa Lam

Applied Taxonomies

MIT

Classifications de taxonomie MIT

Machine-Classified

Détails de la taxonomie

Risk Subdomain

2.2. AI system security vulnerabilities and attacks

Risk Domain

Privacy & Security

Entity

Human

Timing

Post-deployment

Intent

Intentional

Rapports d'incidents

Chronologie du rapport

Bing Chat, alimenté par l'IA, dévoile ses secrets via une attaque par injection rapide [Mise à jour]

arstechnica.com

arstechnica.com · 2023

Traduit par IA

Mardi, Microsoft a révélé un moteur de recherche "New Bing" et un bot conversationnel alimenté par la technologie de type ChatGPT d'OpenAI. Mercredi, un étudiant de l'Université de Stanford nommé Kevin Liu a utilisé une attaque par injectio…

Variantes

Une "Variante" est un incident de l'IA similaire à un cas connu—il a les mêmes causes, les mêmes dommages et le même système intelligent. Plutôt que de l'énumérer séparément, nous l'incluons sous le premier incident signalé. Contrairement aux autres incidents, les variantes n'ont pas besoin d'avoir été signalées en dehors de la base de données des incidents. En savoir plus sur le document de recherche.

Vous avez vu quelque chose de similaire ?

Incidents similaires

Par similarité textuelle

Did our AI mess up? Flag the unrelated incidents

Incidents similaires

Par similarité textuelle

Did our AI mess up? Flag the unrelated incidents

Incident 473: Les invites initiales de Bing Chat révélées par les premiers testeurs grâce à l'injection d'invites

Outils

Entités

Statistiques d'incidents

Classifications de taxonomie MIT

Rapports d'incidents

Chronologie du rapport

Bing Chat, alimenté par l'IA, dévoile ses secrets via une attaque par injection rapide [Mise à jour]

Bing Chat, alimenté par l'IA, dévoile ses secrets via une attaque par injection rapide [Mise à jour]

Variantes

Incidents similaires

Par similarité textuelle

Biased Sentiment Analysis

Inappropriate Gmail Smart Reply Suggestions

High-Toxicity Assessed on Text Involving Women and Minority Groups

Incidents similaires

Par similarité textuelle

Biased Sentiment Analysis

Inappropriate Gmail Smart Reply Suggestions

High-Toxicity Assessed on Text Involving Women and Minority Groups