Incidente 473: Los primeros probadores revelaron los mensajes iniciales de Bing Chat mediante la inyección de mensajes

Descripción:

Los primeros evaluadores de Bing Chat utilizaron con éxito la inyección de indicaciones para revelar sus instrucciones iniciales integradas, que contienen una lista de declaraciones que rigen la interacción de ChatGPT con los usuarios.

Herramientas

Nuevo Informe Nueva Respuesta DescubrirVer Historial

Entidades

Ver todas las entidades

Alleged: OpenAI developed an AI system deployed by , which harmed Microsoft.

Estadísticas de incidentes

473

Cantidad de informes

Fecha del Incidente

2023-02-08

Editores

Khoa Lam

Applied Taxonomies

MIT

Clasificaciones de la Taxonomía MIT

Machine-Classified

Detalles de la Taxonomía

Risk Subdomain

2.2. AI system security vulnerabilities and attacks

Risk Domain

Privacy & Security

Entity

Human

Timing

Post-deployment

Intent

Intentional

Informes del Incidente

Cronología de Informes

Bing Chat impulsado por IA revela sus secretos a través de un ataque de inyección rápida [Actualizado]

arstechnica.com

arstechnica.com · 2023

Traducido por IA

El martes, Microsoft reveló un motor de búsqueda "Nuevo Bing" y un bot conversacional con tecnología similar a ChatGPT de OpenAI. El miércoles, un estudiante de la Universidad de Stanford llamado Kevin Liu utilizó un ataque de inyección ráp…

Variantes

Una "Variante" es un incidente de IA similar a un caso conocido—tiene los mismos causantes, daños y sistema de IA. En lugar de enumerarlo por separado, lo agrupamos bajo el primer incidente informado. A diferencia de otros incidentes, las variantes no necesitan haber sido informadas fuera de la AIID. Obtenga más información del trabajo de investigación.

¿Has visto algo similar?

Incidentes Similares

Por similitud de texto

Did our AI mess up? Flag the unrelated incidents

Incidentes Similares

Por similitud de texto

Did our AI mess up? Flag the unrelated incidents

Incidente 473: Los primeros probadores revelaron los mensajes iniciales de Bing Chat mediante la inyección de mensajes

Herramientas

Entidades

Estadísticas de incidentes

Clasificaciones de la Taxonomía MIT

Informes del Incidente

Cronología de Informes

Bing Chat impulsado por IA revela sus secretos a través de un ataque de inyección rápida [Actualizado]

Bing Chat impulsado por IA revela sus secretos a través de un ataque de inyección rápida [Actualizado]

Variantes

Incidentes Similares

Por similitud de texto

Biased Sentiment Analysis

Inappropriate Gmail Smart Reply Suggestions

High-Toxicity Assessed on Text Involving Women and Minority Groups

Incidentes Similares

Por similitud de texto

Biased Sentiment Analysis

Inappropriate Gmail Smart Reply Suggestions

High-Toxicity Assessed on Text Involving Women and Minority Groups