Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
Descubrir
Enviar
  • Bienvenido a la AIID
  • Descubrir Incidentes
  • Vista espacial
  • Vista Tabular
  • Vista de lista
  • Entidades
  • Taxonomías
  • Enviar Informes de Incidentes
  • Ranking de Reportadores
  • Blog
  • Resumen de noticias de IA
  • Control de Riesgos
  • Incidente aleatorio
  • Registrarse
Colapsar
Descubrir
Enviar
  • Bienvenido a la AIID
  • Descubrir Incidentes
  • Vista espacial
  • Vista Tabular
  • Vista de lista
  • Entidades
  • Taxonomías
  • Enviar Informes de Incidentes
  • Ranking de Reportadores
  • Blog
  • Resumen de noticias de IA
  • Control de Riesgos
  • Incidente aleatorio
  • Registrarse
Colapsar

Incidente 855: Names Linked to Defamation Lawsuits Reportedly Spur Filtering Errors in ChatGPT's Name Recognition

Descripción: ChatGPT has reportedly been experiencing errors and service disruptions caused by hard-coded filters designed to prevent it from producing potentially harmful or defamatory content about certain individuals by blocking prompts containing specific names, likely related to post-training interventions. The reported names are Brian Hood, Jonathan Turley, Jonathan Zittrain, David Faber, David Mayer, and Guido Scorza.
Editor Notes: For the reference to Jonathan Turley, see Incident 506; for Brian Hood, see Incident 507. This incident also presents potential adversarial vulnerabilities, as well as unintended consequences for users sharing affected names.

Herramientas

Nuevo InformeNuevo InformeNueva RespuestaNueva RespuestaDescubrirDescubrirVer HistorialVer Historial

Entidades

Ver todas las entidades
Alleged: OpenAI y ChatGPT developed an AI system deployed by OpenAI y ChatGPT users, which harmed ChatGPT users , Jonathan Zittrain , Jonathan Turley , Guido Scorza , David Mayer , David Faber y Brian Hood.

Estadísticas de incidentes

ID
855
Cantidad de informes
3
Fecha del Incidente
2024-11-30
Editores
Daniel Atherton
Applied Taxonomies
MIT

Clasificaciones de la Taxonomía MIT

Machine-Classified
Detalles de la Taxonomía

Risk Subdomain

A further 23 subdomains create an accessible and understandable classification of hazards and harms associated with AI
 

7.3. Lack of capability or robustness

Risk Domain

The Domain Taxonomy of AI Risks classifies risks into seven AI risk domains: (1) Discrimination & toxicity, (2) Privacy & security, (3) Misinformation, (4) Malicious actors & misuse, (5) Human-computer interaction, (6) Socioeconomic & environmental harms, and (7) AI system safety, failures & limitations.
 
  1. AI system safety, failures, and limitations

Entity

Which, if any, entity is presented as the main cause of the risk
 

AI

Timing

The stage in the AI lifecycle at which the risk is presented as occurring
 

Post-deployment

Intent

Whether the risk is presented as occurring as an expected or unexpected outcome from pursuing a goal
 

Unintentional

Informes del Incidente

Cronología de Informes

Incident OccurrenceCiertos nombres hacen que ChatGPT se detenga, y sabemos por qué¿Por qué ChatGPT no decía el nombre de este profesor muerto?El misterio de por qué ChatGPT no pudo pronunciar el nombre de “David Mayer”
Ciertos nombres hacen que ChatGPT se detenga, y sabemos por qué

Ciertos nombres hacen que ChatGPT se detenga, y sabemos por qué

arstechnica.com

¿Por qué ChatGPT no decía el nombre de este profesor muerto?

¿Por qué ChatGPT no decía el nombre de este profesor muerto?

nytimes.com

El misterio de por qué ChatGPT no pudo pronunciar el nombre de “David Mayer”

El misterio de por qué ChatGPT no pudo pronunciar el nombre de “David Mayer”

wsj.com

Ciertos nombres hacen que ChatGPT se detenga, y sabemos por qué
arstechnica.com · 2024
Traducido por IA

El ChatGPT de OpenAI es más que un modelo de lenguaje de IA con una interfaz elegante. Es un sistema que consta de una pila de modelos de IA y filtros de contenido que garantizan que sus resultados no avergüencen a OpenAI ni metan a la empr…

¿Por qué ChatGPT no decía el nombre de este profesor muerto?
nytimes.com · 2024
Traducido por IA

Durante los últimos años de su vida, David Mayer, un profesor de teatro que vivía en Manchester, Inglaterra, se enfrentó a las consecuencias en cascada de una desafortunada coincidencia: un rebelde checheno muerto que figuraba en una lista …

El misterio de por qué ChatGPT no pudo pronunciar el nombre de “David Mayer”
wsj.com · 2024
Traducido por IA

David Mayer no era un nombre particularmente conocido hasta la semana pasada, cuando saltó a la fama en Internet. La razón no fue nada que una persona llamada David Mayer dijera o hiciera, sino más bien la forma en que el chatbot generativo…

Variantes

Una "Variante" es un incidente que comparte los mismos factores causales, produce daños similares e involucra los mismos sistemas inteligentes que un incidente de IA conocido. En lugar de indexar las variantes como incidentes completamente separados, enumeramos las variaciones de los incidentes bajo el primer incidente similar enviado a la base de datos. A diferencia de otros tipos de envío a la base de datos de incidentes, no se requiere que las variantes tengan informes como evidencia externa a la base de datos de incidentes. Obtenga más información del trabajo de investigación.

Incidentes Similares

Selected by our editors
ChatGPT Erroneously Alleged Mayor Served Prison Time for Bribery

Australian mayor readies world's first defamation lawsuit over ChatGPT content

Mar 2023 · 2 informes
ChatGPT Allegedly Produced False Accusation of Sexual Harassment

ChatGPT sometimes makes up facts. For one law prof, it went too far.

Mar 2023 · 3 informes
Por similitud de texto

Did our AI mess up? Flag the unrelated incidents

Biased Sentiment Analysis

Google's sentiment analysis API is just as biased as humans

Oct 2017 · 7 informes
High-Toxicity Assessed on Text Involving Women and Minority Groups

Google’s comment-ranking system will be a hit with the alt-right

Feb 2017 · 9 informes
Inappropriate Gmail Smart Reply Suggestions

Computer, respond to this email: Introducing Smart Reply in Inbox by Gmail

Nov 2015 · 22 informes
Incidente AnteriorSiguiente Incidente

Incidentes Similares

Selected by our editors
ChatGPT Erroneously Alleged Mayor Served Prison Time for Bribery

Australian mayor readies world's first defamation lawsuit over ChatGPT content

Mar 2023 · 2 informes
ChatGPT Allegedly Produced False Accusation of Sexual Harassment

ChatGPT sometimes makes up facts. For one law prof, it went too far.

Mar 2023 · 3 informes
Por similitud de texto

Did our AI mess up? Flag the unrelated incidents

Biased Sentiment Analysis

Google's sentiment analysis API is just as biased as humans

Oct 2017 · 7 informes
High-Toxicity Assessed on Text Involving Women and Minority Groups

Google’s comment-ranking system will be a hit with the alt-right

Feb 2017 · 9 informes
Inappropriate Gmail Smart Reply Suggestions

Computer, respond to this email: Introducing Smart Reply in Inbox by Gmail

Nov 2015 · 22 informes

Investigación

  • Definición de un “Incidente de IA”
  • Definición de una “Respuesta a incidentes de IA”
  • Hoja de ruta de la base de datos
  • Trabajo relacionado
  • Descargar Base de Datos Completa

Proyecto y Comunidad

  • Acerca de
  • Contactar y Seguir
  • Aplicaciones y resúmenes
  • Guía del editor

Incidencias

  • Todos los incidentes en forma de lista
  • Incidentes marcados
  • Cola de envío
  • Vista de clasificaciones
  • Taxonomías

2024 - AI Incident Database

  • Condiciones de uso
  • Política de privacidad
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • ecd56df