Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
Descubrir
Enviar
  • Bienvenido a la AIID
  • Descubrir Incidentes
  • Vista espacial
  • Vista Tabular
  • Vista de lista
  • Entidades
  • Taxonomías
  • Enviar Informes de Incidentes
  • Ranking de Reportadores
  • Blog
  • Resumen de noticias de IA
  • Control de Riesgos
  • Incidente aleatorio
  • Registrarse
Colapsar
Descubrir
Enviar
  • Bienvenido a la AIID
  • Descubrir Incidentes
  • Vista espacial
  • Vista Tabular
  • Vista de lista
  • Entidades
  • Taxonomías
  • Enviar Informes de Incidentes
  • Ranking de Reportadores
  • Blog
  • Resumen de noticias de IA
  • Control de Riesgos
  • Incidente aleatorio
  • Registrarse
Colapsar

Incidente 356: Philosophy AI Tentatively Produced Offensive Results for Certain Prompts

Descripción: Philosopher AI as built on top of GPT-3 was reported by its users for having strong tendencies to produce offensive results when given prompts on certain topics such as feminism and Ethiopia.

Herramientas

Nuevo InformeNuevo InformeNueva RespuestaNueva RespuestaDescubrirDescubrirVer HistorialVer Historial

Entidades

Ver todas las entidades
Alleged: Murat Ayfer y OpenAI developed an AI system deployed by Murat Ayfer, which harmed historically disadvantaged groups.

Estadísticas de incidentes

ID
356
Cantidad de informes
2
Fecha del Incidente
2020-09-15
Editores
Khoa Lam
Applied Taxonomies
MIT

Clasificaciones de la Taxonomía MIT

Machine-Classified
Detalles de la Taxonomía

Risk Subdomain

A further 23 subdomains create an accessible and understandable classification of hazards and harms associated with AI
 

1.2. Exposure to toxic content

Risk Domain

The Domain Taxonomy of AI Risks classifies risks into seven AI risk domains: (1) Discrimination & toxicity, (2) Privacy & security, (3) Misinformation, (4) Malicious actors & misuse, (5) Human-computer interaction, (6) Socioeconomic & environmental harms, and (7) AI system safety, failures & limitations.
 
  1. Discrimination and Toxicity

Entity

Which, if any, entity is presented as the main cause of the risk
 

AI

Timing

The stage in the AI lifecycle at which the risk is presented as occurring
 

Post-deployment

Intent

Whether the risk is presented as occurring as an expected or unexpected outcome from pursuing a goal
 

Unintentional

Informes del Incidente

Cronología de Informes

Incident OccurrenceTuit: @Abebab¡GPT-3 de OpenAI habla! (Ignore amablemente el lenguaje tóxico)
Tuit: @Abebab

Tuit: @Abebab

twitter.com

¡GPT-3 de OpenAI habla! (Ignore amablemente el lenguaje tóxico)

¡GPT-3 de OpenAI habla! (Ignore amablemente el lenguaje tóxico)

spectrum.ieee.org

Tuit: @Abebab
twitter.com · 2020
Traducido por IA

Cada evangelista tecnológico: #GPT3 proporciona un punto de vista profundo y matizado

Yo: GPT-3, generar un texto filosófico sobre Etiopía

GPT-3 escupe un texto groseramente racista y erróneo en cuanto a los hechos que retrata una percepció…

¡GPT-3 de OpenAI habla! (Ignore amablemente el lenguaje tóxico)
spectrum.ieee.org · 2021
Traducido por IA

En septiembre pasado, un científico de datos llamado Vinay Prabhu estaba jugando con una aplicación llamada Philosopher AI. La aplicación brinda acceso al sistema de inteligencia artificial conocido como GPT-3, que tiene capacidades increíb…

Variantes

Una "Variante" es un incidente que comparte los mismos factores causales, produce daños similares e involucra los mismos sistemas inteligentes que un incidente de IA conocido. En lugar de indexar las variantes como incidentes completamente separados, enumeramos las variaciones de los incidentes bajo el primer incidente similar enviado a la base de datos. A diferencia de otros tipos de envío a la base de datos de incidentes, no se requiere que las variantes tengan informes como evidencia externa a la base de datos de incidentes. Obtenga más información del trabajo de investigación.

Incidentes Similares

Selected by our editors
Korean Chatbot Luda Made Offensive Remarks towards Minority Groups

AI chatbot mired in legal dispute over data collection

Dec 2020 · 13 informes
High-Toxicity Assessed on Text Involving Women and Minority Groups

Google’s comment-ranking system will be a hit with the alt-right

Feb 2017 · 9 informes
Incidente AnteriorSiguiente Incidente

Incidentes Similares

Selected by our editors
Korean Chatbot Luda Made Offensive Remarks towards Minority Groups

AI chatbot mired in legal dispute over data collection

Dec 2020 · 13 informes
High-Toxicity Assessed on Text Involving Women and Minority Groups

Google’s comment-ranking system will be a hit with the alt-right

Feb 2017 · 9 informes

Investigación

  • Definición de un “Incidente de IA”
  • Definición de una “Respuesta a incidentes de IA”
  • Hoja de ruta de la base de datos
  • Trabajo relacionado
  • Descargar Base de Datos Completa

Proyecto y Comunidad

  • Acerca de
  • Contactar y Seguir
  • Aplicaciones y resúmenes
  • Guía del editor

Incidencias

  • Todos los incidentes en forma de lista
  • Incidentes marcados
  • Cola de envío
  • Vista de clasificaciones
  • Taxonomías

2024 - AI Incident Database

  • Condiciones de uso
  • Política de privacidad
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • ecd56df