Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
Descubrir
Enviar
  • Bienvenido a la AIID
  • Descubrir Incidentes
  • Vista espacial
  • Vista Tabular
  • Vista de lista
  • Entidades
  • Taxonomías
  • Enviar Informes de Incidentes
  • Ranking de Reportadores
  • Blog
  • Resumen de noticias de IA
  • Control de Riesgos
  • Incidente aleatorio
  • Registrarse
Colapsar
Descubrir
Enviar
  • Bienvenido a la AIID
  • Descubrir Incidentes
  • Vista espacial
  • Vista Tabular
  • Vista de lista
  • Entidades
  • Taxonomías
  • Enviar Informes de Incidentes
  • Ranking de Reportadores
  • Blog
  • Resumen de noticias de IA
  • Control de Riesgos
  • Incidente aleatorio
  • Registrarse
Colapsar

Problema 2394

Incidentes Asociados

Incidente 42011 Reportes
Users Bypassed ChatGPT's Content Filters with Ease

Loading...
Tuit: @spiantado
twitter.com · 2022

Sí, ChatGPT es asombroso e impresionante. No,

@OpenAI

no se ha acercado a abordar el problema del sesgo. Los filtros parecen pasarse por alto con trucos simples y enmascarados superficialmente. Y lo que está al acecho en el interior es atroz.

@Abebab

@sama

dos racismo, sexismo.

no es una casualidad

Algunas personas piensan que hay un contexto de chat que no estoy mostrando. No, ese aviso es todo. Tampoco seguí rehaciendo hasta que mostró esto. Si se negara, le diría que lo vuelva a intentar o modifique la redacción.

Pero no todo el mundo obtiene resultados idénticos (por lo que sé, para casi cualquier indicación)

Para las personas que dicen que obtienen algo más o que esto requiere un contexto especial, aquí tienen. Es cierto que a veces es diferente, una variante o incluso lo contrario, pero los resultados anteriores son típicos sin contexto adicional. Aquí hay un montón de salidas.

Leer la Fuente

Investigación

  • Definición de un “Incidente de IA”
  • Definición de una “Respuesta a incidentes de IA”
  • Hoja de ruta de la base de datos
  • Trabajo relacionado
  • Descargar Base de Datos Completa

Proyecto y Comunidad

  • Acerca de
  • Contactar y Seguir
  • Aplicaciones y resúmenes
  • Guía del editor

Incidencias

  • Todos los incidentes en forma de lista
  • Incidentes marcados
  • Cola de envío
  • Vista de clasificaciones
  • Taxonomías

2024 - AI Incident Database

  • Condiciones de uso
  • Política de privacidad
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • e1b50cd