Registro de citas para el Incidente 420

Description: Users reported bypassing ChatGPT's content and keyword filters with relative ease using various methods such as prompt injection or creating personas to produce biased associations or generate harmful content.

Herramientas

Nuevo InformeNuevo InformeNueva RespuestaNueva RespuestaDescubrirDescubrirVer HistorialVer Historial
Presunto: un sistema de IA desarrollado e implementado por OpenAI, perjudicó a OpenAI y ChatGPT users.

Estadísticas de incidentes

ID
420
Cantidad de informes
11
Fecha del Incidente
2022-11-30
Editores
Khoa Lam
Tuit: @spiantado
twitter.com · 2022

Sí, ChatGPT es asombroso e impresionante. No,

@OpenAI

no se ha acercado a abordar el problema del sesgo. Los filtros parecen pasarse por alto con trucos simples y enmascarados superficialmente. Y lo que está al acecho en el interior es atro…

Probando formas de eludir las funciones de seguridad de ChatGPT
lesswrong.com · 2022

La semana pasada, OpenAI lanzó ChatGPT, que describen como un modelo “que interactúa de forma conversacional”. E incluso tenía características de seguridad limitadas, como negarse a decirle cómo conectar un automóvil, aunque admiten que ten…

El impresionante nuevo chatbot de OpenAI no es inmune al racismo
thedailybeast.com · 2022

“El último modelo de lenguaje de OpenAI, ChatGPT, está causando sensación en el mundo de la IA conversacional. Con su capacidad para generar texto similar al humano basado en las entradas de los usuarios, ChatGPT tiene el potencial de revol…

La nueva IA favorita de Internet propone torturar iraníes y vigilar mezquitas
theintercept.com · 2022

Los nuevos avances sensacionales de aprendizaje automático parecen barrer nuestros feeds de Twitter todos los días. Apenas tenemos tiempo para decidir si el software que puede conjurar instantáneamente una imagen de Sonic the Hedgehog dirig…

OpenAI Chatbot escupe reflexiones sesgadas, a pesar de las medidas de seguridad
bloomberg.com · 2022

Hola, soy Davey Alba, un reportero de tecnología en Nueva York, aquí para profundizar en cómo su nuevo chatbot con tecnología de inteligencia artificial favorito viene con un bagaje sesgado. Pero primero...

Las noticias imprescindibles de e…

ChatGPT demuestra que la IA todavía tiene un problema de racismo
newstatesman.com · 2022

El inteligencia artificial (AI) chatbot ChatGPT es una tecnología asombrosa. No es de extrañar por qué se ha vuelto viral desde su lanzamiento el 30 de noviembre. Si se le hace una pregunta al chatbot en lenguaje natural, responde instantán…

ChatGPT bot engañado para dar instrucciones para fabricar bombas, dicen los desarrolladores
thetimes.co.uk · 2022

Un programa de inteligencia artificial que ha sorprendido a los usuarios escribiendo ensayos, poemas y código de computadora a pedido también puede ser engañado para dar consejos sobre cómo construir bombas y robar autos, se ha afirmado.

Má…

ChatGPT podría usarse para bien, pero como muchos otros modelos de IA, está plagado de prejuicios racistas y discriminatorios.
insider.com · 2023

ChatGPT, el chatbot de inteligencia artificial que genera respuestas de texto con un sonido inquietantemente humano, es la cara nueva y avanzada del debate sobre el potencial y los peligros de la IA.

La tecnología tiene la capacidad de ayud…

Conoce al gemelo malvado de ChatGPT, DAN
washingtonpost.com · 2023

Pídele a ChatGPT que opine sobre Adolf Hitler y probablemente objetará, diciendo que no tiene opiniones personales o citando sus reglas contra la producción de discursos de odio. El creador del bot conversacional tremendamente popular, la e…

ChatGPT generó abuso sexual infantil cuando se le pidió que escribiera escenarios BDSM
vice.com · 2023

ChatGPT se puede manipular para crear contenido que vaya en contra de las reglas de OpenAI. Comunidades han surgido en torno al objetivo de "jailbreaking" el bot para escribir lo que el usuario quiera.

Una estrategia de incitación contradic…

Engatusé a ChatGPT para que tuviera una relación BDSM profundamente inquietante
vice.com · 2023

ChatGPT es un chatbot, ensayista y guionista convincente, pero también es una fuente de depravación sin límites, si lo engañas para que rompa las reglas.

A primera vista, ChatGPT de OpenAI parece tener pautas más estrictas que otros chatbot…

Variantes

Una "Variante" es un incidente que comparte los mismos factores causales, produce daños similares e involucra los mismos sistemas inteligentes que un incidente de IA conocido. En lugar de indexar las variantes como incidentes completamente separados, enumeramos las variaciones de los incidentes bajo el primer incidente similar enviado a la base de datos. A diferencia de otros tipos de envío a la base de datos de incidentes, no se requiere que las variantes tengan informes como evidencia externa a la base de datos de incidentes. Obtenga más información del trabajo de investigación.