Registro de citas para el Incidente 357

Description: OpenAI's GPT-2 reportedly memorized and could regurgitate verbatim instances of training data, including personally identifiable information such as names, emails, twitter handles, and phone numbers.

Herramientas

Nuevo InformeNuevo InformeNueva RespuestaNueva RespuestaDescubrirDescubrirVer HistorialVer Historial
Presunto: un sistema de IA desarrollado e implementado por OpenAI, perjudicó a OpenAI y people having personal data in GPT-2's training data.

Estadísticas de incidentes

ID
357
Cantidad de informes
3
Fecha del Incidente
2019-02-14
Editores
Khoa Lam
Extracción de datos de entrenamiento de modelos de lenguaje grandes
arxiv.org · 2020

Se ha vuelto común publicar grandes modelos de lenguaje (mil millones de parámetros) que han sido entrenados en conjuntos de datos privados. Este documento demuestra que en tales entornos, un adversario puede realizar un ataque de extracció…

¿GPT-2 sabe su número de teléfono?
bair.berkeley.edu · 2020

Probablemente no. Sin embargo, el [modelo de lenguaje GPT-2] de OpenAI (https://openai.com/blog/better-language-models/) sabe cómo comunicarse con un tal Peter W--- (nombre redactado por motivos de privacidad). Cuando se le solicita un b…

¿Qué sucede cuando su red neuronal masiva de generación de texto comienza a escupir los números de teléfono de las personas? Si eres OpenAI, creas un filtro
theregister.com · 2021

Informe especial OpenAI está creando un filtro de contenido para evitar que GPT-3, su última y más grande red neuronal generadora de texto, revele inadvertidamente la información personal de las personas mientras se prepara para comercializ…

Variantes

Una "Variante" es un incidente que comparte los mismos factores causales, produce daños similares e involucra los mismos sistemas inteligentes que un incidente de IA conocido. En lugar de indexar las variantes como incidentes completamente separados, enumeramos las variaciones de los incidentes bajo el primer incidente similar enviado a la base de datos. A diferencia de otros tipos de envío a la base de datos de incidentes, no se requiere que las variantes tengan informes como evidencia externa a la base de datos de incidentes. Obtenga más información del trabajo de investigación.

Incidentes Similares

Por similitud de texto

Did our AI mess up? Flag the unrelated incidents