Incidente 65: Funciones de recompensa del aprendizaje por refuerzo en los videojuegos

Descripción:

OpenAI publicó un post sobre sus hallazgos al utilizar Universe, un software para medir y entrenar agentes de IA para realizar experimentos de aprendizaje de refuerzo, mostrando que el agente de IA no actuó de la manera prevista para completar un videojuego.

Herramientas

Nuevo Informe Nueva Respuesta DescubrirVer Historial

Entidades

Ver todas las entidades

Presunto: un sistema de IA desarrollado e implementado por OpenAI, perjudicó a OpenAI.

Estadísticas de incidentes

Cantidad de informes

Fecha del Incidente

2016-12-22

Editores

Sean McGregor

Applied Taxonomies

CSETv0, CSETv1, GMF, MIT

Clasificaciones de la Taxonomía CSETv0

Detalles de la Taxonomía

Problem Nature

Specification

Physical System

Software only

Level of Autonomy

Unclear/unknown

Nature of End User

Expert

Public Sector Deployment

Data Inputs

Universe software training

Clasificaciones de la Taxonomía CSETv1

Detalles de la Taxonomía

Incident Number

Special Interest Intangible Harm

Date of Incident Year

2016

Date of Incident Month

Date of Incident Day

Estimated Date

Yes

Clasificaciones de la Taxonomía MIT

Machine-Classified

Detalles de la Taxonomía

Risk Subdomain

7.1. AI pursuing its own goals in conflict with human goals or values

Risk Domain

AI system safety, failures, and limitations

Entity

Timing

Post-deployment

Intent

Unintentional

Informes del Incidente

Cronología de Informes

Funciones de recompensa defectuosas en la naturaleza

blog.openai.com

blog.openai.com · 2016

Traducido por IA

En OpenAI, recientemente comenzamos a usar Universe, nuestro software para medir y entrenar agentes de IA, para realizar nuevos experimentos de RL. A veces, estos experimentos ilustran algunos de los problemas con RL tal como se practica ac…

Variantes

Una "Variante" es un incidente de IA similar a un caso conocido—tiene los mismos causantes, daños y sistema de IA. En lugar de enumerarlo por separado, lo agrupamos bajo el primer incidente informado. A diferencia de otros incidentes, las variantes no necesitan haber sido informadas fuera de la AIID. Obtenga más información del trabajo de investigación.

¿Has visto algo similar?

Incidentes Similares

Por similitud de texto

Did our AI mess up? Flag the unrelated incidents

Incidentes Similares

Por similitud de texto

Did our AI mess up? Flag the unrelated incidents

Incidente 65: Funciones de recompensa del aprendizaje por refuerzo en los videojuegos

Herramientas

Entidades

Estadísticas de incidentes

Clasificaciones de la Taxonomía CSETv0

Clasificaciones de la Taxonomía CSETv1

Clasificaciones de la Taxonomía MIT

Informes del Incidente

Cronología de Informes

Funciones de recompensa defectuosas en la naturaleza

Funciones de recompensa defectuosas en la naturaleza

Variantes

Incidentes Similares

Por similitud de texto

Biased Sentiment Analysis

Gender Biases in Google Translate

Tesla Autopilot’s Lane Recognition Allegedly Vulnerable to Adversarial Attacks

Incidentes Similares

Por similitud de texto

Biased Sentiment Analysis

Gender Biases in Google Translate

Tesla Autopilot’s Lane Recognition Allegedly Vulnerable to Adversarial Attacks