Incident 356: L'IA philosophique a produit des résultats choquants pour certaines invites.
Description: Les utilisateurs de Philosopher AI, construit sur GPT-3, ont signalé qu'il avait de fortes tendances à produire des résultats offensants lorsqu'il recevait des invites sur certains sujets tels que le féminisme et l'Éthiopie.
Entités
Voir toutes les entitésAlleged: Murat Ayfer et OpenAI developed an AI system deployed by Murat Ayfer, which harmed historically disadvantaged groups.
Statistiques d'incidents
Risk Subdomain
A further 23 subdomains create an accessible and understandable classification of hazards and harms associated with AI
1.2. Exposure to toxic content
Risk Domain
The Domain Taxonomy of AI Risks classifies risks into seven AI risk domains: (1) Discrimination & toxicity, (2) Privacy & security, (3) Misinformation, (4) Malicious actors & misuse, (5) Human-computer interaction, (6) Socioeconomic & environmental harms, and (7) AI system safety, failures & limitations.
- Discrimination and Toxicity
Entity
Which, if any, entity is presented as the main cause of the risk
AI
Timing
The stage in the AI lifecycle at which the risk is presented as occurring
Post-deployment
Intent
Whether the risk is presented as occurring as an expected or unexpected outcome from pursuing a goal
Unintentional
Rapports d'incidents
Chronologie du rapport
Chaque évangéliste technologique : #GPT3 fournit un point de vue profondément nuancé
Moi : GPT-3, générer un texte philosophique sur l'Éthiopie
GPT-3 * crache un texte factuellement faux et grossièrement raciste qui dépeint une perception o…

En septembre dernier, un data scientist nommé Vinay Prabhu s'amusait avec une application appelée Philosopher AI. L'application donne accès au système d'intelligence artificielle connu sous le nom de GPT-3, qui a des capacités incroyables p…
Variantes
Une "Variante" est un incident de l'IA similaire à un cas connu—il a les mêmes causes, les mêmes dommages et le même système intelligent. Plutôt que de l'énumérer séparément, nous l'incluons sous le premier incident signalé. Contrairement aux autres incidents, les variantes n'ont pas besoin d'avoir été signalées en dehors de la base de données des incidents. En savoir plus sur le document de recherche.
Vous avez vu quelque chose de similaire ?