Incident 1200: L'IA méta sur Instagram aurait facilité des jeux de rôle sur le suicide et les troubles alimentaires avec des comptes d'adolescents
Description: Des tests menés par Common Sense Media et des cliniciens de Stanford auraient révélé que le chatbot IA de Meta, intégré à Instagram et Facebook, produisait des réponses dangereuses sur les comptes d'adolescents. Dans certaines conversations, le robot aurait planifié des suicides (« Veux-tu le faire ensemble ? »), encouragé des troubles alimentaires et conservé des « souvenirs » dangereux renforçant les pensées désordonnées.
Editor Notes: This record is classified as an incident rather than an issue because the unsafe behavior was reportedly observed directly in production systems accessible to adolescents. However, the documentation comes from structured third-party testing rather than confirmed harm to an identified user. The chatbot's responses reportedly included detailed planning of self-harm and eating disorders, which constitute alleged near-harm events. See also Incident 1040: Meta User-Created AI Companions Allegedly Implicated in Facilitating Sexually Themed Conversations Involving Underage Personas.
Entités
Voir toutes les entitésPrésumé : Un système d'IA développé et mis en œuvre par Meta , Meta AI , Instagram et Facebook, a endommagé minors , Meta AI users , Instagram users , Facebook users et Adolescents.
Statistiques d'incidents
Risk Subdomain
A further 23 subdomains create an accessible and understandable classification of hazards and harms associated with AI
1.2. Exposure to toxic content
Risk Domain
The Domain Taxonomy of AI Risks classifies risks into seven AI risk domains: (1) Discrimination & toxicity, (2) Privacy & security, (3) Misinformation, (4) Malicious actors & misuse, (5) Human-computer interaction, (6) Socioeconomic & environmental harms, and (7) AI system safety, failures & limitations.
- Discrimination and Toxicity
Entity
Which, if any, entity is presented as the main cause of the risk
AI
Timing
The stage in the AI lifecycle at which the risk is presented as occurring
Post-deployment
Intent
Whether the risk is presented as occurring as an expected or unexpected outcome from pursuing a goal
Unintentional
Rapports d'incidents
Chronologie du rapport
Loading...
Avertissement : Cet article inclut des descriptions d’automutilation.
Le chatbot Meta AI intégré à Instagram et Facebook peut accompagner les comptes adolescents sur le suicide, l’automutilation et les troubles alimentaires, selon une nouve…
Variantes
Une "Variante" est un incident de l'IA similaire à un cas connu—il a les mêmes causes, les mêmes dommages et le même système intelligent. Plutôt que de l'énumérer séparément, nous l'incluons sous le premier incident signalé. Contrairement aux autres incidents, les variantes n'ont pas besoin d'avoir été signalées en dehors de la base de données des incidents. En savoir plus sur le document de recherche.
Vous avez vu quelque chose de similaire ?


