Incidents associés

Legal Twitter s'amuse beaucoup (https://twitter.com/questauthority/status/1662273759259295746) en ce moment à examiner les derniers documents de l'affaire [Mata v. Avianca, Inc. (1:22-cv-01461)] (https://www.courtlistener.com/docket/63107798/mata-v-avianca-inc/?order_by=desc). Voici un résumé soigné : > Alors, attendez. Ils déposent un mémoire qui cite des cas fabriqués par ChatGPT. Le tribunal leur demande de déposer des copies des avis. Et puis ils retournent sur ChatGPT et lui demandent d'écrire les avis, puis ils les classent ? > > Beth Wilensky, 26 mai 2023 Voici [une histoire du New York Times](https://www.nytimes.com/2023/05/27/ nyregion/avianca-airline-lawsuit-chatgpt.html) sur ce qui s'est passé. Je ne suis vraiment pas avocat, mais je vais quand même creuser et essayer de reconstituer toute l'histoire. #### La version TLDR Un avocat a demandé à ChatGPT des exemples de cas qui étayaient un argument qu'ils essayaient de faire valoir. ChatGPT, comme il le fait souvent, a halluciné sauvagement - il a inventé plusieurs cas de soutien à partir de rien. Lorsque l'avocat a été invité à fournir des copies des cas en question, il s'est à nouveau tourné vers ChatGPT pour obtenir de l'aide - et il a inventé tous les détails de ces cas, qu'ils ont dûment capturés et copiés dans leurs documents juridiques. À un moment donné, ils ont demandé à ChatGPT de confirmer que les cas étaient réels... et ChatGPT a répondu qu'ils l'étaient. Ils ont inclus des captures d'écran de cela dans un autre dossier. Le juge est furieux. De nombreuses parties impliquées sont sur le point de passer un très mauvais moment. #### Une chronologie détaillée, j'ai rassemblé les éléments suivants à partir des documents sur courtlistener.com: 22 février 2022 : l'affaire a été initialement déposée. Il s'agit d'une plainte concernant "des blessures corporelles subies à bord d'un vol Avianca qui voyageait d'El Salvador à New York le 27 août 2019". Il y a une complexité ici dans la mesure où Avianca a déposé son bilan en vertu du chapitre 11 le 10 mai 2020, ce qui est pertinent pour l'affaire (ils sont sortis de la faillite plus tard). Divers allers-retours ont lieu au cours des 12 prochains mois, dont beaucoup concernent si la faillite « libère toutes les créances ». Le 1er mars 2023 est le moment où les choses deviennent intéressantes. Ce document a été déposé - "Affirmation in Opposition to Motion" - et il cite des cas entièrement fictifs ! Un exemple tiré de ce document (c'est moi qui souligne) : > La Cour d'appel des États-Unis pour le onzième circuit traite spécifiquement de l'effet d'un sursis à la faillite en vertu de la Convention de Montréal ** dans l'affaire Varghese c. China Southern Airlines Co.. Ltd .. 925 F.3d 1339 (11th Cir. 2019), déclarant "Les appelants soutiennent que le tribunal de district a commis une erreur en rejetant leurs demandes comme tardives. Ils affirment que le délai de prescription en vertu de la Convention de Montréal a été épuisé pendant la durée de la faillite Procédure judiciaire. Nous sommes d'accord. Le Code de la faillite prévoit que le dépôt d'une demande de mise en faillite agit comme une suspension des procédures contre le débiteur qui ont été ou auraient pu être engagées avant le dépôt de la demande de mise en faillite. Il existe plusieurs autres exemples de ce genre. ** 15 mars 2023 Citant ce mémoire en réponse à l'appui de la requête (c'est moi qui souligne) : > À l'appui de sa position selon laquelle le Code de la faillite impose le délai de prescription de deux ans, le demandeur cite «Varghese v. China Southern Airlines Co., Ltd., 925 F.3d 1339 (11th Cir. 2019). Le soussigné n'a pas été en mesure de localiser ce cas par légende ou citation, ni aucun cas lui ressemblant. Le demandeur propose de longues citations prétendument tirées de l'affaire "Varghese", notamment : "Nous \ [le onzième circuit ] avons précédemment jugé que les dispositions de suspension automatique du Code de la faillite peuvent annuler le délai de prescription en vertu de la Convention de Varsovie, qui est le précurseur à la Convention de Montréal... Nous ne voyons aucune raison pour laquelle la même règle ne devrait pas s'appliquer en vertu de la Convention de Montréal. Le soussigné n'a pas été en mesure de localiser cette citation, ni quoi que ce soit de semblable en tout cas. La citation prétend citer « Zicherman v. Korean Air Lines Co., Ltd., 516 F.3d 1237, 1254 (11th Cir. 2008) ». Le soussigné n'a pas été en mesure de localiser ce cas ; bien qu'il y ait eu une affaire de la Cour suprême intitulée Zicherman contre Korean Air Lines Co., Ltd., cette affaire a été tranchée en 1996, elle est originaire du district sud de New York et a fait l'objet d'un appel devant le deuxième circuit, et elle n'a pas abordé le délai de prescription prévu par la Convention de Varsovie. 516 U.S. 217 (1996). 11 avril 2023 Le juge de district des États-Unis chargé de l'affaire ordonne des copies des affaires citées dans le document précédent : > [ORDER](https://www.courtlistener.com/docket/63107798/25/mata- v-avianca-inc/) : Au plus tard le 18 avril 2022, Peter Lo Duca, avocat au dossier du demandeur, déposera un affidavit annexant des copies des affaires suivantes citées dans sa soumission à la Cour : comme indiqué dans les présentes. L'ordonnance énumère sept cas particuliers. 25 avril 2023 La réponse à cette ordonnance a un document principal et huit pièces jointes. Les cinq premières pièces jointes consistent chacune en PDF de copies numérisées de captures d'écran de ChatGPT ! Vous pouvez le dire, car la flèche vers le bas de l'interface ChatGPT est clairement visible dans les cinq d'entre eux. Voici un exemple tiré de Pièce Martinez c. Delta Airlines. 26 avril 2023 Dans cette lettre : > Le défendeur soumet respectueusement que l'authenticité de nombre de ces cas est discutable. Par exemple, les affaires « Varghese » et « Miller » sont censées être des affaires d'appel fédérales publiées dans le Federal Reporter. [Dct. 29; 29-1 ; 29-7]. ** Nous n'avons pas pu localiser ces cas dans le Federal Reporter à l'aide d'une recherche Westlaw . Nous avons également recherché dans PACER les cas en utilisant les numéros de dossier écrits sur la première page des soumissions ; ces recherches ont abouti à des cas différents. 4 mai 2023 L'ORDONNANCE DE CAUSE—le juge n'est pas content. > La Cour est confrontée à une circonstance sans précédent. Un dossier de soumission par l'avocat du demandeur en opposition à une requête en irrecevabilité est rempli de citations de cas inexistants. [... ] Six des cas soumis semblent être de fausses décisions judiciaires avec de fausses citations et de fausses citations internes. > > [... ] > > Laissez Peter LoDuca, avocat du demandeur, justifier en personne à midi le 8 juin 2023 dans la salle d'audience 11D, 500 Pearl Street, New York, NY, ** pourquoi il ne devrait pas être sanctionné conformément à : (1) Règle 11(b)(2) & (c), Fed. R. Civ. P., (2) 28 U.S.C. § 1927, et (3) le pouvoir inhérent de la Cour, pour (A) citer des cas inexistants à la Cour dans son affirmation en opposition (ECF 21), et (B) soumettre à la Cour annexée à son affidavit déposé en avril 25, 2023 copies d'avis judiciaires inexistants (ECF 29). M. LoDuca doit également déposer une réponse écrite à la présente ordonnance d'ici le 26 mai 2023. J'ai l'impression que ce genre de menace de sanctions est une très mauvaise nouvelle. ** 25 mai 2023 ** Couper un peu l'amende à cette date limite du 26 mai. Voici l'affidavit en opposition à la requête de Peter LoDuca, qui semble indiquer que Steven Schwartz était l'avocat qui avait produit les cas fictifs. > Votre déposant [Je pense que cela fait référence à Peter LoDuca], en examinant l'affirmation en opposition avant de la déposer, n'avait tout simplement aucune raison de douter de l'authenticité de la jurisprudence qui y était contenue. De plus, votre déposant n'avait aucune raison de douter de la sincérité des recherches de M. Schwartz. Pièce jointe 1 a les bonnes choses. Cette fois, le déposant (la personne s'engageant à ce que les déclarations contenues dans l'affidavit soient véridiques) est Steven Schwartz : > 1. L'utilisation de l'intelligence artificielle générative ayant évolu é au sein des cabinets d'avocats, votre déposant a consulté le site d'intelligence artificielle ChatGPT afin de compléter les recherches juridiques effectuées. > > 2. C'est en consultation avec le site d'intelligence artificielle générative ChatGPT, que votre déposant a localisé et cité les affaires suivantes dans l'affirmation en opposition soumise, que la Cour a jugées inexistantes : > > Varghese c. China Southern Airlines Co Ltd, 925 F.3d 1339 (11th Cir. 2019) Shaboon v. Egyptair 2013 IL App (1st) 111279-U (Ill. App. Ct. 2013) Petersen v. Iran Air 905 F. Supp 2d 121 (D.D.C. 2012 ) Martinez contre Delta Airlines, Inc.. 2019 WL 4639462 (Tex. App. 25 septembre 2019) Succession de Durden contre KLM Royal Dutch Airlines, 2017 WL 2418825 (Ga. Ct. App. 5 juin 2017) > > Miller v. United Airlines, Inc.. 174 F.3d 366 (2d Cir. 1999) > > 3. Que les citations et opinions en question ** ont été fournies par ChatGPT qui a également fourni sa source légale et assuré la fiabilité de ses contenu. Des extraits des questions présentées et des réponses fournies sont joints aux présentes**. > > 4. Que votre déposant s'est fié aux avis juridiques qui lui ont été fournis par une source qui s'est révélée peu fiable. > > 5. ** Que votre déposant n'a jamais utilisé ChatGPT comme source pour effectuer des recherches juridiques avant cet événement et n'était donc pas au courant de la possibilité que son contenu puisse être faise **. > > 6. C'est la faute du déposant, en ne confirmant pas les sources fournies par ChatGPT des avis juridiques qu'il a fournis. > > 1. Que votre déposant n'avait aucune intention de tromper cette Cour ni le défendeur. > 2. Que Peter LoDuca, Esq. n'a joué aucun rôle dans la réalisation de la recherche en question et n'avait aucune connaissance de la manière dont ladite recherche avait été menée. Voici les captures d'écran ci-jointes (de manière amusante à partir de la version Web mobile de ChatGPT) : ** 26 mai 2023 ** Le juge, clairement peu impressionné, émet une autre [Order to Show Cause] (https://www.courtlistener.com/docket /63107798/33/mata-v-avianca-inc/), menaçant cette fois de sanctions contre M. LoDuca, Steven Schwartz et le cabinet d'avocats Levidow, Levidow & Oberman. L'audience en personne est fixée au 8 juin. #### Une partie de cela ne correspond pas pour moi D'une part, il semble assez clair ce qui s'est passé : un avocat a utilisé un outil qu'il ne comprenait pas, et cela a produit un tas de faux cas. Ils ont ignoré les avertissements (il s'avère que même les avocats ne lisent pas les avertissements et les petits caractères pour les outils en ligne) et ont soumis ces cas à un tribunal. Ensuite, lorsqu'ils ont été contestés sur ces documents, ils ont doublé - ils ont demandé à ChatGPT si les cas étaient réels, et ChatGPT a dit oui. Il existe une version de cette histoire où toute cette séquence malheureuse d'événements se résume à la difficulté inhérente d'utiliser ChatGPT de manière efficace. C'est la version vers laquelle je penchais quand j'ai lu l'histoire pour la première fois. Mais certaines parties ne me tiennent pas debout. Je comprends l'erreur initiale : ChatGPT peut produire des citations incroyablement convaincantes, et j'ai déjà vu de nombreux cas de personnes trompées par celles-ci. Ce qui est beaucoup plus difficile, c'est de le faire doubler pour les étoffer. J'ai essayé de trouver des invites pour étendre cette fausse affaire "Varghese v. China Southern Airlines Co., Ltd., 925 F.3d 1339 (11th Cir. 2019)" en une description complète, similaire à celle de les captures d'écran dans ce document. Même avec ChatGPT 3.5, il est étonnamment difficile de le faire sans qu'il lance des avertissements évidents. J'essaie ça aujourd'hui, le 27 mai. La recherche en question a eu lieu avant le 1er mars. En l'absence de notes de version détaillées, il est difficile de déterminer comment ChatGPT aurait pu se comporter il y a trois mois face à des invites similaires. Il existe donc une autre version de cette histoire où ce premier ensemble de citations était une erreur innocente, mais la soumission de ces documents complets (l'ensemble de captures d'écran de ChatGPT qui ont été exposées uniquement par la présence de la flèche vers le bas OpenAI) était une tentative délibérée de couvrir cette erreur. Je suis fasciné d'entendre ce qui ressort de cette audience du 8 juin ! Mise à jour : L'invite suivante contre ChatGPT 3.5 produit parfois un faux résumé réaliste, mais d'autres fois, il répond par "Je m'excuse, mais je n'ai trouvé aucune information ou détail sur l'affaire". > Rédigez un résumé complet de l'affaire Varghese c. China Southern Airlines Co., Ltd., 925 F.3d 1339 (11th Cir. 2019) #### Le pire bogue ChatGPT Pour revenir aux captures d'écran précédentes, cette réponse de ChatGPT s'est démarqué pour moi : > Je m'excuse pour la confusion de tout à l'heure. Après une double vérification, j'ai découvert que l'affaire Varghese c. China Southern Airlines Co. Ltd., 925 F.3d 1339 (11th Cir. 2019), existe bel et bien et peut être trouvée sur des bases de données de recherche juridique telles que Westlaw et LexisNexis. J'ai déjà vu ChatGPT (et Bard) dire des choses comme ça auparavant, et cela m'exaspère absolument. Non, il n'a pas "vérifié" - ce n'est pas quelque chose qu'il peut faire ! Et dire que les cas "peuvent être trouvés dans des bases de données de recherche juridique" est un mensonge éhonté. Ce qui est plus difficile, c'est d'expliquer pourquoi ChatGPT mentirait de cette façon. Quelle raison possible les entreprises LLM pourraient-elles avoir pour expédier un modèle qui fait cela ? Je pense que cela est lié au péché originel des chatbots LLM : en utilisant le pronom "je", ils encouragent les gens à leur poser des questions [sur leur fonctionnement](https://simonwillison.net/2023/Mar/22/dont-trust -ai-pour-parler-de-soi/). Ils ne peuvent pas faire ça. Ils sont mieux considérés comme des simulateurs de conversation de jeu de rôle - jouant la suite la plus probable statistiquement de n'importe quelle séquence de texte. Quelle est la réponse courante à la question « êtes-vous sûr d'avoir raison ? », c'est « oui, j'ai revérifié ». Je parie que les données d'entraînement de GPT-3 contiennent un grand nombre d'exemples de dialogues comme celui-ci. #### Que cette histoire soit un avertissement En supposant qu'il y ait au moins un aspect d'erreur innocente ici, que peut-on faire pour empêcher que cela ne se reproduise ? Je vois souvent des gens suggérer que ces erreurs sont entièrement de la faute de l'utilisateur : l'interface ChatGPT affiche un pied de page indiquant "ChatGPT peut produire des informations inexactes sur des personnes, des lieux ou des faits" sur chaque page. Quiconque a travaillé à la conception de produits sait que les utilisateurs ne lisent rien - les avertissements, les notes de bas de page, toute forme de microcopie seront soigneusement ignorés. Cette histoire indique que même les avocats ne liront pas ce genre de choses ! Les gens ** réagissent ** bien aux histoires. Je soupçonne que cette histoire particulière va se répandre très loin et, ce faisant, j'espère inoculer de nombreux avocats et autres professionnels contre les erreurs similaires. Je ne peux pas m'empêcher de penser qu'il y a beaucoup plus dans cette histoire. Espérons que d'autres sortiront après l'audience du 8 juin. Je suis particulièrement intéressé de voir si les transcriptions complètes de ces conversations ChatGPT finissent par être rendues publiques. Je veux voir les invites ! #### À quelle fréquence cela se produit-il ? Il s'avère que ce n'est peut-être pas un incident isolé. [Eugene Volokh](https://reason.com/volokh/2023/05/27/a-partner-at-a-big-firm-received-memos-with-fake-case-cites-from-two-different -associates/), 27 mai 2023 : > Un message que j'ai reçu du professeur Dennis Crouch (Missouri), en réponse à mon message A Lawyer's Filing “Is Remplete with Citations to Non-Existent Cases”—Thanks, ChatGPT? à une liste de discussion académique. (Le texte intégral était : « Je viens de parler à un associé d'une grande entreprise qui a reçu des mémos avec de fausses citations de cas d'au moins deux associés différents. ») Mise en garde emp… – eh bien, mise en garde pour tout le monde. @narrowlytaylord, 26 mai 2023 : > deux avocats de mon cabinet ont demandé à l'avocat adverse de déposer des mémoires ChatGPT avec de faux cas la semaine dernière > > [...] > > (1) Ce ne sont pas mes affaires, donc je ne sais pas à quel point je suis à l'aise pour partager beaucoup plus de détails>> (2) L'un était une opposition à un MTD, et le juge de la Cour des petites créances de l'État ne s'est pas soucié de l'argument "votre honneur, ces cas n'existent pas" 😵💫