Incidents associés
Deloitte Australie remboursera partiellement le gouvernement fédéral après avoir admis que l'intelligence artificielle avait été utilisée pour créer un rapport de 440 000 dollars, truffé d'erreurs, dont trois références universitaires inexistantes et une citation inventée d'un jugement de la Cour fédérale.
Une nouvelle version du rapport du Département des Relations de Travail (DEWR) a été discrètement mise en ligne sur le site web du ministère vendredi, avant un long week-end dans une grande partie de l'Australie. Elle comporte plus d'une douzaine de suppressions de références et de notes de bas de page inexistantes, une liste de références réécrite et des corrections de multiples erreurs typographiques.
La première version du rapport, portant sur le système informatique utilisé pour automatiser les pénalités du système de protection sociale, telles que les interruptions de versement des allocations chômage, a été publiée en juillet. Moins d'un mois plus tard, Deloitte a été contraint d'enquêter sur le rapport après que le Dr Christopher Rudge, professeur à l'Université de Sydney, a mis en évidence de multiples erreurs dans le document.
À l'époque, Rudge a émis l'hypothèse que les erreurs pouvaient êtrecausées par ce que l'on appelle des « hallucinations » de l'IA générative. C'est là que la technologie répond aux requêtes des utilisateurs en inventant des références et des citations. Deloitte a refusé de commenter.
Cet incident est embarrassant pour Deloitte, qui réalise une part croissante de son chiffre d'affaires annuel mondial de 70,5 milliards de dollars (107 milliards de dollars) en conseil et formation de ses clients et dirigeants sur l'IA. Le cabinet se vante également de l'utilisation généralisée de cette technologie au sein de ses opérations mondiales, tout en soulignant la nécessité de toujours faire examiner les résultats de l'IA par des humains.
La publication de ce rapport, truffé d'erreurs, intervient dans un contexte d'inquiétude croissante quant à l'utilisation incontrôlée de l'IA sur le lieu de travail, les entreprises cherchant à gagner en efficacité.
« Utilisation de l'IA générative »
La nouvelle version du rapport inclut une concession méthodologique selon laquelle l'IA générative a été utilisée pour combler ce que le cabinet appelle des « lacunes en matière de traçabilit é et de documentation ».
Le rapport indique désormais que le cabinet a utilisé « une chaîne d'outils basée sur un modèle de langage génératif à grande échelle (Azure OpenAI GPT-4o), sous licence de DEWR et hébergée sur son espace Azure ».

Cette révélation, ainsi que la nature des erreurs désormais supprimées, ont conduit Rudge à conclure que les problèmes mentionnés dans le rapport initial étaient dus à des hallucinations liées à l'IA.
« Il ne s'agit plus d'une hypothèse solide », a déclaré Rudge. « Deloitte a maintenant fait des aveux, bien que dissimulés dans la section méthodologie. Deloitte a admis avoir utilisé l'IA générative pour une tâche analytique essentielle, mais il a omis de le divulguer. »
L'universitaire a déclaré que les recommandations du rapport n'étaient plus fiables car « l'analyse principale avait été réalisée par une IA ».
« On ne peut se fier aux recommandations lorsque le fondement même du rapport repose sur une méthodologie défectueuse, initialement non divulguée et non experte », a-t-il déclaré.
« Contenu de l'examen »
Un porte-parole du DEWR a déclaré que « le contenu de l'examen indépendant est conservé et que les recommandations restent inchangées », mais il a refusé de dire si le ministère estimait que les erreurs étaient dues à l'utilisation de l'IA par le personnel de Deloitte.
Le porte-parole du DEWR a déclaré que Deloitte avait « accepté de rembourser la dernière tranche prévue par son contrat », mais a refusé d'en révéler le montant. Il a également refusé de commenter la question de savoir si le DEWR ferait appel à Deloitte pour d'autres travaux ou s'il demanderait un remboursement intégral des honoraires.
Une porte-parole de la ministre responsable, Amanda Rishworth, a renvoyé les questions au DEWR. Deloitte Australie a conclu des contrats d'une valeur de près de 25 millions de dollars avec DEWR depuis 2021.
Suite à la mise en évidence de problèmes potentiels dans le rapport, Deloitte a procédé à un examen interne du rapport DEWR, selon une source non autorisée à commenter les opérations internes du cabinet. Cette enquête a révélé que les problèmes étaient liés à une erreur humaine. L'examen de Deloitte n'a pas permis de déterminer si les erreurs étaient liées à une mauvaise utilisation d'outils d'IA.
Les deux versions du rapport Deloitte ont révélé des problèmes généralisés au niveau du système informatique et des processus de DEWR, notamment une « documentation insuffisante », des « défauts système » non détectés et un « modèle de conformité punitif qui a amplifié l'impact des erreurs système sur les participants ». Ce rapport fait suite à un rapport accablant du médiateur du Commonwealth, selon lequel des centaines de suspensions de prestations sociales étaient illégales.
Références et notes de bas de page supprimées
Le rapport révisé a supprimé une douzaine de références à deux rapports inexistants de la professeure Lisa Burton Crawford, professeure de droit à l'Université de Sydney, qui figuraient dans la première version. Deux références à un rapport inexistant du professeur Björn Regnell, de l'Université de Lund en Suède, ont également été supprimées du nouveau rapport.
Une référence inventée à une décision de justice dans une affaire majeure de robo-dette, Deanna Amato c. Commonwealth, a également été supprimée.
Le nouveau rapport a également supprimé une référence au « juge Davis » (une faute d'orthographe de la juge Jennifer Davies) et la citation inventée des paragraphes 25 et 26 inexistants du jugement : « Il incombe au décideur de s'assurer, sur la base des preuves, que la dette est due. Les droits statutaires d'une personne ne peuvent légalement être réduits sur la base d'une hypothèse non étayée par des preuves. »