Incidents associés

Bing AI a obtenu des réponses complètement erronées pendant leur démo. Mais personne ne l'a remarqué. Au lieu de cela, tout le monde a sauté dans le train hype Bing.
Bard de Google s'est trompé de réponse lors d'une annonce, ce que tout le monde a remarqué. Maintenant, le récit est "Google se précipite pour rattraper Bing et fait des erreurs!".
Ce serait un bon récit si Bing ne faisait pas d'erreurs encore pires lors de sa propre démo.
Aspirateurs pour animaux de compagnie
Allons acheter un aspirateur pour animaux de compagnie !
Résultats Bing pour "Quels sont les avantages et les inconvénients des 3 aspirateurs pour animaux de compagnie les plus vendus ?"
Selon cette liste d'avantages et d'inconvénients, le "Bissell Pet Hair Eraser Handheld Vacuum" sonne plutôt mal. Puissance d'aspiration limitée, cordon court et assez bruyant pour effrayer les animaux de compagnie ? Décidément, comment cette chose est-elle même un best-seller ?
Oh, attendez, ce sont toutes des informations complètement inventées.
Bing AI a eu la gentillesse de nous donner ses sources, nous pouvons donc consulter l'article hgtv et vérifier par nous-mêmes .
L'article cité ne dit rien sur la puissance d'aspiration limitée ou le bruit. En fait, la meilleure critique d'Amazon pour ce produit parle de son silence.
L'article ne dit rien non plus sur la "longueur courte du cordon de 16 pieds" car il n'a pas de cordon. C'est un aspirateur à main portable.
J'espère que Bing AI appréciera d'être poursuivi pour diffamation.
(Remarque : il existe une autre version de ce produit portant le même nom qui a un cordon et peut en fait être bruyante. Cependant, ce n'est pas la version du produit dans la citation de Bing. Vraisemblablement, Bing avait l'intention de décrire la version la plus vendue , qui est la version sans fil qu'il a citée. Mais au lieu de cela, il s'est embrouillé et a décrit la version avec fil.)
Vie nocturne au Mexique
Allons au Mexique !
Résultats Bing pour "Où est la vie nocturne?" après avoir demandé un itinéraire de voyage à Mexico
Bing AI a généré un itinéraire de voyage de 5 jours pour Mexico, et maintenant nous lui demandons des options de vie nocturne. Ce serait plutôt cool si les descriptions n'étaient pas inexactes.
Cecconi's Bar *pourrait* être chic, mais ne semble pas particulièrement confortable d'après les images que j'ai vues. Et il n'a certainement pas de site Web où vous pouvez faire des réservations et voir leur menu.
Primer Nivel Night Club est un mystère absolu. Il y a une critique TripAdvisor de 2014, et la dernière critique Facebook date de 2016. Il n'y en a aucune mention sur TikTok, donc je doute sérieusement "qu'il soit populaire parmi les jeunes". On dirait que tous les détails de cet endroit sont des hallucinations d'IA.
El Almacen *pourrait* être rustique ou charmant, mais Bing AI a omis le fait très pertinent qu'il s'agit d'un bar gay. En fait, c'est l'un des plus anciens bars gay de Mexico. Il est assez surprenant qu'il n'ait "pas encore de notes ou d'avis" alors qu'il a 500 avis Google, mais c'est peut-être une limitation avec les sources de Bing.
El Marra est un bar animé et coloré, même si les horaires peuvent être erronés. Il y a tellement d'évaluations de cet endroit en ligne qu'il est une fois de plus surprenant qu'il n'y ait "pas encore d'évaluations ou d'avis".
Guadalajara de Noche est le premier qui semble être une description précise. Bravo Bing AI, vous avez raison ! Je suis si fier de toi. Qu'est ce que c'est? Vous voulez essayer de lire des états financiers? Qu'est-ce qui pourrait mal se passer…
Résumé des états financiers de l'écart
C'est de loin la pire erreur commise lors de la démo. C'est aussi le plus inattendu. J'aurais pensé que résumer un document serait trivial pour AI à ce stade. Mais Bing AI parvient à prendre un simple document financier et à fausser tous les chiffres.
Bing AI résume le rapport financier Gap Q3 2022
"Gap Inc. a enregistré des ventes nettes de 4,04 milliards de dollars, en hausse de 2 % par rapport à l'année dernière, et les ventes comparables ont augmenté de 1 % d'une année sur l'autre"
Bing AI démarre bien. Cette affirmation est tout à fait correcte, probablement parce qu'il s'agit d'un copier-coller direct du document financier.
"Gap Inc. a enregistré une marge brute de 37,4 %, ajustée des charges de dépréciation liées à Yeezy Gap, et la marge sur les marchandises a diminué de 370 points de base par rapport à l'année dernière en raison de la hausse des remises et de l'inflation des prix des matières premières"
Euh non. C'est la marge brute non ajustée. La marge brute ajustée des charges de dépréciation était de 38,7 %. Et la marge sur marchandises a diminué de 480 points de base si nous ajustons les charges de dépréciation.
Ne vous inquiétez pas, c'est bien pire.
"Gap Inc. a enregistré une marge d'exploitation de 5,9 %, ajustée des charges de dépréciation et des coûts de restructuration, et un bénéfice dilué par action de 0,42 USD, ajusté des charges de dépréciation, des coûts de restructuration et des impacts fiscaux."
"5,9 %" n'est ni la valeur ajustée ni la valeur non ajustée. Ce numéro n'apparaît même pas dans tout le document. C'est complètement inventé.
La marge opérationnelle incluant les dépréciations est de 4,6 % et hors dépréciation de 3,9 %.
Le bénéfice dilué par action est également un chiffre complètement inventé qui n'apparaît pas dans le document. Le bénéfice dilué ajusté par action est de 0,71 $ et le bénéfice non ajusté est de 0,77 $.
"Gap Inc. a réaffirmé ses prévisions pour l'exercice 2022, prévoyant une croissance des ventes nettes dans les deux chiffres, une marge d'exploitation d'environ 7 % et un bénéfice dilué par action de 1,60 $ à 1,75 $."
Non… ils ne s'attendent pas à une croissance des ventes nettes à deux chiffres. Ils s'attendent à ce que les ventes nettes soient en baisse à un chiffre.
Et je n'ai rien vu d'autre dans ce document sur les perspectives futures de marge opérationnelle ou de bénéfice dilué par action. Donc, Bing AI l'a obtenu à partir d'un document séparé ou l'a complètement inventé.
** Mais ça empire. Maintenant, nous allons comparer Gap à Lululemon**
Bing AI compare Gap et Lululemon’s Rapports financiers du troisième trimestre 2022
Maintenant, nous comparons des nombres inventés.
Les données Lululemon sont à peu près aussi précises que les données Gap.
La marge brute de Lululemon est donnée à "58,7%", ce qui est une valeur hallucinée qui n'apparaît pas dans leur document financier. La valeur réelle est de 55,9 %.
La marge opérationnelle de Lululemon est de 19 %, et non de 20,7 %.
Le bénéfice dilué par action de Lululemon est de 2,00 $ et non de 1,65 $.
La trésorerie et les équivalents de trésorerie sont faux pour Gap (devraient être de 679 millions de dollars), mais corrects pour Lululemon.
L'inventaire est faux pour Gap (devrait être de 3,04 milliards de dollars) mais correct pour Lululemon.
Conclusion
Bing AI a fait un excellent travail pour créer un battage médiatique, mais leur produit n'est pas meilleur que Bard de Google. Au moins pour autant que nous puissions en juger d'après les informations limitées dont nous disposons sur les deux.
Je suis choqué que l'équipe Bing ait créé cette démo préenregistrée remplie d'informations inexactes et l'ait présentée au monde en toute confiance comme si elle était bonne.
Je suis encore plus choqué que cette astuce ait fonctionné, et tout le monde a sauté dans le train de battage médiatique Bing AI sans faire une once de diligence raisonnable.
Bing AI est incapable d'extraire des chiffres précis d'un document et compose des informations en toute confiance même lorsqu'il prétend avoir des sources.
Il n'est certainement pas prêt à être lancé et ne devrait pas être utilisé par quiconque souhaite un modèle précis de la réalité.