Incidentes Asociados
Investigadores de seguridad advierten que los datos expuestos en internet, aunque sea por un instante, pueden permanecer en chatbots de IA generativa en línea como Microsoft Copilot mucho después de que se vuelvan privados.
Miles de repositorios de GitHub, que antes eran públicos, de algunas de las empresas más grandes del mundo se ven afectados, incluyendo el de Microsoft, según nuevos hallazgos de Lasso, una empresa israelí de ciberseguridad especializada en amenazas emergentes de IA generativa.
Ophir Dror, cofundador de Lasso, declaró a TechCrunch que la empresa detectó contenido de su propio repositorio de GitHub en Copilot porque había sido indexado y almacenado en caché por el motor de búsqueda Bing de Microsoft. Dror explicó que el repositorio, que se había hecho público por error durante un breve periodo, se había configurado como privado, y al acceder a él en GitHub se obtenía un error de "página no encontrada".
"Sorprendentemente, en Copilot encontramos uno de nuestros repositorios privados", declaró Dror. Si navegara por la web, no vería estos datos. Pero cualquiera podría hacerle la pregunta correcta a Copilot y obtenerlos.
Tras darse cuenta de que cualquier dato en GitHub, incluso brevemente, podría estar expuesto por herramientas como Copilot, Lasso investigó más a fondo.
Lasso extrajo una lista de repositorios que eran públicos en cualquier momento de 2024 e identificó los repositorios que habían sido eliminados o privados. Utilizando el mecanismo de almacenamiento en caché de Bing, la empresa descubrió que más de 20 000 repositorios de GitHub, que desde entonces eran privados, aún tenían datos accesibles a través de Copilot, lo que afectaba a más de 16 000 organizaciones.
Lasso declaró a TechCrunch antes de publicar su investigación que entre las organizaciones afectadas se encuentran Amazon Web Services, Google, IBM, PayPal, Tencent y Microsoft. Amazon declaró a TechCrunch tras la publicación que no se ve afectada por el problema. Lasso afirmó que "eliminó todas las referencias a AWS siguiendo el consejo de su equipo legal" y que "mantenemos firmes nuestros principios de investigación".
Grandes figuras de la tecnología y el capital riesgo se unen a la agenda de Disrupt 2025
Netflix, ElevenLabs, Wayve, Sequoia Capital, Elad Gil… son solo algunas de las figuras clave que se unen a la agenda de Disrupt 2025. Están aquí para ofrecer información que impulse el crecimiento de las startups y les permita mejorar su ventaja competitiva. No se pierdan el 20.º aniversario de TechCrunch Disrupt y la oportunidad de aprender de las voces más destacadas del sector tecnológico. ¡Consigan su entrada ahora y ahorren hasta 600 $ antes de que suban los precios!
Para algunas empresas afectadas, Copilot podría verse obligado a devolver archivos confidenciales de GitHub que contienen propiedad intelectual, datos corporativos sensibles, claves de acceso y tokens, según informó la compañía.
Lasso señaló que utilizó Copilot para recuperar el contenido de un repositorio de GitHub, ya eliminado por Microsoft, que albergaba una herramienta que permitía la creación de imágenes de IA "ofensivas y dañinas" mediante el servicio de IA en la nube de Microsoft.
Dror afirmó que Lasso contactó a todas las empresas afectadas que se vieron "gravemente afectadas" por la exposición de datos y les recomendó rotar o revocar las claves comprometidas.
Ninguna de las empresas afectadas mencionadas por Lasso respondió a las preguntas de TechCrunch. Microsoft tampoco respondió a la consulta de TechCrunch.
Lasso informó a Microsoft sobre sus hallazgos en noviembre de 2024. Microsoft le indicó que clasificó el problema como de "gravedad baja", afirmando que este comportamiento de almacenamiento en caché era "aceptable". Microsoft dejó de incluir enlaces a la caché de Bing en sus resultados de búsqueda a partir de diciembre de 2024.
Sin embargo, Lasso afirma que, aunque la función de almacenamiento en caché estaba desactivada, Copilot aún tenía acceso a los datos, aunque no eran visibles mediante búsquedas web tradicionales, lo que indica una solución temporal.
Actualizado con comentarios posteriores a la publicación de Amazon Web Services y Lasso.