Report 1888

La investigación y el desarrollo tienen un problema importante sin resolver en los sistemas de inteligencia artificial de última generación: hacer que los sistemas funcionen mucho más allá del entorno para el que fueron diseñados. Si bien este problema tiene muchos nombres (por ejemplo, cambio de distribución, generalización del modelo, robustez de conjunto abierto, etc.), sus implicaciones ya son evidentes en el mundo real,

(dos imágenes muestran dos incidentes diferentes, uno en el que la camiseta de una mujer se confunde con una placa y otro en el que se avergüenza la imagen de una mujer en el costado del autobús por cruzar la calle imprudentemente en China)

Esta incapacidad para "generalizar" es una de las razones por las que compartir incidentes entre culturas, geografías e idiomas es tan importante: un sistema producido originalmente en un país y desplegado en otro producirá incidentes imprevistos de los que todo el mundo necesita aprender. Por lo tanto, la base de datos de incidentes de IA ha comenzado a indexar los incidentes de IA en todos los idiomas.

¿Cómo funciona esto?

La base de datos de incidentes de AI indexa "informes de incidentes" escritos, que hasta ahora han estado completamente en inglés. Ahora, cuando se informa un incidente, el informe se etiqueta con un idioma de origen y se traduce automáticamente a todos los idiomas que se encuentran actualmente en soporte.

(Hay una lista de más de 130 idiomas en la columna de la izquierda y se presenta como compatible con el sitio web, mientras que la columna de la derecha muestra que la interfaz de usuario está traducida al inglés y al español)

¿Por qué aceptamos 133 idiomas, pero solo proporcionamos una interfaz de usuario para dos idiomas? Conveniencia y precaución. Primero, traducir la interfaz de usuario (por ejemplo, botones, descripciones, etc.) a diferentes idiomas lleva tiempo. En segundo lugar, la base de datos de incidentes de AI tiene muchos colaboradores que saben inglés y español y pueden corregir malas traducciones. Si bien la traducción automática admite más de 130 idiomas, no creemos que los peores idiomas traducidos entre estos sean lo suficientemente sólidos como para confiar en ellos. De hecho, en nuestra prueba de desempeño entre español e inglés, encontramos que el texto resultante era interpretable, pero incómodo e inconsistente. Las traducciones encajan bien con el propósito de compartir y descubrir incidentes, pero no son una buena escritura. A medida que ganemos confianza en la calidad de la traducción automática de idiomas de bajos recursos y/o ampliemos nuestra comunidad de colaboradores, agregaremos idiomas a la interfaz de usuario de la base de datos. Esperamos agregar soporte en francés dentro del próximo mes.

En resumen: el camino a seguir más conveniente y cauteloso es agregar un solo idioma antes de escalar la función. Puede ayudar a acelerar nuestros planes para indexar todo, desde albanés hasta zulú.

Llamada a la acción

Fundamos Responsible AI Collaborative (la organización que rige la base de datos de incidentes de IA) para desarrollar en colaboración los sistemas necesarios para compartir incidentes entre culturas, idiomas y geografías. Necesitamos su ayuda para garantizar que nuestras traducciones sirvan a la teoría del cambio de la base de datos de incidentes. Contáctenos si desea ayudar a traducir y localizar idiomas distintos del inglés.

Anexo: Riesgos del modelo y mejores prácticas

Advertencia: aquí damos un ejemplo de una mala traducción para ilustrar cómo la traducción automática produce inevitablemente incidentes de IA. El incidente en cuestión es ofensivo e insultante.

La traducción automática es un caso ilustrativo ideal de por qué la recopilación y difusión de incidentes de IA es tan importante. Pocos argumentarían que el mundo estaría mejor sin la traducción automática, pero la tecnología produce regularmente incidentes ofensivos y [a veces peligrosos] (https://incidentdatabase.ai/cite/72).

Un barco en el puerto es seguro, pero no es para eso que se construyen los barcos.

Para extender un aforismo sobre la seguridad de los barcos, existe una variedad de tecnologías de apoyo (satélites meteorológicos, radar, etc.) y procesos (¡cerrar las escotillas!) que determinan cómo y si es apropiado zarpar. Las empresas, incluida la Colaboración de IA responsable, deben crear sistemas y procesos para el seguimiento, la mejora y la notificación de incidentes de modelos.

Volviendo al contexto de la traducción automática, el desafío de generalización sin resolver es uno de contexto y subtexto. Los humanos tienen un "modelo" para su audiencia que les permite comunicar más que la traducción literal del texto. Solucionar este subtexto es a menudo donde la traducción automática falla. Por ejemplo, un colaborador de la base de datos de incidentes compartió recientemente esta imagen de la función de traducción basada en cámara de Google en Google Lens,

Se presentan dos imágenes una al lado de la otra de un libro. La imagen de la izquierda no está modificada, mientras que la imagen de la derecha traduce la portada del libro del coreano al inglés. El título del libro ha sido mal traducido como "lechón de pollas".

Esta es una traducción que nunca debe realizarse en el contexto de un libro del primer ministro de cultura de Corea. Sin embargo, en una discusión con lectores del idioma coreano, puede ver cómo una traducción sin contexto que probablemente esté entrenada en comunicaciones por Internet podría llegar a esta traducción.

El título del libro se traduce literalmente como "eso, eso", que también significa "en la punta de la lengua". Combine esto con el uso coreano de "eso" como jerga para los genitales masculinos, y llegará a esta desafortunada mala traducción. Sin que el contexto del texto traducido sea el título de un libro de una persona seria, la traducción más probable (y más ofensiva) es la que se encontraría en los foros de Internet.

¿Podemos evitar agregar la base de datos de incidentes de IA como un incidente en la base de datos de incidentes de IA?

No. Pero podemos reducir la probabilidad y los impactos negativos. Hacia esto, las mejores prácticas que identificamos son: (1) identificar siempre en la interfaz de usuario cuando el contenido se ha traducido automáticamente, (2) proporcionar un enlace al texto fuente sin traducir, (3) proporcionar la capacidad para que las personas informen, corrijan y mejorar las malas traducciones, (4) validar la eficacia de las traducciones entre idiomas antes de que esas traducciones estén disponibles de forma general y (5) desarrollar una comunidad de personas que puedan interpretar y responder a los problemas en las traducciones en caso de que ocurran.

Problema 1888

Incidentes Asociados

Incidente 2851 Reporte
Google Lens’s Camera-Based Translation Feature Provided an Offensive Mistranslation of a Book Title in Korean

Informes de incidentes multilingües

¿Cómo funciona esto?

Llamada a la acción

Anexo: Riesgos del modelo y mejores prácticas

Problema 1888

Incidentes Asociados

Incidente 2851 ReporteGoogle Lens’s Camera-Based Translation Feature Provided an Offensive Mistranslation of a Book Title in Korean

Informes de incidentes multilingües

¿Cómo funciona esto?

Llamada a la acción

Anexo: Riesgos del modelo y mejores prácticas

Incidente 2851 Reporte
Google Lens’s Camera-Based Translation Feature Provided an Offensive Mistranslation of a Book Title in Korean