Incidentes Asociados
Basándome en Google/Google Books/Google Scholar/Libgen/LessWrong/Hacker News/Twitter, he recopilado una gran cantidad de variantes de la historia de varias fuentes; a continuación, en orden cronológico inverso por década.
Algo similar sucedió aquí en los Estados Unidos en una de nuestras instituciones de investigación. Donde un perceptrón había sido entrenado para distinguir entre, esto era con fines militares, podría... estaba mirando una escena de un bosque en la que había tanques camuflados en una imagen y ningún tanque camuflado en la otra. Y el perceptrón, después de un poco de entrenamiento, consiguió... hizo una distinción 100% correcta entre estos dos conjuntos diferentes de fotografías. Luego, unas horas más tarde, se avergonzaron al descubrir que los dos rollos de película se habían revelado de manera diferente. Entonces, estas imágenes eran un poco más oscuras que todas estas imágenes y el perceptrón solo estaba midiendo la cantidad total de luz en la escena. Pero fue muy inteligente por parte del perceptrón encontrar alguna forma de hacer la distinción.
Como si tuviera un amigo en Italia que tenía un perceptrón que miraba una imagen... tenía entradas visuales. Entonces, él... tenía partituras de música coral escritas por Bach y tenía partituras corales escritas por estudiantes de música en el conservatorio local. Y tenía un perceptrón, una gran máquina, que miraba esto y aquello y trataba de distinguir entre ellos. Y fue capaz de entrenarlo para distinguir entre las obras maestras de Bach y los corales bastante buenos de los estudiantes del conservatorio. Bueno, entonces, nos mostró estos datos y yo los estaba revisando y lo que descubrí fue que en la esquina inferior izquierda de cada página, uno de los conjuntos de datos tenía notas enteras únicas. Y creo que los de los estudiantes por lo general tenían cuatro notas negras. De modo que, de hecho, era posible distinguir entre estas dos clases de... de piezas musicales simplemente mirando la esquina inferior izquierda... inferior derecha de la página. Entonces, le dije esto a… a nuestro amigo científico y revisó los datos y dijo: ‘Adivinaste bien. Así es… así es como ocurrió hacer esa distinción’. Pensamos que era muy divertido.
Ahora, cuando sucede este tipo de cosas, los laboratorios de investigación tienden a dividirse según la edad. Los cabellos jóvenes dicen “¡Genial! ¡Estamos en la fila para el Premio Nobel!”. y los viejos jefes dicen “Algo salió mal”. Desafortunadamente, los viejos jefes suelen tener razón, como en este caso. Lo que sucedió fue que las fotografías que contenían tanques habían sido tomadas en la mañana mientras el ejército jugaba tanques en el campo de tiro. Después del almuerzo, el fotógrafo había regresado y tomado fotografías desde los mismos ángulos del campo vacío. Entonces, la red identificó la característica individual más confiable que le permitió clasificar los dos conjuntos de fotos, a saber, el ángulo de las sombras. “AM = tanque, PM = sin tanque”. Esta fue una forma extremadamente efectiva de clasificar los dos conjuntos de fotografías en el conjunto de entrenamiento. Lo que ciertamente no era era un programa que reconoce tanques. La gran ventaja de las redes neuronales es que encuentran sus propios criterios de clasificación. ¡El gran problema es que puede que no sea el que quieres!
La historia va algo así. Un equipo de investigación estaba entrenando una red neuronal para reconocer imágenes que contenían tanques. (Te dejaré adivinar por qué eran tanques y no tazas de té). Para hacer esto, le mostraron dos conjuntos de fotografías de entrenamiento. Un conjunto de imágenes contenía al menos un tanque en algún lugar de la escena, el otro conjunto no contenía tanques. La red tuvo que ser entrenada para discriminar entre los dos conjuntos de fotografías. Eventualmente, después de todas esas cosas de propagación hacia atrás, dio correctamente la salida "tanque" cuando había un tanque en la imagen y "sin tanque" cuando no lo había. Incluso si, digamos, solo un poco del arma se asomaba desde detrás de una duna de arena, decía "tanque". Luego presentaron una imagen en la que no se veía ninguna parte del tanque, en realidad estaba completamente oculto detrás de una duna de arena, y el programa decía "tanque".
Todavía no está claro cómo se podría entrenar una red neuronal artificial para lidiar con "el mundo" o cualquier conjunto de problemas realmente abiertos. Ahora, algunos lectores pueden sentir que esta imprevisibilidad no es un problema. Después de todo, estamos hablando de entrenamiento, no de programación, y esperamos que una red neuronal se comporte más como un cerebro que como una computadora. Dada la utilidad de las redes en el aprendizaje no supervisado, podría parecer que realmente no tenemos que preocuparnos de que el problema sea de un tamaño manejable y que el proceso de entrenamiento sea predecible. Este no es el caso; realmente necesitamos un problema manejable y bien definido para que el proceso de entrenamiento funcione. Un famoso mito urbano de la IA puede ayudar a aclarar esto.
Estos hechos refutan un argumento neoplatónico a favor de la inmaterialidad esencial del alma, a saber. que dado que la mente trata con representaciones universales, opera de una manera específicamente inmaterial... Entonces, la conciencia no se explica por el conexionismo. Los resultados del entrenamiento de redes neuronales no siempre son los esperados. Un equipo pretendía entrenar redes neuronales para re