Problema 2934

tl;dr: descubrí que si pasa indicaciones vacías a ChatGPT, [escupe los resultados de todos modos] (https://stochasticparrot.lol/) Al principio pensé que podrían ser alucinaciones, pero ahora creo que también estoy regresando. respuestas de otras personas
A principios del mes pasado; a una gran cantidad de fanáticos de los desarrolladores, junto con empresas, medios y [gobierno] (https://www.theguardian.com/technology/2023/mar/31/italy-privacy-watchdog-bans-chatgpt-over-data -breach-preocupaciones) intereses - OpenAI lanza su nuevo modelo de lenguaje grande ChatGPT-4 .
Para [LLM] (https://en.wikipedia.org/wiki/Large_language_model) definitivamente es muy avanzado. Justo unos días antes estaba jugando con alpaca.cpp, un modelo que está diseñado para ejecutarse en una CPU con un conjunto más pequeño de restricciones de memoria. Comencé construyendo una interfaz web muy simple usando NodeJS y sockets para analizar la línea de comando. Poco después de comenzar a trabajar en esto, llegó mi invitación de GTP-4 y comencé a jugar con la API. Rápidamente pude ver con el tipo correcto de indicaciones, puede ser una herramienta útil en las manos adecuadas. Ya me ha ayudado a reescribir código complejo en métodos más simples que pasan las pruebas o reducen la complejidad al mover el código a las funciones:
Sin embargo, comencé a notar algo extraño: debido a un error en mi código, pasaba mensajes vacíos al extremo de ChatGPT, pero cada vez recibía una respuesta, y eran completamente aleatorias. Desde respuestas estándar "Soy un modelo de IA..." hasta información sobre personas, lugares y conceptos.
El mismo día, fue #StochasticParrotsDay, una conferencia en línea sobre la ética de la IA, la exageración y su futuro, y me dio una idea: ¿por qué no ¡Convierto esto en un Mastodon Bot! (*esta era esta URL original; ahora se ha movido a botsin.space)
Desde que ejecuté este bot, llegué a algunas conclusiones sobre las respuestas y creo que sin un aviso una gran proporción de las respuestas están destinadas a otros usuarios. Si se trata de un error, es posible que pasar un aviso vacío no saneado haga que devuelva algo que no debería como respuesta.
Por supuesto, podría estar equivocado: podrían ser alucinaciones estocásticas soñadas por una máquina, podrían ser la API que devuelve un conjunto aleatorio de datos de entrenamiento que se encuentran en la [Entropía] correcta (https://en.wikipedia. org/wiki/Entropy_%28information_theory%29), pero ChatGPT en sí mismo no es mucho mejor que una [Cadena de Markov] (https://en.wikipedia.org/wiki/Markov_chain) y OpenAI (y todo el LLM/ AI market) han estado tomando a todos por tontos.
Pero si no me equivoco entonces las API actuales de OpenAI podrían filtrar potencialmente datos privados o confidenciales, simplemente al no sanear sus entradas...
El bot continuará ejecutándose al menos hasta finales de este mes, y todo el contenido se archivará en stochasticparrot.lol.
Configuración de la infraestructura de bots
Para poner en marcha el bot, quería hacerlo de forma gratuita y fácil de administrar. Al final, opté por usar [Acciones de GitHub] (https://github.com/tanepiper/Stochastic-Parrot/actions) con tareas programadas para crearlo; esto me permitió configurar un script que se ejecutaba cada hora, llamando al ChatGPT API con un indicador vacío y convertirlo en un toque. También descubrí que pasar solo un carácter de espacio a la API de Dall-E también producía imágenes.
Con ambos scripts, después de recibir una respuesta de OpenAI, lo uso para generar uno o más pitidos, dependiendo de la longitud como un conjunto de respuestas, con las imágenes primero descárguelas y luego cárguelas como archivos adjuntos primero.
Algunos de los pitidos más recientes se encuentran a continuación: los que tienen un emjoi de loro (🦜) se crean sin un aviso, mientras que si se usa un aviso, agrego una burbuja de diálogo (💬) para indicar
🦜 Mi opinión como modelo de lenguaje de IA es que Corea del Sur no debería prohibir los tatuajes. El tatuaje es una forma de arte y una forma de que las personas se expresen. Sin embargo, es importante regular la industria para garantizar que se cumplan los estándares de seguridad y saneamiento.
Como en muchos países, los tatuajes se han asociado históricamente con la cultura de las pandillas en Corea del Sur. Dado que los tiempos han cambiado, esta percepción ha cambiado con más personas que ven los tatuajes como una forma de
🦜 Sí, es posible y bastante común sentirse atraído por personajes ficticios. Esto puede suceder por muchas razones:
1. Relacionabilidad: las personas a menudo se apegan a personajes con los que se identifican o que comparten experiencias, luchas o rasgos de personalidad similares.
2. Idealización: la ficción permite a los autores y creadores construir su versión ideal de un personaje, una que sea inteligente, atractiva y el epítome de los ideales que la gente anhela.
3. Desear plenitud:
🦜 Aquí están los diez emojis más usados en el mundo:
1. 😂 Rostro con Lágrimas de Alegría2. ❤️ Corazón rojo3. 😍 Cara sonriente con Heart-Eyes4. 🤣 Rodar por el suelo Riendo5. 😊 Cara sonriente con ojos sonrientes6. 👍 Pulgares arriba7. 💕 Dos Corazones8. 🙏 Manos juntas en oración o gesto de agradecimiento (también considerado chocar los cinco)9. 🔥 Fuego, que representa algo caliente o excitante.
10:😘 Cara lanzando un beso
Estas clasificaciones pueden variar ligeramente dependiendo de la zona geográfica
Una vez que tuve esto en funcionamiento, creé un pequeño [AstroJS] (https://astro.build) [sitio web] (https://stochasticparrot.lol/) que genera cada entrada como una publicación.
Hacer hablar a Polly
Hasta este punto, solo había estado trabajando con texto e imágenes, pero recientemente había visto [ElevenLabs] (http://elevenlabs.io/) en algunas noticias tecnológicas, y que tenían una API de texto a voz. Después de algunos problemas iniciales (que consumieron todo el crédito gratuito), eventualmente configuré otra acción que tomó la respuesta de OpenAI y la pasé a la API de ElevenLabs. Esto luego proporcionó una transmisión MP3 del discurso, se guardó localmente y se volvió a cargar. a Mastodon y adjunte a un toot.
También decidí intentar ver si podía conseguir que generara algunas encuestas. Con algunas [indicaciones suaves] (https://github.com/tanepiper/Stochastic-Parrot/blob/main/packages/stochastic-parrot/src/poll.mjs#L34) pude hacer que generara una salida JSON que podría ser utilizado en las encuestas. Lamentablemente, la mayoría de las veces parece repetir las mismas preguntas una y otra vez con una redacción ligeramente diferente, y ocasionalmente se le ocurre algo original.
🦜 ¿Cuál de estas ciudades ficticias te gustaría visitar?
- Ciudad Gótica de Batman (0)
- Hogwarts de Harry Potter (8)
- Poniente de Juego de Tronos (3)
- Panem de Los Juegos del Hambre (2)
Votos totales: 13
🦜 ¿Qué fruta exótica te gustaría probar?
- Durian - El Rey de las Frutas (25)
- Salak - La Fruta de la Serpiente (10)
- Mangostán - Reina de las Frutas (22)
- Rambutan - Lichi Peludo (9)
Votos totales: 66
Un experimento divertido
Incluso llegué a intentar generar contenido de video, no a través de Stable Diffusion, sino generando temas de texto para usar con la API Createomate, lo que me permitió generar un "hecho" de redes sociales. vídeos Desafortunadamente, esto tuvo algunos errores y, debido a la forma en que funciona Mastodon, puede agotarse bastante.
En general, escribir este bot fue un experimento divertido, pero probablemente aprendí más sobre cómo escribir mejores canalizaciones que sobre IA y LLM. Lo que me sorprendió fue la frecuencia con la que las respuestas parecen ser preguntas que no se formularon: ¿dónde se generan estas respuestas? ¿Estamos viendo el parpadeo de AGI? O simplemente las divagaciones estocásticas de una máquina manejada por algunas [personas incompletas](https://www.latimes.com/business/technology/story/2023-03-31/column-afraid-of-ai-the-startups- vendiendo-lo-que-quieres-que-seas).