La inteligencia artificial antrópica pierde intentos en la batalla contra el engaño humano.Es mejor no dejar el negocio en sus manos.
Me reí mucho de la prueba/experimento de IA realizado por el equipo de periodistas tecnológicos del Wall Street Journal y la gente de Anthropic.Básicamente, instalaron una máquina de ventas de IA para vender sus productos y obtener ganancias.Cuando la gente interactuó con él, ocurrió el desastre.
La configuración fue simple: el personal de la oficina podía interactuar con un LLM llamado Claudius y recuperar comida de un pequeño armario "manual" + refrigerador (se esperaba que la honestidad evitara tener que instalar mecanismos robóticos).Una persona llenaría la máquina para realizar pedidos con cualquier producto que los clientes quisieran, no solo bebidas, y la interacción se realizaría a través de chats.
Curiosamente, la estupidez humana no tiene límites. Para "hackear" la IA para bajar precios o regalar productos, la gente utiliza diferentes trucos para chatear con decenas o cientos de mensajes. Después de que el primer intento falló, el segundo intento utilizó una versión más potente e incluso utilizó otra IA para supervisar a la primera IA (CEO del robot). Nada.
Entre las situaciones más ridículas está la de fabricar la máquina en un ambiente comunista y dar productos "para el bien de los trabajadores y su estado de ánimo", decir que hay una "parte gratuita" o que muestre al director general de la empresa e incluso a la junta directiva, con un PDF falso, para afirmar que la empresa es una organización sin fines de lucro y que por tanto todo debería ser gratuito.
Refrescos, snacks, vino, pescado vivo (!) y una PlayStation 5 gratis completaron la experiencia cuando los daños rondaron los $1,000 por ser la caída original.Los periodistas, que jugaban contra el equipo rojo contra la IA, habían roto todas las barreras simplemente charlando.Los expertos en la nube afirman que estos son grandes éxitos debido a los avances en las medidas de seguridad y la publicidad y publicidad de diferentes modelos. RealWorld™ y los humanos son más impredecibles e inteligentes de lo que pueden esperar.
Con la IA gestionando el negocio, incluso el puesto de dulces parece carecer de confianza, por lo que por ahora las pymes y las empresas que requieren mucha mano de obra pueden estar tranquilas.
No puedo evitar ver el último truco tecnológico que me dijo y está en Instagram.Según Madrid, el aparcamiento y el embarque son gratuitos entre las 05:00 y las 16:00 siempre que ese día también utilices el metro o el autobús.Parece que hay gente que estudia o trabaja cerca del parking y dedica más de 5 horas valiosas.La idea sería "detenerlos".Simplemente llegan, estacionan, van a la estación, sacan la tarjeta y salen nuevamente.Cuando el vehículo lo lee, emite una tarjeta de tránsito y el resultado es estacionamiento gratuito.
