La primavera pasada, cuando Karim Lakhani comenzó a probar el impacto de ChatGPT en el trabajo de consultores empresariales de élite, pensó que estarían encantados con la herramienta. En un estudio preliminar de dos docenas de trabajadores, el robot lingüístico les ayudó a completar dos horas de tareas en 20 minutos.
“Pensé que ellos, como yo, pensarían: ‘¡Genial! ¡Puedo hacer mucho más!” dijo el Dr. Lakhani, profesor de la Escuela de Negocios de Harvard.
En cambio, los consejeros experimentaron sentimientos de inquietud. Apreciaron el hecho de haber hecho un mejor trabajo en menos tiempo. Pero el rápido trabajo de ChatGPT amenazó su percepción de sí mismos como trabajadores altamente calificados y algunos temieron depender demasiado de él. «Estaban realmente preocupados y sentían que esto los deprimiría y se convertiría en una especie de calorías vacías para su cerebro», dijo el Dr. Lakhani.
Después de estas pruebas preliminares, el Dr. Lakhani y sus colegas diseñaron un experimento controlado más grande para medir cómo ChatGPT afectaría a más de 750 trabajadores administrativos. Este estudio, actualmente bajo revisión en una revista científica, indicó resultados marcadamente contradictorios en el producto del trabajo de los consultores. ChatGPT mejoró enormemente la velocidad y la calidad del trabajo en una tarea de lluvia de ideas, pero desvió a muchos consultores al realizar un trabajo más analítico.
El estudio también detalló los diferentes sentimientos de los trabajadores sobre la herramienta. Un participante lo comparó con el fuego que Prometeo robó a los dioses para ayudar a los mortales. Otro le dijo al colega del Dr. Lakhani, Fabrizio Dell’Acqua, que ChatGPT parecía comida chatarra: difícil de resistir, fácil de consumir pero, en última instancia, perjudicial para el consumidor.
En un futuro próximo, se espera que los robots lingüísticos como ChatGPT de OpenAI, Llama de Meta y Gemini de Google asuman muchas tareas administrativas, como redacción de textos publicitarios, preparación de informes legales y redacción de cartas de recomendación. El estudio es uno de los primeros en mostrar cómo la tecnología podría afectar al trabajo de oficina real y a los trabajadores de oficina.
«Es un estudio bien diseñado, especialmente en un área incipiente como esta», afirmó Maryam Alavi, profesora de la Facultad de Negocios Scheller del Instituto de Tecnología de Georgia que no participó en los experimentos. El Dr. Alavi, que ha estudiado el impacto de las nuevas tecnologías digitales en los trabajadores y las organizaciones, también señaló que el estudio «realmente resalta cuánto más necesitamos aprender».
Para el estudio se contrataron consultores de gestión del Boston Consulting Group, una de las firmas de consultoría de gestión más grandes del mundo. La empresa había prohibido a sus consultores utilizar robots de inteligencia artificial en su trabajo.
«Queríamos involucrar a un gran grupo de trabajadores reales que trabajaran en tareas reales», dijo François Candelon, director ejecutivo de la empresa que ayudó a diseñar los experimentos.
Los voluntarios se dividieron en dos grupos, cada uno de los cuales trabajó en un problema diferente de consultoría de gestión. Dentro de cada grupo, algunos consejeros usaron ChatGPT después de 30 minutos de capacitación, otros lo usaron sin instrucción y otros no lo usaron.
Una de las tareas era pensar en un nuevo tipo de zapato, esbozar un plan de negocios convincente para hacerlo realidad y escribir de manera convincente sobre ello. Algunos investigadores creían que sólo los humanos podían realizar tareas tan creativas.
Ellos estaban equivocados. Los consultores que utilizaron ChatGPT produjeron trabajos que los evaluadores independientes calificaron alrededor de un 40% mejor en promedio. De hecho, las personas que simplemente cortaron y pegaron la producción de ChatGPT recibieron calificaciones más altas que sus pares que complementaron su trabajo con sus propios pensamientos. Y los asesores asistidos por IA fueron más de un 20% más rápidos.
Los estudios de ChatGPT de este año sobre análisis jurídico y trabajos de redacción administrativos encontraron que el bot ayuda a las personas de bajo rendimiento más que a las más calificadas. El Dr. Lakhani y sus colegas encontraron el mismo efecto en su estudio.
Sin embargo, en una tarea que requería un razonamiento basado en evidencia, ChatGPT no resultó de ninguna ayuda. En este grupo, se pidió a los voluntarios que recomendaran una empresa inventada para el estudio. Tuvieron que interpretar datos de hojas de cálculo y vincularlos a transcripciones ficticias de entrevistas con ejecutivos.
En este caso, ChatGPT engañó a los empleados para que confiaran demasiado. Los humanos sin ayuda tuvieron la respuesta correcta el 85 por ciento de las veces. Las personas que utilizaron ChatGPT sin formación obtuvieron una puntuación de poco más del 70%. Aquellos que habían sido capacitados obtuvieron resultados aún peores, obteniendo la respuesta sólo el 60% de las veces.
En entrevistas realizadas después del experimento, «la gente nos dijo que no lo comprobaron porque es muy refinado y se siente muy bien», dijo Hila Lifshitz-Assaf, profesora de administración de la Warwick Business School en Gran Bretaña.
Muchos consultores dijeron que ChatGPT les inquietaba acerca de cómo la herramienta cambiaría su profesión e incluso su sentido de identidad. Casi tres de cada cuatro participantes dijeron a los investigadores que temen que el uso de ChatGPT cause que sus músculos creativos se atrofien, dijo Candelon del Boston Consulting Group.
«Si no ha tenido una crisis existencial con esta herramienta, es que todavía no la ha utilizado mucho», dijo otro coautor, Ethan Mollick, profesor de gestión en la Escuela Wharton de la Universidad de Pensilvania.