Una ola de informes publicados a fines de enero trajo noticias desalentadoras para los líderes empresariales que han apostado fuerte por la inteligencia artificial: la mayoría de las empresas están viendo mucha actividad pero poca mejora en sus resultados.
Estudios publicados en enero de 2026 por la consultora PwC, junto con las empresas tecnológicas Anthropic, OpenAI y Google, muestran un panorama consistente. Los trabajadores utilizan estas herramientas más que nunca. Sin embargo, los ahorros de costes y los aumentos de ingresos previstos no se han materializado en la mayoría de las organizaciones.
Las cifras son contundentes. La encuesta de PwC de 2026 a directores ejecutivos reveló que el 56 % no observó ni menores costos ni mayores ingresos durante el último año. Solo el 12 % reportó mejoras en ambas áreas.
Esa brecha es importante. Las empresas han invertido mucho en licencias de software y capacitación. La encuesta sugiere que el problema no es la tecnología, sino cómo la están implementando. Los ejecutivos que reportaron beneficios financieros tenían entre dos y tres veces más probabilidades de haber integrado estas herramientas en sus operaciones y actividades de atención al cliente, en lugar de simplemente distribuir cuentas de software.
Simplemente añadir más usuarios no se traduce en un mejor rendimiento financiero. Las empresas necesitan rediseñar su forma de trabajar, no solo distribuir nuevas herramientas.
Entonces, si contar usuarios activos no funciona, ¿qué deberían medir las empresas? Anthropic publicó el 15 de enero sus hallazgos, que proponen trac lo que denomina "primitivos económicos": el tipo y la dificultad de las tareas que las personas asignan a estos sistemas.
La diferencia entre los tipos de tareas es importante. Que un sistema resuma un correo electrónico requiere poca sofisticación y ahorra un tiempo mínimo. Delegar un proyecto de codificación complejo de varios pasos representa un verdadero reemplazo de mano de obra. La investigación de Anthropic muestra que las solicitudes de desarrollo de software suponen un promedio de 3,3 horas de trabajo humano equivalente, mientras que las tareas administrativas personales solo requieren 1,8 horas.
Los gerentes empresariales deben ir más allá del simple recuento de usuarios conectados. Necesitan saber qué tipo de trabajo se está realizando realmente. El uso excesivo de tareas triviales equivale a un desperdicio de dinero. El uso concentrado en tareas complejas se traduce en ganancias reales de productividad.
El análisis de OpenAI, publicado el 21 de enero, respalda este argumento. La compañía dent lo que denomina un " exceso de capacidad", un desajuste entre lo que estos sistemas pueden lograr y cómo la gente realmente los utiliza.
Dos hallazgos destacan. En primer lugar, los usuarios más activos utilizan funciones avanzadas, en particular capacidades de razonamiento sofisticadas, siete veces más que los usuarios típicos. En segundo lugar, cuando OpenAI examinó los patrones de uso en más de 70 países, encontró una diferencia de tres veces en la intensidad con la que las personas utilizan estas funciones avanzadas.
Esto crea una nueva dinámica competitiva. Las empresas que operan en regiones donde los trabajadores saben cómo aprovechar al máximo sus capacidades superarán a sus rivales que utilizan el mismo software de forma menos sofisticada. La alfabetización digital por sí sola no basta. Los trabajadores necesitan lo que los investigadores denominan «fluidez agente», la capacidad de delegar tareas complejas de varios pasos.
La actualización del 20 de enero de Google para su software Workspace aborda otro desafío de medición. La empresa ahora muestra análisis de uso completos, incluyendo qué equipos utilizan las funciones y con qué frecuencia, directamente en los paneles de administrador.
Este cambio es importante. Transforma el gasto en una categoría que los departamentos financieros pueden supervisar y auditar. El panel ofrece datos de utilización para respaldar o refutar la afirmación de un gerente sobre una mayor eficiencia.
¿Qué medidas deberían tomar los ejecutivos de forma diferente? Los analistas del sector sugieren cinco prioridades:
los funcionarios financieros necesiten informes uniformes sobre los efectos de las pérdidas y ganancias durante los próximos tres meses. Probablemente habrá competencia entre los proveedores de software para que sus técnicas de medición se conviertan en estándares de la industria. Los reguladores también podrían solicitar datos sobre la autonomía del funcionamiento de estos sistemas y las medidas de seguridad implementadas.
El mensaje de este conjunto de estudios es claro: la fase experimental ha terminado. Las empresas ahora se enfrentan a la presión de mostrar un rendimiento concreto de sus inversiones.
Si estás leyendo esto, ya estás al tanto. Sigue leyendo nuestro boletín .