Estrategia de gestión de datos para la IA

Puntos Clave

Los datos perfectos son un mito, y la adopción de IA empresarial no debería esperar a que existan. Las organizaciones necesitan una estrategia deliberada de gestión de datos para la IA basada en los datos existentes, no un plan aplazado indefinidamente y condicionado a unos datos limpios que nunca llegarán por completo.
Los silos de datos son la principal barrera para el rendimiento de la IA empresarial, ya que el 89 % de los profesionales de TI afirma que los datos en silos afectan negativamente a las operaciones e impiden que los sistemas de IA actúen a partir de información fiable y unificada.
Elegir el enfoque adecuado de preparación de datos para cada caso de uso es fundamental. La limpieza manual ofrece precisión para flujos de trabajo estructurados y de alta precisión, mientras que la IA generativa se adapta mejor a escenarios no estructurados y de gran volumen en los que la velocidad pesa más que la fidelidad perfecta.
La mayor brecha en la IA y la gestión de datos es la madurez de los procesos, no la tecnología. Las empresas que inviertan ahora en visibilidad de datos, marcos de gobernanza, infraestructura en la nube y validación de resultados capturarán el mayor valor de la IA a medida que los sistemas autónomos y agénticos se conviertan en la norma.

Un hombre trabajando en un escritorio con tres monitores de ordenador que muestran hojas de cálculo, gráficos y código en un entorno de oficina moderno y diáfano. Se ven otros empleados.

Los datos nunca estarán completamente limpios. Es solo cuestión de grado.

Lo asimilé el primer día de mi máster en ciencia de datos, cuando un profesor nos advirtió de que aproximadamente el 80 % de nuestro tiempo se dedicaría al preprocesamiento y la limpieza, no a crear modelos.

Años después, como directora principal de producto de IA, aprendizaje automático y analítica en Ivanti, he comprobado que esa orientación sigue siendo extraordinariamente válida en la práctica.

Mientras mi equipo y yo trabajamos para sacar la IA del laboratorio y llevarla a producción para los equipos de TI y seguridad, la gestión de datos para la IA importa más que nunca. Informe Technology at Work 2025 de Ivanti reveló que el 42 % de los trabajadores de oficina utilizan herramientas de IA generativa en el trabajo, 16 puntos más en un solo año. Entre los profesionales de TI, la adopción alcanzó el 74 %.

El interés existe. También la duda. Muchos responsables de TI saben que sus datos no están limpios, sus sistemas están fragmentados y su gobernanza no está al día. La buena noticia: no necesita datos perfectos para adoptar la IA.

Necesita una estrategia clara de gestión de datos para la IA basada en lo que ya tiene.

Por qué los datos de TI nunca son perfectos

En la TI empresarial, los problemas de calidad de los datos no son anomalías. Son la realidad de base de la IA y la gestión de datos. Los tickets se clasifican de forma incoherente. Los inventarios de activos están incompletos. La información crítica reside en silos repartidos por distintos sistemas. Y el texto no estructurado de los tickets de soporte y las respuestas a encuestas se resiste a una categorización ordenada.

La investigación de Ivanti confirma hasta qué punto llega este problema. Nuestro Informe Autonomous Endpoint Management Advantage 2026 reveló que el 89 % de los profesionales de TI afirman que los datos en silos afectan negativamente a las operaciones, y el 39 % señala que los silos provocan un uso ineficiente de los recursos.

Nuestro Informe Tech at Work cuenta una historia similar:

El 38 % de los profesionales de TI citan la complejidad tecnológica como una barrera significativa para unas operaciones eficaces, cuatro puntos más que el año anterior.
Casi la mitad (46 %) afirma que las nuevas implementaciones de software en realidad aumentan el volumen de tickets en lugar de reducir el ruido.

Si a esto añadimos que el 48 % de las organizaciones sigue ejecutando software al final de su vida útil, la situación queda clara: es un entorno de datos imperfecto por diseño.

Como me explicó David Pickering, director de marketing de producto de Ivanti: cuando los datos tienen formatos distintos según el sistema, se introducen de manera incoherente, están aislados por departamento y se han visto condicionados por años de adquisiciones, los flujos de trabajo de IA agéntica que abarcan esos sistemas pronto se encuentran con problemas. No puede decirle a una IA en qué datos debe confiar si usted mismo no lo sabe. Y sin esa base, incluso las automatizaciones bien diseñadas acabarán fallando por las costuras.

En otras palabras: «si entra basura, sale basura» sigue siendo válido. Pero los datos impecables no van a llegar pronto. Cualquier enfoque serio de la gestión de datos maestros y el aprendizaje automático debe tener en cuenta el desorden, no esperar a que se resuelva por sí solo.

El marco de decisión: elegir su estrategia de gestión de datos

Existen dos vías principales para la gestión de datos para la IA en TI. Ambas son válidas, ambas implican concesiones y muchas organizaciones utilizarán las dos para distintos casos de uso.

Vía 1: limpieza manual/programática

Cuando mi equipo introdujo la clasificación de tickets en el sistema ITSM de Ivanti, estábamos entrenando un modelo para categorizar solicitudes de servicio. Eso exigía datos de entrenamiento limpios y bien etiquetados. Así que incorporamos un paso al flujo de trabajo que daba a los administradores la oportunidad de revisar y limpiar los datos antes de que alimentaran el modelo. Esa revisión humana supuso una diferencia medible en la precisión.

Esta vía funciona mejor cuando se entrena o ajusta un modelo personalizado, se ingieren datos en una base de conocimientos o se trabaja con conjuntos de datos estructurados en los que pueden definirse estándares de calidad. La contrapartida es el tiempo y los recursos. El resultado es una alta precisión y un control total.

También funciona mejor cuando ya existe una higiene de datos básica. Muchas organizaciones aún no han llegado a ese punto: solo el 35 % realiza un seguimiento de la antigüedad del dispositivo o de su ubicación, y solo el 37 % realiza un seguimiento del estado de los parches.

Vía 2: procesamiento con IA generativa

A veces la limpieza manual no es viable. Lo aprendí trabajando en la analítica de encuestas de Ivanti. Las respuestas a encuestas son algunos de los datos más desordenados con los que se encuentra cualquier equipo de TI: texto libre, formatos incoherentes y niveles de detalle muy variables. Limpiarlos manualmente a escala no es realista.

En su lugar, utilizamos grandes modelos de lenguaje para identificar temas, patrones y sentimiento en entradas incompletas y no estructuradas. Podíamos resumir encuestas completas, señalar factores de satisfacción y sacar a la luz información práctica rápidamente.

Esta vía es ideal para datos no estructurados de gran volumen, situaciones en las que la limpieza manual sencillamente no es posible o cualquier escenario en el que el coste de la limpieza supere el valor del resultado. Requiere acceso a grandes modelos de lenguaje capaces y validar que el caso de uso encaja.

Elegir entre las dos estrategias

La decisión depende del volumen y la variedad de los datos, las limitaciones de tiempo, los requisitos de precisión y el nivel de control que necesite sobre dónde van sus datos y cómo se procesan.

¿Está ajustando un modelo en el que la precisión es crítica? Invierta en limpieza. ¿Trabaja con grandes volúmenes de entradas no estructuradas donde la velocidad importa? Apóyese en la IA generativa. El objetivo es elegir de forma deliberada, no quedarse inmóvil porque los datos no sean perfectos.

Crear una infraestructura preparada para la IA para la gestión de datos

Los servicios en la nube son esenciales en este punto, y no lo digo a la ligera. Cuando mi equipo creó una puntuación de experiencia digital para medir, cuantificar y mejorar la experiencia digital de los empleados, la nube fue el habilitador crítico. Actuó como nuestro centro de integración, reuniendo tickets de servicio, telemetría de dispositivos, rendimiento de aplicaciones y señales de seguridad.

Ese nivel de integración de múltiples fuentes no es viable a escala sin infraestructura en la nube. La nube también nos permitió ejecutar un modelo de IA híbrido que procesa simultáneamente texto y telemetría numérica. Dar soporte a miles de dispositivos y usuarios con ese nivel de complejidad no es viable en instalaciones locales.

Más allá de la computación, una infraestructura preparada para la IA implica abordar la gestión de datos maestros para el aprendizaje automático. Las organizaciones necesitan una única fuente de verdad en todos sus sistemas. Los formatos de datos deben estandarizarse, especialmente cuando el crecimiento mediante adquisiciones introduce plataformas heredadas con convenciones diferentes.

La gobernanza de datos complica aún más el panorama. Normativas como el RGPD y la CCPA imponen requisitos estrictos sobre cómo se procesan los datos personales y dónde pueden transmitirse. Para las organizaciones globales, eso significa que los pipelines de IA deben tener en cuenta las diferencias jurisdiccionales regionales, especialmente al evaluar si utilizar servicios de IA externos o mantener el procesamiento internamente.

Nuestra investigación sobre Autonomous Endpoint Management reveló que solo el 32 % de los profesionales de TI utilizan un sistema de gestión unificada de endpoints. Sin una visibilidad consolidada, la IA y la automatización no pueden alcanzar todo su potencial. La gestión eficaz de datos para la IA empieza por la visibilidad: no puede automatizar lo que no puede ver.

Buenas prácticas para equipos de TI que implementan IA

En lo que respecta a la gestión de datos para la IA, adoptar herramientas sin desarrollar los procesos que las respalden es uno de los errores más comunes que veo.

Establecer prácticas de gestión del conocimiento

La plataforma ITSM de Ivanti utiliza IA para generar artículos de conocimiento a partir de tickets anteriores y resoluciones de incidentes. La mejora de productividad es real. Pero no elimina la necesidad de disciplina de gestión.

Los artículos siguen requiriendo cadencias de revisión y aprobación, control de versiones y una propiedad clara.

A pesar de que el 86 % de los profesionales de TI está de acuerdo en que la IA es importante para unas operaciones eficientes, menos de la mitad la utiliza en escenarios de alto valor como el mantenimiento predictivo o la respuesta automatizada a incidentes. La brecha en la IA y la gestión de datos no es tecnológica. Es de madurez de procesos.

Validación y gobernanza

La validación es tan importante en el lado de la salida como la calidad de los datos en el lado de la entrada. Los resultados generados por IA deben comprobarse, especialmente a medida que las organizaciones avanzan hacia la IA agéntica, en la que los sistemas autónomos actúan sobre decisiones en tiempo real. La cuestión no es solo si los datos que vuelven parecen correctos. Es si el sistema está tomando las acciones adecuadas.

Medir el rendimiento de la IA también importa: con qué frecuencia se utiliza, qué precisión tiene y dónde falla. Informe State of Cybersecurity 2026 de Ivanti reveló que el 92 % de los profesionales de seguridad afirman que la automatización reduce de forma eficaz el tiempo medio de respuesta. Sin embargo, esa eficacia depende de una supervisión y un ajuste continuos.

Usar la IA como catalizador de mejores prácticas de datos

La IA no se limita a consumir buenas prácticas de datos. Las impulsa. Al reducir las barreras para la creación y el análisis de contenido, la IA libera a los equipos para crear los marcos de gobernanza que habían pospuesto. Cuando generar un artículo de conocimiento lleva minutos en lugar de horas, el equipo puede invertir ese tiempo en flujos de aprobación y aseguramiento de la calidad.

Esto resulta especialmente valioso cuando los técnicos júnior reciben orientación de IA en tiempo real, lo que les permite contribuir a un nivel superior mientras el personal sénior se centra en la estrategia.

Nuestro Informe Autonomous Endpoint Management Advantage reveló que el 62 % de los profesionales de TI se sienten desbordados por las operaciones del día a día, y uno de cada cuatro afirma que un compañero ha dimitido debido al agotamiento. La IA que amplía la experiencia humana ayuda a los equipos a escalar sin ese coste.

El camino no siempre está claro, pero la estrategia sí puede estarlo

Los datos perfectos son un mito. Eso no debería detenerle.

Limpieza manual para casos de uso estructurados y de alta precisión. IA generativa para escenarios no estructurados y de gran volumen. Ambos requieren una inversión deliberada en infraestructura en la nube, gobernanza y desarrollo de procesos.

A medida que los modelos de IA sigan evolucionando e incorporen no solo reconocimiento estadístico de patrones, sino también reglas explícitas y razonamiento estructurado, la barrera para una gestión de datos preparada para la IA seguirá reduciéndose. Las organizaciones que actúen ahora, con una visión clara de las imperfecciones de sus datos y equipadas con una estrategia para gestionarlas, capturarán el mayor valor.

Preguntas frecuentes

¿Cómo afectan los silos de datos a los flujos de trabajo de IA agéntica?

Cuando los datos tienen formatos distintos según el sistema, se introducen de forma incoherente o están aislados por departamento, los flujos de trabajo de IA agéntica que abarcan esos sistemas desarrollan problemas rápidamente. Los equipos no pueden entrenar a la IA sobre qué datos debe considerar fiables si ellos mismos no pueden confiar en ellos.

¿Cuáles son las dos estrategias principales de gestión de datos para la IA en TI?

Existen dos vías principales para la gestión de datos para la IA en TI. La primera es la limpieza manual/programática. Esta vía funciona mejor cuando se entrena o ajusta un modelo personalizado, se ingieren datos en una base de conocimientos o se trabaja con conjuntos de datos estructurados en los que pueden definirse estándares de calidad. La segunda vía es el procesamiento con IA generativa: utilizar grandes modelos de lenguaje para identificar temas, patrones y sentimiento en entradas incompletas y no estructuradas. Este enfoque es el más adecuado para conjuntos de datos grandes y no estructurados en los que la IA puede trabajar mucho más rápido y a escala que los enfoques manuales por sí solos.

¿Cuáles son las mejores prácticas para la gestión de datos para la IA?

Las mejores prácticas para la gestión de datos para la IA empiezan por la visibilidad: establezca una visión clara de sus datos antes de crear nada y diseñe su estrategia en torno a lo que ya tiene, en lugar de esperar a disponer de datos perfectos. Estandarice los formatos en todos los sistemas para crear una única fuente de verdad y elija el método de limpieza adecuado: manual para la precisión, IA generativa para el volumen. Valide los resultados generados por IA con el mismo rigor que las entradas, supervise continuamente el uso, la precisión y los puntos de fallo, e invierta en infraestructura en la nube, cumplimiento normativo y procesos como bases no negociables.

La realidad imperfecta de la gestión de datos para la IA (y qué hacer al respecto)

Puntos Clave

Por qué los datos de TI nunca son perfectos

El marco de decisión: elegir su estrategia de gestión de datos

Vía 1: limpieza manual/programática

Vía 2: procesamiento con IA generativa

Elegir entre las dos estrategias

Crear una infraestructura preparada para la IA para la gestión de datos

Buenas prácticas para equipos de TI que implementan IA

Establecer prácticas de gestión del conocimiento

Validación y gobernanza

Usar la IA como catalizador de mejores prácticas de datos

El camino no siempre está claro, pero la estrategia sí puede estarlo

Preguntas frecuentes

¿Cómo afectan los silos de datos a los flujos de trabajo de IA agéntica?

¿Cuáles son las dos estrategias principales de gestión de datos para la IA en TI?

¿Cuáles son las mejores prácticas para la gestión de datos para la IA?

Sobre Susan Fung

La realidad imperfecta de la gestión de datos para la IA (y qué hacer al respecto)

Puntos Clave

Por qué los datos de TI nunca son perfectos

El marco de decisión: elegir su estrategia de gestión de datos

Vía 1: limpieza manual/programática

Vía 2: procesamiento con IA generativa

Elegir entre las dos estrategias

Crear una infraestructura preparada para la IA para la gestión de datos

Buenas prácticas para equipos de TI que implementan IA

Establecer prácticas de gestión del conocimiento

Validación y gobernanza

Usar la IA como catalizador de mejores prácticas de datos

El camino no siempre está claro, pero la estrategia sí puede estarlo

Preguntas frecuentes

¿Cómo afectan los silos de datos a los flujos de trabajo de IA agéntica?

¿Cuáles son las dos estrategias principales de gestión de datos para la IA en TI?

¿Cuáles son las mejores prácticas para la gestión de datos para la IA?

Sobre Susan Fung

Publicaciones de Susan Fung