Un uomo lavora alla scrivania con tre monitor che mostrano fogli di calcolo, grafici e codice in un ambiente d'ufficio moderno e open space. Sono visibili altri dipendenti.

I dati non saranno mai del tutto puliti. È solo una questione di grado.

L'ho capito fin dal primo giorno del mio master in data science, quando un professore ci avvertì che circa l'80% del nostro tempo sarebbe stato dedicato alla pre-elaborazione e alla pulizia dei dati, non alla creazione di modelli.

Anni dopo, nel mio ruolo di Principal Product Manager per IA, ML e analytics in Ivanti, ho constatato che quel principio si conferma sorprendentemente valido nella pratica.

Mentre io e il mio team lavoriamo per portare l'IA fuori dal laboratorio e in produzione per i team IT e di sicurezza, la gestione dei dati per l'IA è più importante che mai. Il Technology at Work Report 2025 di Ivanti ha rilevato che il 42% degli impiegati utilizza strumenti di IA generativa al lavoro, con un aumento di 16 punti percentuali in un solo anno. Tra i professionisti IT, l'adozione ha raggiunto il 74%.

L'interesse c'è. Così come le esitazioni. Molti responsabili IT sanno che i loro dati non sono puliti, i sistemi sono frammentati e la governance non è ancora al passo. La buona notizia: non servono dati perfetti per adottare l'IA.

Serve una strategia chiara di gestione dei dati per l'IA, costruita attorno a ciò che già si possiede.

Perché i dati IT non sono mai perfetti

Nell'IT aziendale, i problemi di qualità dei dati non sono anomalie. Sono la realtà di base dell'IA e della gestione dei dati. I ticket vengono categorizzati in modo incoerente. Gli inventari degli asset sono incompleti. Le informazioni critiche restano isolate in silos tra i sistemi. E il testo non strutturato nei ticket di supporto e nelle risposte ai sondaggi sfugge a una categorizzazione ordinata.

Le ricerche Ivanti confermano la portata del fenomeno. Il nostro Autonomous Endpoint Management Advantage Report 2026 ha rilevato che l'89% dei professionisti IT afferma che i dati in silos incidono negativamente sulle operazioni, mentre il 39% sostiene che i silos causano un utilizzo inefficiente delle risorse.

Il nostro Tech at Work Report racconta una storia simile:

  • Il 38% dei professionisti IT indica la complessità tecnologica come una barriera significativa all'efficacia operativa, con un aumento di quattro punti percentuali anno su anno.
  • Quasi la metà (46%) afferma che le nuove implementazioni software finiscono in realtà per aumentare il volume dei ticket, invece di ridurre il rumore di fondo.

Se si aggiunge che il 48% delle organizzazioni utilizza ancora software a fine vita, il quadro diventa chiaro: questo è un ambiente dati disordinato per sua stessa natura.

Come mi ha detto David Pickering, Product Marketing Director di Ivanti: quando i dati sono formattati in modo diverso tra i sistemi, inseriti in modo incoerente, isolati per reparto e modellati da anni di acquisizioni, i workflow di IA agentica che attraversano questi sistemi incontrano rapidamente difficoltà. Non si può indicare a un'IA di quali dati fidarsi se non lo si sa in prima persona. E senza queste basi, anche automazioni ben progettate finiranno per cedere nei punti di giunzione.

In altre parole: il principio "garbage in, garbage out" è ancora valido. Ma dati immacolati non arriveranno a breve. Qualsiasi approccio serio alla gestione dei dati master e al machine learning deve tenere conto del disordine, non aspettare che si risolva da sé.

Il framework decisionale: scegliere la strategia di gestione dei dati

Esistono due percorsi principali per la gestione dei dati per l'IA nell'IT. Entrambi sono validi, entrambi comportano compromessi e molte organizzazioni li useranno entrambi per casi d'uso diversi.

Percorso 1: pulizia manuale/programmatica

Quando il mio team ha introdotto la classificazione dei ticket per il sistema ITSM di Ivanti, stavamo addestrando un modello per categorizzare le richieste di servizio. Questo richiedeva dati di training puliti e ben etichettati. Abbiamo quindi inserito nel workflow un passaggio che offriva agli amministratori la possibilità di rivedere e pulire i dati prima che alimentassero il modello. Quella revisione umana ha prodotto una differenza misurabile in termini di accuratezza.

Questo percorso funziona al meglio quando si addestra o si perfeziona un modello personalizzato, si importano dati in una knowledge base o si lavora con dataset strutturati per i quali è possibile definire standard di qualità. Il compromesso riguarda tempo e risorse. Il risultato è un'elevata accuratezza e il pieno controllo.

Funziona meglio anche quando l'igiene di base dei dati è già presente. Molte organizzazioni non sono ancora a quel punto: solo il 35% monitora l'età dei dispositivi o la posizione, e solo il 37% monitora lo stato delle patch.

Percorso 2: elaborazione con IA generativa

A volte la pulizia manuale non è praticabile. L'ho imparato lavorando sull'analisi dei sondaggi di Ivanti. Le risposte ai sondaggi sono tra i dati più disordinati che un team IT possa incontrare: testo libero, formattazione incoerente, livello di dettaglio estremamente variabile. Pulirli manualmente su larga scala non è realistico.

Abbiamo invece utilizzato modelli linguistici di grandi dimensioni per identificare temi, pattern e sentiment in input incompleti e non strutturati. Potevamo sintetizzare interi sondaggi, evidenziare i driver di soddisfazione e far emergere rapidamente insight utili.

Questo percorso è ideale per dati non strutturati ad alto volume, per situazioni in cui la pulizia manuale semplicemente non è possibile o per qualsiasi scenario in cui il costo della pulizia supera il valore dell'output. Richiede però l'accesso a modelli linguistici di grandi dimensioni adeguati e la verifica che il caso d'uso sia adatto.

Scegliere tra le due strategie

La decisione dipende da volume e varietà dei dati, vincoli di tempo, requisiti di accuratezza e dal livello di controllo necessario su dove vanno i dati e su come vengono elaborati.

Serve perfezionare un modello in cui la precisione è critica? Investite nella pulizia. Lavorate con grandi volumi di input non strutturati, dove la velocità è determinante? Puntate sull'IA generativa. L'obiettivo è una scelta deliberata, non l'inazione perché i dati non sono perfetti.

Costruire un'infrastruttura pronta per l'IA per la gestione dei dati

I servizi cloud sono essenziali in questo contesto, e non lo dico alla leggera. Quando il mio team ha creato un punteggio di esperienza digitale per misurare, quantificare e migliorare la digital employee experience, il cloud è stato l'abilitatore critico. Ha svolto il ruolo di hub di integrazione, riunendo ticket di servizio, telemetria dei dispositivi, performance delle applicazioni e segnali di sicurezza.

Questo livello di integrazione multi-sorgente non è realizzabile su larga scala senza un'infrastruttura cloud. Il cloud ci ha inoltre consentito di eseguire un modello di IA ibrido che elabora simultaneamente testo e telemetria numerica. Supportare migliaia di dispositivi e utenti a quel livello di complessità non è fattibile on-premise.

Oltre alla capacità di calcolo, un'infrastruttura pronta per l'IA significa affrontare la gestione dei dati master per il machine learning. Le organizzazioni hanno bisogno di un'unica fonte di verità tra i sistemi. I formati dei dati devono essere standardizzati, in particolare quando la crescita tramite acquisizioni introduce piattaforme legacy con convenzioni diverse.

La governance dei dati complica ulteriormente il quadro. Regolamenti come GDPR e CCPA impongono requisiti rigorosi su come vengono trattati i dati personali e su dove possono essere trasmessi. Per le organizzazioni globali, questo significa che le pipeline di IA devono tenere conto delle differenze giurisdizionali regionali, soprattutto quando si valuta se utilizzare servizi di IA esterni o mantenere l'elaborazione internamente.

La nostra ricerca sull'Autonomous Endpoint Management ha rilevato che solo il 32% dei professionisti IT utilizza un sistema di unified endpoint management. Senza una visibilità consolidata, l'IA e l'automazione non possono esprimere il loro potenziale. Una gestione efficace dei dati per l'IA inizia dalla visibilità: non si può automatizzare ciò che non si vede.

Best practice per i team IT che implementano l'IA

Quando si parla di gestione dei dati per l'IA, adottare strumenti senza sviluppare i processi necessari a supportarli è uno degli errori più comuni che riscontro.

Definire pratiche di Knowledge Management

La piattaforma ITSM di Ivanti utilizza l'IA per generare articoli della knowledge base a partire da ticket passati e risoluzioni degli incidenti. Il guadagno di produttività è reale. Ma non elimina la necessità di disciplina gestionale.

Gli articoli richiedono comunque cicli di revisione e approvazione, controllo delle versioni e una chiara titolarità.

Sebbene l'86% dei professionisti IT concordi sul fatto che l'IA sia importante per l'efficienza operativa, meno della metà la utilizza per scenari ad alto valore come la manutenzione predittiva o la risposta automatizzata agli incidenti. Il divario nell'IA e nella gestione dei dati non è tecnologico. È una questione di maturità dei processi.

Validazione e governance

La validazione è importante sul lato dell'output quanto la qualità dei dati lo è sul lato dell'input. I risultati generati dall'IA devono essere verificati, soprattutto mentre le organizzazioni si orientano verso l'IA agentica, in cui sistemi autonomi agiscono in base alle decisioni in tempo reale. La domanda non è solo se i dati restituiti sembrano corretti. È se il sistema sta intraprendendo le azioni giuste.

Anche misurare le performance dell'IA è importante: quanto spesso viene utilizzata, quanto è accurata e dove fallisce. Lo State of Cybersecurity Report 2026 di Ivanti ha rilevato che il 92% dei professionisti della sicurezza afferma che l'automazione riduce efficacemente il tempo medio di risposta. Questa efficacia, tuttavia, dipende da monitoraggio e ottimizzazione continui.

Usare l'IA come catalizzatore per migliori pratiche sui dati

L'IA non si limita a consumare buone pratiche sui dati. Le promuove. Abbassando le barriere alla creazione e all'analisi dei contenuti, l'IA libera i team per costruire i framework di governance che avevano rimandato. Quando generare un articolo della knowledge base richiede minuti invece che ore, il team può investire quel tempo in workflow di approvazione e controllo qualità.

Questo è particolarmente utile quando i tecnici junior ricevono indicazioni dall'IA in tempo reale, potendo contribuire a un livello più elevato mentre il personale senior si concentra sulla strategia.

Il nostro Autonomous Endpoint Management Advantage Report ha rilevato che il 62% dei professionisti IT si sente sopraffatto dalle attività quotidiane e che uno su quattro afferma che un collega si è dimesso a causa del burnout. Un'IA che potenzia le competenze umane aiuta i team a scalare senza pagare quel prezzo.

Il percorso non è sempre chiaro, ma la strategia può esserlo

I dati perfetti sono un mito. Questo non dovrebbe fermarvi.

Pulizia manuale per casi d'uso strutturati e ad alta precisione. IA generativa per scenari non strutturati e ad alto volume. Entrambi richiedono investimenti mirati in infrastruttura cloud, governance e sviluppo dei processi.

Man mano che i modelli di IA continueranno a evolversi, incorporando non solo il riconoscimento statistico dei pattern ma anche regole esplicite e ragionamento strutturato, la barriera alla gestione dei dati pronta per l'IA continuerà ad abbassarsi. Le organizzazioni che si muovono ora, consapevoli delle imperfezioni dei propri dati e dotate di una strategia per gestirle, otterranno il massimo valore.