14 febbraio 2026 · 4 min di lettura
Fine-tuning o RAG? Come dare i tuoi dati a un modello AI
Un modello AI generico non sa nulla della tua azienda: non conosce i tuoi prodotti, le tue procedure, i tuoi documenti. Se vuoi che risponda su ciò che riguarda te, i tuoi dati devono arrivargli in qualche modo, e le due strade principali sono il fine-tuning e il RAG. La scelta tra fine-tuning e RAG condiziona costi, tempi e qualità del risultato, quindi conviene capirla prima di firmare un preventivo, che sia il nostro o di qualcun altro.
Cosa fa il RAG, spiegato senza gergo
RAG sta per retrieval-augmented generation, e l'idea è semplice: invece di insegnare qualcosa al modello, gli passi al momento giusto i documenti che gli servono per rispondere. Quando l'utente fa una domanda, il sistema cerca nei tuoi contenuti (manuali, schede prodotto, procedure, contratti) i passaggi più pertinenti e li allega alla domanda. Il modello legge e risponde basandosi su quel materiale.
I vantaggi pratici:
- i dati restano aggiornabili: cambi un documento e le risposte cambiano subito, senza riaddestrare nulla;
- le risposte sono verificabili: il sistema può citare la fonte, e chi legge può controllare;
- i permessi restano gestibili: puoi filtrare i documenti recuperati in base a chi fa la domanda, cosa impossibile con la conoscenza cucita dentro il modello;
- si parte in piccolo: bastano i documenti che hai già, ripuliti e organizzati.
Il lavoro vero del RAG, quello che distingue un prototipo da un sistema affidabile, sta nella qualità del recupero: come dividi i documenti, come li indicizzi, come scegli i passaggi da passare al modello. Se il recupero porta il testo sbagliato, il modello risponde bene sulla cosa sbagliata.
Cosa fa il fine-tuning, e cosa non fa
Il fine-tuning riaddestra parzialmente un modello su esempi tuoi: coppie di domanda e risposta, testi nel tuo formato, dialoghi annotati. Il risultato è un modello che ha assorbito uno stile o un comportamento.
Il punto chiave, che ribalta molte aspettative: il fine-tuning serve a insegnare come rispondere, non cosa sapere. Funziona bene per fissare un tono di voce, per ottenere output in un formato rigido e ripetitivo, per specializzare un modello su un compito ristretto ad alto volume. Funziona male come deposito di conoscenza aziendale: i fatti imparati in addestramento invecchiano, non si aggiornano documento per documento e il modello può comunque confonderli.
Ci sono anche i costi da considerare: preparare un dataset di qualità richiede lavoro umano significativo, ogni aggiornamento sostanziale richiede un nuovo ciclo di addestramento e valutazione, e serve un processo per misurare se il modello specializzato è migliore di quello di partenza. È un investimento sensato quando il compito è stabile e i volumi lo ripagano.
La regola pratica per scegliere
Dopo diversi progetti, la sintesi che diamo ai clienti è questa:
- La conoscenza cambia nel tempo? Listini, procedure, documentazione viva: RAG.
- Serve citare le fonti o gestire permessi diversi per utenti diversi? RAG.
- Il problema è il formato o lo stile dell'output, sempre uguale e ad alto volume? Fine-tuning.
- Il budget è limitato e serve un risultato in tempi brevi? RAG, perché arriva a un sistema utilizzabile con meno investimento iniziale.
- Hai già un RAG che funziona ma i prompt sono diventati enormi per forzare il comportamento? È il momento in cui il fine-tuning inizia ad avere senso, sopra il RAG, non al suo posto.
Le due tecniche non sono in competizione: i sistemi maturi spesso le combinano, con il RAG per la conoscenza e il fine-tuning per il comportamento. Ma nella nostra esperienza la maggior parte dei progetti aziendali ottiene ciò che serve dal solo RAG fatto bene.
Come si parte con un progetto concreto
Il percorso che seguiamo quando un'azienda vuole dare i propri dati a un modello parte sempre dal caso d'uso, non dalla tecnologia: quale domanda deve saper gestire il sistema, chi la farà, cosa succede quando sbaglia. Poi si guarda lo stato dei dati, perché documenti sparsi, duplicati e obsoleti producono risposte sparse, duplicate e obsolete: la pulizia delle fonti è spesso metà del progetto.
Un esempio dal nostro lavoro: in CareCloud, il gestionale ERP che abbiamo sviluppato per strutture sanitarie e socio-assistenziali, la chat AI integrata lavora accanto a sedi, pazienti, turni, documenti e analytics. In un contesto del genere l'AI ha valore solo se risponde sulla base dei dati della struttura, con la stessa attenzione ai permessi del resto del gestionale: è il tipo di vincolo che orienta l'architettura molto più delle mode del momento.
Vuoi capire quale strada conviene ai tuoi dati?
Sviluppiamo software su misura con funzioni AI integrate, dal RAG sui documenti aziendali agli assistenti dentro i gestionali. Se stai valutando come mettere i tuoi dati al lavoro con un LLM, prenota una call gratuita: analizziamo il tuo caso d'uso e ti diciamo, con motivazioni concrete, se ti serve un RAG, un fine-tuning o nessuno dei due.
