Catégorie · IA
Fine-tuning
Continuer l'entraînement d'un LLM sur un jeu de données spécifique.
LoRA, full fine-tuning, RLHF, DPO. Utile pour style, format de sortie ou domaine très spécifique (code juridique, medical). Coût : GPU + dataset labellisé + évaluation. Souvent, un bon RAG + prompting fait le travail sans fine-tuning.
// En action chez nos clients
// Voir aussi
