Catégorie · IA

Fine-tuning

Continuer l'entraînement d'un LLM sur un jeu de données spécifique.

LoRA, full fine-tuning, RLHF, DPO. Utile pour style, format de sortie ou domaine très spécifique (code juridique, medical). Coût : GPU + dataset labellisé + évaluation. Souvent, un bon RAG + prompting fait le travail sans fine-tuning.

// En action chez nos clients

Tu veux qu'on applique ça chez toi ?

Parler à un architecte