Abbeal

カテゴリ · AI

ファインチューニング(Fine-tuning)

特定のデータセットでLLMの学習を継続することです。

LoRA、フルファインチューニング、RLHF、DPOなどがあります。スタイル、出力フォーマット、または法律コードや医療など非常に特殊なドメインに有効です。コストはGPU、ラベル付きデータセット、評価の3点です。多くの場合、しっかりしたRAG+プロンプティングでファインチューニングなしに対応できます。

// クライアント事例

// 関連

貴社で実装したい?

アーキテクトと話す