カテゴリ · AI

ファインチューニング（Fine-tuning）

特定のデータセットでLLMの学習を継続することです。

LoRA、フルファインチューニング、RLHF、DPOなどがあります。スタイル、出力フォーマット、または法律コードや医療など非常に特殊なドメインに有効です。コストはGPU、ラベル付きデータセット、評価の3点です。多くの場合、しっかりしたRAG＋プロンプティングでファインチューニングなしに対応できます。

// クライアント事例

IA本番のAIエージェント：デモ劇場を避ける。

// 関連

LLM（Large Language Model）
大規模なテキストで学習された大規模言語モデルです。
RAG（Retrieval-Augmented Generation）
ドキュメント検索とLLM生成を組み合わせるAIアーキテクチャです。
Eval（LLM評価）
LLMの品質を測定するための自動テストスイートです。

貴社で実装したい？

アーキテクトと話す