GreenOps
GreenOps:クラウド請求を30%削減する7つのレバー。
パフォーマンスを犠牲にせず。具体例:請求-30%、SLO同等。
クラウド請求が2年で2倍になりました。カーボンフットプリントも同様です。その間、インスタンスの40%がCPU 8%で稼働しています。GreenOpsはマーケティング姿勢ではありません:P&LとCSRDスコアの両方を救う最適化プログラムです。
最近のクライアント、欧州モビリティスケールアップで、以下の7つのレバーを適用しました。6か月後の結果:インフラ請求を30%削減、Scope 2排出量を半減、p99レイテンシは変わらず。レシピを紹介します。
1. ゾンビサーバーを殺す
最初の監査、最初の平手打ち:クライアントのEC2の18%が60日以上トラフィックなし。週次のLambdaスクリプトが非アクティブインスタンスをタグ付けし、Slackでオーナーチームに通知し、14日後にシャットダウンします。即時節約:月9,000ユーロ。
2. データドリブンのライトサイジング、勘ではなく
AWS Compute OptimizerとGCP Recommenderが正しい推奨を提供します。それを適用するかは別問題です。m5.2xlargeの60%をm5.largeまたはm6g.large(Graviton ARM)にダウンサイズしました。同一パフォーマンス、その範囲で請求は1/3。
3. カーボンアウェアコンピューティング
夜間バッチはグリッドがグリーンになるまで待てます。ElectricityMapまたはWattTime APIで、エネルギーミックスが低炭素のときに重いジョブ(MLトレーニング、動画エンコーディング、ETL)をスケジュールします。Kubernetesクラスタでは、Karpenter + カスタムスケジューラが仕事をします。
yamlapiVersion: batch/v1 kind: CronJob metadata: name: nightly-ml-training annotations: carbon-aware/enabled: "true" carbon-aware/max-intensity: "150" # gCO2/kWh carbon-aware/window: "4h" spec: schedule: "0 22 * * *" jobTemplate: spec: template: spec: nodeSelector: karpenter.sh/capacity-type: spot
4. 許容ワークロード向けスポットインスタンス
CIビルド、エンコーディング、MLトレーニング、Sparkジョブ:再起動可能なものはすべてスポットで動かすべきです。60〜90%の節約。EKS上のKarpenterが中断を痛みなく処理します。モビリティクライアントは非クリティカル負荷の70%をスポットに切り替え、月次22,000ユーロの利益。
5. 戦略的キャッシュ
CloudFrontまたはローカルRedisで提供される各リクエストは、APIコール1回減、つまりコンピュート削減、帯域幅削減、カーボン削減。アグレッシブなHTTPキャッシュ、適切なETag、stale-while-revalidate。12,000 RPSのエンドポイントで、ヒット率は30%から88%になりました。
6. アーカイブポリシー:S3 Intelligent-Tieringはオプションではない
2022年のログは監査時以外、誰の役にも立ちません。S3 Glacier Deep Archiveへのライフサイクルポリシー:GB-月あたり0.00099ドル対0.023ドル。800 TBのログで、年間節約:210,000ドル。そして未使用SSDディスクのカーボンも消えます。
7. リージョンを選ぶ
AWS eu-west-3(パリ)は原子力で56 gCO2/kWh。AWS ap-northeast-1(東京)はカーボン重ミックスで480 gCO2/kWh。レイテンシ非依存負荷(バッチ、アーカイブ)では、リージョンを調停することでコードに触れず排出量を削減できます。クライアントはアーカイブの40%をフランスに再配置:その範囲で-65%の排出量。
« GreenOpsはESG制約ではありません。カウンターを1つ追加したFinOpsです。そしてそのカウンターは、しばしば役員会で最も説得力があります。 »
これら7つのレバーに再構築は不要です。エンジニアリング規律と役員スポンサーが必要です。インフラを監査し、数値化されたGreenOpsロードマップを構築したい方、当チームはコマンドモードで介入し、6週間で成果物を届けます。
