Transport · Montréal
カナダのオペレーター:データサイロ12個→lakehouse、リアルタイムKPI。
KPI不整合、ダッシュボード48時間遅延。Databricks lakehouse、medallion、dbt、セルフサービスBI。
KPI
60%
analystes autonomes
期間
9 mois
チーム
6 人
ハブ
Montréal
すべての部署が同じKPIに異なる数字を与えるとき、決定を下しているのではなく、意見間で調停しているのです。
コンテキスト
カナダの交通オペレータ、11,000人従業員、モントリオールハブ。12の歴史的データサイロ(運営、HR、財務、発券、メンテナンスなど)、老朽化Oracleデータウェアハウス、メールで送られるExcelダッシュボード。
問題
- 共通ガバナンスなしの12データサイロ
- 部署間で矛盾するKPI(同じ指標で最大18%のギャップ)
- 48時間遅れのダッシュボード、手動更新
- データカタログなし、重複と曖昧な定義
- SQL抽出で行き詰まったアナリスト、低い業務自律性
アプローチ
メダリオンアーキテクチャ(bronze/silver/gold)のDatabricksデータレイクハウス、Unity Catalogガバナンス、バージョン管理されたdbt変換、セマンティックレイヤー付きセルフサービスTableau BI。
柱
- Auto Loader経由のリアルタイム取り込み(Kafka + ファイル)
- dbt次元モデリング、必須品質テスト
- ガバナンス、リネージ、RBACのためのUnity Catalog
- Tableauに公開されたセマンティックレイヤー(集中化された業務定義)
- イネーブルメントプログラム:4か月でアナリストの60%トレーニング
スタック
- AzureのDatabricks Lakehouse Platform
- バージョン管理された変換のためのdbt Cloud
- ガバナンスとリネージのためのUnity Catalog
- セマンティックレイヤー付きTableau Cloud
- 取り込みオーケストレーションのApache Airflow
結果
- 単一真実ソース:運用KPIの100%を調整
- ダッシュボードレイテンシ:48時間からリアルタイム(KPIの80%で1分未満)
- 自律アナリスト:4か月で60%(目標12)
- データコスト:処理ボリューム3倍にもかかわらず-22%
- データ品質問題:9か月で-76%
« 15年ぶりに、私の運営と財務チームは数字ではなく、アクションレバーについて口論しています。それがデータプラットフォームのROIです。 »
学んだこと
Unity CatalogはDatabricksの真の差別化要因で、Sparkエンジンではありません。dbtは800モデルまで非常によくスケールし、それを超えるとモジュラー化に投資する必要があります。間違い:silverを統合する前にgoldレイヤーを納品し、高価なロールバック。やり直すなら:dbtテストが90%グリーンになる前にアナリストアクセスを開かない。そうでなければ、信頼を失い、取り戻せません。
// 次に読む
Mobilité urbaine · Paris + Montréal
モビリティスケールアップ:クラウド請求−30%、SLO同等。
18ヶ月でAWS請求が2倍、トラフィック増加は比例せず。GreenOps監査、リファクタ、Karpenter、ARM64。計測済みの成果。
−30%
facture cloud
E-commerce sport · Paris
スポーツ大手:PWA、モバイルCV+18%、Lighthouse 92。
モバイルLighthouseが38、CV低下。Next.js App Router、edge、画像、splitting。6ヶ月で納品。
+18%
conversion mobile
Robotique industrielle · Tokyo
日本メーカー:AGV80台、ROS 2、倉庫スループット+40%。
低速なフリート、衝突、ダウンタイム。Nav2刷新、知覚フュージョン、マルチエージェント計画。6ヶ月で衝突ゼロ。
+40%
throughput entrepôt
