整理自:Self-Driving Cars Are Being Put on a Data Diet - WIRED Business
數據收集
- 收集的數據:GPS、影像、音頻、LiDAR 和雷達的空間點雲、汽車零件診斷數值。
- 以前,儲存所有數據,增強自動駕駛演算法模型。
- 後來,車隊數量和傳感器功能擴張,數據的總量和複雜度大增。造成數據難以被分析和理解、儲存成本上升。
- 現在,選擇性儲存特別有用且組織良好的數據(比如特殊或混亂的場景),沒有明確用途或重複的數據更有可能被丟棄。
數據儲存
- 儲存費用高,以 AWS S3 為例,每月每 GB 收費約 0.02 美元。
- Intel 在 2016 年估計,每輛自駕車每天將生成約 4000 GB 數據。
- 經濟情勢使公司須積極開源節流。
- 管理存儲成本的策略包括:將數據移至冷存儲(成本較低、訪問時間較慢)、選擇性刪除低價值數據。
- AWS 冷存儲每月每 GB 約 0.001 美元。
- Waymo、Aurora、Cruise、Motional 和 TuSimple 等主要玩家皆已轉換模式。
- Waymo:從 Google 獨立以後才有預算開始儲存資料,隨著業務增長,已開始丟棄過時數據。
- Aurora:只有約 15% 的數據位於其最容易訪問的儲存層中。
- Aurora、TuSimple:過去的數據會被保留,但會大部分會逐漸轉移冷儲存。
- 數據管理至關重要,比如透過 AI 從壓縮資料中獲得洞見。