雲端儲存太貴了,自駕軟體公司須更高效地收集數據

整理自:Self-Driving Cars Are Being Put on a Data Diet - WIRED Business

數據收集

  1. 收集的數據:GPS、影像、音頻、LiDAR 和雷達的空間點雲、汽車零件診斷數值。
  2. 以前,儲存所有數據,增強自動駕駛演算法模型。
  3. 後來,車隊數量和傳感器功能擴張,數據的總量和複雜度大增。造成數據難以被分析和理解、儲存成本上升。
  4. 現在,選擇性儲存特別有用且組織良好的數據(比如特殊或混亂的場景),沒有明確用途或重複的數據更有可能被丟棄。

數據儲存

  1. 儲存費用高,以 AWS S3 為例,每月每 GB 收費約 0.02 美元。
  2. Intel 在 2016 年估計,每輛自駕車每天將生成約 4000 GB 數據
  3. 經濟情勢使公司須積極開源節流。
  4. 管理存儲成本的策略包括:將數據移至冷存儲(成本較低、訪問時間較慢)、選擇性刪除低價值數據。
  5. AWS 冷存儲每月每 GB 約 0.001 美元。
  6. Waymo、Aurora、Cruise、Motional 和 TuSimple 等主要玩家皆已轉換模式。
  7. Waymo:從 Google 獨立以後才有預算開始儲存資料,隨著業務增長,已開始丟棄過時數據。
  8. Aurora:只有約 15% 的數據位於其最容易訪問的儲存層中。
  9. Aurora、TuSimple:過去的數據會被保留,但會大部分會逐漸轉移冷儲存。
  10. 數據管理至關重要,比如透過 AI 從壓縮資料中獲得洞見。

相關議題