- Python3.5 安裝時記得要勾選 Add Python 3.5 to PATH,讓你直接在小黑窗執行 python
- Git (optional)
- Cmder - 更強大的小黑窗 (optional)
- 下載專案:
git clone https://github.com/ckybonist/etc-m04a
或 直接下載(右上角綠色button) - 請自行在專案根目錄創建 data 資料夾,並將原始資料放在其中。
- 跑一發分析:
python3 main.py
p.s.: 執行 main.py 會跑完所有分析(目前3.5 GB 資料,耗時大約半小時)。 如果想做測試,也可以單獨執行 path.py、 interchange.py、sensor.py
輸出檔都在 output/:
- output/ETC_FGU_FINAL.csv: 最終結果,將所有審核日的分析結果合併在一個檔。
- output/step1: 測站間平均時間紀錄, 由 sensor.py 輸出。
- output/step2: 路段平均時間紀錄, 由 interchange.py 輸出。
- output/step3: 路徑旅行時間紀錄, 由 path.py 輸出。
- output/final: 將歷史資料中的每一筆路徑紀錄,取中位數作為最終結果,根據審核日期存成獨立的結果檔。
-
主程式:
- main.py: 進入點
-
四個主要模組:
- sensor.py: 測站間平均時間
- interchange.py: 交流道間(路段) 平均時間
- path.py: 路徑旅行時間
- final.py: 對於審核日所用的 N 個天數資料所產出的旅行時間,取中位數作為該審核日的 預測結果
-
其它:
- config.py: 一些全域變數
- utils.py: helper functions
-
確保 data/ 內的原始資料為以下目錄結構:
# 檢核日期/對應歷史紀錄日期/小時/TDCS_XXX.csv 例如: 20160822/2015706/02/TDCS_M04A_20150706_020000.csv
有時解壓縮 或 其他原因會導致目錄多了一層,像是:
20160822/20160502/20150706/02/TDCS_XXX.csv # 多了一層 20160502
這會導致程式產生不正常的結果,甚至直接出錯。
-
output/ 資料夾會由程式自動產生
-
MS Excel 開 CSV 時為亂碼:
1. 打開 Excel 2. 點選 資料 > 從文字檔 > 選擇要開啟的檔案 > 匯入 3. 匯入設定三步驟: (1) 勾選分隔符號,檔案原始格式為 65001:Unicode (UTF-8) (2) 分隔符號勾選 Tab鍵 及 逗點 (3) 欄位資料格式選 一般 (4) 完成