用python每日更新追蹤香港covid-19確診或到訪大廈名單

過了農曆新年, 全港疫情大爆發, 好多香港人都會每日上網看看”衛生署”的確診名單 https://www.chp.gov.hk/files/pdf/building_list_chi.pdf

所以我寫了一個小程式來追蹤指定大廈是否在確診名單內, 尤其對做物管及做公司ADMIN朋友 , 某程度上有少許幫助 , 但間中最好抽查

本身我寫的程式在 LINUX 運行 , 每天會自動執行一次再電郵給我 , 但好多人公司或家用電腦都是行 windows 所以我修改程式適合在 windows 行及輸出檔案是 EXCEL FILE

設計該程式概念 : 先下載衛生署 PDF 名單 , 轉換成文字檔方便程式讀取 , 之後程式核對 自定名單同衛生署名單有沒有匹配 , 記錄你要找的數據 , 把文字檔轉換成 EXCEL FILE

步驟一:

先安裝 windows 版 OPENJDK 下載網址: https://docs.microsoft.com/zh-tw/java/openjdk/download

64bit windows 下載64bit版, 32bit windows 下載32bit版

下載完直接安裝

步驟二:

安裝 Python 程式語言 , 下載網址: https://www.python.org/downloads/release/python-3102/

下載完直接安裝

完成後要裝程序需要的python模組

按 “win key” + R , 執行 “CMD”

升級 python pip 下載器 , 在 “命令提示字元” 內 輸入 :

pip install –upgrade pip

注意: –upgrade 前是兩個 – 減號

安裝python模組, 在 “命令提示字元” 內 輸入 :

pip3 install requests tabula-py Workbook datetime openpyxl

步驟三:

如果你的電腦已經有軟件可以開啟 UTF8 FILE可以 忽略這個

安裝 notepad++ 軟件 , 免費好用 ! 下載網址: https://notepad-plus-plus.org/downloads/

步驟四:

我編寫的程式 : Download

解壓後內有3個FILE , “run.cmd” “main.py” “udata.csv”

值得注意的是 , 有些朋友會 “不經意” 把繁簡字混亂使用 , 例子: “厦” 及 “廈” 前者簡體 後者繁體 ! 對系統來說這是不同的字 , 如果你輸入的 “某某大厦” 是會找不到的, 應該”某某大廈”才能找到 , 所以我建議不要用全名, 用 “某某”

用 notepadd++ 修改 udata.csv , 編碼 utf-8

run.cmd 內容如下所示

double click “run.cmd” 會執行程式, 如下圖

同時會有5個FILE 產生 , “building_list_chi.pdf” 是從衛生署下載的名單 , “data.csv” 是從PDF轉換成文字檔, “email.csv” 是輸出文字備用EMAIL, “record.csv” 是記錄你找到的記錄, “checklist.xlsx” 是可以用 EXCEL 開啟的記錄

備註: 所有 CSV 檔案都是 UTF8 編碼, 用 EXCEL 開會亂碼 , 如果真的要開用 NOTEPAD++ 或者用 libreoffice 都可以正常顯示中文字

如有疑問可電郵至 [email protected]