如何下載自己的eBird資料並讀取
eBird的野外紀錄功能很強大,但新版的網頁介面精簡了不少東西。如果你要自己整理自己的資料,系統還是開放你下載自己的資料喔。
這邊先聲明一下,我系統用的是中文,但鳥名用的是英文,所以下載下來的會是英文鳥名。要是設定的是中文,那下載的就會是中文鳥名。
申請與下載資料
先去eBird網站 →我的eBird →左下角深色側欄最下面按「下載我的資料」,之後會跳出一個對話框,按確認就可以了。
再來就是等著去收信,我下載幾次大概都是十分鐘左右就好了。
以下有兩個方法,第一個方法是我自己用的,第二個是大雪山賞鳥大賽 某工作人員教我的方法,原則上是相同的。
方法1–1:解壓縮與資料前處理(更改資料)
下載後的檔案名稱會是eBird_*********.zip,解壓縮之後會出現一個MyEBirdData.CSV,請到檔案總管理面按F2把副檔名砍掉變成下面那樣。
如果看不到副檔名,請到Windows 檔案總管的「檢視」分頁,請參考下圖把副檔名點開。
MyEBirdData裡面是純文字資料,編碼是UTF-8,打開來會長這樣:不同的欄(直)用半形逗點分開,第一列(橫)說明每個欄位的屬性,之後就是依照鳥的分類來一筆一筆的列下去。我有8000多筆觀察紀錄也才有74000筆左右的資料,檔案不到3MB,所以檔案本身並不會太大。
Submission ID,Common Name,Scientific Name,Taxonomic Order,Count,State/Province,County,Location ID,Location,Latitude,Longitude,Date,Time,Protocol,Duration (Min),All Obs Reported,Distance Traveled (km),Area Covered (ha),Number of Observers,Breeding Code,Observation Details,Checklist Comments,ML Catalog Numbers
S59157787,Graylag Goose,Anser anser,246,50,GB-ENG,Lincolnshire,L1135528,Frampton Marsh RSPB Reserve,52.9294782,.0213718,2019-08-21,12:30 PM,eBird - Traveling Count,281,1,4.83,,1,,,Miss the Buff-brested Sandpiper in early afternoon and Long-billed Dowitcher twice in whole afternoon.
方法1–2:用Excel讀取資料
這邊必須要先打開EXCEL並選取檔案,不能直接點MyEBirdData來讀取。你要是雙擊那個檔案就會跑出奇怪的亂碼。
點到檔案所在的目錄,然後沒意外的話你會看不到檔案。因為他預設是顯示EXCEL系列的檔案,我們的檔案並不是,所以請如下圖一樣改成顯示所有檔案。
之後會跑出「匯入字串精靈」,第一個步驟請設定:
- 原始資料類型:以「分隔符號」方式來剖析
- 檔案原始格式:找到「65001:Unicode (UTF-8)」
- 勾選「我的資料有標題」
第二個步驟比較簡單,勾選分隔符號為「逗點」即可。
第三個步驟可以設定每個欄位的屬性,一般來說我都不管他直接按完成。
之後就另存檔案成*.XLSX就可以啦。
方法2:直接讀取MyEBirdData.CSV
這個方法不用改副檔名把*.CSV改掉,請先打開一個「空白的」Excel檔案,然後到:資料— 取得資料 — 從檔案 — 從文字/CSV,如下圖:
這邊步驟比較簡單,請選以下兩項,看到地點的中文變成繁體中文就是對的了。之後再按「載入」就可以了,以我的資料量需要等一下。。
- 檔案原點:「65001: Unicode (UTF-8)」
- 分隔符號:「逗號」
跑出來的結果會是這樣,其實流程來說比第一個方法簡單。
要是中文鳥名會跑出什麼東西?
因為我個人習慣用英文鳥名,所以這邊懶得再嘗試了。根據使用中文鳥名的朋友表示,要是選取中文鳥名的話MyEBirdData.CSV轉出來的鳥名部分也會是中文,所以就可以進行簡單的分析了。
直接讀解壓縮後的MyEBirdData.CSV的後果
由於EXCEL直接點CSV檔案並不能更改編碼語系,必須要用上面方法二的方法。繁體中文Windows的底層應該是BIG-5,但UTF-8其實是支援更多語系的編碼。不把副檔名改掉直接讀其實也沒有問題,問題是地點會變成奇怪的亂碼,而且副檔名CSV並不會跳出任何更改檔案編碼的選項,只能看著EXCEL用BIG-5去開UTF-8的檔案,然後跑出一堆神秘亂碼。
某些軟體如Notepad++可以更改純文字檔案的編碼系統,但先改成BIG-5之後再讀取並不能解決這個問題就是了,但這在批次輸入的時候會有用,有機會再來解釋這個應用。
祝各位整理資料愉快RRRRRRR。至於該怎麼整理利用這些資料?要怎麼直接和中華鳥會名錄委員會的名錄對接?請等我下一篇吧,先富奸一下。