如何下載自己的eBird資料並讀取

eBird的野外紀錄功能很強大,但新版的網頁介面精簡了不少東西。如果你要自己整理自己的資料,系統還是開放你下載自己的資料喔。

這邊先聲明一下,我系統用的是中文,但鳥名用的是英文,所以下載下來的會是英文鳥名。要是設定的是中文,那下載的就會是中文鳥名。

申請與下載資料

先去eBird網站 →我的eBird →左下角深色側欄最下面按「下載我的資料」,之後會跳出一個對話框,按確認就可以了。

再來就是等著去收信,我下載幾次大概都是十分鐘左右就好了。

以下有兩個方法,第一個方法是我自己用的,第二個是大雪山賞鳥大賽 某工作人員教我的方法,原則上是相同的。

方法1–1:解壓縮與資料前處理(更改資料)

下載後的檔案名稱會是eBird_*********.zip,解壓縮之後會出現一個MyEBirdData.CSV,請到檔案總管理面按F2把副檔名砍掉變成下面那樣。

如果看不到副檔名,請到Windows 檔案總管的「檢視」分頁,請參考下圖把副檔名點開。

MyEBirdData裡面是純文字資料編碼是UTF-8,打開來會長這樣:不同的欄(直)用半形逗點分開,第一列(橫)說明每個欄位的屬性,之後就是依照鳥的分類來一筆一筆的列下去。我有8000多筆觀察紀錄也才有74000筆左右的資料,檔案不到3MB,所以檔案本身並不會太大。

Submission ID,Common Name,Scientific Name,Taxonomic Order,Count,State/Province,County,Location ID,Location,Latitude,Longitude,Date,Time,Protocol,Duration (Min),All Obs Reported,Distance Traveled (km),Area Covered (ha),Number of Observers,Breeding Code,Observation Details,Checklist Comments,ML Catalog Numbers
S59157787,Graylag Goose,Anser anser,246,50,GB-ENG,Lincolnshire,L1135528,Frampton Marsh RSPB Reserve,52.9294782,.0213718,2019-08-21,12:30 PM,eBird - Traveling Count,281,1,4.83,,1,,,Miss the Buff-brested Sandpiper in early afternoon and Long-billed Dowitcher twice in whole afternoon.

方法1–2:用Excel讀取資料

這邊必須要先打開EXCEL並選取檔案,不能直接點MyEBirdData來讀取。你要是雙擊那個檔案就會跑出奇怪的亂碼。

點到檔案所在的目錄,然後沒意外的話你會看不到檔案。因為他預設是顯示EXCEL系列的檔案,我們的檔案並不是,所以請如下圖一樣改成顯示所有檔案。

之後會跑出「匯入字串精靈」,第一個步驟請設定:

  • 原始資料類型:以「分隔符號」方式來剖析
  • 檔案原始格式:找到「65001:Unicode (UTF-8)」
  • 勾選「我的資料有標題」

第二個步驟比較簡單,勾選分隔符號為「逗點」即可。

第三個步驟可以設定每個欄位的屬性,一般來說我都不管他直接按完成。

之後就另存檔案成*.XLSX就可以啦。

方法2:直接讀取MyEBirdData.CSV

這個方法不用改副檔名把*.CSV改掉,請先打開一個「空白的」Excel檔案,然後到:資料— 取得資料 — 從檔案 — 從文字/CSV,如下圖:

這邊步驟比較簡單,請選以下兩項,看到地點的中文變成繁體中文就是對的了。之後再按「載入」就可以了,以我的資料量需要等一下。。

  • 檔案原點:「65001: Unicode (UTF-8)」
  • 分隔符號:「逗號」

跑出來的結果會是這樣,其實流程來說比第一個方法簡單。

要是中文鳥名會跑出什麼東西?

因為我個人習慣用英文鳥名,所以這邊懶得再嘗試了。根據使用中文鳥名的朋友表示,要是選取中文鳥名的話MyEBirdData.CSV轉出來的鳥名部分也會是中文,所以就可以進行簡單的分析了。

直接讀解壓縮後的MyEBirdData.CSV的後果

由於EXCEL直接點CSV檔案並不能更改編碼語系,必須要用上面方法二的方法。繁體中文Windows的底層應該是BIG-5,但UTF-8其實是支援更多語系的編碼。不把副檔名改掉直接讀其實也沒有問題,問題是地點會變成奇怪的亂碼,而且副檔名CSV並不會跳出任何更改檔案編碼的選項,只能看著EXCEL用BIG-5去開UTF-8的檔案,然後跑出一堆神秘亂碼。

某些軟體如Notepad++可以更改純文字檔案的編碼系統,但先改成BIG-5之後再讀取並不能解決這個問題就是了,但這在批次輸入的時候會有用,有機會再來解釋這個應用。

祝各位整理資料愉快RRRRRRR。至於該怎麼整理利用這些資料?要怎麼直接和中華鳥會名錄委員會的名錄對接?請等我下一篇吧,先富奸一下。

--

--

Taiwan Bird Guide Unofficial Blog

Kuan-Chieh Hung, who is an English-speaking Bird Guide in Taiwan 水雞逃避工作的部落格XD