
中文顧客關係管理 CSV 檔案完整介紹 | Microsoft Excel、OpenOffice Calc 與 Google Sheet 的使用訣竅與實際對決
內容介紹
- 數位化的編碼是電腦問世開始的最基本功能。
- 演變至今,現代的數位編碼建議使用 Unicode (UTF-8)。
- 常用軟體的使用訣竅,包括:Microsoft Excel、OpenOffice Calc、以及 Google 試算表。
- 完整介紹與操作示範的影片。
資料數位化編碼
電腦是由許多的電子元件組成,每個電子元件就是一個開關。
通常會使用是 8 個開與關為一組,來編碼一個字元或符號。
你可以將他們想像成是 8 個燈號,像是這樣子:
◍ ◍ ◉ ◍ ◉ ◉ ◍ ◍
就像是船舶的燈號、摩斯碼、或者旗號的作用一樣,電腦上的資料也是使用相同的技術來記錄和處理資料。
因此,數位化世界也稱為是二進位的世界。
0 是◍(關)、1 是◉(開)。
使用電腦,在輸入一個英文字母或是阿拉伯數字的時候,電腦會先將輸入的資料,透過數位化的編碼轉換為實際儲存在電腦裡的數位碼。
例如:
阿拉伯數字的 1,經過數位化,實際上電腦裡面,是轉換成為,0 0 1 1 0 0 0 1
。
阿拉伯數字的 2,經過數位化,實際上電腦裡面,是轉換成為,0 0 1 1 0 0 1 0
。
英文子母也是一樣。
大寫的英文字母 A,在電腦數位化的世界裡是,0 1 0 0 0 0 0 1
。
大寫的英文字母 B,在電腦數位化的世界裡是,0 1 0 0 0 0 1 0
。
這個編碼方式稱為 ASCII,是電腦時代最早,也是至今最廣泛被使用的編碼方式。
因為 ASCII 是使用 8 個 0 與 1 來進行編碼,因此,最多可以定義的字元或符號是 2 的 8 次方,也就是 256 個。
在隨後的幾年,國際標準化組織 ISO 以 ASCII 為基礎,發展出了 ISO 8859-1 編碼方式,它一共收納了 191 個字元或符號。
在使用英文體系的歐美國家,語言文字都是由字母所組成,這個編碼已經足夠 99.9% 以上的使用。
像是英文字母,26 個大寫的 A 到 Z,小寫的 a 到 z,阿拉伯數字 0 到 9,以及常用的符號,全部加起來也不過 100 個。
中文編碼
在中文世界,中文字是圖像文字,並不像是英文字都是由 26 個字母組成,光是常用的中文字就超過 10,000 個,這個數量遠遠超過 ISO 8859-1 的編碼能力。
在 1983 年,為了推廣個人電腦,由資策會與當時民間的電腦廠商共同合作開發了 Big 5 編碼,收納約 13,053 個字與 441 個符號。
在當時,Big 5 的推出,解決了各個中文電腦系統之間內碼不相容的問題。
Big 5 是由業界主導開發,而不是由官方制定。
Big 5 編碼是使用 2 組 8 位元,也就是一共 16 個 0 與 1 來進行編碼。
例如:
顧客的顧,使用 Big 5 編碼是,1 1 0 0 0 1 0 1 0 1 0 1 0 1 0 1
。
相對於繁體中文的世界是使用 Big 5,簡體中文的世界則有 GB2312 編碼方式。
中文編碼的三個大問題
第一、繁體中文與簡體中文之間彼此不相容;
第二、掉字,尤其容易發生在顧客的姓名,像是歌手陶喆的喆是哲的異形字,在 Big 5 不支援,其他包括啟發的啟和啓,山峰的峰和峯,以及游錫堃的堃…等等;
第三、現在的顧客資料會出現更多的符號,也需要支援更多國家的語文與文字;
因此,Big 5 已經不足夠使用!
萬國碼 Unicode (UTF-8) 介紹
萬國碼 Unicode (UTF-8) 是一個變動長度的編碼方式,可編碼的字數高達二百萬個以上。
使用 Unicode (UTF-8) 解決中文字掉字問題,同時支援更多語文文字、符號。
不過,處理同樣的資料,資料量和檔案大小都會增加。
例如:
顧客的顧,同一個字。
使用 Big 5 編碼是,1 1 0 0 0 1 0 1 0 1 0 1 0 1 0 1
。
使用 UTF-8 編碼是,1 1 1 0 1 0 0 1 1 0 1 0 0 0 0 1 1 0 1 0 0 1 1 1
。
實際測試,使用Unicode (UTF-8)的資料量與檔案大小,增加 119% ~ 134%。

在個人電腦剛開始推廣的時代,運算速度與儲存空間都是寶貴的資源,絕大多數的常用中文字都可以使用 Big 5 編碼,相對起來,使用了 3 組 8 位元的 Unicode (UTF-8) 顯得浪費資源。
但是,對於現代的電腦運算能力與儲存空間,這個差別已經影響不大。
因此,即便是中文的 CRM 顧客關係資料,建議使用 Unicode (UTF-8),也就是萬國碼作為編碼方式。
接下來是實際使用三種常用的軟體,示範操作中文顧客關係管理 CSV 檔案的一些訣竅。
Microsoft Excel
首先是 Microsoft Excel,雖然 Excel 是最廣泛被使用的資料處理軟體,但是,使用 Excel 建立 Unicode (UTF-8) 中文顧客關係管理 CSV 檔案的時候,有地雷,要避開!
使用 Excel 建立中文 UTF-8 CSV 檔案
使用 Microsoft Excel 建立 CSV 檔案,要使用『另存新檔』的方式操作。
不要直接使用『匯出』功能,這是中文 UTF-8 CSV 檔案的地雷,要避開,否則匯出的中文顧客關係資料是亂碼。
正確的操作步驟:
檔案 → 另存新檔 → 檔案格式選擇 “CSV UTF-8 (逗號分隔) (*.csv)”。

使用 Excel 開啟中文 UTF-8 CSV 檔案
Excel 無法直接開啟中文 UTF-8 的 CSV 檔案,即便是最新版本的 Excel 也是。
使用 Excel 開啟中文 UTF-8 的 CSV 檔案的方式是使用『資料匯入』的方式。
正確的操作有二個步驟:
第一步,先開啟 Excel,並新增一個『空白活頁簿』。
然後,執行資料匯入,點:資料 → 從文字/CSV,執行匯入。

OpenOffice Calc
使用 OpenOffice Calc 建立中文 UTF-8 CSV 檔案
相較於 Excel 建立中文 UTF-8 CSV 檔案可能會遇到地雷,使用 OpenOffice Calc 則比較安全且直覺。
OpenOffice Calc 的操作步驟是,首先,檔案 → 另存新檔 → 存檔類型選擇『Text CSV (.csv) (*.csv)』。

接著選擇以 Unicode (UTF-8) 為編碼方式。

使用 OpenOffice Calc 開啟中文 UTF-8 CSV 檔案
使用 OpenOffice Calc 開啟中文 UTF-8 CSV 檔案的操作步驟也比較簡單,不像是 Excel 需要先新增空白活頁簿,然後再匯入。
OpenOffice Calc 可以直接而且正確地開啟中文 UTF-8 CSV 檔案。
在 YouTube 影片有完整的操作過程。
Google 試算表
使用 Google 試算表 建立中文 UTF-8 CSV 檔案
Google 試算表是雲端服務,不是本機端的軟體,因此沒有另存新檔的功能。
使用 Google 試算表 建立中文 UTF-8 CSV 檔案是使用『下載』功能。
操作路徑:檔案→下載→逗號分隔值檔案 (.csv)。

使用 Google 試算表 開啟中文 UTF-8 CSV 檔案
Google 試算表是使用匯入的方式來開啟本機端的中文 UTF-8 CSV 檔案。
操作步驟與 Microsoft Excel 相似,需要先建立一個完全空白的試算表,然後進行檔案的匯入。
