preface

中文顧客關係管理 CSV 檔案完整介紹 | Microsoft Excel、OpenOffice Calc 與 Google Sheet 的使用訣竅與實際對決

內容介紹

  1. 數位化的編碼是電腦問世開始的最基本功能。
  2. 演變至今,現代的數位編碼建議使用 Unicode (UTF-8)。
  3. 常用軟體的使用訣竅,包括:Microsoft Excel、OpenOffice Calc、以及 Google 試算表。
  4. 完整介紹與操作示範的影片。

資料數位化編碼

電腦是由許多的電子元件組成,每個電子元件就是一個開關。

通常會使用是 8 個開與關為一組,來編碼一個字元或符號。

你可以將他們想像成是 8 個燈號,像是這樣子:

◍ ◍ ◉ ◍ ◉ ◉ ◍ ◍

就像是船舶的燈號、摩斯碼、或者旗號的作用一樣,電腦上的資料也是使用相同的技術來記錄和處理資料。

因此,數位化世界也稱為是二進位的世界。

0 是◍(關)、1 是◉(開)。

使用電腦,在輸入一個英文字母或是阿拉伯數字的時候,電腦會先將輸入的資料,透過數位化的編碼轉換為實際儲存在電腦裡的數位碼。

例如:

阿拉伯數字的 1,經過數位化,實際上電腦裡面,是轉換成為,0 0 1 1 0 0 0 1

阿拉伯數字的 2,經過數位化,實際上電腦裡面,是轉換成為,0 0 1 1 0 0 1 0

英文子母也是一樣。

大寫的英文字母 A,在電腦數位化的世界裡是,0 1 0 0 0 0 0 1

大寫的英文字母 B,在電腦數位化的世界裡是,0 1 0 0 0 0 1 0

這個編碼方式稱為 ASCII,是電腦時代最早,也是至今最廣泛被使用的編碼方式。

因為 ASCII 是使用 8 個 0 與 1 來進行編碼,因此,最多可以定義的字元或符號是 2 的 8 次方,也就是 256 個。

在隨後的幾年,國際標準化組織 ISO 以 ASCII 為基礎,發展出了 ISO 8859-1 編碼方式,它一共收納了 191 個字元或符號。

在使用英文體系的歐美國家,語言文字都是由字母所組成,這個編碼已經足夠 99.9% 以上的使用。

像是英文字母,26 個大寫的 A 到 Z,小寫的 a 到 z,阿拉伯數字 0 到 9,以及常用的符號,全部加起來也不過 100 個。

中文編碼

在中文世界,中文字是圖像文字,並不像是英文字都是由 26 個字母組成,光是常用的中文字就超過 10,000 個,這個數量遠遠超過 ISO 8859-1 的編碼能力。

在 1983 年,為了推廣個人電腦,由資策會與當時民間的電腦廠商共同合作開發了 Big 5 編碼,收納約 13,053 個字與 441 個符號。

在當時,Big 5 的推出,解決了各個中文電腦系統之間內碼不相容的問題。

Big 5 是由業界主導開發,而不是由官方制定。

Big 5 編碼是使用 2 組 8 位元,也就是一共 16 個 0 與 1 來進行編碼。

例如:

顧客的顧,使用 Big 5 編碼是,1 1 0 0 0 1 0 1 0 1 0 1 0 1 0 1

相對於繁體中文的世界是使用 Big 5,簡體中文的世界則有 GB2312 編碼方式。

中文編碼的三個大問題

第一、繁體中文與簡體中文之間彼此不相容;

第二、掉字,尤其容易發生在顧客的姓名,像是歌手陶喆的喆是哲的異形字,在 Big 5 不支援,其他包括啟發的啟和啓,山峰的峰和峯,以及游錫堃的堃…等等;

第三、現在的顧客資料會出現更多的符號,也需要支援更多國家的語文與文字;

因此,Big 5 已經不足夠使用!

萬國碼 Unicode (UTF-8) 介紹

萬國碼 Unicode (UTF-8) 是一個變動長度的編碼方式,可編碼的字數高達二百萬個以上。

使用 Unicode (UTF-8) 解決中文字掉字問題,同時支援更多語文文字、符號。

不過,處理同樣的資料,資料量和檔案大小都會增加。

例如:

顧客的顧,同一個字。

使用 Big 5 編碼是,1 1 0 0 0 1 0 1 0 1 0 1 0 1 0 1

使用 UTF-8 編碼是,1 1 1 0 1 0 0 1 1 0 1 0 0 0 0 1 1 0 1 0 0 1 1 1

實際測試,使用Unicode (UTF-8)的資料量與檔案大小,增加 119% ~ 134%。

使用不同編碼的檔案大小,使用Unicode (UTF-8)的資料量與檔案大小,增加 119% ~ 134%。

在個人電腦剛開始推廣的時代,運算速度與儲存空間都是寶貴的資源,絕大多數的常用中文字都可以使用 Big 5 編碼,相對起來,使用了 3 組 8 位元的 Unicode (UTF-8) 顯得浪費資源。

但是,對於現代的電腦運算能力與儲存空間,這個差別已經影響不大。

因此,即便是中文的 CRM 顧客關係資料,建議使用 Unicode (UTF-8),也就是萬國碼作為編碼方式。

接下來是實際使用三種常用的軟體,示範操作中文顧客關係管理 CSV 檔案的一些訣竅。

Microsoft Excel

首先是 Microsoft Excel,雖然 Excel 是最廣泛被使用的資料處理軟體,但是,使用 Excel 建立 Unicode (UTF-8) 中文顧客關係管理 CSV 檔案的時候,有地雷,要避開!

使用 Excel 建立中文 UTF-8 CSV 檔案

使用 Microsoft Excel 建立 CSV 檔案,要使用『另存新檔』的方式操作。

不要直接使用『匯出』功能,這是中文 UTF-8 CSV 檔案的地雷,要避開,否則匯出的中文顧客關係資料是亂碼。

正確的操作步驟:

檔案 → 另存新檔 → 檔案格式選擇 “CSV UTF-8 (逗號分隔) (*.csv)”。

使用 Excel 建立中文 UTF-8 CSV 檔案,要使用『另存新檔 → CSV UTF-8 (逗號分隔) (*.csv)』才能正確建立。

使用 Excel 開啟中文 UTF-8 CSV 檔案

Excel 無法直接開啟中文 UTF-8 的 CSV 檔案,即便是最新版本的 Excel 也是。

使用 Excel 開啟中文 UTF-8 的 CSV 檔案的方式是使用『資料匯入』的方式。

正確的操作有二個步驟:

第一步,先開啟 Excel,並新增一個『空白活頁簿』。

然後,執行資料匯入,點:資料 → 從文字/CSV,執行匯入。

使用 Excel 開啟中文 UTF-8 CSV 檔案,需要使用資料匯入的方式才能正確開啟。

OpenOffice Calc

使用 OpenOffice Calc 建立中文 UTF-8 CSV 檔案

相較於 Excel 建立中文 UTF-8 CSV 檔案可能會遇到地雷,使用 OpenOffice Calc 則比較安全且直覺。

OpenOffice Calc 的操作步驟是,首先,檔案 → 另存新檔 → 存檔類型選擇『Text CSV (.csv) (*.csv)』。

OpenOffice Calc 建立中文 UTF-8 CSV 檔案是使用『另存新檔』的方式。

接著選擇以 Unicode (UTF-8) 為編碼方式。

選擇以『Unicode (UTF-8)』為編碼方式。

使用 OpenOffice Calc 開啟中文 UTF-8 CSV 檔案

使用 OpenOffice Calc 開啟中文 UTF-8 CSV 檔案的操作步驟也比較簡單,不像是 Excel 需要先新增空白活頁簿,然後再匯入。

OpenOffice Calc 可以直接而且正確地開啟中文 UTF-8 CSV 檔案。

YouTube 影片有完整的操作過程。

Google 試算表

使用 Google 試算表 建立中文 UTF-8 CSV 檔案

Google 試算表是雲端服務,不是本機端的軟體,因此沒有另存新檔的功能。

使用 Google 試算表 建立中文 UTF-8 CSV 檔案是使用『下載』功能。

操作路徑:檔案→下載→逗號分隔值檔案 (.csv)。

使用 Google 試算表的下載功能,建立中文 UTF-8 CSV 檔案。

使用 Google 試算表 開啟中文 UTF-8 CSV 檔案

Google 試算表是使用匯入的方式來開啟本機端的中文 UTF-8 CSV 檔案。

操作步驟與 Microsoft Excel 相似,需要先建立一個完全空白的試算表,然後進行檔案的匯入。

使用 Google 試算表的檔案匯入功能,開啟中文 UTF-8 CSV 檔案。

完整的操作過程,歡迎在我們的 YouTube 影片觀看

中文顧客關係管理 CSV 檔案完整介紹 | Microsoft Excel、OpenOffice Calc 與 Google Sheet 的使用訣竅與實際對決