大家都知道 python有 2與 3兩個分支,除了部份程式語法不同之外,兩個分支對字串物件 (string object)的處理更是採取完全不一樣的方式。
當初為了開發四大報爬蟲程式處理中文字串時著實吃了非常大的苦頭......在網路資源裡游蕩了許久才瞭解不同編碼之間轉換的關係。本文就是希望大家能免去查資料的麻煩,一次就搞懂。
2017年2月9日 星期四
2016年7月30日 星期六
Newsurvey媒體爬蟲課程介紹 三堂課程快速上手!專為不會寫程式的你設計
三堂課程快速上手!專為不會寫程式的你設計
為什麼選擇 Newsurvey?
●媒體文字一直以來都是文本分析最重要的資料來源。面對巨量資料以及新媒體的熱潮,資訊流的掌握已成為不可或缺的能力
○爬蟲是透過電腦自動擷取網頁資料的程式,基本上在網頁上的可視資料都能透過爬蟲程式系統性的擷取下來。除了免除大量手動複製貼上的麻煩,也可以依照需求設定資料儲存的格式
●在三堂課程中,我們將實作自由時報、蘋果日報、PTT以及臉書的爬蟲程式,一網打盡熱門媒體
2016年7月14日 星期四
python文字探勘,資料前處理流程介紹
當拿到文本資料想進行探勘時,若直接將原始資料去訓練 model或是代入套件通常都會得到雜訊非常嚴重的結果。因此,要擷取資料中真正有意義的部份,前處理是不可或缺的一個步驟。
以下的介紹是基於中文文本資料來撰寫的,簡述常用到的幾個技巧:
2016年7月12日 星期二
Keras筆記:implementing Graph object to concatenate multiple CNN example
你可以把 Keras想像為以 Tensorflow及 Theano做為運算後臺的前臺使用者介面,讓你能夠在略懂皮毛的知識濃度下就輕鬆地建立起自己需要的類神經網絡。
2016年6月20日 星期一
香港住宿推薦:平價優質青年旅舍 美荷樓住宿、餐廳細節及最佳交通方式大公開
想去香港旅遊的朋友一定很快就會發現香港的住宿讓人有點不知所措......漂亮舒適的酒店價錢太高了住不起,便宜一點的賓館又大多座落於老舊大廈的某一樓層,讓人看得有點觸目驚心。
但這次找到的 YHA美荷樓青年旅舍真的是性價比 CP值非常高,不僅相當乾淨舒適,附有早餐,離港鐵深水埗也只有約 5~10分鐘的距離,就算不是青年的旅行者我也相當推薦入住。
2016年3月4日 星期五
賀!瀏覽人次十萬人達成!!
值得慶祝的一刻,就在昨天 DannyPhoebe瀏覽人次正式突破十萬人!真的非常感謝所有來過 DannyPhoebe的朋友,尤其每當看到讀者們的留言回應時更是令人興奮的時刻!
近半年來肥鰻由於投入職場的關係,不論時間或精神上都不足以好好整理更多有用、有趣的資訊給大家。但其實這段時間內是有不少想法想分享的,請大家拭目以待!
再次感謝所有閱讀過 DannyPhoebe中任何一篇文章的朋友,所有的資訊都是我在面臨不同挑戰時的學習歷程,希望大家都能從中獲得需要的幫助,謝謝!
圖片取自網站
近半年來肥鰻由於投入職場的關係,不論時間或精神上都不足以好好整理更多有用、有趣的資訊給大家。但其實這段時間內是有不少想法想分享的,請大家拭目以待!
再次感謝所有閱讀過 DannyPhoebe中任何一篇文章的朋友,所有的資訊都是我在面臨不同挑戰時的學習歷程,希望大家都能從中獲得需要的幫助,謝謝!
2015年8月30日 星期日
財政部電子發票申請、載具申請流程、手機條碼申請教學
大家有沒有錢包裡塞滿發票的困擾呢?最近開始使用財政部推出的電子發票服務後發票量明顯地減少了,不僅解決收納的問題也達到節省紙張的目的。
Labels:
好站分享
2015年7月30日 星期四
2015年7月23日 星期四
2015年7月6日 星期一
日檢N4準備方法心得、初學者日文自學推薦書&聽力練習&網路學習資源大公開
昨天終於考完人生第一次的日檢了!雖然只是 N4測驗,但對肥鰻來說可是日文學習過程中一個重要的里程碑,同時也肯定了日文初學者自學的可能性。
2015/09/02 補記:就在昨天成績單出爐囉!讀解拿了滿分相當開心呢,回想當時準備的狀態,假若報考的是 N3應該也是沒問題的。
首先先來簡介過去學習日文的經歷:
約四年前 (時光匆匆orz)在大學時曾經修了一年的日文,基本上五十音的讀和寫是沒問題的,但文法幾乎只記得最簡單的句型而已......差不多可以說是砍掉重練的狀態。
2015/09/02 補記:就在昨天成績單出爐囉!讀解拿了滿分相當開心呢,回想當時準備的狀態,假若報考的是 N3應該也是沒問題的。
首先先來簡介過去學習日文的經歷:
約四年前 (時光匆匆orz)在大學時曾經修了一年的日文,基本上五十音的讀和寫是沒問題的,但文法幾乎只記得最簡單的句型而已......差不多可以說是砍掉重練的狀態。
Labels:
證照考試
訂閱:
文章
(
Atom
)





