機器學習&混淆矩陣&KNN&貝式分類法&簡單線性回歸

Github

機器學習分兩種

Supervised 監督式學習

有結果的,EX:iris資料集,有品項的

Unsupervised 非監督式學習

    不知道結果的

 

混淆矩陣範例

 .

假如最近一周的天氣是

下雨、沒下雨、下雨、下雨、下雨、沒下雨、沒下雨

而天氣預報則是

下雨、下雨、沒下雨、沒下雨、下雨、下雨、沒下雨

 .

會有以下幾種情況

預測下雨,實際上也真的下雨 → 準(TP)
預測不會下雨,實際上也真的沒下雨 → 準(TN)
預測會下雨,實際上卻沒下雨 → 不準(FP)
預測不會下雨,實際上卻下雨 → 不準 (FN)

  .

以上狀況的準確度有

TP:2 (28.5%)

FP:3 (42.8%)

FN:1 (14.2%)

TN:1 (14.2%)

 .

 

TP,TN,FP,FN 範例

 

 

 KNN (k-Nearest Neighbors) 最近鄰居法 範例

  優點:準確度高

  缺點:資料多時比較慢

 

 

 先下載這兩個檔案

states.txt

plot_state_borders.py

畫地圖
Import 至python裡

 

平均距離與最小距離

 

 

 

貝式分類法

.

比較信件差異,用不同的信件去斷字斷詞,並計算該封信是不是垃圾信,由該單字站整體信件的比例為何判斷該封是不是垃圾信

.

將這個範例下載起來,解壓縮至檔案底下

信件範例

 

 

簡單線性回歸範例,一個x搭配一個y

 

備註:2017/05/11 計算方法分析與設計 課堂筆記

Leave a Reply