Supervised Learning
=由一些已經知道解答的數據群中, 訓練出模型的方式
這主要分兩大類 1.回歸 2.分群
1.回歸=用於連續值得輸出預測
譬如你有一堆這個區域房子成交價
X= 坪數
Y=售價
你用這些歷史數據訓練出一個回歸模型, 於是你可以利用這個回歸模型去預測新的X
譬如你朋友想要在這區域賣房子, 於是他給你他房子的坪數, 你套入那個練出來的模型
得到Y, 則可以建議他以Y價格售出
2. 分群=用於離散值得輸出預測
譬如
有一堆有腫瘤病患的資料, 而假設我們X只看一個feature 叫做腫瘤直徑
(實際上會有很多feature)
而 Y就是 0=不是惡性腫瘤 1=是惡性腫瘤
所以把歷史資料都畫出來之後, 訓練出一個演算法可以分群, 以便之後出入新的病人的
腫瘤直徑, 可以預測是否為惡性
又
X=腫瘤直徑 , Y=年齡
一樣可以訓練出分群模型
Unsupervised Learning
=這是說你不知道這推數據姿料理有怎樣的規則, 你想要用演算法看看能不能找出這些資料中存在某種結構(可能這些data能分成不同群)
譬如說
每天看到的新聞網頁, 他們去其他網路上收集新聞之後, 他會被自動分到同一類, 譬如某些新聞會被分成運動, 財金 , 這就是跑了演算法之後, 發現能被分類
又或者你有一大堆的健身客戶資料, 你不知道客戶之間有甚關係, 去跑之後, 發現
這些客戶之中, 又有很多膝蓋受過傷的細分市場客戶
簡單來說,
我手上有一堆數據, 我根本不知道裡面有甚東西, 我沒給演算法答案,
請問你(演算法)你可以幫我找出這些數據當中的類型嗎?
我只告訴你演算法, 沒告訴你這些資料的答案(譬如這個人該分到哪群)
沒有留言:
張貼留言