分類技術(shù)(或分類法)是一種根據(jù)輸入數(shù)據(jù)建立分類模型的系統(tǒng)方法,分類法的例子包括決策分類法,基于規(guī)則的分類法,神經(jīng)網(wǎng)絡(luò),支持向量機(jī)和樸素貝葉斯分類法。這些技術(shù)都使用一種學(xué)習(xí)算法(learningalgorithm)確定分類模型,該模型能夠很好的擬合輸入數(shù)據(jù)中類標(biāo)號(hào)和屬性集之間的聯(lián)系,學(xué)習(xí)算法得到的模型不僅要很好地?cái)M合輸入數(shù)據(jù),還要能夠正確的預(yù)測未知樣本的類標(biāo)號(hào)。因此,訓(xùn)練算法的主要目標(biāo)就是建立具有很好泛化能力模型,即建立能夠準(zhǔn)確的預(yù)測未知樣本類標(biāo)號(hào)的模型。
那我們首先說一下分類與回歸的區(qū)別。
回歸(regression)
回歸問題的應(yīng)用場景(預(yù)測的結(jié)果是連續(xù)的,例如預(yù)測明天的溫度:23,24,25度等等)
所以說回歸問題通常是用來預(yù)測一個(gè)值,如預(yù)測房價(jià),未來的天氣情況等等,例如一個(gè)產(chǎn)品的實(shí)際價(jià)格為500元,通過回歸分析預(yù)測值為501元,我們認(rèn)為這是一個(gè)比較好的回歸分析。一個(gè)比較常見的回歸算法是線性回歸算法(LR)。另外,回歸分析用在神經(jīng)網(wǎng)絡(luò)上,其最上層是不需要softmax函數(shù)的,而是直接對(duì)前一層累加即可?;貧w是對(duì)真實(shí)值的一種逼近預(yù)測。
分類(classification)
分類問題的應(yīng)用場景(預(yù)測的結(jié)果是離散的,例如預(yù)測明天天氣:陰,晴,雨等等)
例如判斷一幅圖片上的動(dòng)物是一只貓還是一只狗,分類通常是建立在回歸之上,分類的最后一層通常要使用softmax函數(shù)進(jìn)行判斷其所屬類別。分類并沒有逼近的概念,最終正確結(jié)果只有一個(gè),錯(cuò)誤的就是錯(cuò)誤的,不會(huì)有相近的概念。最常見的分類方法是邏輯回歸,或者叫邏輯分類。
以上內(nèi)容為大家介紹了Python分類技術(shù),希望對(duì)大家有所幫助,如果想要了解更多Python相關(guān)知識(shí),請(qǐng)關(guān)注IT培訓(xùn)機(jī)構(gòu):千鋒教育。