免费可以看的无遮挡av无码|国产在线拍揄自揄视频网站|在线无码精品视频播放在|欧美亚洲国产成人精品,国产成人久久77777精品,亚洲欧美视频在线观看,色偷偷色噜噜狠狠网站久久

千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)

手機(jī)站

千鋒學(xué)習(xí)站 | 隨時(shí)隨地免費(fèi)學(xué)

掃一掃進(jìn)入千鋒手機(jī)站

領(lǐng)取全套視頻

關(guān)注千鋒學(xué)習(xí)站小程序
隨時(shí)隨地免費(fèi)學(xué)習(xí)課程

當(dāng)前位置：首頁(yè) > 技術(shù)干貨 > Python 決策樹(shù)的生成算法介紹

Python 決策樹(shù)的生成算法介紹

來(lái)源：千鋒教育

發(fā)布人：xqq

時(shí)間： 2023-11-07 23:06:24 1699369584

劃分?jǐn)?shù)據(jù)集的最大原則是：使無(wú)序的數(shù)據(jù)變的有序。如果一個(gè)訓(xùn)練數(shù)據(jù)中有20個(gè)特征，那么選取哪個(gè)做劃分依據(jù)?這就必須采用量化的方法來(lái)判斷，量化劃分方法有多重，其中一項(xiàng)就是“信息論度量信息分類”?；谛畔⒄摰臎Q策樹(shù)算法有ID3、CART和C4.5等算法，其中C4.5和CART兩種算法從ID3算法中衍生而來(lái)。

決策樹(shù)的生成算法由很多變形，這里簡(jiǎn)單說(shuō)一下幾種經(jīng)典的實(shí)現(xiàn)算法：ID3算法，C4.5算法和CART算法。這些算法的主要區(qū)別在于分類結(jié)點(diǎn)熵特征選擇的選取標(biāo)準(zhǔn)不同，下面了解一下算法的具體實(shí)現(xiàn)過(guò)程。

一：ID3算法

ID3算法所采用的度量標(biāo)準(zhǔn)就是我們前面提到的“信息增益”。當(dāng)屬性a的信息增益最大時(shí)，則意味著用a屬性劃分，其所獲得的“純度”提升最大，我們所要做的，就是找到信息增益最大的屬性。

ID3算法的核心是在決策樹(shù)的各個(gè)節(jié)點(diǎn)上應(yīng)用信息增益準(zhǔn)則進(jìn)行特征選擇，具體的做法是：

從根節(jié)點(diǎn)上開(kāi)始，對(duì)結(jié)點(diǎn)計(jì)算所有可能特征的信息增益，選擇信息增益最大的特征作為結(jié)點(diǎn)的特征，并由該特征的不同取值構(gòu)建子節(jié)點(diǎn);

對(duì)于子節(jié)點(diǎn)遞歸的調(diào)用以上方法，構(gòu)建決策樹(shù);

直到所有特征的信息增益均很小或者沒(méi)有特征可選擇的時(shí)候?yàn)橹埂?/p>

ID3算法具體的算法過(guò)程如下：

輸入的是m個(gè)樣本，樣本輸出集合為D，每個(gè)樣本有n個(gè)離散特征，特征集合為A，輸出為決策樹(shù)T。

1，初始化信息增益的閾值€

2，判斷樣本是否為同一類輸出Di，如果是則返回單節(jié)點(diǎn)樹(shù)T，標(biāo)記類別為Di

3，判斷特征是否為空，如果是則返回單節(jié)點(diǎn)樹(shù)T，標(biāo)記類別為樣本值紅輸出類別D實(shí)例數(shù)最多的類別

4，計(jì)算A中的各個(gè)特征(一共n個(gè))對(duì)輸出D的信息增益，選擇信息增益最大的特征Ag

5，如果Ag的信息增益小于閾值€，則返回單節(jié)點(diǎn)樹(shù)T，標(biāo)記類別為樣本中輸出類別D實(shí)例樹(shù)最多的類別

6，否則，按特征Ag的不同取值A(chǔ)gi將對(duì)應(yīng)的樣本輸出D分成不同的類別Di，每個(gè)類別產(chǎn)生一個(gè)子節(jié)點(diǎn)。對(duì)應(yīng)特征為Agi，返回增加了節(jié)點(diǎn)的數(shù)T

7，對(duì)于所有的子節(jié)點(diǎn)，令D=Di，A=A-{Ag}遞歸調(diào)用2~6步，得到子樹(shù)Ti并返回

ID3算法存在的缺點(diǎn)：

1.ID3算法在選擇根節(jié)點(diǎn)和內(nèi)部節(jié)點(diǎn)中的分支屬性時(shí)，采用信息增益作為評(píng)價(jià)標(biāo)準(zhǔn)。信息增益的缺點(diǎn)是傾向于選擇取值較多是屬性，在有些情況下這類屬性可能不會(huì)提供太多有價(jià)值的信息。

2.ID3算法只能對(duì)描述屬性為離散型屬性的數(shù)據(jù)集構(gòu)造決策樹(shù)。

3.ID3算法對(duì)于缺失值的情況沒(méi)做考慮。

4.沒(méi)有考慮過(guò)擬合的問(wèn)題。

以上內(nèi)容為大家介紹了Python決策樹(shù)的生成算法介紹，希望對(duì)大家有所幫助，如果想要了解更多Python相關(guān)知識(shí)，請(qǐng)關(guān)注 IT培訓(xùn)機(jī)構(gòu):千鋒教育。

tags: python培訓(xùn)

聲明：本站稿件版權(quán)均屬千鋒教育所有，未經(jīng)許可不得擅自轉(zhuǎn)載。

10年以上業(yè)內(nèi)強(qiáng)師集結(jié)，手把手帶你蛻變精英

請(qǐng)您保持通訊暢通，專屬學(xué)習(xí)老師24小時(shí)內(nèi)將與您1V1溝通

免費(fèi)領(lǐng)取

今日已有369人領(lǐng)取成功

劉同學(xué) 138****2860 剛剛成功領(lǐng)取

王同學(xué) 131****2015 剛剛成功領(lǐng)取

張同學(xué) 133****4652 剛剛成功領(lǐng)取

李同學(xué) 135****8607 剛剛成功領(lǐng)取

楊同學(xué) 132****5667 剛剛成功領(lǐng)取

岳同學(xué) 134****6652 剛剛成功領(lǐng)取

梁同學(xué) 157****2950 剛剛成功領(lǐng)取

劉同學(xué) 189****1015 剛剛成功領(lǐng)取

張同學(xué) 155****4678 剛剛成功領(lǐng)取

鄒同學(xué) 139****2907 剛剛成功領(lǐng)取

董同學(xué) 138****2867 剛剛成功領(lǐng)取

周同學(xué) 136****3602 剛剛成功領(lǐng)取

Python C4.5算法

Python 決策樹(shù)算法思想

免費(fèi)打包獲取

相關(guān)推薦HOT

Python NumPy

NumPy是Python語(yǔ)言的一個(gè)擴(kuò)充程序庫(kù)。支持高級(jí)大量的維度數(shù)組與矩陣運(yùn)算，此外也針對(duì)數(shù)組運(yùn)算提供大量的數(shù)學(xué)函數(shù)庫(kù)。Numpy內(nèi)部解除了CPython的G...詳情>>

2023-11-07 23:56:48

Python 面向?qū)ο蟮能浖_(kāi)發(fā)

很多人在學(xué)完了python的class機(jī)制之后，遇到一個(gè)生產(chǎn)中的問(wèn)題，還是會(huì)懵逼，這其實(shí)太正常了，因?yàn)槿魏纬绦虻拈_(kāi)發(fā)都是先設(shè)計(jì)后編程，python的cla...詳情>>

2023-11-07 23:20:48

Python 決策樹(shù)算法思想

決策樹(shù)(decisiontree)是一個(gè)樹(shù)結(jié)構(gòu)(可以是二叉樹(shù)或者非二叉樹(shù))。決策樹(shù)分為分類樹(shù)和回歸樹(shù)兩種，分類樹(shù)對(duì)離散變量做決策樹(shù)，回歸樹(shù)對(duì)連續(xù)變量做...詳情>>

2023-11-07 23:10:00

Python C4.5算法

ID3算法的作者昆蘭基于上面的不足，對(duì)ID3算法做了改進(jìn)，這就是C4.5算法，也許你會(huì)問(wèn)，為什么不叫ID4，ID5之類的名字呢?那是因?yàn)闆Q策樹(shù)當(dāng)時(shí)太火...詳情>>

2023-11-07 23:02:48

Python 面向過(guò)程

python面向過(guò)程優(yōu)點(diǎn)：復(fù)雜的問(wèn)題流程化，進(jìn)而簡(jiǎn)單化(一個(gè)復(fù)雜的問(wèn)題，分成一個(gè)個(gè)小的步驟去實(shí)現(xiàn)，實(shí)現(xiàn)小的步驟將會(huì)非常簡(jiǎn)單)舉個(gè)典型的面向過(guò)程...詳情>>

2023-11-07 22:55:36