決策是什么意思有什么優(yōu)缺點(diǎn)
決策是什么意思有什么優(yōu)缺點(diǎn)
分類樹(決策樹)是一種十分常用的分類方法。那么你對(duì)決策樹了解多少呢?以下是由學(xué)習(xí)啦小編整理關(guān)于什么是決策樹的內(nèi)容,希望大家喜歡!
決策樹的簡(jiǎn)介
決策樹(Decision Tree)是在已知各種情況發(fā)生概率的基礎(chǔ)上,通過(guò)構(gòu)成決策樹來(lái)求取凈現(xiàn)值的期望值大于等于零的概率,評(píng)價(jià)項(xiàng)目風(fēng)險(xiǎn),判斷其可行性的決策分析方法,是直觀運(yùn)用概率分析的一種圖解法。由于這種決策分支畫成圖形很像一棵樹的枝干,故稱決策樹。在機(jī)器學(xué)習(xí)中,決策樹是一個(gè)預(yù)測(cè)模型,他代表的是對(duì)象屬性與對(duì)象值之間的一種映射關(guān)系。Entropy = 系統(tǒng)的凌亂程度,使用算法ID3, C4.5和C5.0生成樹算法使用熵。這一度量是基于信息學(xué)理論中熵的概念。
決策樹是一種樹形結(jié)構(gòu),其中每個(gè)內(nèi)部節(jié)點(diǎn)表示一個(gè)屬性上的測(cè)試,每個(gè)分支代表一個(gè)測(cè)試輸出,每個(gè)葉節(jié)點(diǎn)代表一種類別。
分類樹(決策樹)是一種十分常用的分類方法。他是一種監(jiān)管學(xué)習(xí),所謂監(jiān)管學(xué)習(xí)就是給定一堆樣本,每個(gè)樣本都有一組屬性和一個(gè)類別,這些類別是事先確定的,那么通過(guò)學(xué)習(xí)得到一個(gè)分類器,這個(gè)分類器能夠?qū)π鲁霈F(xiàn)的對(duì)象給出正確的分類。這樣的機(jī)器學(xué)習(xí)就被稱之為監(jiān)督學(xué)習(xí)。
決策樹的組成
□——決策點(diǎn),是對(duì)幾種可能方案的選擇,即最后選擇的最佳方案。如果決策屬于多級(jí)決策,則決策樹的中間可以有多個(gè)決策點(diǎn),以決策樹根部的決策點(diǎn)為最終決策方案。
○——狀態(tài)節(jié)點(diǎn),代表備選方案的經(jīng)濟(jì)效果(期望值),通過(guò)各狀態(tài)節(jié)點(diǎn)的經(jīng)濟(jì)效果的對(duì)比,按照一定的決策標(biāo)準(zhǔn)就可以選出最佳方案。由狀態(tài)節(jié)點(diǎn)引出的分支稱為概率枝,概率枝的數(shù)目表示可能出現(xiàn)的自然狀態(tài)數(shù)目每個(gè)分枝上要注明該狀態(tài)出現(xiàn)的概率。
△——結(jié)果節(jié)點(diǎn),將每個(gè)方案在各種自然狀態(tài)下取得的損益值標(biāo)注于結(jié)果節(jié)點(diǎn)的右端。
決策樹的優(yōu)點(diǎn)
決策樹易于理解和實(shí)現(xiàn),人們?cè)谠趯W(xué)習(xí)過(guò)程中不需要使用者了解很多的背景知識(shí),這同時(shí)是它的能夠直接體現(xiàn)數(shù)據(jù)的特點(diǎn),只要通過(guò)解釋后都有能力去理解決策樹所表達(dá)的意義。
對(duì)于決策樹,數(shù)據(jù)的準(zhǔn)備往往是簡(jiǎn)單或者是不必要的,而且能夠同時(shí)處理數(shù)據(jù)型和常規(guī)型屬性,在相對(duì)短的時(shí)間內(nèi)能夠?qū)Υ笮蛿?shù)據(jù)源做出可行且效果良好的結(jié)果。
易于通過(guò)靜態(tài)測(cè)試來(lái)對(duì)模型進(jìn)行評(píng)測(cè),可以測(cè)定模型可信度;如果給定一個(gè)觀察的模型,那么根據(jù)所產(chǎn)生的決策樹很容易推出相應(yīng)的邏輯表達(dá)式。
決策樹的缺點(diǎn)
1)對(duì)連續(xù)性的字段比較難預(yù)測(cè)。
2)對(duì)有時(shí)間順序的數(shù)據(jù),需要很多預(yù)處理的工作。
3)當(dāng)類別太多時(shí),錯(cuò)誤可能就會(huì)增加的比較快。
4)一般的算法分類的時(shí)候,只是根據(jù)一個(gè)字段來(lái)分類。
決策樹的實(shí)例
為了適應(yīng)市場(chǎng)的需要,某地準(zhǔn)備擴(kuò)大電視機(jī)生產(chǎn)。市場(chǎng)預(yù)測(cè)表明:產(chǎn)品銷路好的概率為0.7;銷路差的概率為0.3。備選方案有三個(gè):第一個(gè)方案是建設(shè)大工廠,需要投資600萬(wàn)元,可使用10年;如銷路好,每年可贏利200萬(wàn)元;如銷路不好,每年會(huì)虧損40萬(wàn)元。第二個(gè)方案是建設(shè)小工廠,需投資280萬(wàn)元;如銷路好,每年可贏利80萬(wàn)元;如銷路不好,每年也會(huì)贏利60萬(wàn)元。第三個(gè)方案也是先建設(shè)小工廠,但是如銷路好,3年后擴(kuò)建,擴(kuò)建需投資400萬(wàn)元,可使用7年,擴(kuò)建后每年會(huì)贏利190萬(wàn)元。
各點(diǎn)期望:
點(diǎn)②:0.7×200×10+0.3×(-40)×10-600(投資)=680(萬(wàn)元)
決策樹分析
決策樹分析
點(diǎn)⑤:1.0×190×7-400=930(萬(wàn)元)
點(diǎn)⑥:1.0×80×7=560(萬(wàn)元)
比較決策點(diǎn)4的情況可以看到,由于點(diǎn)⑤(930萬(wàn)元)與點(diǎn)⑥(560萬(wàn)元)相比,點(diǎn)⑤的期望利潤(rùn)值較大,因此應(yīng)采用擴(kuò)建的方案,而舍棄不擴(kuò)建的方案。把點(diǎn)⑤的930萬(wàn)元移到點(diǎn)4來(lái),可計(jì)算出點(diǎn)③的期望利潤(rùn)值。
點(diǎn)③:0.7×80×3+0.7×930+0.3×60×(3+7)-280 = 719(萬(wàn)元)
最后比較決策點(diǎn)1的情況。由于點(diǎn)③(719萬(wàn)元)與點(diǎn)②(680萬(wàn)元)相比,點(diǎn)③的期望利潤(rùn)值較大,因此取點(diǎn)③而舍點(diǎn)②。這樣,相比之下,建設(shè)大工廠的方案不是最優(yōu)方案,合理的策略應(yīng)采用前3年建小工廠,如銷路好,后7年進(jìn)行擴(kuò)建的方案。
看過(guò)“決策樹的優(yōu)缺點(diǎn)”的人還看了: