欧美综合视频在线_国产乱码精品一区二区三区av _国产精品白浆_免费日本一区二区三区视频_波多野结衣家庭主妇_三级黄色片免费看_国产精品久久久一区二区三区_欧美一区二区黄色_狠狠色丁香九九婷婷综合五月 _亚洲一级二级三级在线免费观看

統(tǒng)計(jì)學(xué)決策規(guī)則優(yōu)選九篇

時(shí)間:2023-09-13 17:06:21

引言:易發(fā)表網(wǎng)憑借豐富的文秘實(shí)踐,為您精心挑選了九篇統(tǒng)計(jì)學(xué)決策規(guī)則范例。如需獲取更多原創(chuàng)內(nèi)容,可隨時(shí)聯(lián)系我們的客服老師。

第1篇

[關(guān)鍵詞] 科學(xué)決策 市場調(diào)查 假設(shè)檢驗(yàn)

假設(shè)檢驗(yàn)是一類重要的統(tǒng)計(jì)推斷方法,它是利用樣本統(tǒng)計(jì)量并按一種決策規(guī)則對零假設(shè)H0作出拒絕或接受的推斷,決策規(guī)則運(yùn)用了“小概率”原理。

一、理論基礎(chǔ)

設(shè)每次試驗(yàn)可能出現(xiàn)的結(jié)果為,相應(yīng)的概率分別為,且;進(jìn)行了次獨(dú)立試驗(yàn),記出現(xiàn)的次數(shù)為。顯然,在次試驗(yàn)中,事件出現(xiàn)的頻數(shù)與期望數(shù)有差異,卡爾?皮爾遜提出了這種差異程度的統(tǒng)計(jì)量

并證明了如下的定理。

定理當(dāng)為總體的真實(shí)概率時(shí),由上式定義的統(tǒng)計(jì)量的漸近分布是自由度為的-分布,即其密度函數(shù)為

在上面的定理中,我們假定是已知的,但是在實(shí)際問題中,通常依賴于個(gè)未知參數(shù),而這個(gè)參數(shù)需要用樣本估計(jì),這時(shí)皮爾遜定理不再成立。不過,1929年費(fèi)歇證明了在一定條件下,可以先用極大似然估計(jì)方法估計(jì)這個(gè)參數(shù),然后再算出,這時(shí)統(tǒng)計(jì)量

當(dāng)時(shí)還是漸近服從-分布,不過自由度為。

二、應(yīng)用實(shí)例

石市萬方商城準(zhǔn)備在東開發(fā)區(qū)幾個(gè)大中專學(xué)校內(nèi)建連鎖店,商城文化用品專柜銷售經(jīng)理安娣要為本專柜在各連鎖店內(nèi)的投資規(guī)模提供資料,供決策層參考。于是,對準(zhǔn)備建連鎖店的幾個(gè)學(xué)校的學(xué)生進(jìn)行了抽樣調(diào)查,其中某大專學(xué)校每月生均消費(fèi)(本文中專指學(xué)生用于購買文化用品的支出)的資料如下:

解:(1)統(tǒng)計(jì)假設(shè):

(2)對水平,查自由度為的-分布得臨界值,故拒絕域?yàn)閇)

(3)計(jì)算統(tǒng)計(jì)量的觀測值

(4)作判斷:由于,故接受零假設(shè),即此大專學(xué)校學(xué)生的每月人均消費(fèi)(本文中專指學(xué)生用于購買文化用品的支出)X服從正態(tài)分布。據(jù)此推斷結(jié)論,再綜合其他因素,銷售部經(jīng)理、商場決策層等最后商討在此校開連鎖店事宜。

參考文獻(xiàn):

[1]魏宗舒等:概率論與數(shù)理統(tǒng)計(jì)教程[M].北京:高等教育出版社,2003年6月

[2]吳遠(yuǎn)芬:淺析抽樣調(diào)查在應(yīng)用中的局限性[J].商場現(xiàn)代化,2006年8月總第475期

第2篇

目前,中國除了上海之外,其它城市還沒有專營消費(fèi)信貸調(diào)查業(yè)務(wù)的報(bào)告機(jī)構(gòu)。1999年下半年,建設(shè)銀行濟(jì)南分行出臺(tái)的《個(gè)人信用等級評定辦法》在信用評估方面進(jìn)行了嘗試。該辦法對不同的指標(biāo)賦予不同的分值,對借款申請人的還款能力、信用狀況等做出綜合評價(jià)以決定貸款決策。隨著信貸業(yè)務(wù)的需要,國內(nèi)越來越多金融機(jī)構(gòu)以業(yè)務(wù)對象的個(gè)人信用記錄直接作決策參考,或附以一些評分方法,但畢竟以主觀經(jīng)驗(yàn)為主。而國外在信用評估方面已經(jīng)有人做了大量的工作,提出了有FICO評分模型、神經(jīng)網(wǎng)絡(luò)模型、貝葉斯分析模型等等各種評估模型,并采用了各種數(shù)學(xué)的、統(tǒng)計(jì)學(xué)的、信息學(xué)的方法,取得了一定的效果,特別是FICO評分模型,更是成為西方發(fā)達(dá)國家信用評分事實(shí)上的標(biāo)準(zhǔn)。

二、常用評估方法

1.標(biāo)準(zhǔn)數(shù)理統(tǒng)計(jì)模型

基于標(biāo)準(zhǔn)數(shù)理統(tǒng)計(jì)理論的信用評分模型是對大量的個(gè)人消費(fèi)貸款的歷史信用數(shù)據(jù)進(jìn)行科學(xué)的歸納、總結(jié)、計(jì)算而得到的量化分析公式。在美國,不同的行業(yè)有不同的信用評分模型來幫助專業(yè)人士進(jìn)行信用風(fēng)險(xiǎn)管理,如表1所示:

表1美國不同行業(yè)常用信用評分模型表

從概念上講,信用評分就是利用消費(fèi)者過去的信用表現(xiàn)來預(yù)測其未來的信用行為,如圖1所示。

信用評分模型的關(guān)鍵是科學(xué)合理地選出信用變量,并產(chǎn)生一個(gè)公式。信用評分模型的統(tǒng)計(jì)方法有線性概率模型、logit模型、probit模型以及線性判別(Discriminant)分析方法。

(1)線性概率模型

線性概率模型假設(shè)違約概率Y與信用變量X之間的關(guān)系是線性的,用于解釋過去信用行為(違約或不違約)的信用變量及其重要性(系數(shù))被用來預(yù)測未來的信用行為。線性概率模型數(shù)學(xué)表達(dá)如下:

根據(jù)歷史樣本數(shù)據(jù)進(jìn)行優(yōu)化計(jì)算,得出系數(shù)βj的估算值。

(2)Logit信用評分模型

Logit信用評分模型是采用數(shù)理統(tǒng)計(jì)的logit回歸方法建模分析。logit信用評分模型的分析方法如下:

這里,Y∈{0,1}是二元響應(yīng)變量,表示信貸狀況;為logit概率累積分布函數(shù)。當(dāng)Xj屬于度量變量時(shí),Xj表示為第j個(gè)可度量變量;當(dāng)Xj屬于范疇變量時(shí),Xj表示為啞元變量向量。

(3)Probit信用評分模型

Probit模型同樣能夠把違約概率的預(yù)測值限制在0和1之間。它與logit模型的不同在于probit模型假設(shè)違約概率服從累積正態(tài)分布(cumulativenormaldistribution),即

(4)線性判別模型

判別模型根據(jù)過去觀察到的借貸者的信用特征,把他們劃分成高違約風(fēng)險(xiǎn)和低違約風(fēng)險(xiǎn)類別。線性判別模型(LinearDiscriminantModel)假定信用變量對這種劃分的影響是線性的。

2.數(shù)據(jù)挖掘技術(shù)

數(shù)據(jù)挖掘從大量數(shù)據(jù)中提取或“挖掘”知識(shí),其任務(wù)可以分為描述和預(yù)測兩類,用于信用評估,可對客戶進(jìn)行分類、聚類、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、預(yù)測、偏差檢測等。其中多數(shù)用分類、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)和預(yù)測方法進(jìn)行個(gè)人信用評估。

(1)分類

按分析對象的屬性、特征建立不同的組類描述事物。它基于對類標(biāo)記已知的數(shù)據(jù)對象的分析,導(dǎo)出描述并區(qū)分?jǐn)?shù)據(jù)類或概念的模型(或函數(shù)),用以預(yù)測類標(biāo)記未知的對象類。導(dǎo)出模式可以用分類規(guī)則、判定樹、數(shù)學(xué)公式或神經(jīng)網(wǎng)絡(luò)等形式表示。

(2)關(guān)聯(lián)規(guī)則發(fā)現(xiàn)

某種事物發(fā)生時(shí)其他事物會(huì)發(fā)生的一種聯(lián)系,這些規(guī)則展示屬性-值頻繁地在給定數(shù)據(jù)集中一起出現(xiàn)的條件,關(guān)聯(lián)規(guī)則形式:X=>Y,即“A1∧...∧Am=>B1∧...∧Bm”。

(3)預(yù)測

把握分析對象發(fā)展的規(guī)律,對未來的趨勢作出預(yù)見,其表示形式與分類同。

三、一種基于歷史記錄規(guī)則相似性的綜合評估方法

由于國內(nèi)銀行業(yè)現(xiàn)有客戶記錄多數(shù)是不完整的,所以使用單一的方法進(jìn)行評估未必能體現(xiàn)客戶真實(shí)的信用歷史狀況。為了將數(shù)據(jù)挖掘技術(shù)和數(shù)理統(tǒng)計(jì)完全基于記錄本身特征并與能夠體現(xiàn)專家判斷的評分很好地結(jié)合起來,本文提出一種基于關(guān)聯(lián)規(guī)則的相似推薦方法,實(shí)現(xiàn)如下:

1.應(yīng)用粗糙集理論對歷史數(shù)據(jù)記錄進(jìn)行屬性約簡及規(guī)則提取

粗糙集理論是數(shù)據(jù)表簡化和生成最小決策算法的有效方法,可以實(shí)現(xiàn)知識(shí)約簡,發(fā)現(xiàn)屬性表中的屬性依賴,從而在信息不完全環(huán)境下進(jìn)行知識(shí)發(fā)現(xiàn),其定義如下:

S=<U,A,F(xiàn),V>

其中,S:信息系統(tǒng)(決策表)

U:論域

A:屬性集合

F:UXAV的映射

V:屬性值域集合

采用決策偏好信息的挖掘方法(參見文獻(xiàn)[3]),對S進(jìn)行屬性約簡并提取規(guī)則,形成不同支持度S和信任度C決策規(guī)則集合DN{фΨ}(其中N代表提取的規(guī)則數(shù)量,可根據(jù)實(shí)際情況確定),且D是S不重復(fù)的子集,ф是條件屬性,Ψ是決策屬性,ф、Ψ∈A。

2.對測試記錄與步驟1提取的規(guī)則進(jìn)行相似性計(jì)算

相似性是某種關(guān)系強(qiáng)度的度量,可以通過數(shù)值比較來衡量(參見文獻(xiàn)[4])。因?yàn)闆Q策規(guī)則集合D不能完全覆蓋所有測試記錄屬性值組合,而且決策表對象結(jié)構(gòu)相同。測試集合SD中的任一組合(規(guī)則)Dd對照D中Dn進(jìn)行相似性計(jì)算,得出SIM1、SIM2...SIMn

其中,B:歸一化因子

(B=1/∑Wi)

Wi:屬性i貢獻(xiàn)因子

(體現(xiàn)數(shù)據(jù)特性或?qū)<医?jīng)驗(yàn),也可通過多種賦權(quán)綜合評價(jià)求得)

SD(Dd,Dn):已知Dd發(fā)生,Dn也在同一組發(fā)生的概率

3.多賦權(quán)綜合評價(jià)

對上述步驟求得參照各個(gè)規(guī)則的支持度S、信任度C及相似性SIM組成一個(gè)N個(gè)對象、3個(gè)指標(biāo)的矩陣XN×3。

(1)運(yùn)用變異系數(shù)法對X進(jìn)行客觀賦權(quán)

此時(shí),第j個(gè)指標(biāo)的權(quán)重就是這種加權(quán)方法是為了突出各指標(biāo)的相對變化幅度,即變異程度。

(2)對X使用線性插值法進(jìn)行規(guī)范化處理,得到規(guī)范化矩形ZN×3,對其使用互補(bǔ)判斷矩陣排序法求屬性權(quán)重:

I=1運(yùn)用綜合賦權(quán)法將(1)、(2)兩個(gè)權(quán)向量進(jìn)行有機(jī)集成,得到綜合權(quán)向量W=(W1,W2,......,WN)。傳統(tǒng)的綜合賦權(quán)有乘法合成歸一化、線性加權(quán)組合法、基于spearman等級相關(guān)系數(shù)綜合賦權(quán)法等,也可采用基于灰色關(guān)聯(lián)度的客觀權(quán)重綜合集成法。

最終求出測試記錄對各個(gè)規(guī)則的評價(jià)值fi=∑wj×zij,(i=1,2,......,N),其中MAX(fi)就是與測試記錄最相似的規(guī)則,可將其決策偏好作為測試記錄的預(yù)期偏好。

第3篇

[關(guān)鍵詞] 支持向量機(jī)投資決策統(tǒng)計(jì)學(xué)習(xí)理論

企業(yè)進(jìn)行項(xiàng)目投資可選用內(nèi)部收益率來作決策,決策規(guī)則:設(shè)置基準(zhǔn)貼現(xiàn)率Ic,當(dāng)內(nèi)部收益率IRR>=Ic時(shí)則方案可行,否則不行。用這種方法來進(jìn)行決策比較合理,但計(jì)算過程很復(fù)雜一般需要一次或多次測算。

支持向量機(jī)是Vapnik等人根據(jù)統(tǒng)計(jì)學(xué)習(xí)理論提出的一種機(jī)器學(xué)習(xí)方法.由于支持向量機(jī)(SVM)出色的學(xué)習(xí)性能,已成為國際上機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn).目前在手寫體數(shù)字識(shí)別、文本分類、人臉檢測等模式識(shí)別問題以及函數(shù)逼近、信息融合等領(lǐng)域中獲得了應(yīng)用.但目前在經(jīng)濟(jì)領(lǐng)域的應(yīng)用還只是嘗試,本了基于支持向量機(jī)的銀行客戶信用評估系統(tǒng)研究,可見SVM在經(jīng)濟(jì)上的應(yīng)用還是很有前途的。我們知道,應(yīng)用SVM作入侵檢測最好的效果是檢測正確率達(dá)到88%左右,但是如果在投資經(jīng)濟(jì)領(lǐng)域的能大到這樣的效果就非常好了,因?yàn)檫@本身就是一個(gè)不可確定的結(jié)果,即便是經(jīng)驗(yàn)豐富的人做出的決策結(jié)果也存在不確定性,能有88%的正確率,說明可能性已經(jīng)很大了。因此用SVM做投資決策時(shí)是具有經(jīng)濟(jì)意義的。

一、支持向量機(jī)

1.廣義最優(yōu)分類面假設(shè)有一線性可分的樣本集(xi,yi),i=1,…,n,x∈Rd,y∈{+1,-1},為了將yi=1和yi=-1兩類點(diǎn)盡可能正確地區(qū)分開,可構(gòu)造分離超平面x?w+b=0,使得

歸一化得yi[(w?xi+b)]-1≥0,i=1,…,n (1c)

{(xi,yi)}到分類超平面的距離可定義為1/w,若樣本集到該超平面的最小距離最大,則為最優(yōu)分類面。所以要使x?w+b=0為最優(yōu),當(dāng)且僅當(dāng)(w,b)是下面優(yōu)化問題的解:

這個(gè)二次規(guī)劃問題有惟一的極小點(diǎn),可以用Lagrang乘子法把(2)化成其對偶形式:

i=1可以證明解中只有小部分ai不為0,稱對應(yīng)的xi為支持向量。于是最優(yōu)超平面方程為: (4a)

最優(yōu)判別函數(shù)為: (4b)

對于線性不可分的情況,可以在條件(式2b)中增加一個(gè)松弛項(xiàng)ξi≥0,成為:yi[ω?xi+b]-1+ξ≥0,i=1,…,n 5)

目標(biāo)函數(shù)改為求:

最小,其中C>0是個(gè)預(yù)先給定的常數(shù),它控制對錯(cuò)分樣本懲罰的程度。最優(yōu)分類面的對偶問題與線性可分情況下幾乎完全相同,只是條件(式3c)改為0≤ai≤C,i=1,…,n。

2.支持向量機(jī)。對于非線性問題,作非線性映射Φ(x):RdF, F是高維內(nèi)積空間稱為特征空間,Φ(x)稱為特征映射;然后在F中構(gòu)造(廣義)最優(yōu)超平面。實(shí)際上不用知道Φ(x)的K(xi,xj)滿足Mercer條件,它就對應(yīng)某一變換空間的內(nèi)積。因此,采用適當(dāng)?shù)暮撕瘮?shù)K(xi,xj)就可以實(shí)現(xiàn)某一非線性變換后的線性分類,此時(shí)最優(yōu)分類面中目標(biāo)函數(shù)就變?yōu)榇_切表達(dá)式,只需在高維空間進(jìn)行內(nèi)積計(jì)算。根據(jù)泛函的有關(guān)理論,只要一種核函數(shù):

相應(yīng)的判別函數(shù)也變?yōu)?

這就是支持向量機(jī)。

簡單地說,支持向量機(jī)就是首先通過內(nèi)積核函數(shù)將輸入空間變換到一個(gè)高維空間,然后在這個(gè)空間求廣義最優(yōu)分類面。

SVM中不同的內(nèi)積核函數(shù)形成不同的算法,常用的核函數(shù)有:

多項(xiàng)式核函數(shù)K(xi?xj)=[(xi?xj)+1]q,q是自然數(shù)徑向基核函數(shù)(RBF):

兩層神經(jīng)網(wǎng)絡(luò)核函數(shù)K(xi?xj)=S(a(xi?xj)+t)其中S是sigmoid函數(shù),a,t為常數(shù)。

二、SVM在投資決策中的應(yīng)用

1.可行性分析。對于獨(dú)立的方案的決策,常用的評價(jià)指標(biāo)是凈現(xiàn)值和內(nèi)部報(bào)酬率。一個(gè)獨(dú)立方案的凈現(xiàn)值如為正值,說明該方案可實(shí)現(xiàn)的報(bào)酬率大于所用的貼現(xiàn)率,經(jīng)濟(jì)上可行;如凈現(xiàn)值為負(fù)值,說明該方案可實(shí)現(xiàn)的投資報(bào)酬率小于要求達(dá)到的最底報(bào)酬率,經(jīng)濟(jì)上不可行。內(nèi)部報(bào)酬率是指用它來對投資方案的現(xiàn)金流入量進(jìn)行貼現(xiàn),使所得的總現(xiàn)值恰好與現(xiàn)金流出量的總現(xiàn)值相等,從而使凈現(xiàn)值等與零的利率。也就是投資項(xiàng)目本身可以達(dá)到的的報(bào)酬率。該指標(biāo)比較合理,但計(jì)算很復(fù)雜,有時(shí)要經(jīng)過多次的測算。

SVM理論是在統(tǒng)計(jì)學(xué)習(xí)理論的基礎(chǔ)上發(fā)展起來的。由于統(tǒng)計(jì)學(xué)習(xí)理論和SVM方法對有限樣本情況下模式識(shí)別中的一些根本性的問題進(jìn)行了系統(tǒng)的理論研究,很大程度上解決了以往的機(jī)器學(xué)習(xí)中模型的選擇與過學(xué)習(xí)問題、非線性和維數(shù)災(zāi)難問題、局部極小點(diǎn)問題等,所以它們在20世紀(jì)90年代以來受到了很大的重視。

2.支持向量機(jī)的構(gòu)造。根據(jù)常用的評價(jià)指標(biāo)選取以下特征向量作為SVM輸入向量:輸入向量x的屬性及含義;對應(yīng)的輸出y為兩類:可行與不可行,用1代表可行,-1代表不可行。

輸入數(shù)據(jù)根據(jù)用內(nèi)部收益率指標(biāo)已經(jīng)算的結(jié)果來給定。例如:原始投資為5500元,凈現(xiàn)金量為11000元,殘值為500元,折現(xiàn)年數(shù)為10年,通過用測算內(nèi)部投資收益率為0.157,那么所有基準(zhǔn)收益率大于0.157方案為不可行,小于等于0.157的方案為可行。這樣可以得到許多組輸入向量。根據(jù)以上方法我用30個(gè)數(shù)據(jù)做實(shí)驗(yàn),用13個(gè)做測試。

3.核函數(shù)的選取。支持向量機(jī)在實(shí)際應(yīng)用中關(guān)于參數(shù)選擇的問題還沒有很好的解決,比如多項(xiàng)式學(xué)習(xí)機(jī)器的階數(shù)問題,徑向基學(xué)習(xí)機(jī)器中的函數(shù)寬度問題,以及Sigmoid機(jī)器中函數(shù)的寬度和偏移問題等,統(tǒng)計(jì)學(xué)理論目前對這些問題只是給出了一些建議和解釋。筆者采用徑向基核函數(shù)做試驗(yàn)。

三、訓(xùn)練和測試

根據(jù)數(shù)據(jù)按內(nèi)部收益率指標(biāo)的計(jì)算,筆者可以的到一組數(shù)據(jù)。這樣筆者采用了30個(gè)數(shù)據(jù)來作為訓(xùn)練數(shù)據(jù)。部分?jǐn)?shù)據(jù)如下圖:

經(jīng)過訓(xùn)練后,用13個(gè)數(shù)據(jù)做測試,得到測試結(jié)果(部分?jǐn)?shù)據(jù))如下:

根據(jù)試驗(yàn)結(jié)果發(fā)現(xiàn)用SVM作投資決策,13個(gè)測試數(shù)據(jù)中有11個(gè)判斷正確,其正確率達(dá)84.6%。

四、結(jié)論

1.支持向量機(jī)是在統(tǒng)計(jì)學(xué)理論的基礎(chǔ)上發(fā)展起來的一種新的學(xué)習(xí)算法,解決了實(shí)際問題中樣本有限的問題。

2.本文研究了SVM在投資決策的應(yīng)用,結(jié)果表明用支持向量機(jī)作投資決策的應(yīng)用取得了較好的結(jié)果。

3.本文的研究的數(shù)據(jù)雖然具有一定的典型性,但對支持向量機(jī)應(yīng)用于經(jīng)濟(jì)領(lǐng)域的研究提供了依據(jù),有很重要的實(shí)際意義。

本文存在的不足之處是試驗(yàn)數(shù)據(jù)具有典型性,因?yàn)楣P者在編程試驗(yàn)時(shí)很難找到真實(shí)的數(shù)據(jù),只能根據(jù)其特征來組合,所以試驗(yàn)結(jié)果還不能完全說明SVM會(huì)在所有的投資決策應(yīng)用中顯示出明顯的效果。但是,此次試驗(yàn)證明了SVM在經(jīng)濟(jì)領(lǐng)域里有著廣泛的應(yīng)用前途。

參考文獻(xiàn):

[1]李麗娜侯朝楨:基于支持向量機(jī)(SVM)的工業(yè)過程辨識(shí).北京理工大學(xué)學(xué)報(bào),2003年10月

[2]王小平沈玉娣:支持向量機(jī)在軸承故障診斷中的應(yīng)用.機(jī)床與液壓,2003.No.4

[3]姚奕葉中行:基于支持向量機(jī)的銀行客戶信用評估系統(tǒng)研究,系統(tǒng)仿真學(xué)報(bào),2004年4月

[4]姬水旺姬旺田:支持向量機(jī)訓(xùn)練算法綜述.微機(jī)發(fā)展,2004年1月

第4篇

【關(guān)鍵詞】粗糙集方法;醫(yī)學(xué)影像學(xué);診斷準(zhǔn)確性

粗糙集理論是一個(gè)交叉融合多種學(xué)科形成的新學(xué)科,已被廣泛用于各個(gè)行業(yè)包括:市場營銷、衛(wèi)生、電信、金融、農(nóng)副產(chǎn)品、互聯(lián)網(wǎng)語言的識(shí)別以及知識(shí)管理系統(tǒng)等等。粗糙集理論在很多的領(lǐng)域已取得令人驕傲的應(yīng)用效果。在醫(yī)學(xué)影像學(xué)領(lǐng)域中,隨著影像學(xué)數(shù)據(jù)信息不斷的增長,在醫(yī)學(xué)影像學(xué)診斷中運(yùn)用粗糙集方法,能客觀地展現(xiàn)出海量數(shù)據(jù)信息以及高維資料的背后的真實(shí)情況,更好的幫助醫(yī)生做出客觀、準(zhǔn)確的判斷,有利于臨床診斷正確性的提高。

1 簡要論述粗糙集方法

1982年波蘭數(shù)學(xué)家首次提出粗糙集概念,這是以等價(jià)關(guān)系為基礎(chǔ)的,用于分類問題的研究,用上集合與下集合生成一個(gè)相逼近的新集合,新結(jié)合的邊界線被定義為上下近似集的差集。是繼概率論、證據(jù)論之后有一個(gè)不確定性問題的處理工具,是一種新型的軟計(jì)算方式。

這種建立在分類機(jī)制前提下的粗糙及理論,可以把分類解釋成為一定區(qū)域中的等價(jià)關(guān)系,這個(gè)區(qū)域正是由等價(jià)關(guān)系進(jìn)行劃分的。將知識(shí)歸納為數(shù)據(jù)的劃分,被劃分后的集合定義為概念。充分利用已知的信息庫,對不確定或不精確的知識(shí)通過已知的信息庫進(jìn)行近似刻畫。無須提出數(shù)據(jù)集合以外的一切知識(shí),因此,對于問題的描述比較客觀、比較具體,再加上粗糙集理論不包含不確定或不精確原始數(shù)據(jù)機(jī)制,與證據(jù)理論、概率論等有較強(qiáng)的互補(bǔ)性。

粗糙集合理方法適用于研究不定型問題的工具,作為集合理論的擴(kuò)展,粗糙集理論主要用來研究不完整的信息數(shù)據(jù)挖掘技術(shù)。它可以在缺乏數(shù)據(jù)的先驗(yàn)知識(shí)前提下,用考察數(shù)據(jù)分類的能力解決模糊不定的數(shù)據(jù)并加以分析處理,與此同時(shí)粗糙集算法簡單且容易操作,現(xiàn)在以它為基礎(chǔ)的數(shù)據(jù)挖掘工具也非常多,粗糙集理論其出發(fā)點(diǎn)是假設(shè)所有研究對象都涉及一些的信息。隨著粗糙集理論的廣泛應(yīng)用,其有效性被越來越多的證實(shí),成為了現(xiàn)階段人工智能研究的重點(diǎn)。

2 醫(yī)學(xué)影像學(xué)診斷中粗糙集方法的應(yīng)用實(shí)例分析

收集了2011年1月-2012年1月來我院進(jìn)行膠質(zhì)瘤診斷治療的50例患者的臨床資料進(jìn)行詳細(xì)研究,其中,29例男,21例女,患者年齡在23歲-77歲之間,平均年齡為58.7歲。其中,11例WHO I級,25例WHO II級,9例WHO III級,5例WHO IV級。對上述患者進(jìn)行MRI檢查,平掃TIW1橫斷面與矢狀面得出影像學(xué)資料。由放射科專業(yè)醫(yī)生對上述患者的MRI影像學(xué)資料進(jìn)行分析研究,包括病灶位置、形狀、囊變、TIW1、T2W1、水腫、鈣化、出血、性變等等,按照影像學(xué)特征對不同指標(biāo)進(jìn)行分類。并通過粗糙集方法、Logistic二元回歸方法與分類回歸樹方法對影像學(xué)資料進(jìn)行研究。具體粗糙集方法:將決策表導(dǎo)入專門的Rosetta軟件,通過軟件對病例進(jìn)行規(guī)則約簡與屬性約簡。在條件屬性核產(chǎn)生的基礎(chǔ)上,得到?jīng)Q策規(guī)則庫,通過規(guī)則庫過濾,達(dá)到知識(shí)的精簡。通過10折交叉驗(yàn)證方式測試膠質(zhì)瘤數(shù)據(jù),通過測試結(jié)果的診斷靈敏性、覆蓋率、陽性預(yù)測值、特異度、陰性預(yù)測值等提取診斷性能,繪制ROC曲線。結(jié)果顯示,粗糙集方法的診斷準(zhǔn)確性為85.2%,特異度為92.7%;決策樹方法診斷準(zhǔn)確性為83.0%,特異度為91.3%;Logistic二元回歸方法診斷準(zhǔn)確性為83.2%,特異度為85.6%。充分證實(shí)了,在臨床影像學(xué)診斷中,粗糙集方法能夠得到更多的確定性規(guī)則,進(jìn)一步提高臨床診斷準(zhǔn)確率。

3 醫(yī)學(xué)影像學(xué)診斷中粗糙集方法的應(yīng)用的優(yōu)點(diǎn)分析

3.1 粗糙集方法應(yīng)用便捷、結(jié)果準(zhǔn)確性高

粗糙集方法不需要預(yù)先設(shè)計(jì)概率、不需要建立相應(yīng)的因變量函數(shù)關(guān)系,直接運(yùn)算集合中的對象,直接獲得不可分辨的矩陣,直接得出結(jié)論。通過粗糙集法分析,其結(jié)論呈現(xiàn)的方式是以IF….Then…的形式出現(xiàn),呈現(xiàn)結(jié)果不僅具有非常高的價(jià)值,而且呈現(xiàn)形式非常明確。

3.2 粗糙集方法能客觀地展現(xiàn)出海量數(shù)據(jù)信息以及高維資料的背后的真實(shí)情

這種基于數(shù)據(jù)集合的挖掘方法,在臨床影像學(xué)診斷中,粗糙集方法能夠發(fā)現(xiàn)隱藏在現(xiàn)象背后的知識(shí)。例如,在在對膠質(zhì)瘤影像學(xué)資料進(jìn)行規(guī)則提取以及屬性約簡時(shí),整個(gè)過程都是客觀的,不受外界因素、人為因素的干擾,獲得的膠質(zhì)瘤級別診斷比較容易理解、診斷規(guī)則比較清晰。Logistic二元回歸方法與分類回歸樹方法,是通過訓(xùn)練集方式生成一個(gè)新的測試函數(shù),通過函數(shù)分析方法,計(jì)算不同對象的可能發(fā)生概率,進(jìn)而預(yù)測對象的分類。Logistic二元回歸方法是基于數(shù)理統(tǒng)計(jì)基礎(chǔ)上的,通過筆數(shù)比篩選具有價(jià)值、有統(tǒng)計(jì)學(xué)意義的不同變量,將這些變量通過模型方程形式進(jìn)行計(jì)算,比較計(jì)算前后實(shí)際結(jié)果與預(yù)測結(jié)果兩者的差異性,從而進(jìn)一步確定自變量的入選,同時(shí),還可以計(jì)算出自變量的重要價(jià)值。決策樹方式是通過地規(guī)模與分層模式進(jìn)行的,也就是根據(jù)不同的對象建立不同的樹分支。在不同分支的子集中建立重復(fù)的分值和下層節(jié)點(diǎn),從而生成了決策樹。再對決策樹剪枝,再對決策樹進(jìn)行規(guī)則處理。但是,這種基于概率的分類結(jié)果,是根據(jù)概率進(jìn)行判定的,對于高級別膠質(zhì)瘤的診斷率比較低,這種決策樹分析方法很容易受到人為因素的影響,比如說決策樹的修建、決策樹的增長、選擇父節(jié)點(diǎn)數(shù)以及子節(jié)點(diǎn)數(shù)等等,都會(huì)影響到分析結(jié)果的準(zhǔn)確性。

4 結(jié)語

粗糙集方法是將觀測到的龐大數(shù)據(jù)集加以分析研究,其目的是找的未知的關(guān)系及數(shù)據(jù)擁有者能夠理解且有價(jià)值的新方法來總結(jié)數(shù)據(jù),經(jīng)粗糙集方法推導(dǎo)出的準(zhǔn)確率較高,在臨床醫(yī)學(xué)影像診斷中應(yīng)用價(jià)值較高。

【參考文獻(xiàn)】

[1]馬常杰,陳守余.數(shù)據(jù)庫中模糊關(guān)聯(lián)規(guī)則挖掘研究進(jìn)展[J].計(jì)算機(jī)工程與應(yīng)用,2010,12(11):752-753.

[2]田軍章.基于PACS的結(jié)構(gòu)化報(bào)告(SR)模塊的設(shè)計(jì)與實(shí)現(xiàn)研究[D].第一軍醫(yī)大學(xué),2011,4(09):141-142.

[3]王小鳳,周明全,耿國華.一種基于模糊粗糙集理論的算法及其在醫(yī)學(xué)影像中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用研究,2012,11(5):369-371.

[4]王國胤.Rough集理論在不完備信息系統(tǒng)中的擴(kuò)充[J].計(jì)算機(jī)研究與發(fā)展,2012,5(17):13-15.

第5篇

關(guān)鍵詞:生物統(tǒng)計(jì)學(xué);實(shí)驗(yàn)教學(xué);改革探索;實(shí)踐

中圖分類號 G642.0 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號 1007-7731(2013)15-148-02

生物統(tǒng)計(jì)學(xué)是數(shù)理統(tǒng)計(jì)原理和方法在生物學(xué)中的應(yīng)用,不僅在生命科學(xué)領(lǐng)域、而且也在其他學(xué)科領(lǐng)域中得到廣泛應(yīng)用,是一門工具學(xué)科[1]。生物統(tǒng)計(jì)學(xué)的理論性和實(shí)踐性均較強(qiáng),涉及的基本原理、公式和概念較多,需有一定的數(shù)學(xué)基礎(chǔ)和邏輯推理能力才能學(xué)好,相對于其他專業(yè)課程,師生普遍反映難教、難學(xué)、難記[2]?!渡锝y(tǒng)計(jì)學(xué)》不容易理解和掌握,導(dǎo)致學(xué)生缺乏學(xué)習(xí)興趣和動(dòng)力,考試前通過死記硬背接受理論知識(shí),形成短暫記憶,隨著時(shí)間的延長,所學(xué)內(nèi)容逐漸忘記。這門課程講授完之后,學(xué)生不會(huì)靈活運(yùn)用其中的方法,也不會(huì)設(shè)計(jì)一個(gè)簡單的試驗(yàn),更不會(huì)將生物統(tǒng)計(jì)學(xué)的基本理論、技術(shù)和常用統(tǒng)計(jì)方法應(yīng)用到本科畢業(yè)論文設(shè)計(jì)中,導(dǎo)致理論教學(xué)與實(shí)踐應(yīng)用脫節(jié),顯然未達(dá)到教學(xué)目的。以往《生物統(tǒng)計(jì)學(xué)》教學(xué)以單純理論教學(xué)為主,不設(shè)或很少開設(shè)實(shí)驗(yàn)課。因此,筆者結(jié)合《生物統(tǒng)計(jì)學(xué)》的基本原理,利用計(jì)算機(jī)和統(tǒng)計(jì)軟件,開設(shè)了《生物統(tǒng)計(jì)學(xué)》實(shí)驗(yàn)課,并嘗試對該課程的實(shí)驗(yàn)教學(xué)方法進(jìn)行改革探索。

實(shí)踐教學(xué)環(huán)節(jié)非常有利于提高大學(xué)生的培養(yǎng)質(zhì)量,而《生物統(tǒng)計(jì)學(xué)》課程教學(xué)的實(shí)踐環(huán)節(jié)亟待加強(qiáng)。在《生物統(tǒng)計(jì)學(xué)》實(shí)驗(yàn)教學(xué)過程中,我們利用計(jì)算機(jī)輔助實(shí)驗(yàn)教學(xué),開設(shè)以下實(shí)驗(yàn)課:(1)《生物統(tǒng)計(jì)學(xué)》某章節(jié)理論知識(shí)講授完之后,利用計(jì)算機(jī)和相關(guān)統(tǒng)計(jì)軟件,開設(shè)相應(yīng)的實(shí)驗(yàn)課。在實(shí)驗(yàn)課上,教師通過統(tǒng)計(jì)軟件演示例題的計(jì)算和分析過程,并講授統(tǒng)計(jì)軟件的使用方法,學(xué)生根據(jù)所學(xué)理論知識(shí),結(jié)合實(shí)例在計(jì)算機(jī)上借助統(tǒng)計(jì)軟件進(jìn)行操作,這樣使學(xué)生獲得知識(shí)更加直接與快速。(2)學(xué)生參與試驗(yàn)設(shè)計(jì)和科學(xué)試驗(yàn)。學(xué)生要在生產(chǎn)實(shí)踐或?qū)嶒?yàn)室中設(shè)計(jì)試驗(yàn),親自參與試驗(yàn)數(shù)據(jù)的采集,并對試驗(yàn)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和分析,這樣有利于加深學(xué)生對所學(xué)內(nèi)容的理解?!渡锝y(tǒng)計(jì)學(xué)》教學(xué)開設(shè)了如下實(shí)驗(yàn):

1 利用Excel繪制常用統(tǒng)計(jì)圖

Excel繪制圖形功能強(qiáng)大,各種版本的Excel軟件均提供了14種標(biāo)準(zhǔn)圖表類型,每種圖表類型中又含有2~7種子圖表類型;還有20種自定義圖表類型可以套用。講授完試驗(yàn)資料的搜集和整理后,開設(shè)利用Excel繪制常用統(tǒng)計(jì)圖的實(shí)驗(yàn)課。學(xué)生在實(shí)驗(yàn)課上利用Excel繪圖時(shí),可以對圖表區(qū)、繪圖區(qū)、數(shù)據(jù)系列、坐標(biāo)軸、圖例、圖表標(biāo)題的格式,例如文字的顏色、字體、大小,背景圖案、顏色等進(jìn)行修改和調(diào)整,使修飾后的圖形更加美觀好看,爽心悅目。當(dāng)圖和數(shù)據(jù)放在一張工作表上、學(xué)生改變繪制圖形的數(shù)據(jù)時(shí),其圖形將發(fā)生相應(yīng)變化;將鼠標(biāo)放在圖中某數(shù)據(jù)點(diǎn)上,在鼠標(biāo)下方將彈出一個(gè)文本框給出數(shù)據(jù)點(diǎn)的具體數(shù)值;用鼠標(biāo)單擊繪圖區(qū)中的“數(shù)據(jù)系列”標(biāo)志,其圖所屬數(shù)據(jù)單元格將被彩色框線圍住,便于用戶查看圖形的數(shù)據(jù)引用位置。在“數(shù)據(jù)系列”點(diǎn)擊右鍵可以向散點(diǎn)圖、線圖、條形圖等添加趨勢線,并可給出趨勢線的方程與決定系數(shù)。

2 利用Excel進(jìn)行數(shù)據(jù)描述統(tǒng)計(jì)分析

講授完試驗(yàn)資料特征數(shù)的計(jì)算后,開設(shè)利用Excel進(jìn)行數(shù)據(jù)描述統(tǒng)計(jì)分析的實(shí)驗(yàn)課。首先選用與生活聯(lián)系緊密的數(shù)據(jù)資料,讓學(xué)生利用Excel計(jì)算這些數(shù)據(jù)的平均數(shù)、中位數(shù)和眾數(shù),測定和分析這些數(shù)據(jù)的集中趨勢,然后利用Excel測定樣本標(biāo)準(zhǔn)差、總體標(biāo)準(zhǔn)差和四分位數(shù),讓學(xué)生分析這些數(shù)據(jù)的離散趨勢。另外,讓學(xué)生利用Excel分析總體次數(shù)的分布形態(tài),計(jì)算總體平均值的置信區(qū)間,有助于識(shí)別總體的數(shù)量特征??傮w的分布形態(tài)可以從兩個(gè)角度考慮,一是分布的對稱程度,另一個(gè)是分布的高低。前者的測定參數(shù)稱為偏度或偏斜度,后者的測定參數(shù)稱為峰度。

3 利用Excel進(jìn)行統(tǒng)計(jì)假設(shè)檢驗(yàn)

講授完統(tǒng)計(jì)推斷之后,利用Excel進(jìn)行統(tǒng)計(jì)假設(shè)檢驗(yàn)的實(shí)驗(yàn)課。統(tǒng)計(jì)假設(shè)檢驗(yàn)是根據(jù)隨機(jī)樣本中的數(shù)據(jù)信息來判斷其與總體分布是否具有指定的特征[1]。我們選擇實(shí)際案例,讓學(xué)生提出假設(shè),利用Excel中適當(dāng)?shù)慕y(tǒng)計(jì)方法計(jì)算檢驗(yàn)的統(tǒng)計(jì)量及其分布,確定顯著性水平和決策規(guī)則,最后推斷是否接受假設(shè),得出科學(xué)合理的結(jié)論,這個(gè)過程就稱為假設(shè)檢驗(yàn)或統(tǒng)計(jì)假設(shè)檢驗(yàn)。統(tǒng)計(jì)假設(shè)檢驗(yàn)的方法多樣,通過比較就會(huì)發(fā)現(xiàn)它們的基本方法和步驟大同小異,例如t檢驗(yàn)、u 檢驗(yàn)、x2檢驗(yàn)等,可以詳細(xì)講述其中1~3種假設(shè)檢驗(yàn)方法,其它假設(shè)檢驗(yàn)方法可以采用啟迪和推導(dǎo)方式讓學(xué)生利用統(tǒng)計(jì)軟件自行輕松地學(xué)習(xí)和操作。

4 利用Excel和SAS軟件進(jìn)行方差分析

講授完方差分析之后,開設(shè)利用Excel和SAS軟件進(jìn)行方差分析的實(shí)驗(yàn)課。利用Excel只能進(jìn)行單因素或雙因素(包括可重復(fù)雙因素和無重復(fù)雙因素)方差分析,而涉及雙因素隨機(jī)區(qū)組試驗(yàn)、三因素試驗(yàn)和裂區(qū)試驗(yàn)等試驗(yàn)數(shù)據(jù)的方差分析,即讓學(xué)生利用SAS軟件進(jìn)行多重方差分析。另外,Excel中的單因素或雙因素方差分析只能給出方差分析表,不能進(jìn)行平均數(shù)的多重比較,也無法用不同字母標(biāo)記法表示差異顯著性的結(jié)果,這些也都需要利用SAS軟件。

5 利用多種統(tǒng)計(jì)軟件進(jìn)行回歸分析

由一個(gè)或一組非隨機(jī)變量來估計(jì)或預(yù)測某一個(gè)隨機(jī)變量的觀測值時(shí),所建立的數(shù)學(xué)模型及所進(jìn)行的統(tǒng)計(jì)分析,稱為回歸分析[1]。按變量個(gè)數(shù)的多少,回歸分析有一元回歸分析與多元回歸分析之分,多元回歸分析的原理與一元回歸分析的原理基本相似。按變量之間的關(guān)系,回歸分析可以分為線性回歸分析和非線性回歸分析。利用統(tǒng)計(jì)軟件進(jìn)行回歸分析時(shí),首先讓學(xué)生如何確定因變量與自變量之間的回歸模型;如何根據(jù)樣本觀測數(shù)據(jù),估計(jì)并檢驗(yàn)回歸模型及未知參數(shù);在眾多的自變量中,讓學(xué)生判斷哪些變量對因變量的影響是顯著的,哪些變量的影響是不顯著的。在方差分析實(shí)驗(yàn)課上,先讓學(xué)生利用Excel進(jìn)行簡單的線性回歸分析,然后利用SPSS軟件進(jìn)行相關(guān)與回歸分析,最后利用SAS軟件進(jìn)行多元線性回歸分析和逐步回歸分析,使學(xué)生了解不同統(tǒng)計(jì)軟件的特點(diǎn)、功能和作用。

6 利用基本原理設(shè)計(jì)試驗(yàn)

試驗(yàn)的精確度高低取決于試驗(yàn)設(shè)計(jì)的各個(gè)方面,只有通過有效地控制試驗(yàn)誤差才能提高試驗(yàn)精確度。因此,教師有必要正確引導(dǎo)大學(xué)生在試驗(yàn)過程中要做到操作仔細(xì),這樣有利于提高學(xué)生的科研素質(zhì)。在試驗(yàn)工作中,從試驗(yàn)資料中發(fā)現(xiàn)潛在的規(guī)律性是極其重要的,這需要科學(xué)合理地運(yùn)用統(tǒng)計(jì)學(xué)的基本原理和方法。講授完試驗(yàn)設(shè)計(jì)之后,要求學(xué)生根據(jù)試驗(yàn)設(shè)計(jì)的基本原理,在生產(chǎn)實(shí)踐或?qū)嶒?yàn)室內(nèi)提出試驗(yàn)設(shè)計(jì)的基本思路,制定試驗(yàn)方案。然后,學(xué)生分組討論試驗(yàn)設(shè)計(jì)的可行性,并進(jìn)行糾正和修改。在試驗(yàn)前期,學(xué)生應(yīng)進(jìn)行試驗(yàn)前期準(zhǔn)備工作。在試驗(yàn)過程中,學(xué)生要考慮試驗(yàn)條件的差異對試驗(yàn)數(shù)據(jù)的影響,可根據(jù)試驗(yàn)設(shè)計(jì)的原理和技巧分析試驗(yàn)出現(xiàn)的問題,使學(xué)生獲得的理論知識(shí)與實(shí)際聯(lián)系起來,從而加深對理論知識(shí)的理解。試驗(yàn)結(jié)束后,獲得大量的試驗(yàn)數(shù)據(jù),需要選擇正確的統(tǒng)計(jì)方法分析試驗(yàn)資料,得出科學(xué)合理的結(jié)論,以達(dá)到研究目的。最后,教師根據(jù)學(xué)生設(shè)計(jì)的試驗(yàn)思路、方案、步驟及作出的試驗(yàn)報(bào)告給予評價(jià)。通過開設(shè)試驗(yàn)設(shè)計(jì)實(shí)踐課,可以使學(xué)生明確試驗(yàn)的目的、試驗(yàn)設(shè)計(jì)方法、試驗(yàn)因素及水平等內(nèi)容,有利于提高學(xué)生設(shè)計(jì)試驗(yàn)方案的能力。

實(shí)踐證明,開設(shè)《生物統(tǒng)計(jì)學(xué)》實(shí)驗(yàn)教學(xué)后,學(xué)生能夠在計(jì)算機(jī)上借助相關(guān)統(tǒng)計(jì)軟件親自統(tǒng)計(jì)試驗(yàn)數(shù)據(jù),利用所學(xué)的統(tǒng)計(jì)學(xué)方法分析和檢驗(yàn)試驗(yàn)結(jié)果,最后得出可靠的結(jié)論。最后畢業(yè)時(shí),學(xué)生能根據(jù)試驗(yàn)設(shè)計(jì)的基本原理,可獨(dú)立完成畢業(yè)論文試驗(yàn)設(shè)計(jì),實(shí)施設(shè)計(jì)的試驗(yàn)方案,獲得試驗(yàn)數(shù)據(jù)資料。由于試驗(yàn)數(shù)據(jù)統(tǒng)計(jì)分析耗時(shí),而且繁瑣,因而過去畢業(yè)生害怕對試驗(yàn)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。自從我們結(jié)合《生物統(tǒng)計(jì)學(xué)》的基本原理,利用計(jì)算機(jī)和計(jì)軟件開設(shè)了該課程的實(shí)驗(yàn)教學(xué)后,學(xué)生輕松地掌握了該課程的基本原理和統(tǒng)計(jì)分析方法,統(tǒng)計(jì)和分析數(shù)據(jù)的速度、精確度均大幅度提高?,F(xiàn)在部分學(xué)生還能幫助教師進(jìn)行科研課題的數(shù)據(jù)處理和分析,畢業(yè)論文水平也大大提高。

《生物統(tǒng)計(jì)學(xué)》教學(xué)實(shí)驗(yàn)課的開設(shè),使學(xué)生從被動(dòng)學(xué)習(xí)轉(zhuǎn)變?yōu)榉e極主動(dòng)地學(xué)習(xí),培養(yǎng)了學(xué)生進(jìn)行科學(xué)試驗(yàn)設(shè)計(jì)的能力,初步掌握開展科學(xué)試驗(yàn)設(shè)計(jì)的方法;培養(yǎng)學(xué)生掌握正確收集、整理試驗(yàn)資料的方法,能利用生物統(tǒng)計(jì)方法對試驗(yàn)資料進(jìn)行正確的統(tǒng)計(jì)分析;培養(yǎng)學(xué)生掌握常見統(tǒng)計(jì)軟件的使用方法和統(tǒng)計(jì)方法?!渡锝y(tǒng)計(jì)學(xué)》實(shí)驗(yàn)課深受學(xué)生的歡迎,這也是對該課程實(shí)驗(yàn)教學(xué)的嘗試和改革探索的肯定。在該課程實(shí)驗(yàn)教學(xué)過程中,筆者深刻體會(huì)到要提高《生物統(tǒng)計(jì)學(xué)》課程的實(shí)驗(yàn)教學(xué)效果和質(zhì)量,教師需要投入時(shí)間與精力,鉆研實(shí)驗(yàn)教學(xué)內(nèi)容,提高教學(xué)水平,轉(zhuǎn)變實(shí)驗(yàn)教學(xué)理念,不斷探索和優(yōu)化多元化的實(shí)驗(yàn)教學(xué)方法。

參考文獻(xiàn)

[1]李春喜,邵云,姜麗娜.生物統(tǒng)計(jì)學(xué)[M].4版.北京:科學(xué)出版社,2008:1-3.

第6篇

利用計(jì)算機(jī)軟件進(jìn)行仿真模擬教學(xué)的目的是通過軟件技術(shù),將企業(yè)的經(jīng)營活動(dòng)進(jìn)行高度的提煉,通過模擬經(jīng)營環(huán)境,使學(xué)生在接近真實(shí)的情境下,體驗(yàn)如何在競爭的環(huán)境下進(jìn)行企業(yè)各項(xiàng)決策,學(xué)生可以在親自動(dòng)手的實(shí)踐中鞏固已學(xué)知識(shí)、探索如何解決管理上的難題與困境、鍛煉綜合運(yùn)用知識(shí)的能力、提高自身的綜合素質(zhì)。在競爭模擬中,學(xué)生們將組建不同的管理團(tuán)隊(duì)進(jìn)行公司運(yùn)營,在激烈的市場競爭中盡可能實(shí)現(xiàn)公司價(jià)值最大化。而團(tuán)隊(duì)成員將分別擔(dān)任CEO,COO,總經(jīng)理、營銷經(jīng)理、研發(fā)經(jīng)理、生產(chǎn)經(jīng)理,財(cái)務(wù)經(jīng)理、人力資源管理經(jīng)理等不同的角色,做出相應(yīng)的戰(zhàn)略決策,盡量使公司在變幻莫測和競爭激烈的市場中得以生存和發(fā)展。管理團(tuán)隊(duì)必須結(jié)合不斷變化的宏觀經(jīng)濟(jì)環(huán)境、各公司的競爭地位以及本企業(yè)的各部門之間的協(xié)同作用,輔以各種數(shù)據(jù)模型,制定出自己公司的競爭戰(zhàn)略并按規(guī)定的時(shí)間提交決策單。通過軟件對各企業(yè)的決策數(shù)據(jù)進(jìn)行匯總,依據(jù)模擬的市場環(huán)境和需求決定各企業(yè)的主要經(jīng)營指標(biāo),并且按照加權(quán)平均計(jì)算出各企業(yè)的模擬結(jié)果。然后,各企業(yè)再根據(jù)當(dāng)下的狀況,做出下一輪次的決策,直到整個(gè)模擬的周期結(jié)束。一般做一期演練需要一個(gè)小時(shí),而一般地一個(gè)較為完整的模擬過程則需要9期。教師與學(xué)生在仿真模擬教學(xué)中,角色發(fā)生轉(zhuǎn)換,一改以往傳統(tǒng)授課方式中學(xué)生被動(dòng)充當(dāng)“聽眾”,把教學(xué)活動(dòng)從關(guān)注“教”轉(zhuǎn)向關(guān)注“學(xué)”;老師則在模擬實(shí)驗(yàn)中充當(dāng)“導(dǎo)演”的角色,只起組織、指導(dǎo)的作用,強(qiáng)調(diào)學(xué)習(xí)的主體是學(xué)生,學(xué)生要成為“roleplayers”,自主地在模擬競爭情景下進(jìn)行各項(xiàng)活動(dòng),要讓學(xué)生在實(shí)踐中學(xué)習(xí)知識(shí),應(yīng)用知識(shí),并提升能力。

二、計(jì)算機(jī)仿真模擬教學(xué)的教學(xué)策略

與任何教學(xué)一樣,計(jì)算機(jī)仿真模擬教學(xué)也必須在一定的指導(dǎo)原則下充分準(zhǔn)備、精心設(shè)計(jì)、靈活開展;并且相對傳統(tǒng)教學(xué)而言,由于計(jì)算機(jī)仿真模擬教學(xué)的活動(dòng)更豐富、學(xué)習(xí)主體之個(gè)體差異性表現(xiàn)更為明顯,因此,在進(jìn)行模擬實(shí)驗(yàn)時(shí),教師還應(yīng)當(dāng)注意設(shè)計(jì)與傳統(tǒng)教學(xué)相區(qū)別的教學(xué)策略。

(一)以親歷體驗(yàn)為手段,著重讓學(xué)生掌握工商管理中的“意會(huì)性知識(shí)”

工商管理本科生在其四年的學(xué)習(xí)過程中,應(yīng)當(dāng)建立起由傳統(tǒng)教學(xué)方法和現(xiàn)代教學(xué)方法等多種方式組合而成的學(xué)習(xí)立方體。其中傳統(tǒng)教學(xué)方法,即由課堂講授、課外作業(yè)、考試三者構(gòu)成,這是一種“式”學(xué)習(xí)方法,適合于“言傳性知識(shí)”的傳授?,F(xiàn)代教學(xué)方法主要包括案例教學(xué)、畢業(yè)設(shè)計(jì)、經(jīng)營模擬等“親驗(yàn)式”學(xué)習(xí)方法,適合于“意會(huì)性知識(shí)”的掌握。計(jì)算機(jī)仿真模擬教學(xué)是相關(guān)專業(yè)教學(xué)的手段之一,雖有它的實(shí)際意義,但并不能完全代替基本理論的學(xué)習(xí)。如果參加模擬仿真競爭的學(xué)生缺乏最基本的知識(shí),不懂得如何計(jì)算成本、利潤、納稅等,所做的決策只是空憑感覺,隨意性太強(qiáng),這樣勢必難以實(shí)現(xiàn)教學(xué)之目的。因此,模擬仿真應(yīng)當(dāng)也建議在基本的課程(如生產(chǎn)運(yùn)作管理、市場營銷、財(cái)務(wù)管理、人力資源管理等)的學(xué)習(xí)結(jié)束后進(jìn)行,既可以在比較綜合的課上使用,也可以單獨(dú)設(shè)置實(shí)訓(xùn)課程。眾所周知,管理決策既是一門科學(xué)也是一種藝術(shù),管理的層次越高,決策中的藝術(shù)性就越高;決策層次越低,決策的科學(xué)性就越強(qiáng)。通過仿真模擬教學(xué)加深對各學(xué)科基礎(chǔ)知識(shí)的理解,教師在重視決策科學(xué)性訓(xùn)練的同時(shí),也應(yīng)培養(yǎng)學(xué)生們縱觀全局和高瞻遠(yuǎn)矚的能力。選擇的模擬決策層面通常包括各個(gè)專業(yè)主要課程相關(guān)內(nèi)容,如生產(chǎn)運(yùn)作管理、市場營銷、財(cái)務(wù)管理、人力資源管理、戰(zhàn)略管理、目標(biāo)管理、溝通管理、運(yùn)籌學(xué)、統(tǒng)計(jì)學(xué)、博弈論等。而與現(xiàn)代教學(xué)方式中廣泛運(yùn)用的案例教學(xué)比較起來,計(jì)算機(jī)仿真模擬教學(xué)的對抗性更強(qiáng),參與者的積極性更高,所設(shè)計(jì)的知識(shí)更全面,是以動(dòng)態(tài)方式進(jìn)行的案例分析。讓學(xué)生站在企業(yè)最高決策的位置上來分析、處理所要面對的各項(xiàng)問題,親身體驗(yàn)企業(yè)決策中的“甜酸苦辣”等滋味,使學(xué)生深刻領(lǐng)悟作為管理者所應(yīng)掌握的硬功夫和軟功夫。通過對一系列動(dòng)態(tài)實(shí)際情境連續(xù)不斷的分析與決策來獲得知識(shí),并且取得及時(shí)的反饋,這正是模擬實(shí)驗(yàn)相對于其他教學(xué)手段所獨(dú)有的特點(diǎn)。

(二)以學(xué)生為主體,設(shè)計(jì)符合學(xué)生認(rèn)知規(guī)律的教學(xué)方案

實(shí)踐性的學(xué)習(xí)不再是以教師為中心,而是由學(xué)生發(fā)揮主觀能動(dòng)性,自由地選擇團(tuán)隊(duì)成員、自主地確定模擬仿真內(nèi)容、自發(fā)地學(xué)習(xí)相關(guān)知識(shí)以解決所遇上的難題。在設(shè)計(jì)教學(xué)環(huán)節(jié)時(shí),要循序漸進(jìn),首先讓學(xué)生掌握基本的操作規(guī)律和決策規(guī)則;在之后的實(shí)踐過程中要穿針引線,深入講解,啟發(fā)學(xué)生動(dòng)手動(dòng)腦,在仿真模擬教學(xué)中運(yùn)用基本知識(shí)和分析方法。模擬實(shí)驗(yàn)結(jié)束后要求學(xué)生進(jìn)行總結(jié),口頭發(fā)表演講并提交書面報(bào)告。在運(yùn)用軟件進(jìn)行教學(xué)時(shí),教師可以根據(jù)課時(shí)安排數(shù)輪比賽。在介紹了軟件的基本操作和一般規(guī)則之后,可以開展熱身賽,學(xué)生需要提交前期決策,旨在讓學(xué)生盡可能快速熟悉競爭規(guī)則,掌握各項(xiàng)職能之間的分工與配合。熱身賽結(jié)束后,教師要帶領(lǐng)學(xué)生總結(jié)并進(jìn)一步使學(xué)生深入掌握各項(xiàng)規(guī)則背后所隱含的管理學(xué)原理和知識(shí)。在此基礎(chǔ)上,學(xué)生們進(jìn)行9期的正式競賽,以比賽的方法考察學(xué)生綜合運(yùn)用知識(shí)的能力和戰(zhàn)略決策水平。各輪比賽之間,教師應(yīng)該注意穿插講解,點(diǎn)評反饋,要適時(shí)啟發(fā)學(xué)生帶著問題主動(dòng)學(xué)習(xí),在模擬仿真中不斷通過想辦法解決問題的方法加深自己對相關(guān)知識(shí)的理解。當(dāng)模擬進(jìn)行到一定階段,就可以適當(dāng)引入統(tǒng)計(jì)方法,利用Excel、SPSS……等計(jì)算機(jī)統(tǒng)計(jì)軟件進(jìn)行預(yù)測。除了此項(xiàng)模型,還可以對生產(chǎn)排班、財(cái)務(wù)控制等問題建模以輔助決策。當(dāng)學(xué)生們掌握了這些技術(shù)并用于改進(jìn)之前的決策時(shí),他們將更能體會(huì)到所學(xué)知識(shí)的實(shí)際用途,“做中學(xué)”的方式會(huì)將容易遺忘的書本知識(shí)轉(zhuǎn)化為難以磨滅的技能。

(三)以提高學(xué)生各項(xiàng)管理技能為目標(biāo),采用多元化的方式進(jìn)行考核

利用計(jì)算機(jī)模擬企業(yè)經(jīng)營管理的教學(xué)目的是多層次的,包括上述對管理學(xué)科理論知識(shí)的實(shí)際運(yùn)用之外,還將提高學(xué)生的團(tuán)隊(duì)協(xié)作能力和領(lǐng)導(dǎo)能力。因此,設(shè)計(jì)課程考核方式時(shí),應(yīng)當(dāng)綜合課程自身的特征與大綱要求,建立以基礎(chǔ)概念、基本理論、基本技能為根本,以復(fù)合運(yùn)用能力為重點(diǎn),以競爭成果為參照的綜合考察體系,注重考評方式的多樣化和考評指標(biāo)的規(guī)范化,以保持對學(xué)生學(xué)習(xí)成績和教師教學(xué)效果檢驗(yàn)的客觀性和公正性。企業(yè)競爭模擬軟件可以作為管理學(xué)、企業(yè)戰(zhàn)略管理等課程的實(shí)踐環(huán)節(jié)展開,也可以針對高職大專高年級學(xué)生、本科生,甚至是碩士生和企業(yè)員工獨(dú)立設(shè)課。作為一門單獨(dú)的課程,學(xué)生最終的成績評定可以由以下三部分構(gòu)成:1.企業(yè)競爭模擬競賽成績,占本課程總成績的20%。2.企業(yè)競爭模擬總結(jié)演講,占本課程總成績的40%;要求學(xué)生以小組為單位發(fā)表不超過10分鐘的演講,并回答其他學(xué)員和老師的提問。老師將根據(jù)小組演講的內(nèi)容、回答提問以及現(xiàn)場演講的表現(xiàn)對學(xué)生進(jìn)行綜合評價(jià)。3.企業(yè)競爭模擬書面報(bào)告,占本課程總成績的40%;要求學(xué)生以小組為單位提交不少于3000字的報(bào)告,內(nèi)容應(yīng)當(dāng)包括本企業(yè)在模擬中的總體戰(zhàn)略思路、各職能部門制定決策的情況、模擬過程中遇到的問題和解決方案、學(xué)習(xí)心得體會(huì)、團(tuán)隊(duì)合作中的經(jīng)驗(yàn)以及對軟件和教學(xué)的意見與建議等等方面。

三、小結(jié)

第7篇

關(guān)鍵詞: 農(nóng)業(yè)生產(chǎn);數(shù)據(jù)挖掘;數(shù)據(jù)倉庫;決策支持系統(tǒng)

0 引言

我國作為農(nóng)業(yè)大國,三農(nóng)問題一直是國民經(jīng)濟(jì)和社會(huì)發(fā)展各項(xiàng)工作中的重中之重,隨著科技的進(jìn)步以及計(jì)算機(jī)技術(shù)在農(nóng)業(yè)生產(chǎn)中的廣泛應(yīng)用,農(nóng)業(yè)科技人員在研究過程中積累了大量有價(jià)值的農(nóng)業(yè)數(shù)據(jù)資源,其中包括各種作物的苗情、土情、肥情、病蟲害、氣象、災(zāi)害和市場行情等諸多方面。但是由于農(nóng)業(yè)生產(chǎn)的復(fù)雜性,使得這些農(nóng)業(yè)數(shù)據(jù)資源具有大量、多維、動(dòng)態(tài)、不完整、不確定等特性,使得從這些海量的數(shù)據(jù)中抽取模式、找出數(shù)據(jù)變化的規(guī)律和數(shù)據(jù)之間的相互關(guān)系、建立農(nóng)業(yè)決策支持系統(tǒng)等工作變得越來越困難,這產(chǎn)生了所謂的“數(shù)據(jù)豐富而知識(shí)貧乏”的現(xiàn)象。[1]在農(nóng)業(yè)生產(chǎn)決策支持系統(tǒng)中引進(jìn)數(shù)據(jù)挖掘技術(shù),從這些海量的農(nóng)業(yè)數(shù)據(jù)資源中挖掘出一些隨諸因素動(dòng)態(tài)變化而產(chǎn)生的新的指導(dǎo)農(nóng)業(yè)生產(chǎn)的規(guī)律,農(nóng)業(yè)科技人員可以根據(jù)這些規(guī)律確定正確的農(nóng)業(yè)生產(chǎn)策略,從而推動(dòng)農(nóng)業(yè)生產(chǎn),產(chǎn)生更大的經(jīng)濟(jì)效益。

1 數(shù)據(jù)挖掘技術(shù)概述

數(shù)據(jù)挖掘(Data Mining,DM)[2],就是從大量的、不完全的、有噪聲、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道、但又是潛在有用的信息和知識(shí)的過程。數(shù)據(jù)挖掘是一個(gè)融合了數(shù)據(jù)庫技術(shù)、人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、知識(shí)工程、面向?qū)ο蠓椒ǖ刃录夹g(shù)的多學(xué)科交叉的研究領(lǐng)域。從商業(yè)應(yīng)用的角度看,數(shù)據(jù)挖掘是一種嶄新的商業(yè)信息處理技術(shù)。目前,國內(nèi)外在農(nóng)業(yè)領(lǐng)域數(shù)據(jù)挖掘的研究涉及面不廣,研究還不夠深入。對于將數(shù)據(jù)挖掘技術(shù)應(yīng)用到農(nóng)業(yè)生產(chǎn)決策支持系統(tǒng)的中的研究,關(guān)注度較小,有些研究還處于探索階段,并且對挖掘算法的研究還是不系統(tǒng)、不全面,分析原因,主要是與農(nóng)業(yè)信息化建設(shè)的滯后,有著一定的聯(lián)系。

2 數(shù)據(jù)挖掘技術(shù)在農(nóng)業(yè)生產(chǎn)決策支持系統(tǒng)中的應(yīng)用

決策支持系統(tǒng)(Decision Support System,DSS)是基于計(jì)算機(jī)的信息系統(tǒng),其主要目的是為知識(shí)工作者提供奠定明智決策的基礎(chǔ)的信息。[3]農(nóng)業(yè)生產(chǎn)決策支持系統(tǒng)主要是指以一個(gè)區(qū)域的農(nóng)業(yè)經(jīng)濟(jì)為研究對象,以農(nóng)業(yè)可持續(xù)發(fā)展為決策目標(biāo),綜合運(yùn)用計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)、管理科學(xué)、農(nóng)學(xué)、農(nóng)業(yè)系統(tǒng)工程以及運(yùn)籌學(xué)等多種科學(xué)知識(shí),針對農(nóng)業(yè)生產(chǎn)中的非結(jié)構(gòu)化或半結(jié)構(gòu)化決策問題,通過對以往農(nóng)業(yè)技術(shù)人員積累的大量的數(shù)據(jù)資源進(jìn)行模型計(jì)算、列舉可能方案等方式,為農(nóng)業(yè)生產(chǎn)的管理者做出正確決策提供幫助的計(jì)算機(jī)管理系統(tǒng)。[4]

2.1 農(nóng)業(yè)生產(chǎn)決策支持系統(tǒng)的總體設(shè)計(jì)

針對農(nóng)業(yè)數(shù)據(jù)資源的特點(diǎn),在農(nóng)業(yè)生產(chǎn)決策支持系統(tǒng)中引入數(shù)據(jù)倉庫技術(shù),從而建立基于數(shù)據(jù)倉庫的農(nóng)業(yè)生產(chǎn)決策支持系統(tǒng),決策支持系統(tǒng)的基本結(jié)構(gòu)如圖1所示。用戶可以通過客戶端子系統(tǒng)登錄系統(tǒng),提出一些農(nóng)業(yè)生產(chǎn)方面的決策問題,通過人機(jī)交互形式輸入到計(jì)算機(jī)中,由決策支持系統(tǒng)產(chǎn)生決策規(guī)則。農(nóng)業(yè)生產(chǎn)決策支持系統(tǒng)的內(nèi)部結(jié)構(gòu)主要是:由以往農(nóng)業(yè)生產(chǎn)數(shù)據(jù)庫積累的各種數(shù)據(jù)資源,經(jīng)過對數(shù)據(jù)進(jìn)行的抽取、清理、轉(zhuǎn)換、載入等操作建立面向農(nóng)業(yè)生產(chǎn)為主題的數(shù)據(jù)倉庫,根據(jù)決策的需要,確定挖掘的任務(wù)和目的,并應(yīng)用各種數(shù)據(jù)挖掘算法對數(shù)據(jù)倉庫中的相關(guān)數(shù)據(jù)進(jìn)行精簡、提取和預(yù)處理,最終挖掘出新的、有效的信息、知識(shí)或規(guī)則加入到知識(shí)庫中,以便決策者進(jìn)行查詢請求,最后形成決策結(jié)果到交互系統(tǒng)中。

2.2 農(nóng)業(yè)生產(chǎn)決策支持系統(tǒng)數(shù)據(jù)倉庫模型

數(shù)據(jù)倉庫的邏輯數(shù)據(jù)模型是多維數(shù)據(jù)模型,這也正好適合農(nóng)業(yè)生產(chǎn)數(shù)據(jù)信息的多維性的特性,常見的由星型模型、雪花模型、多主表結(jié)構(gòu)等,操作人員可以根據(jù)數(shù)據(jù)的具體情況選擇適合的數(shù)據(jù)模型。根據(jù)對農(nóng)作物數(shù)據(jù)庫的分析,確定數(shù)據(jù)倉庫的基本主題有:作物生長時(shí)間、室外氣候、作物生長狀態(tài)、病蟲草害以及田間管理。根據(jù)農(nóng)作物生長的多維數(shù)據(jù)特點(diǎn),本文選取星型模型,這種模型建模方便,并且支持用戶從多個(gè)維度對數(shù)據(jù)進(jìn)行查詢分析。作物生長時(shí)間、室外氣候、作物生長狀態(tài)、病蟲草害以及田間管理這些關(guān)于農(nóng)作物的數(shù)據(jù)信息就構(gòu)成了星型模型中的事實(shí)表,維表則是圍繞農(nóng)作物數(shù)據(jù)信息的擴(kuò)展。數(shù)據(jù)倉庫模型見圖2。

2.3 建立農(nóng)業(yè)生產(chǎn)決策支持系統(tǒng)

首先對于聯(lián)機(jī)分析處理(OLAP)模塊的建立,本文利用Microsoft OLAP Analysis Services服務(wù)端組件,根據(jù)星型數(shù)據(jù)倉庫中的事實(shí)表和維表,對數(shù)據(jù)倉庫中的數(shù)據(jù)進(jìn)行切片、切塊、鉆取和旋轉(zhuǎn)等操作,從而完成對氣候維、生長時(shí)間維、生長狀態(tài)維、病蟲草害維、田間管理維的建立和處理。OLAP模塊對數(shù)據(jù)倉庫中的多維數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,并能以圖形、報(bào)表等形式展現(xiàn)分析結(jié)果。

數(shù)據(jù)挖掘系統(tǒng)能夠挖掘多種類型的模型,以適應(yīng)農(nóng)業(yè)生產(chǎn)中農(nóng)作物星型數(shù)據(jù)倉庫的需求和應(yīng)用。使用SQL Server 2005 Analysis Services(SSAS)創(chuàng)建關(guān)于農(nóng)業(yè)生產(chǎn)方面的復(fù)雜的數(shù)據(jù)挖掘解決方案。本系統(tǒng)根據(jù)農(nóng)作物的數(shù)據(jù)倉庫模型的應(yīng)用需要,對模型進(jìn)行了決策樹分類分析、關(guān)聯(lián)分析、聚類分析等類型的挖掘。

2.3.1 決策樹分類分析。決策樹(decision tree)是一個(gè)類似流程圖的樹型結(jié)構(gòu),樹中包含三種節(jié)點(diǎn)類型:根節(jié)點(diǎn)、內(nèi)部節(jié)點(diǎn)以及葉節(jié)點(diǎn)。其中樹中的每個(gè)內(nèi)部節(jié)點(diǎn)都代表著對一個(gè)屬性的測試,用以區(qū)分具有不同特性的記錄。葉節(jié)點(diǎn)則代表某個(gè)類或者是類的分布,最上面的節(jié)點(diǎn)就是根節(jié)點(diǎn)。決策樹構(gòu)造的輸入是一組帶有類別標(biāo)記的數(shù)據(jù),往往構(gòu)造的結(jié)果是一棵二叉樹或多叉樹。在農(nóng)作物發(fā)生病蟲草等方面的分析,可以通過決策樹分類分析對農(nóng)作物災(zāi)害數(shù)據(jù)資料中大量的歷史數(shù)據(jù)處理、挖掘出蘊(yùn)含其中的對防治病蟲草害有價(jià)值的信息,從而為診斷和防治提供更準(zhǔn)確的決策服務(wù)。

2.3.2 關(guān)聯(lián)分析。若兩個(gè)或多個(gè)數(shù)據(jù)項(xiàng)的取值之間重復(fù)出現(xiàn)且概率很高時(shí),它就存在某種關(guān)聯(lián),可以建立起這些數(shù)據(jù)項(xiàng)的關(guān)聯(lián)規(guī)則。在大型數(shù)據(jù)庫中,這種關(guān)聯(lián)規(guī)則是很多的,需要進(jìn)行篩選,一般用“支持度”和“可信度”兩個(gè)閾值來淘汰那些無用的關(guān)聯(lián)規(guī)則。在農(nóng)作物信息數(shù)據(jù)倉庫中,SSAS提供了關(guān)聯(lián)算法,可以根據(jù)農(nóng)作物以往發(fā)生病蟲草害的疾病和特征分析,挖掘出在一段時(shí)間內(nèi),氣候環(huán)境與特定農(nóng)作物發(fā)病之間的關(guān)聯(lián)規(guī)則。

2.3.3 聚類分析。聚類就是把一組對象按照屬性值劃分成一系列有意義的子集的過程。它所采用的劃分原則是保持最大的組內(nèi)相似性和最小的組間相似性,即不同的聚類中的數(shù)據(jù)盡可能地不同,同一聚類中的數(shù)據(jù)盡可能相似。所以,聚類有助于建立集合的細(xì)分。SSAS提供聚類的分段算法,先對農(nóng)作物數(shù)據(jù)倉庫模型中的關(guān)系進(jìn)行標(biāo)識(shí),并根據(jù)這些發(fā)生病蟲草害的病例數(shù)據(jù)分組為包含類似特征的分類組。

3 結(jié)論

本文對數(shù)據(jù)挖掘技術(shù)在農(nóng)業(yè)生產(chǎn)決策支持系統(tǒng)中的應(yīng)用進(jìn)行了研究,構(gòu)建了基于數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的農(nóng)業(yè)生產(chǎn)決策支持系統(tǒng)模型,并對該模型進(jìn)行了介紹。該系統(tǒng)具有一定的輔助決策功能,用戶可以通過聯(lián)機(jī)分析處理模塊和數(shù)據(jù)挖掘模塊從多角度、多側(cè)面地分析數(shù)據(jù)庫中的數(shù)據(jù),通過該系統(tǒng)可以挖掘和發(fā)現(xiàn)隱含的信息,對信息作出決策樹分類分析、聚類分析以及關(guān)聯(lián)分析等一系列數(shù)據(jù)挖掘操作,從而獲得對農(nóng)業(yè)生產(chǎn)有決策作用的信息,指導(dǎo)人們進(jìn)行農(nóng)業(yè)生產(chǎn)實(shí)踐。

參考文獻(xiàn):

[1]李增祥,數(shù)據(jù)挖掘技術(shù)在農(nóng)業(yè)生產(chǎn)中的應(yīng)用[J].微計(jì)算機(jī)信息,2010,6-3:150-151.

[2]Jiawei Han and Micheline Kamber.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2001:23-34.

第8篇

1 數(shù)據(jù)挖掘的概念、步驟及常用方法

1.1 數(shù)據(jù)挖掘概念、步驟 數(shù)據(jù)挖掘(Data mining,DM)即數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn),是從大型數(shù)據(jù)庫的海量數(shù)據(jù)中提取人們感興趣的知識(shí),這些知識(shí)是隱藏的、事先未知的、潛在有用的信息,挖掘的知識(shí)表現(xiàn)為概念、規(guī)則、規(guī)律、模式等形式[1]。數(shù)據(jù)挖掘的目的在于使用所發(fā)現(xiàn)的模式幫助解釋當(dāng)前的行為或預(yù)測未來的結(jié)果[2]。挖掘步驟大致有:問題定義、數(shù)據(jù)提取、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、知識(shí)評估、結(jié)果應(yīng)用這六步。

1.2 數(shù)據(jù)挖掘常用方法

1.2.1 描述統(tǒng)計(jì) 數(shù)據(jù)總結(jié)的目的是對數(shù)據(jù)進(jìn)行從低層次抽象、濃縮到高層次,得出它的緊湊描述。最簡單的數(shù)據(jù)總結(jié)方法是描述統(tǒng)計(jì),它包括平均數(shù)、中位數(shù)、分位數(shù)等,它常和統(tǒng)計(jì)圖配合應(yīng)用。

1.2.2 關(guān)聯(lián)規(guī)則 關(guān)聯(lián)規(guī)則從本質(zhì)上講是條件概率,即當(dāng)A發(fā)生時(shí)、B同時(shí)出現(xiàn)的概率有多大?只要B離50%較遠(yuǎn)就有意義。數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類重要的可被發(fā)現(xiàn)的知識(shí)。若兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。關(guān)聯(lián)包括簡單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)、因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng)。有時(shí)我們并不知道數(shù)據(jù)庫中數(shù)據(jù)的關(guān)聯(lián)函數(shù),即使知道也不確定。因此關(guān)聯(lián)分析生成的規(guī)則帶有可信度。

1.2.3 分類和聚類 這是最常用的技術(shù)。分類方法主要有:回歸、決策樹、神經(jīng)網(wǎng)絡(luò)。分類分析在數(shù)據(jù)挖掘中是一項(xiàng)重要任務(wù)。分類器的構(gòu)造方法有統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法等。聚類是根據(jù)事物本身潛在的特性研究對象分類的方法。通過聚類把一個(gè)數(shù)據(jù)集合中的個(gè)體按照相似性歸成若干類別,使其“物以類聚”,將數(shù)據(jù)庫中的記錄劃分為一系列有意義的子集。聚類要解決的就是實(shí)現(xiàn)滿足這種要求的類的聚合。在進(jìn)行聚類前,這些類別是潛在的,可分割的類的個(gè)數(shù)(聚類數(shù))也是未知的。聚類大致分為統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法和面向數(shù)據(jù)庫的方法等。

1.2.4 偏差檢測 數(shù)據(jù)庫中的數(shù)據(jù)可能有一些異常記錄,檢測這些偏差很有意義。偏差檢測的基本方法是尋找觀測結(jié)果與參照值之間有意義的差別。

2 中醫(yī)病歷中醫(yī)學(xué)數(shù)據(jù)挖掘的特點(diǎn)

目前中醫(yī)病歷中采集的中醫(yī)學(xué)信息具有如下特點(diǎn)。

2.1 癥狀的模糊性 中醫(yī)學(xué)對疾病的診斷是通過望、聞、問、切的四診合參,獲取有用信息,再結(jié)合醫(yī)生的經(jīng)驗(yàn),對疾病做出診斷。癥狀的模糊性不僅表現(xiàn)在獲得信息的形式多樣,而且因中醫(yī)癥狀存在著一癥多名,或多癥一名的現(xiàn)象,因此不同醫(yī)生即使對同樣的癥狀,可能會(huì)用不同的文字加以描述,比如對“患者不欲進(jìn)食”的記錄,可能會(huì)有納差、食欲不振、納呆等的不同。這種模糊性模式加大了中醫(yī)學(xué)數(shù)據(jù)挖掘的難度。

2.2 癥狀的不完整性 病例和病案的有限性使醫(yī)學(xué)數(shù)據(jù)庫不可能對任何一種疾病信息都能全面地反映出來,表現(xiàn)為醫(yī)學(xué)信息的不完全性。同時(shí),許多醫(yī)學(xué)信息的表達(dá)、記錄本身就具有不確定和模糊性的特點(diǎn)[3],這方面在中醫(yī)癥狀未做出標(biāo)準(zhǔn)量化方法并推行應(yīng)用之前,尤為突出。疾病信息體現(xiàn)的客觀不完整和描述疾病的主觀不確切,形成了中醫(yī)病歷中醫(yī)學(xué)信息的不完整性。

2.3 證候的復(fù)雜性 著名的王永炎院士指出了證候具有動(dòng)態(tài)時(shí)空、內(nèi)實(shí)外虛、多維界面的特點(diǎn),簡明扼要的描述了證候的復(fù)雜性。中醫(yī)證候的復(fù)雜性給數(shù)據(jù)挖掘增加了難度,但這也恰好是數(shù)據(jù)挖掘發(fā)揮效力的用武之地。

2.4 治療信息的個(gè)體化特性 中醫(yī)治病之本是辨證論治,體現(xiàn)在“三因治宜”、“同病異治、異病同治”等方面。即使針對同一疾病相同的證,醫(yī)生的處方用藥也可能會(huì)有差異。這種個(gè)體化的治療,充分體現(xiàn)了中醫(yī)治病的精髓,而其中所蘊(yùn)涵的深?yuàn)W哲理和規(guī)律,用一般的研究方法難以全面發(fā)掘。數(shù)據(jù)挖掘在這方面很可能會(huì)有很高的應(yīng)用價(jià)值。

2.5 挖掘過程的復(fù)雜性 中醫(yī)藥領(lǐng)域中的數(shù)據(jù)屬性有離散型的,也有連續(xù)型和混合型的,對這些數(shù)據(jù)的噪聲處理等預(yù)處理相當(dāng)復(fù)雜,挖掘過程還需要人機(jī)交互、多次反復(fù),其中任何一個(gè)環(huán)節(jié)都不能缺少專業(yè)人員。只有靠中醫(yī)藥專家的引導(dǎo),針對具體問題,選擇合理的挖掘方法,才能挖掘出真正有價(jià)值的知識(shí)。

在中醫(yī)學(xué)數(shù)據(jù)挖掘中,應(yīng)針對上述數(shù)據(jù)特點(diǎn)和挖掘目標(biāo),結(jié)合運(yùn)用不同的挖掘方法,對非線性、不完全的信息進(jìn)行智能處理,發(fā)揮各自的技術(shù)及其整合優(yōu)勢。

3 數(shù)據(jù)挖掘在中醫(yī)藥研究中的應(yīng)用

近年來,數(shù)據(jù)挖掘技術(shù)在中醫(yī)藥研究中已得到應(yīng)用。有學(xué)者認(rèn)為中醫(yī)藥數(shù)據(jù)挖掘是中醫(yī)藥現(xiàn)代化研究的重要組成部分[4]。

3.1 中醫(yī)藥信息化研究 姚氏等[5]綜合文獻(xiàn)指出對中醫(yī)藥理論和實(shí)踐進(jìn)行信息化、數(shù)字化、知識(shí)化,能夠克服中醫(yī)名詞術(shù)語過于繁雜造成的中醫(yī)發(fā)展障礙,對于中醫(yī)藥信息進(jìn)行文本數(shù)據(jù)挖掘是促進(jìn)中醫(yī)藥信息結(jié)構(gòu)化的途徑之一,該問題的解決,能極大促進(jìn)中醫(yī)藥現(xiàn)代化發(fā)展的進(jìn)程。

3.2 中藥研究 陳凱先等[6]認(rèn)為對大量中藥化學(xué)成分進(jìn)行藥效基團(tuán)的建模研究,并對中藥化學(xué)成分?jǐn)?shù)據(jù)庫進(jìn)行柔性搜索,能夠?yàn)楦浞掷弥兴幓瘜W(xué)成分所含的化學(xué)信息提供技術(shù)支持。馮雪松等[7]對中藥指紋圖譜的特點(diǎn)及數(shù)據(jù)挖掘技術(shù)在其中的應(yīng)用做了綜述,指出中藥指紋圖譜由于反映了藥用植物的“共有特征”,又由于地域、生長環(huán)境、采收等多種因素影響,具有統(tǒng)計(jì)數(shù)學(xué)中多元隨機(jī)分布的“模糊性”,利用模糊數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)技術(shù)等建立一種同時(shí)反應(yīng)這兩種特征數(shù)據(jù)庫,存儲(chǔ)中藥指紋圖譜信息,應(yīng)用數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)和解析其中潛在的信息,以評價(jià)和控制中藥質(zhì)量及研究中藥定量組效關(guān)系。

3.3 方劑研究 喬延江等[4]綜述了KDD在中藥研究開發(fā)中的意義。喬氏等認(rèn)為中藥(復(fù)方)的KDD研究是在中醫(yī)理論指導(dǎo)下,以數(shù)據(jù)挖掘技術(shù)作為知識(shí)發(fā)現(xiàn)的主要環(huán)節(jié),對中藥研發(fā)、設(shè)計(jì)、中醫(yī)組方理論及規(guī)律、中藥作用機(jī)制、構(gòu)效關(guān)系、中藥藥效集團(tuán)群的確認(rèn)、化學(xué)成分及藥理指標(biāo)的預(yù)測等進(jìn)行多方位、多學(xué)科、系統(tǒng)的現(xiàn)代化研究,是一個(gè)高度復(fù)雜的系統(tǒng)。其目的是建立傳統(tǒng)中醫(yī)理論同現(xiàn)代中藥的科學(xué)化、系統(tǒng)化、可描述化的關(guān)系,是中醫(yī)藥現(xiàn)代化的重要組成部分。楊林等[8]闡述了數(shù)據(jù)庫技術(shù)與Web結(jié)合實(shí)現(xiàn)網(wǎng)上中醫(yī)方劑的信息挖掘。將方劑文獻(xiàn)資料進(jìn)行全方位解析,設(shè)計(jì)內(nèi)容詳細(xì)的數(shù)據(jù)庫與Web技術(shù)結(jié)合,通過Internet開發(fā)了網(wǎng)上中醫(yī)方劑信息分析處理系統(tǒng),選擇支持Web-DB的ORACLE數(shù)據(jù)庫管理系統(tǒng)作為系統(tǒng)開發(fā)和運(yùn)行平臺(tái)。經(jīng)過數(shù)據(jù)預(yù)處理、選擇和篩選數(shù)據(jù)、確定分析目標(biāo)、信息挖掘結(jié)果顯示等階段,完成對一批方劑數(shù)據(jù)的信息挖掘。姚美村等[9]應(yīng)用數(shù)據(jù)挖掘技術(shù)對治療消渴病的中藥復(fù)方配伍的內(nèi)涵進(jìn)行探索性研究。以文獻(xiàn)收錄的106個(gè)治療消渴病的中藥復(fù)方為對象,經(jīng)解析后建立復(fù)方特征數(shù)據(jù)庫;以數(shù)據(jù)挖掘系統(tǒng)Enterprise Miner為平臺(tái),在單味藥層次上進(jìn)行消渴病復(fù)方組成藥味之間的關(guān)聯(lián)規(guī)則分析研究,結(jié)果顯示單味藥、兩味藥組合、三味藥組合的應(yīng)用規(guī)律與歷代中醫(yī)在消渴病治療用藥方面的論述一致。挖掘結(jié)果的可信度可達(dá)到或接近中醫(yī)專家的分析能力。秦首科等[10]在構(gòu)建方劑、中藥和病癥數(shù)據(jù)倉庫的基礎(chǔ)上,通過對數(shù)據(jù)倉庫內(nèi)部各種關(guān)聯(lián)和映射關(guān)系的定義,利用中藥和病癥數(shù)據(jù)倉庫的聯(lián)機(jī)分析功能,探討了方劑和其針對癥狀之間的聯(lián)系。蔣永光等[11]對從《中醫(yī)大辭典·方劑分冊》中篩選出1355首脾胃方中的414種藥物,經(jīng)用聚類分析、對應(yīng)分析和頻繁集方法,從功效、歸經(jīng)、藥性和藥味等方面進(jìn)行了分類特征分析,并就脾胃方的核心藥物、方劑結(jié)構(gòu)、“藥對藥”組和“方藥證”的對應(yīng)關(guān)聯(lián)方面形成了有關(guān)技術(shù)規(guī)則和處理程序。

3.4 中醫(yī)證候研究 張世筠等[12]應(yīng)用流行病學(xué)和變量聚類分析的數(shù)理統(tǒng)計(jì)方法,對2442例中醫(yī)肝證患者進(jìn)行了初步研究。由調(diào)查組采集核對中醫(yī)四診資料,按肝證辨證記分標(biāo)準(zhǔn)記分,分為11個(gè)證型。經(jīng)過聚類分為實(shí)證、風(fēng)證、虛證3類,解決了中醫(yī)各肝證的歸屬問題,本研究還定量地闡明肝的實(shí)證、虛證、風(fēng)證的相互關(guān)系。白云靜等[13]在充分闡釋證候系統(tǒng)的非線性、復(fù)雜性特征的基礎(chǔ)上,探析了人工神經(jīng)網(wǎng)絡(luò)方法用于證候研究的可行性,并介紹了基于人工神經(jīng)網(wǎng)絡(luò)的證候研究方法。徐蕾等[14]采用boot strap方法對406例樣本進(jìn)行擴(kuò)增以滿足數(shù)據(jù)挖掘?qū)颖玖康囊?,采用基于信息熵的決策樹C4.5算法建立中醫(yī)辨證模型。通過決策樹C4.5算法篩選出對辨證分型有意義的26個(gè)因素,按其重要程度排序;產(chǎn)生出清楚易懂可用于分類的決策規(guī)則,建立辨證模型,模型分類符合率為:訓(xùn)練集83.6%,驗(yàn)證集80.67%,測試集81.25%;模型區(qū)分各類證型的靈敏度和特異度也較高。認(rèn)為決策樹C4.5算法建立的模型效果較好,可用于慢性胃炎中醫(yī)證型的鑒別診斷。吳斌[15]等探討了腎陽虛證的辨證因子分布規(guī)律。以腎陽虛證量表為基礎(chǔ),從定性、定量角度收集資料。以定性評分計(jì)算各辨證因子的出現(xiàn)頻率,用定量評分進(jìn)行分層聚類分析。發(fā)現(xiàn):畏寒、肢冷、夜尿、腰背發(fā)冷等辨證因子出現(xiàn)頻率高,聚類分析提示腎陽虛主證、舌象、脈象分布較有規(guī)律。認(rèn)為根據(jù)數(shù)理統(tǒng)計(jì)結(jié)果對腎陽虛證的辨證因子進(jìn)行初篩,為腎陽虛證的量化研究奠定了基礎(chǔ)。

4 小結(jié)與展望

利用數(shù)據(jù)挖掘技術(shù)探求中醫(yī)藥診治疾病的規(guī)律,形成用數(shù)字描述和表達(dá)的中醫(yī)藥內(nèi)容,能有力推動(dòng)中醫(yī)藥研究的規(guī)范化進(jìn)程。但由于中醫(yī)藥信息的復(fù)雜性和特殊性,中醫(yī)藥數(shù)據(jù)挖掘在挖掘?qū)ο蟮膹V泛性、挖掘算法的高效性和魯棒性、提供知識(shí)或決策的準(zhǔn)確性方面有更高的要求。目前中醫(yī)藥數(shù)據(jù)庫資源已較豐富。數(shù)據(jù)挖掘技術(shù)將成為中醫(yī)藥現(xiàn)代化的重要組成部分。但從目前應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn)行的中醫(yī)藥研究來看,中醫(yī)數(shù)據(jù)挖掘尚處于起步階段,多數(shù)是對古文獻(xiàn)數(shù)據(jù)的整理挖掘,缺乏用于探求中醫(yī)診治疾病規(guī)律和復(fù)方用藥規(guī)律的研究。這可能與中醫(yī)數(shù)據(jù)的復(fù)雜性所致的數(shù)據(jù)預(yù)處理繁瑣有關(guān);如能通過建立結(jié)構(gòu)化數(shù)據(jù)庫,采用結(jié)構(gòu)化的臨床信息采集系統(tǒng)收集數(shù)據(jù),將能提高中醫(yī)學(xué)數(shù)據(jù)挖掘的效率及可信度。有助于發(fā)現(xiàn)中醫(yī)的診治規(guī)律,并創(chuàng)新診治模式,提高診療與科研教學(xué)水平。

1 Srikanth R''Agrawal R.Mining Sequential Patterns:Generalizationsand Performance Improvement.In 5th Int’ Extending Database Technology.Avignon France''1996''121-130.

2 翁敬農(nóng)(譯).數(shù)據(jù)挖掘教程.北京:清華大學(xué)出版社''2003''11.

3 Qu JH''Liao QM''Xu WZ''et al.The construction of medical database and datamining.Journal of the Fourth Military Medical University''2001''22(1):88.

4 喬延江''李澎濤''蘇鋼強(qiáng)''等.中藥(復(fù)方)KDD研究開發(fā)的意義.北京中醫(yī)藥大學(xué)學(xué)報(bào)''1998''21(3):15-17.

5 姚美村''袁月梅''艾路,等.數(shù)據(jù)挖掘及其在中醫(yī)藥現(xiàn)代化研究中的應(yīng)用.北京中醫(yī)藥大學(xué)學(xué)報(bào)''2002''25(3):20-23.

6 陳凱先''蔣華良''嵇汝運(yùn).計(jì)算機(jī)輔助藥物設(shè)計(jì)—原理、方法及應(yīng)用.上海:上海科技出版社''2001''1.

7 馮雪松''董鴻曄.中藥指紋圖譜的數(shù)據(jù)挖掘技術(shù).藥學(xué)進(jìn)展''2002''26(4):198-201.

8 楊林''徐慧''任廷革,等.數(shù)據(jù)庫技術(shù)與Web結(jié)合實(shí)現(xiàn)網(wǎng)上中醫(yī)方劑的信息挖掘.中國中醫(yī)藥信息雜志''1999''6(9):71-72.

9 姚美村''艾路''袁月梅''等.消渴病復(fù)方配伍規(guī)律的關(guān)聯(lián)規(guī)則分析.北京中醫(yī)藥大學(xué)學(xué)報(bào)''2002''25(6):48-50.

10 秦首科''牛孺子.利用數(shù)據(jù)倉庫分析處理中醫(yī)方劑評析.中醫(yī)藥學(xué)刊''2002''20(3):341-342.

11 蔣永光''李力''李認(rèn)書''等.中醫(yī)脾胃方劑配伍規(guī)律數(shù)據(jù)挖掘試驗(yàn).世界科學(xué)技術(shù)—中醫(yī)藥現(xiàn)代化''2003''5(3):33-37.

12 張世筠''沈明秀''王先春''等.中醫(yī)肝證的變量聚類分析.中國中西醫(yī)結(jié)合雜志''2004''24 (1):35.

13 白云靜''申洪波''孟慶剛''等.中醫(yī)證候研究的人工神經(jīng)網(wǎng)絡(luò)方法探析.中醫(yī)藥學(xué)刊''2004''22(12):2221-2223.

14 徐蕾''賀佳''孟虹''等.基于信息熵的決策樹在慢性胃炎中醫(yī)辨證中的應(yīng)用.第二軍醫(yī)大學(xué)學(xué)報(bào)''2004''25(9):1101-1103.

第9篇

文獻(xiàn)標(biāo)識(shí)碼:A

文章編號:16723198(2015)17005503

0引言

連鎖零售企業(yè)的需求預(yù)測是指對消費(fèi)者所需購買的商品數(shù)目進(jìn)行預(yù)測。當(dāng)實(shí)際上需要的商品數(shù)目和預(yù)測數(shù)目有較大差異時(shí),連鎖零售企業(yè)供應(yīng)鏈會(huì)受到極大擾動(dòng),并且會(huì)提高成本,競爭力會(huì)降低。如果產(chǎn)品受季節(jié)、廣告和特賣活動(dòng)等其他因素影響較大時(shí),精確快速的物資需求可以高效提示企業(yè)產(chǎn)品需求量的變化,這能夠顯著減少零售企業(yè)的庫存量,使成本更低,企業(yè)在市場中的競爭力有效提高。所以當(dāng)發(fā)生了突發(fā)事件時(shí),如何能夠快速精確預(yù)測連鎖零售企業(yè)應(yīng)急物資需求量對于企業(yè)供應(yīng)鏈的穩(wěn)定和優(yōu)化具有重大意義。

現(xiàn)在國內(nèi)外對物資需求預(yù)測的方法主要包括回歸分析法和時(shí)間序列法,對它們的研究已經(jīng)比較成熟,由于能夠快速得到結(jié)果,所以很多研究員都喜歡這種方法,可是由于它們的模型一般不夠復(fù)雜,且假定實(shí)驗(yàn)條件相對理想,僅考慮了小部分影響因素,因此預(yù)測出來的結(jié)果精度不高,效果不夠理想。除此以外,還有部分研究員利用人工神經(jīng)網(wǎng)絡(luò)、專家系統(tǒng)模型等其他方法進(jìn)行預(yù)測,其中通過人工神經(jīng)網(wǎng)絡(luò)建立模型來進(jìn)行預(yù)測,最后的結(jié)果更加精確,所以越來越多的學(xué)者開始利用人工神經(jīng)網(wǎng)絡(luò)來對物資需求進(jìn)行預(yù)測。但是由概率統(tǒng)計(jì)學(xué)可得,神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法僅僅是根據(jù)經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原理(empirical riskminimization)來進(jìn)行學(xué)習(xí),但沒有有效降低期望風(fēng)險(xiǎn);除此以外,由于沒有準(zhǔn)確的理論知識(shí)來對神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行確定,它只能通過多次試驗(yàn)得出的經(jīng)驗(yàn)來確定。

最近貝爾實(shí)驗(yàn)室的Vapnik等提出了支持向量機(jī)(support vector machine,SVM),它是一種新的機(jī)器學(xué)習(xí)算法。SVM不僅能將結(jié)構(gòu)風(fēng)險(xiǎn)減至最小,而且還最大化地縮小了VC維和經(jīng)驗(yàn)風(fēng)險(xiǎn)之間的界限,與神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法相比較,它的預(yù)測效果更好,能更好的代替神經(jīng)網(wǎng)絡(luò)方法,應(yīng)用前景更加優(yōu)越。當(dāng)要處理大規(guī)模數(shù)據(jù)時(shí),由于存在過多的冗余信息,這會(huì)極大降低支持向量機(jī)算法的運(yùn)算速度,導(dǎo)致訓(xùn)練消耗更多的時(shí)間。為了將SVM算法應(yīng)用于對實(shí)時(shí)性要求較高的連鎖零售企業(yè)應(yīng)急需求預(yù)測這個(gè)課題上,由于粗糙集算法具有屬性約簡的特點(diǎn),本文引入粗糙集算法用于對與連鎖超市應(yīng)急物資需求量相關(guān)的各種歷史數(shù)據(jù)進(jìn)行約簡,把和決策信息關(guān)系不大的屬性消除,極大地減少了SVM的輸入變量,因此使得SVM算法速度更快,預(yù)測結(jié)果更準(zhǔn)確。

1基于粗糙集與支持向量機(jī)的預(yù)測模型

1.1粗糙集屬性約簡

由粗糙集理論可得,把客觀世界簡化成一個(gè)信息系統(tǒng),用A=〈W,Q,V,f〉來表示它,其中:W=x1,x2,…,xn是論域;Q=S∪D是屬性有限集,上式中S=s1,s2,…,sm是條件屬性集;V=v1,v2,…,vm是屬性的值域集,上式中vi是屬性ci的值域:f:W×SV為信息函數(shù),由上式可得出論域W與條件屬性集S到值域集V的映射。一個(gè)決策屬性的決策表的一般表達(dá)形式如表1所示,下表中f(xi,sj)=uj,i,fxi,d=vi,并且uj,i的值和對象xi和條件屬性si相對應(yīng),vi的值和對象xi與決策屬性d相對應(yīng)。

表1決策表的一般表達(dá)形式

假定B是Q的隨便一個(gè)屬性子集,可得下式的等價(jià)關(guān)系I(B)={(x,y)∈W×W:f(x,a)=f(y,a),a∈B}。假定(x,y)∈I(B),那么x,y相對于B是不可分辨的;假定R為等價(jià)關(guān)系族,如果I(R)=I(R-{r}),那么在R中r能夠被消除;如果P=R-{r}相互獨(dú)立,那么P是R中的一個(gè)約簡。對于R中無法消除的關(guān)系,我們把它稱為核,核所組成的集合稱為R的核集。

由上可得,粗糙集屬性約簡過程如下所示:

(1)通過論域中的決策屬性和條件屬性建立決策表。

(2)找出決策表中的條件屬性和決策屬性,然后根據(jù)粗糙集算法離散化這些變量。

(3)求出新決策表,然后對它屬性簡約,最終得到約簡的決策規(guī)則。

1.2支持向量機(jī)的基本原理

支持向量機(jī)(Support Vector Machines,簡稱SVM)是一種新的機(jī)器學(xué)習(xí)算法,由Vapnik等人提出,在時(shí)間序列預(yù)測和優(yōu)化控制等領(lǐng)域得到廣泛的應(yīng)用。SVM先分解非線性函數(shù)樣本集,然后把它們轉(zhuǎn)化成向量形式,與高維空間相映射,經(jīng)過線性回歸后再映射回原空間。由上可得,它就是一個(gè)對非線性數(shù)據(jù)進(jìn)行線性回歸變換,最開始一般用來解決尋優(yōu)分類問題。

通過下圖1詳細(xì)說明了SVM的計(jì)算原理,假設(shè)有實(shí)心點(diǎn)和空心點(diǎn)這兩類樣本,H是最優(yōu)分類線,它兩邊的H1、H2分別代表2類中離分類線H最近且平行于分類線的直線,H1與H的距離和H2與H的距離都被稱作分類間隔,用margin表示。假定分類線H不但可以準(zhǔn)確分開2類樣本,還要使margin最大,那么距離最優(yōu)分類線H最近的樣本向量就稱為支持向量。此外如果要使H能保證經(jīng)驗(yàn)風(fēng)險(xiǎn)最小,要求margin最大也就是要保證推廣性的界中的置信區(qū)間最小,這樣也就能夠最小化真實(shí)風(fēng)險(xiǎn)。

圖1支持向量機(jī)原理圖

1.3支持向量機(jī)的基本算法

SVM的原理就是找到一個(gè)非線性映射j,它能將數(shù)據(jù)x映射到高維特征空間并進(jìn)行線性回歸。現(xiàn)在給定訓(xùn)練數(shù)據(jù)xi,yi,i=1,2,…,l,其中xi∈Rn是第i個(gè)樣本點(diǎn)的n維輸入值,yi∈R為對應(yīng)的目標(biāo)值,l為訓(xùn)練樣本輸目。SVM算法的目標(biāo)就是求出函數(shù)fx,它可以盡量逼近全部樣本點(diǎn)。由上可得,支持向量機(jī)的估計(jì)函數(shù)即:

fx=+b

(1)

式中:fx是目標(biāo)函數(shù);w,b是目標(biāo)函數(shù)的法向量及偏移量;jx是特征映射函數(shù)。

那么標(biāo)準(zhǔn)支持向量回歸算法就能描述成下面的問題,即

式中:b是通過支持向量計(jì)算求出;核函數(shù)Kxi,x是滿足Mercer條件的任何對稱的核函數(shù)對應(yīng)于特征空間的點(diǎn)積。一般支持向量機(jī)使用的核函數(shù)包括多項(xiàng)式核函數(shù),線性核函數(shù)和徑向基核函數(shù)(RBF)等,本文采用徑向基核函數(shù)。

2基于粗糙集和SVM的短期應(yīng)急需求預(yù)測

首先找出歷史數(shù)據(jù),然后構(gòu)建屬性值決策表A=〈W,Q,V,f〉,其中Q=S∪D。條件屬性S指歷史負(fù)荷和影響因素信息,決策集D指預(yù)測日的應(yīng)急需求值。因?yàn)榇植诩惴ㄊ菍﹄x散數(shù)據(jù)進(jìn)行分析,所以首先要離散化原有數(shù)據(jù),構(gòu)造一個(gè)新的信息決策表,然后再采用增量約簡算法進(jìn)行屬性約簡,最后可求出推理規(guī)則集。

由于支持向量機(jī)算采用了RBF核函數(shù),它的參數(shù)c值可以極大影響SVM計(jì)算結(jié)果,所以c值通常大于10小于100,如果c值超過100時(shí),就會(huì)產(chǎn)生欠學(xué)習(xí)現(xiàn)象,所以本文假定c=95。

圖2是基于RS預(yù)處理的SVM預(yù)測系統(tǒng)。

圖2基于RS預(yù)處理的SVM預(yù)測系統(tǒng)

3應(yīng)急物資需求量預(yù)測的仿真實(shí)驗(yàn)

在進(jìn)行連鎖零售企業(yè)應(yīng)急物資需求預(yù)測的分析中,主要利用北京城區(qū)應(yīng)急物資需求的數(shù)據(jù)進(jìn)行預(yù)測。

3.1模型參數(shù)選擇

粗糙集理論是一種刻畫不完備、不確定信息的數(shù)學(xué)工具,在保留關(guān)鍵信息的前提下,對數(shù)據(jù)進(jìn)行化簡,使其屬性達(dá)到最小約簡,求得知識(shí)的最小表達(dá)。

影響應(yīng)急物資需求的因素有很多,所以首先要采用粗糙集屬性約簡法約減這些影響因素。首先將原始數(shù)據(jù)制成決策表,然后離散化樣本數(shù)據(jù),同時(shí)不降低數(shù)據(jù)的原始分類能力。本文采用等頻率離散化方法,首先把連續(xù)屬性值分成k個(gè)區(qū)間內(nèi)數(shù)值相等的離散區(qū)間?,F(xiàn)在假定有l(wèi)個(gè)數(shù)值,可以求出每個(gè)區(qū)間有l(wèi)/k個(gè)數(shù)值,本文中k=3。在保證決策表決策屬性和條件屬性間不變化依賴關(guān)系前提下,消除多余的條件屬性,約減后求出的核屬性為x1,x2,x3,x4,x5,x6,此時(shí)約減后求出的指標(biāo)就是支持向量機(jī)模型的輸入數(shù)據(jù)。

本文將數(shù)據(jù)進(jìn)行粗糙集算法屬性約簡后,得到最優(yōu)屬性集,如表2所示。

表2應(yīng)急物資需求量與影響因素?cái)?shù)據(jù)統(tǒng)計(jì)

其中①為受災(zāi)程度,②為受災(zāi)時(shí)間,③為零售企業(yè)門店位置,④為商品消耗周期,⑤為門店商品庫存,⑥為應(yīng)急物資需求量。將表2中1~13組樣本作為訓(xùn)練樣本,14~18組樣本作為檢驗(yàn)樣本。

3.2應(yīng)急物資需求預(yù)測

要建立應(yīng)急物資需求預(yù)測模型,必須求出適當(dāng)?shù)暮撕瘮?shù)基寬γ和懲罰參數(shù)C等,這樣可以有效提高模型預(yù)測精確度,使模型更有效。本文采用交叉驗(yàn)證網(wǎng)格搜索方法來確定優(yōu)化參數(shù)。首先把訓(xùn)練樣本集隨機(jī)分成K個(gè)集合,然后訓(xùn)練它里面的K-1個(gè)集合,求出一個(gè)決策函數(shù),再利用決策函數(shù)測試余下的那個(gè)集合,循環(huán)測試K次后,當(dāng)預(yù)測完全部子集后把測試錯(cuò)誤的平均值定位推廣誤差,這樣就能避免人為選取C和γ所產(chǎn)生的主觀誤差。

對參數(shù)優(yōu)化后再根據(jù)已定的輸入和輸出參數(shù)構(gòu)建建模數(shù)據(jù)Xi,Yii=1,2,…,K,求出輸入?yún)?shù)X和輸出參數(shù)Y之間的非線性映射關(guān)系:Yi=fXif:RnR。根據(jù)支持向量機(jī)預(yù)測理論通過求解一個(gè)二次規(guī)劃問題即可求出αi、α*i和b,即可求出所需要的預(yù)測模型。最后把檢驗(yàn)樣本代入進(jìn)行預(yù)測,其結(jié)果見表3所示。

表3預(yù)測結(jié)果

基于粗糙集-支持向量機(jī)的應(yīng)急物資需求預(yù)測結(jié)果如圖3所示。由表3和圖3可見,采用基于粗糙集與支持向量機(jī)的預(yù)測模型對連鎖零售企業(yè)應(yīng)急物資需求進(jìn)行預(yù)測,達(dá)到了很高的預(yù)測精度,其最大誤差為5.71%,最小誤差為0.60%,平均誤差分別為2.84%。

圖3基于粗糙集-支持向量機(jī)的應(yīng)急物資需求預(yù)測結(jié)果

相關(guān)文章
相關(guān)期刊
毛片视频网站在线观看| 成人黄色免费在线观看| 国产精品无码免费专区午夜| 男人操女人的视频网站| 日本在线观看www| 91久久夜色精品国产按摩| 中文字幕视频一区二区三区久| 日韩在线观看网址| 青青草视频在线视频| 日本三级欧美三级| 日韩伦理福利| 日韩av电影免费观看高清完整版| 精品视频在线看| 国产精品福利视频| 国产精品高清无码在线观看| 美女做暖暖视频免费在线观看全部网址91| 日韩精品一区二区三区免费观影| 亚洲日本中文字幕区| 国外成人在线视频| 国产高潮免费视频| 囯产精品久久久久久| 麻豆一区一区三区四区| 国产精品美女久久久久久久网站| 大量国产精品视频| 无码人妻精品一区二区三区在线| 中文字幕在线观看精品| 国产精品毛片aⅴ一区二区三区| 大桥未久av一区二区三区中文| 亚洲美女免费精品视频在线观看| 日本成人性视频| 极品国产91在线网站| www.久久| 久久精品欧美日韩精品| 欧美黑人视频一区| 日韩高清第一页| 日韩写真在线| 久久精品亚洲人成影院| 在线观看欧美日本| 国精产品一区二区| 久草视频在线免费看| 久久青青视频| 91在线小视频| 久久久久免费精品国产| 日本在线播放一区二区| 一二三在线视频社区| 91久久久精品国产| 欧美日韩一区二区在线观看视频| 国产日韩欧美二区| 美女福利视频在线观看| 欧美日韩美女| 久久一区二区三区四区| 久久久久日韩精品久久久男男| 超碰成人在线播放| 午夜影院在线观看视频| 国产精品激情电影| 日韩欧美的一区| 裸体裸乳免费看| 国产又粗又大又黄| 神马电影久久| 欧美亚洲动漫制服丝袜| 日本不卡一区| 中文字幕激情视频| 久久综合色占| 91福利在线播放| 亚洲aⅴ天堂av在线电影软件| 最新中文字幕一区| 日韩精品免费一区二区三区竹菊| 亚洲电影一区二区三区| 国产在线精品日韩| 国产又大又黄又粗| 日本午夜精品久久久| 欧美日韩另类字幕中文| 欧美成人综合一区| 瑟瑟视频在线免费观看| 精品中文一区| 欧美主播一区二区三区美女| 视频在线99re| www.色视频| 欧美成人69| 亚洲黄页网在线观看| 麻豆传传媒久久久爱| 麻豆国产在线播放| 国精产品一区一区三区mba桃花| 久久国产一区二区三区| 亚洲美女精品视频| sm在线播放| 久久久国产精品麻豆| 国产日韩av在线播放| 亚洲国产精品免费在线观看| 久久久久久久久久久久电影| 精品国产1区2区| 无遮挡亚洲一区| 精品国产99久久久久久宅男i| 久久久久午夜电影| 日韩精品免费在线视频观看| 精品少妇无遮挡毛片| jizzjizz在线观看| 成人av在线资源网站| 国产成人97精品免费看片| 精品自拍偷拍视频| 国产伦乱精品| 欧美日韩午夜在线视频| 日韩黄色短视频| 九色在线播放| 成人不卡免费av| 国产综合色香蕉精品| 日本学生初尝黑人巨免费视频| 日韩美女精品| 日韩精品一区二区三区视频在线观看| 黄色动漫网站入口| 欧美人xxx| 91蝌蚪porny| 69堂成人精品视频免费| 看黄色一级大片| 亚洲欧美网站在线观看| 亚洲色图五月天| 理论片大全免费理伦片| 国产韩日精品| 日韩欧美成人网| 成人免费播放器| 视频免费一区| 国产日韩精品一区二区三区 | 小小水蜜桃在线观看| 国产原创一区二区| 国产精品自产拍在线观看中文| 五月天婷婷综合网| 亚洲成人国产| 日韩小视频网址| 色综合99久久久无码国产精品| 日本精品在线播放 | 亚洲精品国产无码| 国产精品黄色| 欧美国产精品va在线观看| 无码人妻精品中文字幕| 亚洲人成精品久久久 | 日韩精品伦理第一区| 360天大佬第二季在线观看| 国产一区二区三区久久悠悠色av| 国产男人精品视频| 中文资源在线播放| 美女精品在线| 国产99在线|中文| 51国产偷自视频区视频| 尤物在线精品| 国产91成人video| 天天综合天天干| 最新亚洲视频| 国产91精品久久久久久| 亚洲s码欧洲m码国产av| 99视频一区| 日本一区二区三区在线播放| 日本中文字幕久久| 免费欧美日韩| 国产欧美精品日韩精品| 国产精品自产拍| 精彩视频一区二区三区| 成人午夜黄色影院| 亚洲男人天堂久久| 国产91综合一区在线观看| 国产精品国产三级国产专区53| 三级视频在线看| 成人aa视频在线观看| 欧美高清性xxxxhdvideosex| 午夜成人影视| 欧美国产欧美亚州国产日韩mv天天看完整 | 老熟妇一区二区| 国产午夜一区| 不卡中文字幕av| 久久国产视频播放| 日韩综合小视频| 97视频资源在线观看| 日本精品999| 久久女同精品一区二区| 在线不卡视频一区二区| a级网站在线播放| 欧美日韩国产色视频| 999精彩视频| 日韩激情综合| 国产亚洲激情视频在线| 日本少妇高清视频| 亚洲国产一区二区三区高清| 国产精品h片在线播放| 精品人妻一区二区三区日产乱码| 国产成人久久精品77777最新版本| 久久亚洲综合网| 欧美三级电影一区二区三区| 欧美日韩精品国产| 日本成人在线免费观看| 粉嫩久久久久久久极品| 色婷婷**av毛片一区| 国产精品一区二区6| 日本美女一区二区三区视频| 国产精品乱码视频| 国产精品一区在线看| 亚洲一卡二卡三卡四卡无卡久久| 欧美黑人又粗又大又爽免费| 免费成人毛片| 亚洲性无码av在线| 免费观看一区二区三区毛片| 日韩av电影免费观看高清完整版| 国产精品一区二区不卡视频| 懂色av中文在线| 欧美日韩激情视频| 日本少妇毛茸茸| 欧美一区亚洲| 成人国产精品一区二区| 日本在线三级| 亚洲地区一二三色| 国产精品果冻传媒| 水蜜桃精品av一区二区| 日韩av片永久免费网站| 午夜性色福利影院| 亚洲色图第一区| 国产亚洲视频一区| 久久91精品| 国产成人精品免费视频| 中文在线一二区| 欧美日韩国产黄| 亚洲欧美日本一区| 欧美三级视频| 国产精品一区在线播放| av网站网址在线观看| 欧美一级在线视频| 久久国产露脸精品国产| 老司机精品视频导航| 亚洲欧美日韩国产成人综合一二三区| av漫画网站在线观看| 亚洲福利在线视频| 中日韩黄色大片| 不卡在线观看av| 缅甸午夜性猛交xxxx| 亚洲精品a区| 久久人人爽人人爽人人片av高请| 性中国古装videossex| 亚洲日本在线看| 夜夜爽久久精品91| 亚洲国产一区二区在线观看| 5g国产欧美日韩视频| 国产在线激情| 亚洲精品一区二区三区蜜桃下载| 日韩欧美一区二区一幕| 丁香亚洲综合激情啪啪综合| 日韩欧美国产综合在线| 精品国产导航| 国产精品久久久久9999| 国产对白叫床清晰在线播放| 在线成人免费视频| 日本三级视频在线| www国产亚洲精品久久麻豆| 中文字幕在线观看第三页| 精品在线播放| 亚洲一区免费网站| 欧美人与性动交α欧美精品图片| 亚洲国产日韩欧美在线99| 久久永久免费视频| 中文字幕在线一区| 好吊色视频一区二区三区| 国产日韩精品视频一区二区三区 | 青青草观看免费视频在线| 欧美亚一区二区| 久久精品这里只有精品| av电影在线观看一区| 亚洲欧美久久久久| 欧美暴力喷水在线| 色就是色欧美| 免费一级欧美在线大片| 日韩av男人的天堂| 在线观看麻豆蜜桃| 日韩av影视综合网| 99久久精品国产一区二区成人| 亚洲最大成人综合| 男女男精品视频网站| 久久99这里只有精品| 一区二区传媒有限公司| 精品国产一区二区三区久久久樱花| 91久久精品国产91久久| www.51av欧美视频| 九九九久久久久久| 欧美挠脚心网站| 精品国内片67194| 国产精品久久久久久久免费看| 亚洲免费观看高清完整版在线| 韩国三级hd中文字幕| 国产精一品亚洲二区在线视频| 成人亚洲视频在线观看| 午夜精品剧场| 正在播放91九色| 香蕉国产成人午夜av影院| 97超碰人人看人人| 色综合天天色| 日本欧美中文字幕| 久久不射影院| 久久综合久中文字幕青草| 日韩资源在线| 亚洲国产一区二区三区四区 | 欧美在线免费播放| 久久国产视频精品| 亚洲电影第三页| 一级aaa毛片| 亚洲精品国产精华液| 男人在线观看视频| 久久精品免费在线观看| 久久丫精品国产亚洲av不卡| 国产自产视频一区二区三区| 成 人 黄 色 小说网站 s色| 亚洲欧美日韩视频二区| 尤物av无码色av无码| 欧美成人午夜| 免费cad大片在线观看| 青草国产精品| 国产精品jizz在线观看老狼| 亚洲综合图色| 五月天久久狠狠| 国产欧美亚洲精品a| 日本精品一区二区三区视频| 黄色网一区二区| 日本日本精品二区免费| 亚洲第一二三区| 日韩高清专区| 欧美精品一区二区三区精品| 视频一区二区在线观看| 国产一区二区区别| 亚洲日本无吗高清不卡| 红桃视频在线观看一区二区| 日韩久久精品一区二区三区| 亚洲永久精品唐人导航网址| 日韩精品久久一区| 狠狠综合久久av一区二区蜜桃| 水蜜桃亚洲精品| 国产国产精品| 妞干网在线观看视频| 在线不卡视频| 日韩不卡一二三| 国产美女高潮在线观看| 午夜欧美一区二区三区在线播放| 精品无码黑人又粗又大又长| 亚洲精选在线视频| 亚洲国产成人精品激情在线| 亚洲国产精品麻豆| 婷婷激情五月综合| 欧美熟乱第一页| 囯产精品一品二区三区| 日韩高清a**址| 成人亚洲综合天堂| 欧美激情18p| 少妇视频一区| 成人精品在线观看| 日韩激情欧美| 午夜精品福利一区二区| 欧美黄色大片在线观看| 国产妇女馒头高清泬20p多| 亚洲综合国产激情另类一区| 亚洲国产成人va在线观看麻豆| 激情六月婷婷久久| 国产黄色三级网站| 写真福利理论片在线播放| 亚洲最新av在线网站| 久草资源在线| 国产精品极品在线| 欧美视频三区| 亚洲一区二区三区加勒比 | 欧美午夜精品理论片a级按摩| 亚洲精品久久久蜜桃动漫| 精品小视频在线| 黄视频在线观看网站| 日韩美女中文字幕| 视频国产精品| 欧美成人明星100排名| 亚洲午夜久久久久久久| 国产美女在线观看| 国产精品88a∨| 2021年精品国产福利在线| 亚洲一区二区不卡视频| 狠狠色丁香久久综合频道| 日本中文字幕观看| 久久久99久久精品欧美| 日韩久久久久久久久| 欧美精品在线一区二区三区| 在线免费av观看| 午夜精品一区二区三区在线视 | 国模吧一区二区三区| 欧美综合影院| 亚洲国产综合自拍| 美女日韩在线中文字幕| 五月婷婷综合在线观看| 一区二区三区四区视频精品免费 | 久久国产综合精品| 中文天堂资源在线| 欧美日韩亚洲精品一区二区三区| 蜜桃视频久久一区免费观看入口| 久久精彩免费视频| 国产在视频一区二区三区吞精| 色综合久久88色综合天天提莫| 日韩亚洲国产欧美| 色无极影院亚洲| 色老汉一区二区三区| 在线观看中文字幕| 国产91色在线|免| 国产中文精品久高清在线不| 亚洲成人福利在线观看|