時(shí)間:2023-07-24 16:25:59
引言:易發(fā)表網(wǎng)憑借豐富的文秘實(shí)踐,為您精心挑選了九篇數(shù)據(jù)分析的方法范例。如需獲取更多原創(chuàng)內(nèi)容,可隨時(shí)聯(lián)系我們的客服老師。

關(guān)鍵詞:數(shù)據(jù)分析應(yīng)用率;分析應(yīng)用點(diǎn);四個(gè)層次;數(shù)據(jù)中心;儀表盤
中圖分類號:N37 文獻(xiàn)標(biāo)識碼:B 文章編號:1009-9166(2009)02(c)-0063-02
現(xiàn)代企業(yè)的決策往往是在整合大量信息資料的基礎(chǔ)上制定出來的,對數(shù)據(jù)的理解和應(yīng)用將是企業(yè)決策的基石。與傳統(tǒng)的操作型應(yīng)用相比,數(shù)據(jù)利用的應(yīng)用建設(shè)難度更大,它是隨著管理水平而發(fā)展,同時(shí)又取決于業(yè)務(wù)人員的主觀意識,這就決定了以數(shù)據(jù)利用為核心的應(yīng)用建設(shè)不可能一蹴而就,而是一個(gè)長期迭展的建設(shè)過程。從2003年起工廠開始全面推進(jìn)數(shù)據(jù)分析應(yīng)用工作,經(jīng)歷過曲折,同時(shí)也有收獲。經(jīng)過多年的努力,工廠的數(shù)據(jù)分析應(yīng)用工作開始進(jìn)入良性發(fā)展階段,筆者認(rèn)為有必要對工廠目前數(shù)據(jù)分析應(yīng)用工作作一總結(jié)和思考。
一、工廠數(shù)據(jù)分析應(yīng)用工作開展現(xiàn)狀
工廠數(shù)據(jù)分析應(yīng)用工作推進(jìn)至今已有四五年的時(shí)間,從最初全面調(diào)研工廠數(shù)據(jù)量和數(shù)據(jù)分析應(yīng)用狀況,將數(shù)據(jù)分析應(yīng)用率指標(biāo)作為方針目標(biāo)定量指標(biāo)來考核,到后來將數(shù)據(jù)分析應(yīng)用工作的推進(jìn)重心從量向質(zhì)轉(zhuǎn)移,采用以項(xiàng)目為載體進(jìn)行管理,著重體現(xiàn)數(shù)據(jù)分析應(yīng)用的實(shí)效性,再到目前以分析應(yīng)用的需求為導(dǎo)向,以分析應(yīng)用點(diǎn)為載體,分層次進(jìn)行策劃。經(jīng)過上述三個(gè)階段,工廠數(shù)據(jù)分析應(yīng)用工作推進(jìn)機(jī)制得到了逐步的完善,形成了廣度深度協(xié)同發(fā)展的信息資源利用管理框架。截止到目前,工廠數(shù)據(jù)分析應(yīng)用率達(dá)到96%,四個(gè)層次的分析應(yīng)用點(diǎn)共計(jì)100多個(gè),數(shù)據(jù)分析應(yīng)用工作在生產(chǎn)、質(zhì)量、成本、物耗、能源等條線得到廣泛開展,有效推動(dòng)了工廠管理數(shù)字化和精細(xì)化。2007年,工廠開始探索細(xì)化四個(gè)應(yīng)用層次的推進(jìn)脈絡(luò),進(jìn)一步豐富工廠信息資源利用框架,形成層次清晰、脈絡(luò)鮮明、職責(zé)分明的信息資源利用立體化的推進(jìn)思路。
1、第一層次現(xiàn)場監(jiān)控層。第一層次現(xiàn)場監(jiān)控層,應(yīng)用主體是一線工人和三班管理干部,應(yīng)用對象是生產(chǎn)過程實(shí)時(shí)數(shù)據(jù),應(yīng)用目標(biāo)是通過加強(qiáng)生產(chǎn)過程控制,輔助一線及時(shí)發(fā)現(xiàn)生產(chǎn)過程中的異常情況,提高生產(chǎn)穩(wěn)定性。例如制絲車間摻配工段的生產(chǎn)報(bào)警,通過對生產(chǎn)過程中葉絲配比、膨絲配比、梗絲配比、薄片配比、加香配比等信息進(jìn)行判異操作,對異常情況通過語音報(bào)警方式提醒擋車工進(jìn)行異常處理;例如卷包車間通過在機(jī)臺電腦上對各生產(chǎn)機(jī)組的工藝、設(shè)備參數(shù)、實(shí)時(shí)產(chǎn)量、質(zhì)量、損耗數(shù)據(jù)的監(jiān)控,提高對產(chǎn)品質(zhì)量的過程控制能力。第一層次應(yīng)用以上位機(jī)和機(jī)臺電腦上固化的監(jiān)控模型為主,制絲車間每個(gè)工序、卷包車間每種機(jī)型的應(yīng)用點(diǎn)都有所不同,為此我們建立了制絲車間以工序?yàn)槊}絡(luò),卷包車間以機(jī)種為脈絡(luò)的應(yīng)用點(diǎn)列表,圍繞脈絡(luò)對第一層次應(yīng)用點(diǎn)進(jìn)行梳理,形成第一層次應(yīng)用的規(guī)范化模板。制絲車間第一層次應(yīng)用點(diǎn)模板包括工序名稱、應(yīng)用點(diǎn)名稱、應(yīng)用模型描述、應(yīng)用對象、應(yīng)用平臺、異常處置路徑等基本要素。卷包車間應(yīng)用點(diǎn)模板橫向根據(jù)機(jī)種分,縱向按上班及交接班、上班生產(chǎn)過程中、下班及交接班三個(gè)時(shí)間段分,通過調(diào)研分別列出擋車工針對每個(gè)機(jī)種在三個(gè)時(shí)間段分別要查看的數(shù)據(jù)和進(jìn)行的操作。隨著模板的擴(kuò)充和完善,一線職工的知識、經(jīng)驗(yàn)不斷充實(shí)其中,第一層次應(yīng)用點(diǎn)模板將成為一線工人和三班管理干部日常應(yīng)用監(jiān)控的標(biāo)準(zhǔn),同時(shí)可以規(guī)避人員退休或調(diào)動(dòng)帶來的經(jīng)驗(yàn)、知識流失的風(fēng)險(xiǎn)。2、第二層次日常管理分析層。第二層次日常管理分析層,應(yīng)用主體是一般管理干部,應(yīng)用對象是產(chǎn)質(zhì)損、設(shè)備、動(dòng)能等指標(biāo),應(yīng)用目標(biāo)是通過加強(qiáng)對各類考核指標(biāo)的監(jiān)控和分析,提高工廠整體的關(guān)鍵績效指標(biāo)水平。例如制絲車間的劣質(zhì)成本數(shù)據(jù)匯總和分析,通過對車間內(nèi)各類廢物料、劣質(zhì)成本的數(shù)據(jù)進(jìn)行匯總、對比和分析,尋找其中規(guī)律及薄弱環(huán)節(jié),并尋根溯源,采取措施,降低劣質(zhì)成本。例如卷包車間的產(chǎn)量分析,通過對產(chǎn)量數(shù)據(jù)、工作日安排、計(jì)劃產(chǎn)量進(jìn)行統(tǒng)計(jì)和匯總,結(jié)合車間定額計(jì)劃、作業(yè)計(jì)劃和實(shí)際產(chǎn)量進(jìn)行分析,尋找實(shí)際生產(chǎn)情況與計(jì)劃間的差異,并分析原因。第二層次應(yīng)用以管理人員個(gè)性化的分析為主,呈現(xiàn)出分析方法多樣化、應(yīng)用工具多樣化的特點(diǎn)。但是萬變不離其中的是每個(gè)管理崗位的管理目標(biāo)以及圍繞管理目標(biāo)開展的分析應(yīng)用是相對固定的,至少在短期內(nèi)不會(huì)有太大的變化。為此我們建立了一份以重點(diǎn)崗位為脈絡(luò)的應(yīng)用點(diǎn)列表,圍繞脈絡(luò)對第二層次應(yīng)用點(diǎn)進(jìn)行梳理,形成第二層次應(yīng)用的規(guī)范化模板。模板包括崗位名稱、管理目標(biāo)、應(yīng)用點(diǎn)名稱、應(yīng)用描述、涉及主要考核指標(biāo)、應(yīng)用平臺、應(yīng)用頻次、分析去向等基本要素。通過構(gòu)建第二層次應(yīng)用點(diǎn)模板,明確了每個(gè)管理崗位應(yīng)用信息資源支撐管理目標(biāo)的內(nèi)容和職責(zé)。隨著新的管理目標(biāo)的不斷提出以及應(yīng)用的逐步深入,模板每年都會(huì)有更新和擴(kuò)充。3、第三層次針對性分析應(yīng)用層。第三層次針對性分析應(yīng)用層,應(yīng)用主體是項(xiàng)目實(shí)施者,應(yīng)用對象是各類項(xiàng)目的實(shí)施過程,例如QC項(xiàng)目、六西格瑪項(xiàng)目、質(zhì)量改進(jìn)項(xiàng)目,或針對生產(chǎn)中的特定事件進(jìn)行的分析和研究。應(yīng)用目標(biāo)是通過應(yīng)用數(shù)據(jù)資源和統(tǒng)計(jì)方法開展現(xiàn)狀調(diào)查、因果分析、效果驗(yàn)證等工作,提高各類項(xiàng)目實(shí)施的嚴(yán)密性和科學(xué)性。第三層次的應(yīng)用工具在使用初級統(tǒng)計(jì)方法的基礎(chǔ)上會(huì)大量應(yīng)用包括方差分析、回歸分析、正交試驗(yàn)、假設(shè)檢驗(yàn)、流程圖等在內(nèi)的中級統(tǒng)計(jì)方法。以QC活動(dòng)為例,我們可以看出其實(shí)施過程無一不與數(shù)據(jù)應(yīng)用之間有密切的聯(lián)系[1]。近年來,在質(zhì)量改進(jìn)項(xiàng)目和QC項(xiàng)目的評審工作中已逐步將“應(yīng)用數(shù)據(jù)說話、運(yùn)用用正確合理的統(tǒng)計(jì)方法,提高解決問題的科學(xué)性”作為項(xiàng)目質(zhì)量考核標(biāo)準(zhǔn)之一。而六西格瑪項(xiàng)目實(shí)施的核心思想更是強(qiáng)調(diào)“以數(shù)據(jù)和事實(shí)驅(qū)動(dòng)管理”,其五個(gè)階段[2]D(定義)、M(測量)、A(分析)、I(改善)、C(控制),每個(gè)階段都要求結(jié)合如FMEA(失效模式后果分析),SPC(統(tǒng)計(jì)流程控制),MSA(測量系統(tǒng)分析),ANOVE(方差分析),DOE(實(shí)驗(yàn)設(shè)計(jì))等統(tǒng)計(jì)方法和統(tǒng)計(jì)工具的應(yīng)用。4、第四層次主題性應(yīng)用層。第四層次主題性應(yīng)用層,應(yīng)用主體是中層管理者,應(yīng)用對象是專業(yè)性或綜合性的分析主題,應(yīng)用目標(biāo)是通過專業(yè)科室設(shè)計(jì)的專題性分析模型或綜合性分析模型,為中層管理層提供決策依據(jù)。工廠在實(shí)施了業(yè)務(wù)流程“自動(dòng)化”之后,產(chǎn)生了大量的數(shù)據(jù)和報(bào)表。如何將工廠的業(yè)務(wù)信息及時(shí)、精煉、明確地陳述給中層管理層,以此來正確地判斷工廠的生產(chǎn)經(jīng)營狀況,是擺在我們眼前的一個(gè)突出問題。大家都有開車的經(jīng)驗(yàn),司機(jī)在駕駛車輛的時(shí)候,他所掌握的車況基本上是來自汽車的儀表盤,在車輛行使的過程中,儀表盤指針的變化,告知汽車的車速、油料、水溫等的狀況,駕駛員只要有效地控制這些指標(biāo)在安全范圍之內(nèi),車子就能正常地運(yùn)行。我們不妨將儀表盤的理念移植于工廠,建立工廠關(guān)鍵指標(biāo)及運(yùn)行管理儀表盤,將工廠的關(guān)鍵信息直觀地列在上面,及時(shí)提醒各級管理人員工廠生產(chǎn)運(yùn)營是否正常。
⑴關(guān)鍵績效指標(biāo)監(jiān)控系統(tǒng)。對分布在各處的當(dāng)前及歷史數(shù)據(jù)進(jìn)行統(tǒng)一展示,以工廠關(guān)鍵績效指標(biāo)為中心,支持統(tǒng)計(jì)分析和挖掘,可為中層管理者提供工廠關(guān)鍵績效指標(biāo)一門式的查詢服務(wù),使各業(yè)務(wù)部門尋找、闡釋問題產(chǎn)生的原因,以有效監(jiān)控各類關(guān)鍵績效指標(biāo),及時(shí)采取改進(jìn)措施,提高生產(chǎn)經(jīng)營目標(biāo)完成質(zhì)量。⑵系統(tǒng)運(yùn)行狀態(tài)監(jiān)控系統(tǒng)。通過數(shù)據(jù)采集、手工錄入等各種渠道收集各類系統(tǒng)的運(yùn)行狀態(tài),及時(shí)掌握故障情況,采取措施加以閉環(huán),將因系統(tǒng)故障造成對用戶的影響減至最小,確保各類系統(tǒng)的穩(wěn)定運(yùn)行和有效應(yīng)用。通過建立系統(tǒng)運(yùn)行狀態(tài)監(jiān)控系統(tǒng),中層管理人員上班一打開電腦進(jìn)入系統(tǒng),就能了解到當(dāng)天及上一天各類系統(tǒng)的運(yùn)轉(zhuǎn)情況,發(fā)生了什么異常,哪些故障已經(jīng)得到解決,哪些故障還未解決。⑶第四層次主題性分析應(yīng)用。在展示關(guān)鍵績效指標(biāo)和系統(tǒng)運(yùn)行狀態(tài)的基礎(chǔ)上,由各專業(yè)科室思考專業(yè)條線上的分析主題,采用先進(jìn)科學(xué)的理念和方法對數(shù)據(jù)進(jìn)行分析和挖掘。近兩年來,工廠充分發(fā)揮專業(yè)科室的優(yōu)勢和力量,相繼設(shè)計(jì)和開發(fā)了工藝質(zhì)量條線的六西格瑪測評系統(tǒng),設(shè)備條線的設(shè)備效能分析系統(tǒng),還有質(zhì)量成本核算與分析系統(tǒng)。通過這些分析主題的支持,工廠管理人員可以更方便快捷地了解質(zhì)量、設(shè)備、成本等條線上的關(guān)鍵信息,及時(shí)采取相應(yīng)措施,從而提升管理效率。
二、數(shù)據(jù)分析應(yīng)用工作存在的不足及思考
工廠數(shù)據(jù)分析應(yīng)用工作的推進(jìn)方法從最初的采用數(shù)據(jù)分析應(yīng)用率單個(gè)指標(biāo)進(jìn)行推進(jìn)發(fā)展到目前按上文所述的四個(gè)層次進(jìn)行推進(jìn),每個(gè)層次的推進(jìn)脈絡(luò)已經(jīng)逐步清晰和明朗,但事物發(fā)展到一定的階段總會(huì)達(dá)到一個(gè)瓶頸口,目前工廠數(shù)據(jù)分析應(yīng)用工作存在的問題及措施思考如下:
1、從推進(jìn)手段上要突破信息條線,充分發(fā)揮專業(yè)條線的力量。信息條線作為推進(jìn)工廠數(shù)據(jù)分析應(yīng)用的主管條線,其作用往往局限在技術(shù)層面上的支撐。雖然信息條線每年都會(huì)規(guī)劃形成工廠數(shù)據(jù)分析應(yīng)用整體的工作思路和具體的實(shí)施計(jì)劃,但是無論從工廠層面還是從車間層面來講,單純依靠信息條線從側(cè)面加以引導(dǎo)和推進(jìn),使得數(shù)據(jù)分析應(yīng)用工作始終在業(yè)務(wù)條線的邊緣徘徊,與產(chǎn)量、質(zhì)量、設(shè)備、消耗、成本、動(dòng)能等各個(gè)條線本身工作的結(jié)合度有一定的距離。所以工廠要進(jìn)一步推進(jìn)數(shù)據(jù)分析應(yīng)用工作,調(diào)動(dòng)起業(yè)務(wù)人員的積極性和主動(dòng)性,突破現(xiàn)有的瓶頸,應(yīng)該考慮如何調(diào)動(dòng)起專業(yè)條線的力量。一是可以在年初策劃應(yīng)用點(diǎn)的時(shí)候要加強(qiáng)專業(yè)條線對車間業(yè)務(wù)自上而下的指導(dǎo),引導(dǎo)管理人員加強(qiáng)對缺少數(shù)據(jù)分析支撐的工序、崗位/管理目標(biāo)的思考;二是建立平臺加強(qiáng)各車間同性質(zhì)崗位之間的溝通與交流,均衡各個(gè)車間的數(shù)據(jù)分析應(yīng)用水平和能力;三是對車間提交的分析報(bào)告給出專業(yè)性的指導(dǎo)意見。2、要加強(qiáng)對數(shù)據(jù)中心的應(yīng)用。數(shù)據(jù)中心的建立可以使業(yè)務(wù)系統(tǒng)從報(bào)表制作、數(shù)據(jù)導(dǎo)出等功能中解放出來,專注于事務(wù)處理,將數(shù)據(jù)應(yīng)用方面的功能完全交給數(shù)據(jù)中心來解決。目前,數(shù)據(jù)中心已建立了涉及產(chǎn)量、質(zhì)量、消耗等各個(gè)條線的Universe模型,并對全廠管理干部進(jìn)行了普及性的培訓(xùn)。但是從目前應(yīng)用情況來看,還比較局限于個(gè)別管理人員,追尋原因如下:一是業(yè)務(wù)系統(tǒng)開發(fā)根據(jù)用戶需求定制開發(fā)報(bào)表,業(yè)務(wù)人員通常習(xí)慣于從現(xiàn)成的報(bào)表中獲取信息。如果要求業(yè)務(wù)人員使用數(shù)據(jù)中心工具自行制作報(bào)表模板,甚至可能需要將其導(dǎo)出再作二次處理,那么業(yè)務(wù)人員一定更傾向于選擇第一種方式。二是近幾年來人員更替較多,新進(jìn)管理人員不熟悉數(shù)據(jù)中心應(yīng)用,導(dǎo)致數(shù)據(jù)中心應(yīng)用面受到限制。隨著今后MES的建設(shè),業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)、報(bào)表、臺帳和分析功能將有可能由業(yè)務(wù)用戶自行通過集成在MES中的數(shù)據(jù)中心前端開發(fā)工具來訪問和靈活定制。因此,要盡快培養(yǎng)工廠業(yè)務(wù)人員數(shù)據(jù)中心的應(yīng)用能力,包括數(shù)據(jù)獲取以及報(bào)表定制方面的技能。筆者認(rèn)為應(yīng)對方法如下:一是對于崗位人員變更做好新老人員之間一傳一的交接和培訓(xùn);二是適時(shí)針對新進(jìn)管理人員開展集中培訓(xùn);三是通過采用一定的考核方法。3、提高新增應(yīng)用點(diǎn)的質(zhì)量。工廠每年都會(huì)組織各部門審視第一、第二層次應(yīng)用點(diǎn)列表,圍繞重點(diǎn)工序和重點(diǎn)管理崗位調(diào)研有哪些應(yīng)用上的空白點(diǎn)是需要重點(diǎn)思考的,以新增分析應(yīng)用點(diǎn)的方式進(jìn)行申報(bào)和實(shí)施。同時(shí)針對第三層次針對性分析應(yīng)用,工廠也會(huì)要求部門以新增分析應(yīng)用點(diǎn)的方式將需要數(shù)據(jù)支撐的項(xiàng)目進(jìn)行申報(bào)。作為一項(xiàng)常規(guī)性工作,工廠每年都會(huì)組織部門進(jìn)行應(yīng)用點(diǎn)的申報(bào),并按項(xiàng)目管理的思想和方法實(shí)施,事先確立各個(gè)應(yīng)用點(diǎn)的應(yīng)用層次、數(shù)據(jù)獲取方式、實(shí)現(xiàn)平臺,并對其實(shí)施計(jì)劃進(jìn)行事先的思考和分解,確定每一個(gè)階段的活動(dòng)目標(biāo)、時(shí)間節(jié)點(diǎn)以及負(fù)責(zé)人員,每個(gè)季度對實(shí)施情況予以總結(jié),并動(dòng)態(tài)更新下一階段的實(shí)施計(jì)劃。該項(xiàng)工作從2005年起已經(jīng)連續(xù)開展了三年,部門可供挖掘的應(yīng)用點(diǎn)越來越少,如何調(diào)動(dòng)部門的積極性,保持并提高應(yīng)用點(diǎn)的實(shí)效性,我們有必要對新增分析應(yīng)用點(diǎn)的質(zhì)量和實(shí)施情況進(jìn)行考評,考評標(biāo)準(zhǔn)為:一是新增分析應(yīng)用點(diǎn)是否能體現(xiàn)數(shù)據(jù)應(yīng)用開展的進(jìn)取性、開拓性和創(chuàng)新性;二是新增分析應(yīng)用點(diǎn)是否能切實(shí)提高管理的精細(xì)化和科學(xué)化水平;三是新增分析應(yīng)用點(diǎn)是否能采用項(xiàng)目管理的思想和方法實(shí)施,按時(shí)間節(jié)點(diǎn)完成各項(xiàng)預(yù)定計(jì)劃。
三、結(jié)束語。隨著近幾年來技術(shù)平臺的相繼成熟以及管理手段的逐步推進(jìn),工廠業(yè)務(wù)人員用數(shù)據(jù)說話的意識已經(jīng)越來越強(qiáng),但是要真正使工廠管理達(dá)到“三分技術(shù)、七分管理、十二分?jǐn)?shù)據(jù)”的水平,還有很長的路要走,這既需要我們的業(yè)務(wù)人員從自身出發(fā)提高應(yīng)用數(shù)據(jù)的水平和能力,同時(shí)也需要工廠從管理手段和管理方法上不斷拓寬思路、創(chuàng)新手段,真正實(shí)現(xiàn)數(shù)據(jù)分析應(yīng)用成為工廠管理的重要支撐手段。
作者單位:上海卷煙廠
參考文獻(xiàn):
關(guān)鍵詞:粗糙集理論;數(shù)據(jù)分析方法;信息系統(tǒng);決策表;屬性約簡
中圖分類號:TP18 文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2007)06-11651-01
1 引言
粗糙集(Rough Set)理論[1]是波蘭數(shù)學(xué)家Z.Pawlak于1982年提出的,它建立在完善的數(shù)學(xué)基礎(chǔ)之上,是一種新的處理含糊性和不確定性問題的數(shù)學(xué)工具。其主要思想是在保持分類能力不變的前提下,通過知識約簡,導(dǎo)出問題的決策或分類規(guī)則[2]。由于粗糙集理論不需要任何預(yù)備或額外的有關(guān)數(shù)據(jù)信息,使得粗糙集理論成為研究熱點(diǎn)之一,被廣泛應(yīng)用與知識發(fā)現(xiàn)、機(jī)器學(xué)習(xí)、決策分析、模式識別、專家系統(tǒng)和數(shù)據(jù)挖掘等領(lǐng)域。
屬性約簡是粗糙集理論中核心研究內(nèi)容之一[3]。在眾多的屬性約簡算法中,大致可以分為兩類:一類是基于信息熵的啟發(fā)式算法[4],這類算法往往不能得到系統(tǒng)的所有約簡.另一類是基于區(qū)分矩陣和區(qū)分函數(shù)構(gòu)造的算法[5],這種算法直觀,易于理解,能夠計(jì)算出所有約簡。但在區(qū)分矩陣中會(huì)出現(xiàn)大量的重復(fù)元素,造成時(shí)間和空間的浪費(fèi),從而降低了屬性約簡算法的效率。
本文基于數(shù)據(jù)分析方法[6]的屬性簡約算法是在保持分類能力不變的前提下,逐個(gè)約去冗余的屬性,直到不再有冗余的屬性,此時(shí)得到的屬性集是最小屬性集,即為約簡。該算法簡單,能夠求出所有約簡,不會(huì)出現(xiàn)區(qū)分矩陣中大
量的重復(fù)元素,從而提高了屬性約簡的效率。
2 粗糙集概念
定義2.1設(shè)U為所討論對象的非空有限集合,稱為論域;R為建立在U上的一個(gè)等價(jià)關(guān)系族,稱二元有序組S=(U,R)為近似空間。
定義2.2令R為等價(jià)關(guān)系族,設(shè)P?哿R,且P≠?I,則P中所有等價(jià)關(guān)系的交集稱為P上的不可分辨關(guān)系,記作IND(P),即有:[x] IND(P)= ∩ [x]R,顯然IND(P)也是等價(jià)關(guān)系。
定義2.3稱4元有序組K=(U,A,V,f)為信息系統(tǒng),其中U為所考慮對象的非空有限集合,稱為論域;A為屬性的非空有限集合;V=∪Va,Va為屬性a的值域;f:U×AV是一個(gè)信息函數(shù),?坌x∈U,a∈A,f(x,a)∈Va。對于給定對象x,f(x,a)賦予對象x在屬性a下的屬性值。信息系統(tǒng)也可簡記為K=(U,A)。若A=C∪D且C∩D=?I,則S稱,為決策表,其中C為條件屬性集,D為決策屬性集。
顯然,信息系統(tǒng)中的屬性與近似空間中的等價(jià)關(guān)系相對應(yīng)。
定義2.4設(shè)K=(U,A,V,f)為信息系統(tǒng),P?哿A且P≠?I,定義由屬性子集P導(dǎo)出的二元關(guān)系如下:
IND(P)={(x,y)|(x,y)∈U×U且?坌a∈P有f(x,a)=f(y,a)}
則IND(P)也是等價(jià)關(guān)系,稱其為由屬性集P導(dǎo)出的不可分辨關(guān)系。
定義2.5稱決策表是一致的當(dāng)且僅當(dāng)D依賴于C,即IND(C)?哿IND(D),否則決策表是不一致的。一致決策表說明:在不同個(gè)體的條件屬性值相同時(shí),他們的決策屬性值也相同。
定義2.6設(shè)K=(U,A)為一個(gè)信息系統(tǒng)。若P?哿A是滿足IND(P)=IND(A)的極小屬性子集,則稱P為A的一個(gè)約簡,或稱為信息系統(tǒng)的一個(gè)約簡。
定義2.7設(shè)K=(U,CUD)為一個(gè)決策表,其中C為條件屬性集,D為決策屬性,若P?哿C為滿足POSC(D)=POSP(D)的極小屬性子集,則稱P為決策表K的一個(gè)約簡。其中POSC(D)表示決策D關(guān)于屬性集C的正域。
定義2.8數(shù)據(jù)分析方法對于信息系統(tǒng)K=(U,A),逐個(gè)移去A中的屬性,每移去一個(gè)屬性即刻檢查新得到的屬性子集的不可分辨關(guān)系,如果等于IND(A),則該屬性可被約去,否則該屬性不可被約去;對于決策表K=(U,CUD),逐個(gè)移去C中的屬性,每移去一個(gè)屬性即刻檢其決策表,如果不出現(xiàn)新的不一致,則該屬性可被約去,否則該屬性不可被約去。
3 基于數(shù)據(jù)分析方法的屬性簡約算法
3.1 算法思路
利用函數(shù)的遞歸調(diào)用,逐個(gè)判定信息系K=(U,A)中屬性a(a∈A),若IND(A)=ND(A-{a}),則a可以約去,A‘=A-{a},否則a不可以約去,繼續(xù)檢查A‘中的每個(gè)屬性是否能被約去,此過程一直進(jìn)行下去,直到出現(xiàn)某一屬性子集中的每個(gè)屬性都不可約去為止,此時(shí)該屬性子集即為所求的屬性簡約。對于決策表,每次檢查是否增加了不一致的決策規(guī)則,作為是否約去屬性的依據(jù)。
算法如下:
輸入:信息系統(tǒng)K=(U,A)。
輸出:K的屬性約簡。
Match(A') // A’=A-{a}//
begin
for i=1to|U|-1 //|U|表示U的基數(shù)//
for j=i+1to|U|
begin
r=|R|//|R|表示屬性個(gè)數(shù)//
if((f(ui,a1)= f(uj,a1))∧(f(ui,a2)= f(uj,a2))∧….∧(f(ui,ar)= f(uj,ar)))
then a不可被約去,return0
end
a可以被約去return1
end
Reduce (A)
begin
flag=1
for i=1 to |R|//|R|表示屬性個(gè)數(shù)//
begin
a=ai
A'=A-{ai}
if match(A')thenflag =0 , reduce (A’)
if (flag且A未被輸出)then
輸出A中所有元素//flag≠0,說明A中所有元素不可移去,且不會(huì)被重復(fù)輸出//
End
end
以上給出的函數(shù)是求解信息系統(tǒng)的屬性約簡算法;對于決策表,只要將Match(A’)函數(shù)中的if語句的條件換成(f(ui,a1)= f(uj,a1))∧(f(ui,a2)= f(uj,a2))∧….∧(f(ui,ar)= f(uj,ar))∧(f(ui,ag)≠f(uj,ag)),r=|C|是條件屬性個(gè)數(shù),ag是決策屬性。Reduce (A)函數(shù)中|R|換成|C|即可。該算法適用于一致決策表,對非一致決策表,算法類似,也就是逐個(gè)移去屬性并檢查決策表是否出現(xiàn)新的不一致,作為約去此屬性的依據(jù)。
4 舉例
文獻(xiàn)[7]中決策表1,a,b,c,d,e是條件屬性,g是決策屬性,求出的約簡是{a,b,d}
應(yīng)用本算法,求得的屬性約簡為{a,e}和{a,b,d},得到?jīng)Q策簡化表2和表3。
表1 決策表表2簡化表表3簡化表
如果將決策表表1看作一信息系統(tǒng),運(yùn)用本算法,求得的屬性約簡有{c,d,e,g}, {b,e,g}, {a,c,d,g}, {a,c,d,e}, {a,b,g}, {a,b,e}h和{a,b,d}
5 結(jié)束語
本文通過數(shù)據(jù)分析方法討論了屬性約簡問題。該算法是基于不可分辨關(guān)系的,具有直觀、易于理解和完備性的特點(diǎn)。當(dāng)屬性和對象都較少時(shí),效率較高,但當(dāng)屬性和對象較多時(shí),計(jì)算的復(fù)雜度較高。實(shí)例表明,該算法是有效的。
參考文獻(xiàn):
[1]PAWLAK z.Rough set[J].International jom:ua ofcomputer and information science,1982,(11):341―356.
[2]張文修,吳偉志,梁吉業(yè)等.粗糙集理論與方法[M].北京:科學(xué)出版社,2001.
[3]Pawlak Z.Slowinski R.Rough set approach to muhiattribute decision analysis.Ivited Review[J].European Journal of Operational Research.1994,72:443-459
[4]王國胤,于洪,楊大春.基于條件信息熵的決策表約簡[J].計(jì)算機(jī)學(xué)報(bào),2002(7):760―765.
[5]Skowron A,Rauszer C.The Discernibility Matrices and Functions in Information Systems[A].I Slowinsk R.ntelligent Decision Support― Handbook of Applications and Advances of the Rough Sets Theory[c].1991,331-362.
[6]劉請.Rough集及Rough推理[M].北京:科學(xué)出版社,2001.
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)分析;數(shù)據(jù)挖掘
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2017)03-0104-02
1 綜述
1.1 簡介
在數(shù)字化時(shí)代,需要新一代系統(tǒng)架構(gòu)提升業(yè)務(wù)創(chuàng)新能力。在新一代系統(tǒng)架構(gòu)中,大數(shù)據(jù)是核心要素。業(yè)務(wù)應(yīng)用能否自主發(fā)現(xiàn)與自助獲得高質(zhì)量的大數(shù)據(jù),就成為業(yè)務(wù)創(chuàng)新成敗的關(guān)鍵。這就要在搭建大數(shù)據(jù)平臺時(shí),就著手大數(shù)據(jù)治理相關(guān)建設(shè)。
1.2 需求和意義
從某種意義上說大數(shù)據(jù)治理架構(gòu)需要以元數(shù)據(jù)為核心、提高大數(shù)據(jù)質(zhì)量、透明化大數(shù)據(jù)資產(chǎn)、自助化數(shù)據(jù)開發(fā)、自動(dòng)化數(shù)據(jù)、智能化數(shù)據(jù)安全,提升大數(shù)據(jù)平臺服務(wù)能力,讓大數(shù)據(jù)平臺變得易使用、易獲得、高質(zhì)量。
但是,目前很多技術(shù)解決方案存在諸多安全和效率隱患:業(yè)務(wù)系統(tǒng)多,監(jiān)管力度大;數(shù)據(jù)量龐大且呈碎片化分布,急需提升大數(shù)據(jù)質(zhì)量;數(shù)據(jù)格式不規(guī)范、難以在短時(shí)間內(nèi)找到所需數(shù)據(jù);數(shù)據(jù)在各階段的應(yīng)用角度不同,需要降低系統(tǒng)間的集成復(fù)雜度。
2 功能設(shè)計(jì)
2.1 總體架構(gòu)
本文講述的數(shù)據(jù)分析方法及實(shí)現(xiàn)技術(shù)是建立在Hadoop/Spark技術(shù)生態(tài)圈的基礎(chǔ)之上,以實(shí)現(xiàn)用戶集成處理、、清理、分析的一個(gè)統(tǒng)一的數(shù)據(jù)處理平臺;按數(shù)據(jù)類別分為線數(shù)據(jù)、歸檔數(shù)據(jù);按數(shù)據(jù)格式分為非結(jié)構(gòu)化數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù);按數(shù)據(jù)模型分類為范式化模型數(shù)據(jù)、維度模型數(shù)據(jù);按數(shù)據(jù)采集頻度分為非實(shí)時(shí)數(shù)據(jù)、準(zhǔn)實(shí)時(shí)數(shù)據(jù)處理架構(gòu);并提供數(shù)據(jù)中心平臺與安全管理方案,為企業(yè)級用戶建立一個(gè)通用數(shù)據(jù)處理和分析中心。如圖1所示。
2.2 在線數(shù)據(jù)
在線數(shù)據(jù)在線通過接口去獲得的數(shù)據(jù),一般要求為秒級或速度更快。首先應(yīng)當(dāng)將數(shù)據(jù)進(jìn)行區(qū)分:在線數(shù)據(jù)、或歸檔數(shù)據(jù)。本平臺中采用:Storm或Spark Streaming框架進(jìn)行實(shí)現(xiàn)。Spark Streaming將數(shù)據(jù)切分成片段,變成小批量時(shí)間間隔處理,Spark抽象一個(gè)持續(xù)的數(shù)據(jù)流稱為DStream(離散流),一個(gè)DStream是RDD彈性分布式數(shù)據(jù)集的micro-batch微批次,RDD是分布式集合能夠并行地被任何函數(shù)操作,也可以通過一個(gè)滑動(dòng)窗口的數(shù)據(jù)進(jìn)行變換。
2.3 歸檔數(shù)據(jù)
歸檔數(shù)據(jù)是在線存儲周期超過數(shù)據(jù)生命周期規(guī)劃的數(shù)據(jù),處理的要求一般在分鐘級或速度更慢。通常歸檔數(shù)據(jù)的計(jì)算量、數(shù)據(jù)量、數(shù)據(jù)復(fù)雜度均超過試試數(shù)據(jù)處理。本平臺中采用:Hadoop、Spark技術(shù)生態(tài)體系內(nèi)的框架進(jìn)行計(jì)算,這里不詳細(xì)闡述。
2.4 非結(jié)構(gòu)化數(shù)據(jù)
通常非結(jié)構(gòu)化的數(shù)據(jù)不一定具備字段,即使具備字段其長度也不固定,并且字段的又可是由可不可重復(fù)和重復(fù)的子字段組成,不僅可以包含結(jié)構(gòu)化數(shù)據(jù),更適合處理非結(jié)構(gòu)化數(shù)據(jù)。常見的非結(jié)構(gòu)化數(shù)據(jù)包括XML、文本、圖象、聲音、影音、各類應(yīng)用軟件產(chǎn)生的文件。
針對包含文字、數(shù)據(jù)的為結(jié)構(gòu)化數(shù)據(jù)應(yīng)當(dāng)先利用數(shù)據(jù)清洗、數(shù)據(jù)治理工具進(jìn)行提取,這項(xiàng)工作目前仍依賴技術(shù)員進(jìn)行操作,由于格式的復(fù)雜性所以難以使用自動(dòng)化方式進(jìn)行較為高效的批處理。在治理數(shù)據(jù)的過程中,需要根據(jù)情況對數(shù)據(jù)本身額外建立描述數(shù)據(jù)結(jié)構(gòu)的元數(shù)據(jù)、以及檢索數(shù)據(jù)的索引服務(wù),以便后續(xù)更佳深度利用數(shù)據(jù)。
2.5 結(jié)構(gòu)化數(shù)據(jù)
結(jié)構(gòu)化數(shù)據(jù)具備特定的數(shù)據(jù)結(jié)構(gòu),通常可以轉(zhuǎn)換后最終用二維的結(jié)構(gòu)的數(shù)據(jù),并且其字段的含義明確,是挖掘數(shù)據(jù)價(jià)值的主要對象。
本平臺中主要使用Hadoop Impala和Spark SQL來進(jìn)行結(jié)構(gòu)化數(shù)據(jù)的處理。Impale底層采用C++實(shí)現(xiàn),而非Hadoop的基于Java的Map-Reduce機(jī)制,將性能提高了1-2個(gè)數(shù)量級。而Spark SQL提供很好的性能并且與Shark、Hive兼容。提供了對結(jié)構(gòu)化數(shù)據(jù)的簡便的narrow-waist操作,為高級的數(shù)據(jù)分析統(tǒng)一了SQL結(jié)構(gòu)化查詢語言與命令式語言的混合使用。
結(jié)構(gòu)化數(shù)據(jù)根據(jù)采集頻度可以繼續(xù)分類為:非實(shí)時(shí)數(shù)據(jù)、準(zhǔn)實(shí)時(shí)數(shù)據(jù)。
2.6 準(zhǔn)實(shí)時(shí)數(shù)據(jù)
通常準(zhǔn)實(shí)時(shí)數(shù)據(jù)是指數(shù)據(jù)存儲在平臺本身,但更新頻率接近于接口調(diào)用數(shù)據(jù)源的數(shù)據(jù)。適合用于支持?jǐn)?shù)據(jù)和信息的查詢,但數(shù)據(jù)的再處理度不高,具有計(jì)算并發(fā)度高、數(shù)據(jù)規(guī)模大、結(jié)果可靠性較高的特點(diǎn)。通常使用分布式數(shù)據(jù)處理提高數(shù)據(jù)規(guī)模、使用內(nèi)存數(shù)據(jù)進(jìn)行計(jì)算過程緩沖和優(yōu)化。本平臺主要采用Spark SQL結(jié)合高速緩存Redis的技術(shù)來實(shí)現(xiàn)。Spark SQL作為大數(shù)據(jù)的基本查詢框架,Redis作為高速緩存去緩存數(shù)據(jù)熱區(qū),減小高并發(fā)下的系統(tǒng)負(fù)載。
2.7 非實(shí)時(shí)數(shù)據(jù)
非實(shí)時(shí)數(shù)據(jù)主要應(yīng)用于支持分析型應(yīng)用,時(shí)效性較低。通常用于數(shù)據(jù)的深度利用和挖掘,例如:因素分析、信息分類、語義網(wǎng)絡(luò)、圖計(jì)算、數(shù)值擬合等。
非實(shí)時(shí)數(shù)據(jù)根據(jù)數(shù)據(jù)模型可繼續(xù)分類為:范式化模型數(shù)據(jù)、維度模型數(shù)據(jù)。
2.8 范式化模型
范式化模型主要是針對關(guān)系型數(shù)據(jù)庫設(shè)計(jì)范式,通常稻菔遣捎玫諶范式3NF或更高范式。面向近源數(shù)據(jù)查詢、數(shù)據(jù)主題的整合。范式化模型數(shù)據(jù)的數(shù)據(jù)存儲區(qū),建議使用并行MPP數(shù)據(jù)庫集群,既具備關(guān)系型數(shù)據(jù)庫的優(yōu)點(diǎn),又兼顧了大數(shù)據(jù)下的處理。
2.9 基于維度模型
維度模型數(shù)據(jù)主要應(yīng)用于業(yè)務(wù)系統(tǒng)的數(shù)據(jù)挖掘和分析。過去多維度數(shù)據(jù)處理主要依賴OLAP、BI等中間件技術(shù),而在大數(shù)據(jù)和開源框架的時(shí)代下,本技術(shù)平臺采用Hadoop Impala來進(jìn)行實(shí)現(xiàn)。Impala并沒有使用MapReduce這種不太適合做SQL查詢的范式,而是參考了MPP并行數(shù)據(jù)庫的思想另起爐灶,省掉不必要的shuffle、sort等開銷,使運(yùn)算得到優(yōu)化。
3 應(yīng)用效果
本系統(tǒng)在不同的業(yè)務(wù)領(lǐng)域上都可以應(yīng)用,以2016年在某銀行的應(yīng)用案例為例:該銀行已完成數(shù)據(jù)倉庫建設(shè),但眾多數(shù)據(jù)質(zhì)量問題嚴(yán)重影響了數(shù)據(jù)應(yīng)用的效果,以不同的數(shù)據(jù)存儲方式,以更高的要求去進(jìn)行數(shù)據(jù)的統(tǒng)一管理。通過組織、制度、流程三個(gè)方面的實(shí)施,以元數(shù)據(jù)、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量平臺為支撐,實(shí)現(xiàn)了數(shù)據(jù)管控在50多個(gè)分支,60個(gè)局,1000余處的全面推廣,實(shí)現(xiàn)了全行的覆蓋;管理了120個(gè)系統(tǒng)和數(shù)據(jù)倉庫,顯著提升了新系統(tǒng)的快速接入能力;通過14個(gè)數(shù)據(jù)規(guī)范和流程明確了數(shù)據(jù)管控的分工;數(shù)據(jù)考核機(jī)制的實(shí)施,使其在數(shù)據(jù)質(zhì)量評比中名列前茅。
4 結(jié)語
本文介紹了大數(shù)據(jù)下數(shù)據(jù)分析方法及實(shí)現(xiàn)技術(shù)的大體設(shè)計(jì)和思路,從需求分析、總體架構(gòu)和數(shù)據(jù)處理以及數(shù)據(jù)分析這幾個(gè)方面來介紹。文章在最后介紹出了這種平臺的應(yīng)用效果。筆者相信這些思路和技術(shù)能夠在業(yè)務(wù)中能得到很好的應(yīng)用。
參考文獻(xiàn)
[關(guān)鍵詞]財(cái)政收入;GDP;面板數(shù)據(jù)
中圖分類號:F01 文獻(xiàn)標(biāo)識碼:A 文章編號:1006-0278(2013)02-024-01
在計(jì)量經(jīng)濟(jì)學(xué)中,我們一般應(yīng)用的最多的數(shù)據(jù)分析是截面數(shù)據(jù)回歸分析和時(shí)間序列分析,但截面數(shù)據(jù)分析和時(shí)間序列分析都有著一定的局限性。在實(shí)際經(jīng)濟(jì)研究當(dāng)中,截面數(shù)據(jù)回歸分析會(huì)遺漏掉數(shù)據(jù)的時(shí)間序列特征,例如在分析某年中國各省的GDP增長數(shù)據(jù)時(shí),單純的截面數(shù)據(jù)回歸分析無法找出各省GDP隨時(shí)間變化的特征,使得分析結(jié)果沒有深度。而如果只用時(shí)間序列分析,則會(huì)遺漏掉不同截面間的聯(lián)系與區(qū)別,例如在分析中國單個(gè)省市的GDP隨時(shí)間增長的數(shù)據(jù)時(shí),無法找出各個(gè)省市之間經(jīng)濟(jì)增長的聯(lián)系與區(qū)別,因而同樣無法滿足我們的需要。而面板數(shù)據(jù),是一種既包括了時(shí)間序列數(shù)據(jù),也包括了相關(guān)截面數(shù)據(jù)的復(fù)合數(shù)據(jù),是近年來用得較多的一種數(shù)據(jù)類型。
下面我們將基于2000-2009年中國各省GDP和財(cái)政收入的面板數(shù)據(jù)的實(shí)例來詳細(xì)闡述面板數(shù)據(jù)的分析方法。
一、GDP與財(cái)政收入關(guān)系的經(jīng)濟(jì)學(xué)模型
財(cái)政收入是保證國家有效運(yùn)轉(zhuǎn)的經(jīng)濟(jì)基礎(chǔ),在一國經(jīng)濟(jì)建設(shè)中發(fā)揮著重要作用。隨著中國經(jīng)濟(jì)發(fā)展速度的日益加快,財(cái)政收入不斷擴(kuò)大,而擴(kuò)大的財(cái)政收入又以政府支出來調(diào)節(jié)和推動(dòng)國民經(jīng)濟(jì)發(fā)展。正確認(rèn)識財(cái)政收入與經(jīng)濟(jì)增長之間的長期關(guān)系,把握財(cái)政收入與經(jīng)濟(jì)增長之間的相互影響,發(fā)揮財(cái)政收入對經(jīng)濟(jì)發(fā)展的調(diào)節(jié)和促進(jìn)功能,對于完善財(cái)稅政策,深化財(cái)稅體制改革,實(shí)現(xiàn)財(cái)政與經(jīng)濟(jì)之間的良性互動(dòng),具有重要的現(xiàn)實(shí)意義。文章就將從中國各省的面板數(shù)據(jù)出發(fā)研究,中國不同地域間財(cái)政收入和GDP之間的關(guān)系。
二、實(shí)證分析
(一)單位根檢驗(yàn)
Eviews有兩種單位根檢驗(yàn)方法,一種在相同根的假設(shè)下的檢驗(yàn),包括LLC、Breintung、Hadri。另一種則是在不同根下的假設(shè)前提下,包括IPS,ADF-Fisher和PP-Fisher5。檢驗(yàn)結(jié)果表明所有檢驗(yàn)都拒絕原假設(shè),因此序列GDP和CZSR均為一個(gè)2階單整序列。
(二)協(xié)整檢驗(yàn)
如果基于單位根檢驗(yàn)的結(jié)果發(fā)現(xiàn)變量之間是同階單整的,那么我們可以進(jìn)行協(xié)整檢驗(yàn)。協(xié)整檢驗(yàn)是考察變量間長期均衡關(guān)系的方法。所謂的協(xié)整是指若兩個(gè)或多個(gè)非平穩(wěn)的變量序列,其某個(gè)線性組合后的序列呈平穩(wěn)性。此時(shí)我們稱這些變量序列間有協(xié)整關(guān)系存在。
在最終的結(jié)果中,Pedroni方法中除了rho-Statistic、PP-Statistic項(xiàng)目外都拒絕GDP和CZSR不存在協(xié)整關(guān)系的原假設(shè),同樣Kao和Johansen檢驗(yàn)方法也都拒絕原假設(shè),因此,上述檢驗(yàn)結(jié)果表明,我國各省2000-20009年的GDP和財(cái)政收入面板數(shù)據(jù)間存在著協(xié)整關(guān)系。既然通過了協(xié)整檢驗(yàn),說明變量之間存在著長期穩(wěn)定的均衡關(guān)系,其方程回歸殘差是平穩(wěn)的,因此可以在此基礎(chǔ)上直接對進(jìn)行回歸分析,此時(shí)假設(shè)方程的回歸結(jié)果是較精確的。
三、建立模型
混合模型:如果從時(shí)間上看,不同個(gè)體之間不存在顯著性差異;從截面上看,不同截面之間也不存在顯著性差異,那么就可以直接把面板數(shù)據(jù)混合在一起用普通最小二乘法(OLS)估計(jì)參數(shù)。
我們根據(jù)混合模型的回歸結(jié)果,得到財(cái)政收入和GDP之間的回歸方程為:
CZSR=227.3123+0.103224*GDP
(26.47637)(0.002839)
R2=0.810995 F=1321.587
顯然從模型的回歸結(jié)構(gòu)來看,R2的值達(dá)到了0.81,有了比較好的回歸解釋力,同時(shí),GDP的回歸系數(shù)為0.103224,表明各省的財(cái)政收入平均占到了國民收入的10.3%左右。
變系數(shù)模型:顯然,在中國各省之間由于處在不同的地區(qū),因而擁有不同的區(qū)位優(yōu)勢,那么各省的發(fā)展水平顯然就不一樣。正是由于這種不同的地方政策、管理水平、文化差異等會(huì)導(dǎo)致經(jīng)濟(jì)變量間出現(xiàn)一些關(guān)聯(lián)性的變化,此時(shí)在進(jìn)行模型回歸的時(shí)候,我們就有必要考慮變系數(shù)模型。
在回歸結(jié)果中,R2的值達(dá)到了0.97,比混合模型擁有更好的回歸解釋力,而在變系數(shù)模型回歸結(jié)果中,GDP的回歸系數(shù)大于0.5的只有、青海、寧夏三個(gè)省份,也就是說這三個(gè)省份的財(cái)政收入占到了GDP的50%以上,他們同處于經(jīng)濟(jì)并不是很發(fā)達(dá)的西部地區(qū),由此可以看出,處在經(jīng)濟(jì)發(fā)達(dá)地區(qū)的財(cái)政收入占GDP的比重要低,而不發(fā)達(dá)地區(qū)則要高。
四、結(jié)論
通過以上的分析檢驗(yàn),我們發(fā)現(xiàn)針對于中國財(cái)政收入和GDP的面板數(shù)據(jù),我們應(yīng)建立起變系數(shù)模型,并通過模型分析,我們可以得出這樣的結(jié)論,中國各省間由于存在著地域經(jīng)濟(jì)發(fā)展水平不同、管理水平不同以及國家的相關(guān)政策等諸多不同,造成了各省之間在財(cái)政收入以及國民收入上面存在著一定的差異。而回歸結(jié)果也告訴我們,我國西部地區(qū)的財(cái)政收入占GDP的比例要明顯高于東部地區(qū),地區(qū)發(fā)展落后地區(qū)的財(cái)政收入占GDP的比例也要明顯高于東部地區(qū)。因此,這為我們改善我國落后地區(qū)的經(jīng)濟(jì)發(fā)展提供了一定的新思路,就是對一地區(qū)的稅收征收可以適當(dāng)放緩,而將GDP中以前政府占用的部分歸還于民眾和企業(yè),因?yàn)椋凑瞻l(fā)達(dá)地區(qū)的經(jīng)驗(yàn)表明,財(cái)政收入所占比重過高,經(jīng)濟(jì)發(fā)展的活力或者就不會(huì)很高,對于進(jìn)一步刺激財(cái)政收入的增加也沒有任何幫助。因此,我們應(yīng)該適度降低財(cái)政收入占GDP的比重,從而增加經(jīng)濟(jì)活力,使西部地區(qū)以及落后地區(qū)及早的跟上東部發(fā)達(dá)地區(qū)的發(fā)展步伐,從而消除我國經(jīng)濟(jì)發(fā)展的地域不平衡。
參考文獻(xiàn):
[1]謝識予,朱洪鑫.高級計(jì)量經(jīng)濟(jì)學(xué)[M].復(fù)旦大學(xué)出版社,2005.
[2]張曉峒.Eviews使用指南(第二版)[M].南開大學(xué)出版社,2004.
關(guān)鍵詞 自組織映射 組織特異性基因 管家基因 基因表達(dá)譜
一、SOM算法介紹
由Kohonen提出的自組織映射(SOM)的神經(jīng)網(wǎng)絡(luò)是神經(jīng)網(wǎng)絡(luò)中適合用于對數(shù)據(jù)進(jìn)行分類的有效方法。SOM神經(jīng)網(wǎng)絡(luò)包含一個(gè)輸入層和一個(gè)輸出層,組織成一個(gè)二維的網(wǎng)格結(jié)構(gòu)(圖1.1)。該網(wǎng)絡(luò)能夠從任意一個(gè)隨機(jī)選擇輸入的結(jié)點(diǎn)開始最終形成一個(gè)拓?fù)浣Y(jié)構(gòu)的映射,這個(gè)映射反映了輸入模式的內(nèi)在的關(guān)系。但是運(yùn)用SOM有一些參數(shù)的限制,首先需要指定類別數(shù)目,對映射空間結(jié)點(diǎn)進(jìn)行權(quán)值的初始化等。如(圖1.1)所示,SOM網(wǎng)絡(luò)是一個(gè)的映射,如果這個(gè)神經(jīng)元被安排在一個(gè)平面網(wǎng)格上面的話,這個(gè)神經(jīng)網(wǎng)絡(luò)就稱為二維神經(jīng)網(wǎng)絡(luò),因?yàn)檫@個(gè)網(wǎng)絡(luò)將一個(gè)高維的輸入向量映射到一個(gè)二維的平面上面。給定一個(gè)網(wǎng)絡(luò),輸入向量是一個(gè)維的向量,相應(yīng)的第個(gè)突觸向量的第個(gè)元素與輸入向量的第個(gè)元素相連,這樣,一個(gè)維的突觸向量就和第個(gè)神經(jīng)元實(shí)行連接。
圖1.1 SOM網(wǎng)絡(luò)的基本結(jié)構(gòu)
SOM算法描述如下:
(1)令網(wǎng)絡(luò)學(xué)習(xí)次數(shù),賦予初始化權(quán)值向量一個(gè)小的隨機(jī)向量值,對拓?fù)溧徲颍ǎW(xué)習(xí)率()進(jìn)行初始化,設(shè)置網(wǎng)絡(luò)總的學(xué)習(xí)次數(shù)()。
(2)當(dāng)學(xué)習(xí)次數(shù)()小于總的學(xué)習(xí)次數(shù)()時(shí),重復(fù)步驟3至步驟6。
(3)隨機(jī)選一個(gè)輸入向量進(jìn)入網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
(4)確定獲勝神經(jīng)元,相應(yīng)的權(quán)值向量為與輸入向量距離最短的向量,成為獲勝神經(jīng)元,輸入向量與獲勝神經(jīng)元的最短距離為,定義如下:
(1.1)
(5)按照下式更新獲勝神經(jīng)元及其鄰域內(nèi)神經(jīng)元權(quán)值向量:
(1.2)
與函數(shù)定義如下:(1.3)
(6)令,如果,回到第(3)步繼續(xù)訓(xùn)練,否則結(jié)束訓(xùn)練。
二、數(shù)值模擬計(jì)算
本文以HUGEindex數(shù)據(jù)庫中人7000多條基因在19個(gè)正常組織中的表達(dá)情況這19個(gè)組織中表達(dá)的基因?yàn)闃颖緦ζ溥M(jìn)行分析。不同組織下的全基因表達(dá)數(shù)據(jù)構(gòu)成了一個(gè)7070x59的數(shù)據(jù)矩陣,其中每一個(gè)元素表示第個(gè)基因在第個(gè)組織中的表達(dá)水平值,行向量代表基因在19個(gè)人組織中的表達(dá)水平,成為基因的表達(dá)譜,列向量代表某一組織的各基因的表達(dá)水平。
(1.4)
本文運(yùn)用SOM方法對人基因19個(gè)組織的59個(gè)樣本進(jìn)行聚類,SOM網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)見(圖1.2)及參數(shù)選擇見表(表1.1)。
圖1.2 樣本聚類SOM網(wǎng)絡(luò)結(jié)構(gòu)圖
上圖中,根據(jù)Genechip得到的人體19個(gè)組織的59個(gè)微陣列數(shù)據(jù)所得到的信息,我們采用4x5的二維拓?fù)浣Y(jié)構(gòu)的SOM網(wǎng)絡(luò)對人體組織樣本進(jìn)行分類(其中第(4,5)個(gè)結(jié)點(diǎn)為空),圖中每個(gè)結(jié)點(diǎn)的位置(結(jié)點(diǎn)位置用與輸入模式維數(shù)相同的向權(quán)值向量表示,初始權(quán)值由系統(tǒng)自動(dòng)產(chǎn)生)為各個(gè)結(jié)點(diǎn)權(quán)值尺度化之后所得到的位置。
三、結(jié)論
通過分類可以將芯片實(shí)驗(yàn)的59個(gè)樣本按照人體組織類別分為19個(gè)類別,并且與采用層次聚類法所得結(jié)果進(jìn)行比較,可以看出自組織映射的聚類方法與層次聚類方法比較,可以看出采用SOM網(wǎng)絡(luò)聚類方法比層次聚類得到的結(jié)果更為明確,其分類正確率達(dá)到了92.2%,證明了SOM方法是有效的。
參考文獻(xiàn):
[1]孫嘯,陸祖宏,謝建明.生物信息學(xué)基礎(chǔ)[M].北京:清華大學(xué)出版社,2005:282-285.
[2]許東,吳錚.基于matlab6.x的神經(jīng)網(wǎng)絡(luò)系統(tǒng)分析與設(shè)計(jì)[M].西安電了科技大學(xué)出版社,2002.
[3]閻凡平,張長水.人工神經(jīng)網(wǎng)絡(luò)與模擬進(jìn)化計(jì)算[M].北京:清華大學(xué)出版社,2005.:11-34,360-395.
作者簡介:
一、以認(rèn)知沖突,引發(fā)學(xué)生產(chǎn)生數(shù)據(jù)收集與整理的強(qiáng)烈愿望
學(xué)生每一個(gè)學(xué)習(xí)行為的背后,都是有目的、有價(jià)值、有意義的。簡言之,學(xué)生自己要真正認(rèn)識到這種學(xué)習(xí)是有用的,哪怕僅僅是因?yàn)橛腥ぁ⒑猛妫拍芗ぐl(fā)學(xué)生進(jìn)行相關(guān)學(xué)習(xí)的愿望和興趣。對于數(shù)據(jù)分析觀念的培養(yǎng),教師有必要替學(xué)生問一個(gè)“為什么”,問題不必明確提出,但一定要把相關(guān)信息告訴學(xué)生,引發(fā)學(xué)生強(qiáng)烈的認(rèn)知沖突,才會(huì)產(chǎn)生進(jìn)行數(shù)據(jù)收集、整理與分析的欲望,才會(huì)使他們認(rèn)識到學(xué)習(xí)數(shù)據(jù)分析的必要性,產(chǎn)生興趣,從而建立與培養(yǎng)其初步的數(shù)據(jù)分析觀念。
以二年級上冊“統(tǒng)計(jì)”一課的學(xué)習(xí)為例,學(xué)生首次接觸“統(tǒng)計(jì)”的相關(guān)內(nèi)容。在學(xué)生尚不真正知道與理解該詞的確切含義的情況下,教材提供的課例是“統(tǒng)計(jì)最喜歡的動(dòng)物”,以統(tǒng)計(jì)圖形式呈現(xiàn)出喜歡四種動(dòng)物(小貓、小狗、小兔、烏龜)的學(xué)生的人數(shù),并提供了3道題目,但教材始終沒有告訴學(xué)生,“為什么我要學(xué)習(xí)這個(gè)知識”、“為什么我要進(jìn)行數(shù)據(jù)分析”。此時(shí),對這一問題的提出與引導(dǎo)學(xué)生思考,只能由教師在不動(dòng)聲色中完成。所以,教學(xué)時(shí),利用學(xué)生愛吃零食的特點(diǎn),我調(diào)整了教學(xué)思路,首先,我征得學(xué)生同意,打算用班上賣廢品的錢給學(xué)生買糖吃。此舉得到學(xué)生們的一致歡迎;其次,我要求5個(gè)小組長提前去學(xué)校門口的超市,了解糖塊的種類與價(jià)格,并告知其他同學(xué);再次,我要求班委成員負(fù)責(zé)了解班上每一名同學(xué)的需求并進(jìn)行分類、計(jì)算總量。每人限一塊,以便于合理安排買糖的數(shù)量與花費(fèi);再次,將買來的糖帶入教室,上課,進(jìn)行相關(guān)的數(shù)據(jù)整理與分析;最后,完成全部教學(xué)任務(wù)后,吃糖。
當(dāng)我將此想法與實(shí)際的授課過程講給其他老師聽時(shí),有老師笑談“孩子們學(xué)習(xí)的動(dòng)力就是吃糖”。我不否認(rèn)這是學(xué)生們積極參與教學(xué)活動(dòng)的動(dòng)力之一,因?yàn)槭孪任矣懈嬖V學(xué)生全部的活動(dòng)過程與“完不成就不會(huì)有糖吃”的話。但不可否認(rèn)的是,對于二年級的學(xué)生來說,為了達(dá)成“每個(gè)同學(xué)都能吃到自己想吃的糖”這一目標(biāo),要在活動(dòng)的每一個(gè)步驟都進(jìn)行相關(guān)數(shù)據(jù)的收集、整理與分析,才能正確且順利地完成任務(wù)。簡言之,等于我們告訴學(xué)生,“為什么要進(jìn)行數(shù)據(jù)分析”、“只因?yàn)槲覀冃枰_(dá)成一定的目的”,并且,活動(dòng)的每一步驟的數(shù)據(jù)分析都有學(xué)生親自進(jìn)行,并明確知曉這樣做的原因——當(dāng)然不是教師的程式化的要求,這就使得學(xué)生的數(shù)據(jù)分析工作是主動(dòng)的,各成員之間是相互合作的,既使學(xué)生愉快地接受了數(shù)據(jù)分析的內(nèi)容與過程,也在增強(qiáng)學(xué)生數(shù)據(jù)分析觀念的同時(shí),培養(yǎng)了學(xué)生主動(dòng)學(xué)習(xí)與合作的精神。
二、挖掘數(shù)據(jù)中蘊(yùn)藏的深層信息,體驗(yàn)數(shù)據(jù)分析的應(yīng)用價(jià)值
統(tǒng)計(jì)教學(xué)的一個(gè)重要目標(biāo),是鼓勵(lì)學(xué)生通過分析從統(tǒng)計(jì)圖表中獲取盡可能多的信息,為后續(xù)的某項(xiàng)工作或?qū)W習(xí)做出合理的決策。表現(xiàn)在教材中,數(shù)據(jù)分析觀念的首次引入即是一個(gè)簡單的“最喜歡的動(dòng)物”的統(tǒng)計(jì)圖,接下來的每一個(gè)問題的答案無不需要從該統(tǒng)計(jì)圖進(jìn)行尋找。這樣的例子,在學(xué)生生活中也是有接觸的。但是,教學(xué)過程中,也存在一個(gè)常見現(xiàn)象,學(xué)生通過統(tǒng)計(jì)圖表獲取的信息,多是一些最基本的、一眼即可看出的直接信息,而很少能夠?qū)D表上的數(shù)據(jù)信息進(jìn)行更為深入的整理與分析,挖掘出更多有價(jià)值和有意義的信息來做出合理的決策。
相關(guān)熱搜:統(tǒng)計(jì)學(xué) 統(tǒng)計(jì)學(xué)原理
一、數(shù)據(jù)統(tǒng)計(jì)分析的內(nèi)涵
數(shù)據(jù)分析是指運(yùn)用一定的分析方法對數(shù)據(jù)進(jìn)行處理,從而獲得解決管理決策或營銷研究問題所需信息的過程。所謂的數(shù)據(jù)統(tǒng)計(jì)分析就是運(yùn)用統(tǒng)計(jì)學(xué)的方法對數(shù)據(jù)進(jìn)行處理。在實(shí)際的市場調(diào)研工作中,數(shù)據(jù)統(tǒng)計(jì)分析能使我們挖掘出數(shù)據(jù)中隱藏的信息,并以恰當(dāng)?shù)男问奖憩F(xiàn)出來,并最終指導(dǎo)決策的制定。
二、數(shù)據(jù)統(tǒng)計(jì)分析的原則
(1)科學(xué)性。科學(xué)方法的顯著特征是數(shù)據(jù)的收集、分析和解釋的客觀性,數(shù)據(jù)統(tǒng)計(jì)分析作為市場調(diào)研的重要組成部分也要具有同其他科學(xué)方法一樣的客觀標(biāo)準(zhǔn)。(2)系統(tǒng)性。市場調(diào)研是一個(gè)周密策劃、精心組織、科學(xué)實(shí)施,并由一系列工作環(huán)節(jié)、步驟、活動(dòng)和成果組成的過程,而不是單個(gè)資料的記錄、整理或分析活動(dòng)。(3)針對性。就不同的數(shù)據(jù)統(tǒng)計(jì)分析方法而言,無論是基礎(chǔ)的分析方法還是高級的分析方法,都會(huì)有它的適用領(lǐng)域和局限性。(4)趨勢性。市場所處的環(huán)境是在不斷的變化過程中的,我們要以一種發(fā)展的眼光看待問題。(5)實(shí)用性。市場調(diào)研說到底是為企業(yè)決策服務(wù)的,而數(shù)據(jù)統(tǒng)計(jì)分析也同樣服務(wù)于此,在保證其專業(yè)性和科學(xué)性的同時(shí)也不能忽略其現(xiàn)實(shí)意義。
三、推論性統(tǒng)計(jì)分析方法
(1)方差分析。方差分析是檢驗(yàn)多個(gè)總體均值是否相等的一種統(tǒng)計(jì)方法,它可以看作是t檢驗(yàn)的一種擴(kuò)展。它所研究的是分類型自變量對數(shù)值型因變量的影響,比如它們之間有沒有關(guān)聯(lián)性、關(guān)聯(lián)性的程度等,所采用的方法就是通過檢驗(yàn)各個(gè)總體的均值是否相等來判斷分類型自變量對數(shù)值型因變量是否有顯著影響。(2)回歸分析。在數(shù)據(jù)統(tǒng)計(jì)分析中,存在著大量的一種變量隨著另一種變量的變化而變化的情況,這種對應(yīng)的因果變化往往無法用精確的數(shù)學(xué)公式來描述,只有通過大量觀察數(shù)據(jù)的統(tǒng)計(jì)工作才能找到他們之間的關(guān)系和規(guī)律,解決這一問題的常用方法是回歸分析。回歸分析是從定量的角度對觀察數(shù)據(jù)進(jìn)行分析、計(jì)算和歸納。
四、多元統(tǒng)計(jì)分析方法
【關(guān)鍵詞】大數(shù)據(jù)分析;電網(wǎng)調(diào)度能力;方法;應(yīng)用
0.引言
為了評測區(qū)域內(nèi)電網(wǎng)調(diào)度能力,根據(jù)調(diào)度能力評測結(jié)果,調(diào)整輸變電調(diào)度方案,提高變壓器等主要設(shè)備的可靠運(yùn)行,合理利用電網(wǎng)中各項(xiàng)資源和設(shè)備。本發(fā)明的目的是提供一種基于計(jì)算機(jī)實(shí)現(xiàn)的評測電網(wǎng)調(diào)度能力的方法,該方法通過對電壓、有功功率、無功功率的分析,保持各個(gè)變壓器都處于最佳工作狀態(tài),提高設(shè)備使用壽命,降低設(shè)備故障率,降低設(shè)備運(yùn)行的電能損耗,提高電網(wǎng)運(yùn)行的可靠性,提升電網(wǎng)調(diào)度水平。
1.大數(shù)據(jù)分析評測電網(wǎng)的現(xiàn)狀
隨著我國城市化的發(fā)展逐漸加快,我國對電力的需求也在逐漸的增多,未來十幾甚至幾十年,電力需求的增長主要集中在城市地區(qū)。這也就對我國的電網(wǎng)帶來很大的挑戰(zhàn),城市電網(wǎng)是城市的重要基礎(chǔ)設(shè)施,也是電力網(wǎng)的重要組成部分。建設(shè)好城市電網(wǎng)對滿足城市經(jīng)濟(jì)發(fā)展、人民生活水平提高具有重大意義。但是,由于我國長期以來收著“重主網(wǎng)、輕配網(wǎng)”的思想,導(dǎo)致我國很長一段時(shí)間內(nèi),對電網(wǎng)的投資非常的少,城市的電網(wǎng)發(fā)展普遍落后于高壓電網(wǎng)[1]。導(dǎo)致我國在很長一段時(shí)間內(nèi),處于用電不平衡的情況,很多的地方在年前或者重大節(jié)日之前就會(huì)出現(xiàn)的停電的現(xiàn)象。
2.大數(shù)據(jù)分析評測電網(wǎng)調(diào)度能力的具體方法
2.1獲取兩卷變或三卷變高低壓側(cè)的監(jiān)控?cái)?shù)據(jù)
該方法主要是用根據(jù)變壓器端的終端設(shè)備,來獲取的,首先通過各地市部署的調(diào)度EMS系統(tǒng),將變電站中各變壓器的運(yùn)行情況準(zhǔn)確的監(jiān)控,通過變壓器內(nèi)的監(jiān)控元件,對變壓器的的運(yùn)行情況、采集電壓、有功負(fù)荷、無功負(fù)荷等檢測數(shù)據(jù),按指定頻率采集。然后將采集的數(shù)據(jù)通過生產(chǎn)區(qū)的專用網(wǎng)絡(luò)進(jìn)行傳輸,通過生產(chǎn)區(qū)的安全交換機(jī)制放置到電力系統(tǒng)信息內(nèi)網(wǎng),開始清洗、篩選,去除設(shè)備檢測的異常數(shù)據(jù),保留有效數(shù)據(jù)用于負(fù)載率分析該評測電網(wǎng)調(diào)度能力工具通過在信息內(nèi)網(wǎng)中載入電網(wǎng)運(yùn)行的監(jiān)控?cái)?shù)據(jù)[2]。
2.2得到變壓器實(shí)際功率與額定功率的比值
通過對變壓器內(nèi)高低壓側(cè)的檢測數(shù)據(jù),計(jì)算變壓器實(shí)際功率與額定功率的比值,負(fù)責(zé)率分析,接下來對采集的調(diào)度EMS系統(tǒng)的電網(wǎng)運(yùn)行數(shù)據(jù)進(jìn)行計(jì)算,負(fù)載率有兩種計(jì)算方法,一是根據(jù)選定的地區(qū)、時(shí)間段,使用公式二“有功負(fù)荷與無功負(fù)荷平方根/容量”計(jì)算每個(gè)時(shí)點(diǎn)該地區(qū)各個(gè)變壓器的負(fù)載率;二是根據(jù)選定的地區(qū)、時(shí)間段,使用公式“有功負(fù)荷/(容量*0.95)”計(jì)算每個(gè)時(shí)點(diǎn)該地區(qū)各個(gè)變壓器的負(fù)載率[3]。
2.3計(jì)算各個(gè)變壓器的平均負(fù)載率以及平均負(fù)載率的平均值
首先要通過選定的地區(qū)、時(shí)間段,得到該地區(qū)在本時(shí)間段內(nèi)各個(gè)變壓器的平均負(fù)載率以及平均負(fù)載率的平均值。然后再計(jì)算各個(gè)變壓器平均負(fù)載率的均方差,由變壓器的均方差,判斷選定區(qū)域在該時(shí)間段的調(diào)度運(yùn)行能力。主變不均衡度分析,根據(jù)選定地區(qū)和時(shí)間段,統(tǒng)計(jì)負(fù)載率分析結(jié)果,得出平均負(fù)載率[4]。根據(jù)平均負(fù)載率計(jì)算各個(gè)變壓器平均負(fù)載率的均方差,作為變壓器的不均衡度,將結(jié)果逐級放大,能夠得出變壓器、變電站、縣公司、市公司乃至網(wǎng)省公司在該時(shí)間段的調(diào)度健康情況,從而有效的調(diào)整調(diào)度策略和計(jì)劃,改善電網(wǎng)運(yùn)行情況。
3.大數(shù)據(jù)分析評測電網(wǎng)調(diào)度能力的應(yīng)用
3.1調(diào)度EMS數(shù)據(jù)采集
要對EMS數(shù)據(jù)采集,首先要制定EMS系統(tǒng)監(jiān)控?cái)?shù)據(jù)的格式,然后加載指定格式的調(diào)度數(shù)據(jù),其中指定數(shù)據(jù)額格式要求主要為:(1)按“變電站+地區(qū)+變電站電壓等級+主變名稱+時(shí)間”的順序排序,每小時(shí)記錄一次,主要記錄每個(gè)整點(diǎn)、時(shí)點(diǎn)的有功、無功負(fù)荷該數(shù)據(jù)容量的單位是MVA,負(fù)荷的單位是MW。(2)時(shí)間,變電站,地區(qū),變電站電壓等級,主變名稱,繞組電壓,容量,有功負(fù)荷值,無功負(fù)荷值。(3)變電站的數(shù)據(jù)采集按照一定的順序進(jìn)行,不可以同時(shí)多個(gè)變電站的數(shù)據(jù)進(jìn)行采集。
在這個(gè)過程中還要對數(shù)據(jù)進(jìn)行“清洗”。清洗的流程為:(1)使用8個(gè)逗號作為數(shù)據(jù)的分隔符,分別隔開不同字段的數(shù)據(jù)。如果有多余逗號或缺逗號或兩個(gè)逗號中間為空的行,則該行數(shù)據(jù)無效。(2)在計(jì)算的過程中除了容量、有功負(fù)荷值及無功負(fù)荷值外,其他各字段如數(shù)據(jù)超長,則頁面拋出提示錯(cuò)誤,結(jié)束導(dǎo)入。(3)廠站電壓等級為110kV的變壓器容量小于等于100MVA(系統(tǒng)用戶可以在管理端修改此值大小),否則該行數(shù)據(jù)無效。
3.2負(fù)載率計(jì)算
負(fù)載率計(jì)算有兩種情況,分別是近似計(jì)算和精確計(jì)算,其中近似計(jì)算效率高,能夠很快得到近似結(jié)果。但是在常規(guī)檢查時(shí)可使用本公式計(jì)算;精確計(jì)算算法相對復(fù)雜、比較耗時(shí),但是計(jì)算準(zhǔn)確,通常用于分析調(diào)度情況時(shí)使用。
簡便公式為:
計(jì)算要求:
1、選定地區(qū)、場站或主變和時(shí)間段;
2、根據(jù)選定的地區(qū)、時(shí)間段,使用公式計(jì)算每個(gè)時(shí)點(diǎn)該地區(qū)各個(gè)變壓器的負(fù)載率;
3、使用意義在于根據(jù)負(fù)載率大小得出各變壓器負(fù)載率的最高或最低時(shí)點(diǎn),從而判斷當(dāng)前電網(wǎng)的負(fù)荷情況。
精確公式:
計(jì)算方法:
1、選定地區(qū)、場站或主變和時(shí)間段;
2、根據(jù)選定的地區(qū)、時(shí)間段,使用公式二計(jì)算每個(gè)時(shí)點(diǎn)該地區(qū)各個(gè)變壓器的負(fù)載率;
3、使用意義在于根據(jù)負(fù)載率大小得出各變壓器負(fù)載率的最高或最低時(shí)點(diǎn),從而判斷當(dāng)前電網(wǎng)的負(fù)荷情況。
4.結(jié)語
該發(fā)明可及時(shí)調(diào)整調(diào)度方案,從而均衡電網(wǎng)的運(yùn)行負(fù)荷,保持各個(gè)變壓器都處于最佳工作狀態(tài),提高設(shè)備使用壽命,降低設(shè)備故障率,降低設(shè)備運(yùn)行的電能損耗,提高電網(wǎng)運(yùn)行的可靠性,提升電網(wǎng)調(diào)度水平,對提高大數(shù)據(jù)分析電網(wǎng)調(diào)度能力具有顯著的作用。
參考文獻(xiàn)
[1]李庚銀,羅艷,周明,等.基于數(shù)學(xué)形態(tài)學(xué)和網(wǎng)格分形的電能質(zhì)量擾動(dòng)檢測及定位[J].中國電機(jī)工程學(xué)報(bào),2012,26(03):25-30.
[2]賀仁睦,王衛(wèi)國,蔣德斌,等.廣東電網(wǎng)動(dòng)態(tài)負(fù)荷實(shí)測建模及模型有效性研究[J].中國電機(jī)工程學(xué)報(bào),2015,22(03):78-82.
關(guān)鍵詞:Matlab軟件;制流與分壓電路實(shí)驗(yàn);特性研究
一、分壓電路特性研究及參數(shù)的變化
首先,用1000Ω滑線變阻作分壓器,負(fù)載電阻用1000Ω(K=1),測出滑線電阻滑動(dòng)端的位置參數(shù)X和U/Umax分壓比,并作出U/Umax的關(guān)系曲線。其次,同上,用1000Ω滑線電阻和500Ω的負(fù)載電阻(K=0.1),測出X和U/Umax,記錄不同的K值。在Matlab軟件中編寫下列程序?qū)崿F(xiàn)分壓電路實(shí)驗(yàn)數(shù)據(jù)的處理和圖像的擬合:
x0=0:0.1:1.0;
y1=[0 0.24 0.48 0.58 0.72 0.92 1.12 1.58 2.18 3.42 4.46];
z1=max(y1);
y2=[0 0.38 0.72 0.98 1.32 1.72 2.02 2.48 3.26 4.18 4.64];
z2=max(y2);
y3=[0 0.40 0.82 1.18 1.58 2.02 2.40 2.98 3.62 4.32 4.52];
z3=max(y3);
y4=[0 0.18 0.28 0.34 0.48 0.58 0.78 1.02 1.66 2.98 4.48];
z4=max(y4);
n=3;
p1=polyfit(x0,y1,n)
p2=polyfit(x0,y2,n)
p3=polyfit(x0,y3,n)
p4=polyfit(x0,y4,n)
xx=0:0.01:1.0;
yy1=polyval(p1,xx);
yy2=polyval(p2,xx);
yy3=polyval(p3,xx);
yy4=polyval(p4,xx);
plot(xx,yy1/z1,'r',x0,y1/z1,'.r')
hold on;
plot(xx,yy2/z2,'k',x0,y2/z2,'.k')
hold on;
plot(xx,yy3/z3,'b',x0,y2/z2,'.b')
hold on;
plot(xx,yy4/z4,'g',x0,y4/z4,'.g')
hold off;
由實(shí)驗(yàn)可得不同K值的分壓特性曲線,如圖1所示。從曲線可以清楚看出分壓電路有如下幾個(gè)特點(diǎn):第一,不論R0的大小,負(fù)載RZ的電壓調(diào)節(jié)范圍均可從0■E;第二,K越小電壓調(diào)節(jié)越不均勻,曲線線性程度越差,細(xì)調(diào)程度較差;第三,K越大電壓調(diào)節(jié)越均勻,因此要電壓U在0到Umax整個(gè)范圍內(nèi)均勻變化,則取K>1比較合適。
■
圖1 不同K值的分壓特性曲線
二、制流電路特性研究及參數(shù)的變化
首先,用1000Ω滑線變阻作制流器,負(fù)載電阻用100Ω(K=0.1),測出滑線電阻滑動(dòng)端的位置參數(shù)X和分壓比I/Imax,并作出I/Imax-x的關(guān)系曲線。其次,同上,用10000Ω滑線電阻和20Ω的負(fù)載電阻(K=0.02),測出X和I/Imax,記錄不同的K值,并作出關(guān)系曲線,在Matlab軟件中編寫下列程序?qū)崿F(xiàn)制流電路實(shí)驗(yàn)數(shù)據(jù)的處理和圖像的擬合:
x0=0:0.1:1.0;
y1=[0.04 0.04 0.08 0.12 0.18 0.22 0.30 0.52 1.02 3.58 4.18];
z1=max(y1);
y2=[0.04 0.04 0.08 0.12 0.18 0.24 0.30 0.52 0.92 2.38 4.98];
z2=max(y2);
y3=[0.02 0.02 0.02 0.04 0.12 0.18 0.28 0.40 0.70 2.98 3.52];
z3=max(y3);
y4=[0.01 0.01 0.01 0.01 0.02 0.08 0.20 0.30 0.60 1.20 2.0];
z4=max(y4);
n=3;
p1=polyfit(x0,y1,n)
p2=polyfit(x0,y2,n)
p3=polyfit(x0,y3,n)
p4=polyfit(x0,y4,n)
xx=0:0.01:1.0;
yy1=polyval(p1,xx);
yy2=polyval(p2,xx);
yy3=polyval(p3,xx);
yy4=polyval(p4,xx);
plot(xx,yy1/z1,'r',x0,y1/z1,'.r')
hold on;
plot(xx,yy2/z2,'k',x0,y2/z2,'.k')
hold on;
plot(xx,yy3/z3,'b',x0,y2/z2,'.b')
hold on;
plot(xx,yy4/z4,'g',x0,y4/z4,'.g')
hold off;
(上接第47頁)
■
圖2 不同值的制流特性曲線
圖2表示不同K值的制流特性曲線,從曲線可以清楚地看到制流電路有以下幾個(gè)特點(diǎn):第一,K越大電流調(diào)節(jié)范圍越小;電流調(diào)節(jié)越均勻,曲線線性程度較好;第二,K(K≥1)時(shí)調(diào)節(jié)的線性較好;第三,K較小時(shí)(即R0>RZ),電流調(diào)節(jié)范圍大,電流調(diào)節(jié)越不均勻,曲線線性程度越差,細(xì)調(diào)程度較差;第四,不論R0大小如何,負(fù)載RZ上通過的電流都不可能為零。第五,制流電路適用于負(fù)載電阻較小,功耗較大,電壓調(diào)節(jié)范圍較小的場合。
綜上所述,當(dāng)負(fù)載電阻較大時(shí),要求調(diào)節(jié)范圍較寬時(shí)宜采用分壓電路。相反,在負(fù)載電阻較小,功耗較大且調(diào)節(jié)范圍不太大時(shí),選用制流電路較好。
參考文獻(xiàn):
[1]陳玉林,李傳起.大學(xué)物理實(shí)驗(yàn)[M].北京:科學(xué)出版社,2007:186-190.
[2]穆曉東.制流與分壓電路實(shí)驗(yàn)參數(shù)的選擇與確定[J].大學(xué)物理實(shí)驗(yàn),2004,(01).
預(yù)計(jì)1個(gè)月內(nèi)審稿 省級期刊
北京市統(tǒng)計(jì)局主辦
預(yù)計(jì)1個(gè)月內(nèi)審稿 統(tǒng)計(jì)源期刊
工業(yè)和信息化部主辦
預(yù)計(jì)1個(gè)月內(nèi)審稿 省級期刊
貴州出版集團(tuán)公司主辦
預(yù)計(jì)1個(gè)月內(nèi)審稿 部級期刊
中國人民公安大學(xué)法學(xué)院主辦
預(yù)計(jì)1-3個(gè)月審稿 CSCD期刊
中國科學(xué)院主辦
預(yù)計(jì)1個(gè)月內(nèi)審稿 部級期刊
信息產(chǎn)業(yè)部主辦