數(shù)據(jù)挖掘論文
無論是在學(xué)習(xí)還是在工作中,大家都有寫論文的經(jīng)歷,對(duì)論文很是熟悉吧,通過論文寫作可以培養(yǎng)我們獨(dú)立思考和創(chuàng)新的能力。你知道論文怎樣才能寫的好嗎?下面是小編整理的數(shù)據(jù)挖掘論文,歡迎大家借鑒與參考,希望對(duì)大家有所幫助。
數(shù)據(jù)挖掘論文 篇1
【摘要】由于我國的信息技術(shù)迅速發(fā)展,傳統(tǒng)檔案管理的技術(shù)已經(jīng)不能滿足現(xiàn)代的信息需求,數(shù)據(jù)挖掘技術(shù)的應(yīng)用為檔案管理工作效率的提升帶來便利。本文通過說明數(shù)據(jù)挖掘技術(shù)的有關(guān)內(nèi)容,闡明數(shù)據(jù)挖掘技術(shù)的相關(guān)知識(shí),并對(duì)數(shù)據(jù)挖掘技術(shù)在檔案管理工作中的實(shí)際運(yùn)用來進(jìn)行舉例分析。
【關(guān)鍵詞】數(shù)據(jù)挖掘技術(shù);檔案管理;分析運(yùn)用
由于信息技術(shù)的迅速發(fā)展,現(xiàn)代的檔案管理模式與過去相比,也有了很大的變化,也讓如今的檔案管理模式有了新的挑戰(zhàn)。讓人們對(duì)信息即時(shí)、大量地獲取是目前檔案管理工作和檔案管理系統(tǒng)急切需要解決的問題。
一、數(shù)據(jù)挖掘概述
(一)數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘是指從大量的、不規(guī)則、亂序的數(shù)據(jù)中,進(jìn)行分析歸納,得到隱藏的,未知的,但同時(shí)又含有較大價(jià)值的信息和知識(shí)。它主要對(duì)確定目標(biāo)的有關(guān)信息,使用自動(dòng)化和統(tǒng)計(jì)學(xué)等方法對(duì)信息進(jìn)行預(yù)測(cè)、偏差分析和關(guān)聯(lián)分析等,從而得到合理的結(jié)論。在檔案管理中使用數(shù)據(jù)挖掘技術(shù),能夠充分地發(fā)揮檔案管理的作用,從而達(dá)到良好的檔案管理工作效果。(二)數(shù)據(jù)挖掘技術(shù)分析。數(shù)據(jù)挖掘技術(shù)分析的方法是多種多樣的,其主要方法有以下幾種:1.關(guān)聯(lián)分析。指從已經(jīng)知道的信息數(shù)據(jù)中,找到多次展現(xiàn)的信息數(shù)據(jù),由信息的'說明特征,從而得到具有相同屬性的事物特征。2.分類分析。利用信息數(shù)據(jù)的特征,歸納總結(jié)相關(guān)信息數(shù)據(jù)的數(shù)據(jù)庫,建立所需要的數(shù)據(jù)模型,從而來識(shí)別一些未知的信息數(shù)據(jù)。3.聚類分析。通過在確定的數(shù)據(jù)中,找尋信息的價(jià)值聯(lián)系,得到相應(yīng)的管理方案。4.序列分析。通過分析信息的前后因果關(guān)系,從而判斷信息之間可能出現(xiàn)的聯(lián)系。
二、數(shù)據(jù)挖掘的重要性
在進(jìn)行現(xiàn)代檔案信息處理時(shí),傳統(tǒng)的檔案管理方法已經(jīng)不能滿足其管理的要求,數(shù)據(jù)挖掘技術(shù)在這方面確有著顯著的優(yōu)勢(shì)。首先,檔案是較為重要的信息記錄,甚至有些檔案的重要性大到無價(jià),因此對(duì)于此類的珍貴檔案,相關(guān)的檔案管理人員也是希望檔案本身及其價(jià)值一直保持下去。不過越是珍貴的檔案,其使用率自然也就越高,所以其安全性就很難得到保障,在檔案管理中運(yùn)用數(shù)據(jù)挖掘技術(shù),可以讓檔案的信息數(shù)據(jù)得到分析統(tǒng)計(jì),歸納總結(jié),不必次次實(shí)物查閱,這樣就極大地提升了檔案相關(guān)內(nèi)容的安全性,降低檔案的磨損率。并且可以對(duì)私密檔案進(jìn)行加密,進(jìn)行授權(quán)查閱,進(jìn)一步提高檔案信息的安全性。其次,對(duì)檔案進(jìn)行鑒定與甄別,這也是檔案工作中較困難的過程,過去做好這方面的工作主要依靠管理檔案管理員自己的能力和水平,主觀上的因素影響很大,但是數(shù)據(jù)挖掘技術(shù)可以及時(shí)對(duì)檔案進(jìn)行編碼和收集,對(duì)檔案進(jìn)行數(shù)字化的管理和規(guī)劃,解放人力資源,提升檔案利用的服務(wù)水平。第三,數(shù)據(jù)挖掘技術(shù)可以減少檔案的收集和保管成本,根據(jù)檔案的特點(diǎn)和規(guī)律建立的數(shù)據(jù)模型能為之后的工作人員建立一種標(biāo)準(zhǔn),提升了檔案的鑒定效率。
三、檔案管理的數(shù)據(jù)挖掘運(yùn)用
。ㄒ唬n案信息的收集。在實(shí)施檔案管理工作時(shí),首先需要對(duì)檔案信息數(shù)據(jù)的收集。可以運(yùn)用相關(guān)檔案數(shù)據(jù)庫的數(shù)據(jù)資料,進(jìn)行科學(xué)的分析,制定科學(xué)的說明方案,對(duì)確定的數(shù)據(jù)集合類型和一些相關(guān)概念的模型進(jìn)行科學(xué)說明,利用這些數(shù)據(jù)說明,建立準(zhǔn)確的數(shù)據(jù)模型,并以此數(shù)據(jù)模型作為標(biāo)準(zhǔn),為檔案信息的快速分類以及整合奠定基礎(chǔ)。例如,在體育局的相關(guān)網(wǎng)站上提供問卷,利用問卷來得到的所需要的信息數(shù)據(jù),導(dǎo)入數(shù)據(jù)庫中,讓數(shù)據(jù)庫模型中保有使用者的相關(guān)個(gè)人信息,通過對(duì)使用者的信息數(shù)據(jù)進(jìn)行說明,從而判斷使用者可能的類型,提升服務(wù)的準(zhǔn)確性。因此,數(shù)據(jù)挖掘技術(shù)為檔案信息的迅速有效收集,為檔案分類以及后續(xù)工作的順利展開,提供了有利條件,為個(gè)性化服務(wù)的實(shí)現(xiàn)提供了保證。(二)檔案信息的分類。數(shù)據(jù)挖掘技術(shù)具有的屬性分析能力,可以將數(shù)據(jù)庫中的信息進(jìn)行分門別類,將信息的對(duì)象通過不同的特征,規(guī)劃為不同的分類。將數(shù)據(jù)挖掘技術(shù)運(yùn)用到檔案管理中時(shí),可以簡(jiǎn)單快速地找到想要的檔案數(shù)據(jù),能根據(jù)數(shù)據(jù)中使用者的相關(guān)數(shù)據(jù),找尋使用者在數(shù)據(jù)庫中的信息,使用數(shù)據(jù)模型的分析能力,分析出使用者的相關(guān)特征。利如,在使用者上網(wǎng)使用網(wǎng)址時(shí),數(shù)據(jù)挖掘技術(shù)可以充分利用使用者的搜索數(shù)據(jù)以及網(wǎng)站的訪問記錄,自動(dòng)保存用戶的搜索信息、搜索內(nèi)容、下載次數(shù)、時(shí)間等,得到用戶的偏好和特征,對(duì)用戶可能存在的需求進(jìn)行預(yù)測(cè)和分類,更加迅速和準(zhǔn)確的,為用戶提供個(gè)性化的服務(wù)。(三)檔案信息的整合。數(shù)據(jù)挖掘技術(shù)可以對(duì)新舊檔案的信息進(jìn)行整合處理,可以較為簡(jiǎn)單地將“死檔案”整合形成為“活檔案”,提供良好的檔案信息和有效的檔案管理。例如,對(duì)于企事業(yè)單位而言,培訓(xùn)新員工的成本往往比聘請(qǐng)老員工的成本要高出很多。對(duì)老員工的檔案信息情況進(jìn)行全體整合,使檔案資源充分發(fā)揮作用,將檔案數(shù)據(jù)進(jìn)行總結(jié)和規(guī)劃,根據(jù)數(shù)據(jù)之間的聯(lián)系確定老員工流失的原因,然后建立清晰、明白的數(shù)據(jù)庫,這樣可以防止人才流失,也能大大提高檔案管理的效率。
四、結(jié)語
綜上所述,在這個(gè)信息技術(shù)迅速跳躍發(fā)展的時(shí)代,將數(shù)據(jù)挖掘技術(shù)運(yùn)用到檔案管理工作中是時(shí)代發(fā)展的需求與必然結(jié)果。利用數(shù)據(jù)挖掘技術(shù),可以使檔案管理工作的效率大大提升,不僅減少了搜索檔案信息的時(shí)間,節(jié)省人力物力,避免資源的浪費(fèi),還能幫助用戶在海量的信息數(shù)據(jù)中,快速找到所需的檔案數(shù)據(jù)信息。數(shù)據(jù)挖掘技術(shù)的運(yùn)用,使靜態(tài)的檔案信息變成了可以“主動(dòng)”為企事業(yè)單位的發(fā)展,提供有效的個(gè)性化服務(wù)的檔案管家,推動(dòng)了社會(huì)的快速發(fā)展。
【參考文獻(xiàn)】
[1]欒立娟,盧健,劉佳,數(shù)據(jù)挖掘技術(shù)在檔案管理系統(tǒng)中的應(yīng)用[J].計(jì)算機(jī)光盤軟件與應(yīng)用,20xx:35-36.
[2]宇然,數(shù)據(jù)挖掘技術(shù)研究以及在檔案計(jì)算機(jī)管理系統(tǒng)中的應(yīng)用[D].沈陽工業(yè)大學(xué),20xx.
[3]吳秀霞,關(guān)于檔案管理方面的數(shù)據(jù)挖掘分析及應(yīng)用探討[J].經(jīng)營管理者,20xx:338.
數(shù)據(jù)挖掘論文 篇2
隨著會(huì)計(jì)現(xiàn)代化的發(fā)展,會(huì)計(jì)越來越多的運(yùn)用計(jì)算機(jī)技術(shù)的拓展。
一、數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是從數(shù)據(jù)當(dāng)中發(fā)現(xiàn)趨勢(shì)和模式的過程,它融合了現(xiàn)代統(tǒng)計(jì)學(xué)、知識(shí)信息系統(tǒng)、機(jī)器學(xué)習(xí)、決策理論和數(shù)據(jù)庫管理等多學(xué)科的知識(shí)。它能有效地從大量的、不完全的、模糊的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的潛在有用的信息和知識(shí),揭示出大量數(shù)據(jù)中復(fù)雜的和隱藏的關(guān)系,為決策提供有用的參考。數(shù)據(jù)挖掘是從數(shù)據(jù)當(dāng)中發(fā)現(xiàn)趨勢(shì)和模式的過程,它融合了現(xiàn)代統(tǒng)計(jì)學(xué)、知識(shí)信息系統(tǒng)、機(jī)器學(xué)習(xí)、決策理論和數(shù)據(jù)庫管理等多學(xué)科的知識(shí)。它能有效地從大量的、不完全的、模糊的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的潛存有用的信息和知識(shí),揭示出大量數(shù)據(jù)中復(fù)雜的和隱藏的關(guān)系,為決策提供有用的參考。
二、數(shù)據(jù)挖掘的現(xiàn)代最新方法介紹
常用的數(shù)據(jù)挖掘方法主要有決策樹(Decision Tree)、遺傳算法(Genetic Algorithms)、關(guān)聯(lián)分析(Association Analysis).聚類分析(C~smr Analysis)、序列模式分析(Sequential Pattern)以及神經(jīng)網(wǎng)絡(luò)(Neural Networks)等。
三、數(shù)據(jù)挖掘的實(shí)際應(yīng)用
由于數(shù)據(jù)挖掘市場(chǎng)還處于起步的階段,但是發(fā)展很快。在國外有一些著名的大公司對(duì)數(shù)據(jù)挖掘系統(tǒng)進(jìn)行了開發(fā)。
1.Intelligent Miner這是IBM公司的數(shù)據(jù)挖掘產(chǎn)品,它提供了很多數(shù)據(jù)挖掘算法,包括關(guān)聯(lián)、分類、回歸、預(yù)測(cè)模型、偏離檢測(cè)、序列模式分析和聚類。有2個(gè)特點(diǎn):一是它的數(shù)據(jù)挖掘算法的可伸縮性;二是它與IBM/DB/2關(guān)系數(shù)據(jù)庫系統(tǒng)緊密地結(jié)合在一起。
2.EineSet是由SGI公司開發(fā)的,它也提供了多種數(shù)據(jù)挖掘方法,包括關(guān)聯(lián)分析和分類以及高級(jí)統(tǒng)計(jì)和可視化工具。特色是它具有的強(qiáng)大的圖形工具,包括規(guī)則可視化工具、樹可視化工具、地圖可視化工具和多維數(shù)據(jù)分散可視化工具,它們用于實(shí)現(xiàn)數(shù)據(jù)和數(shù)據(jù)挖掘結(jié)果的可視化。
3.Clementine是由ISL公司開發(fā)的,它為終端用戶和開發(fā)者提供提供了一個(gè)集成的數(shù)據(jù)挖掘開發(fā)環(huán)境。
4.DBMiner是由DBMiner Technology公司開發(fā)的,它提供多種數(shù)據(jù)挖掘算法,包括發(fā)現(xiàn)驅(qū)動(dòng)的OLAP分析、關(guān)聯(lián)、分類和聚類。特色是它的基于數(shù)據(jù)立方體的聯(lián)機(jī)分析挖掘,它包含多種有效的頻繁模式挖掘功能和集成的可視化分類方法
四、數(shù)據(jù)挖掘與管理會(huì)計(jì)
1.提供有力的決策支持
面對(duì)日益激烈的競(jìng)爭(zhēng)環(huán)境,企業(yè)管理者對(duì)決策信息的需求也越來越高。管理會(huì)計(jì)作為企業(yè)決策支持系統(tǒng)的重要組成部分,提供更多、更有效的有用信息責(zé)無旁貸。因此,從海量數(shù)據(jù)中挖掘和尋求知識(shí)和信息,為決策提供有力支持成為管理會(huì)計(jì)師使用數(shù)據(jù)挖掘的強(qiáng)大動(dòng)力。例如,數(shù)據(jù)挖掘可以幫助企業(yè)加強(qiáng)成本管理,改進(jìn)產(chǎn)品和服務(wù)質(zhì)量,提高貨品銷量比率,設(shè)計(jì)更好的貨品運(yùn)輸與分銷策略,減少商業(yè)成本。
2.贏得戰(zhàn)略競(jìng)爭(zhēng)優(yōu)勢(shì)的有力武器
實(shí)踐證明數(shù)據(jù)挖掘不僅能明顯改善企業(yè)內(nèi)部流程,而且能夠從戰(zhàn)略的高度對(duì)企業(yè)的競(jìng)爭(zhēng)環(huán)境、市場(chǎng)、顧客和供應(yīng)商進(jìn)行分析,以獲得有價(jià)值的商業(yè)情報(bào),保持和提高企業(yè)持續(xù)競(jìng)爭(zhēng)優(yōu)勢(shì)。如,對(duì)顧客價(jià)值分析能夠?qū)槠髽I(yè)創(chuàng)造80%價(jià)值的20%的顧客區(qū)分出來,對(duì)其提供更優(yōu)質(zhì)的服務(wù),以保持這部分顧客。
3.預(yù)防和控制財(cái)務(wù)風(fēng)險(xiǎn)
利用數(shù)據(jù)挖掘技術(shù)可以建立企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型。企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)的發(fā)生并非一蹴而就,而是一個(gè)積累的'、漸進(jìn)的過程,通過建立財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型,可以隨時(shí)監(jiān)控企業(yè)財(cái)務(wù)狀況,防范財(cái)務(wù)危機(jī)的發(fā)生。另外,也可以利用數(shù)據(jù)挖掘技術(shù),對(duì)企業(yè)籌資和投資過程中的行為進(jìn)行監(jiān)控,防止惡意的商業(yè)欺詐行為,維護(hù)企業(yè)利益。尤其是在金融企業(yè),通過數(shù)據(jù)挖掘,可以解決銀行業(yè)面臨的如信用卡的惡意透支及可疑的信用卡交易等欺詐行為。根據(jù)SEC的報(bào)告,美國銀行、美國第一銀行、聯(lián)邦住房貸款抵押公司等數(shù)家銀行已采用了數(shù)據(jù)挖掘技術(shù)。
五、數(shù)據(jù)挖掘在管理會(huì)計(jì)中的應(yīng)用
1.作業(yè)成本和價(jià)值鏈分析
作業(yè)成本法以其對(duì)成本的精確計(jì)算和對(duì)資源的充分利用引起了人們的極大興趣,但其復(fù)雜的操作使得很多管理者望而卻步。利用數(shù)據(jù)挖掘中的回歸分析、分類分析等方法能幫助管理會(huì)計(jì)師確定成本動(dòng)因,更加準(zhǔn)確計(jì)算成本。同時(shí),也可以通過分析作業(yè)與價(jià)值之間的關(guān)系,確定增值作業(yè)和非增值作業(yè),持續(xù)改進(jìn)和優(yōu)化企業(yè)價(jià)值鏈。在Thomas G,John J和Il-woon Kim的調(diào)查中,數(shù)據(jù)挖掘被用在作業(yè)成本管理中僅占3%。
2.預(yù)測(cè)分析
管理會(huì)計(jì)師在很多情況下需要對(duì)未來進(jìn)行預(yù)測(cè),而預(yù)測(cè)是建立在大量的歷史數(shù)據(jù)和適當(dāng)?shù)哪P突A(chǔ)上的。數(shù)據(jù)挖掘自動(dòng)在大型數(shù)據(jù)庫中尋找預(yù)測(cè)性信息,利用趨勢(shì)分析、時(shí)間序列分析等方法,建立對(duì)如銷售、成本、資金等的預(yù)測(cè)模型,科學(xué)準(zhǔn)確的預(yù)測(cè)企業(yè)各項(xiàng)指標(biāo),作為決策的依據(jù)。例如對(duì)市場(chǎng)調(diào)查數(shù)據(jù)的分析可以幫助預(yù)測(cè)銷售;根據(jù)歷史資料建立銷售預(yù)測(cè)模型等。
3.投資決策分析
投資決策分析本身就是一個(gè)非常復(fù)雜的過程,往往要借助一些工具和模型。數(shù)據(jù)挖掘技術(shù)提供了有效的工具。從公司的財(cái)務(wù)報(bào)告、宏觀的經(jīng)濟(jì)環(huán)境以及行業(yè)基本狀況等大量的數(shù)據(jù)資料中挖掘出與決策相關(guān)的實(shí)質(zhì)性的信息,保證投資決策的正確性和有效性。如利用時(shí)間序列分析模型預(yù)測(cè)股票價(jià)格進(jìn)行投資;用聯(lián)機(jī)分析處理技術(shù)分析公司的信用等級(jí),以預(yù)防投資風(fēng)險(xiǎn)等。
4.產(chǎn)品和市場(chǎng)預(yù)測(cè)與分析
品種優(yōu)化是選擇適當(dāng)?shù)漠a(chǎn)品組合以實(shí)現(xiàn)最大的利益的過程,這些利益可以是短期利潤,也可以是長(zhǎng)期市場(chǎng)占有率,還可以是構(gòu)建長(zhǎng)期客戶群及其綜合體。為了達(dá)到這些目標(biāo),管理會(huì)計(jì)師不僅僅需要價(jià)格和成本數(shù)據(jù)有時(shí)還需要知道替代品的情況,以及在某一市場(chǎng)段位上它們與原產(chǎn)品競(jìng)爭(zhēng)的狀況。另外企業(yè)也需要了解一個(gè)產(chǎn)品是如何刺激另一些產(chǎn)品的銷量的等等。例如,非盈利性產(chǎn)品本身是沒有利潤可言的,但是,如果它帶來了可觀的客戶流量,并刺激了高利潤產(chǎn)品的銷售,那么,這種產(chǎn)品就非常有利可圖,就應(yīng)該包括在產(chǎn)品清單中。這些信息可根據(jù)實(shí)際數(shù)據(jù),通過關(guān)聯(lián)分析等技術(shù)來得到。
5.財(cái)務(wù)風(fēng)險(xiǎn)預(yù)測(cè)與評(píng)估
管理會(huì)計(jì)師可以利用數(shù)據(jù)挖掘工具來評(píng)價(jià)企業(yè)的財(cái)務(wù)風(fēng)險(xiǎn),建立企業(yè)財(cái)務(wù)危機(jī)預(yù)警模型,進(jìn)行破產(chǎn)預(yù)測(cè)。破產(chǎn)預(yù)測(cè)或稱財(cái)務(wù)危機(jī)預(yù)警模型能夠幫助管理者及時(shí)了解企業(yè)的財(cái)務(wù)風(fēng)險(xiǎn),提前采取風(fēng)險(xiǎn)防范措施,避免破產(chǎn)。另外,破產(chǎn)預(yù)測(cè)模型還能幫助分析破產(chǎn)原因,對(duì)企業(yè)管理者意義重大。,數(shù)據(jù)挖掘技術(shù)包括多維判別式分析、邏輯回歸分析、遺傳算法、神經(jīng)網(wǎng)絡(luò)以及決策樹等方法在管理會(huì)計(jì)中得到了廣泛的應(yīng)用。
六、結(jié)論
數(shù)據(jù)挖掘是個(gè)嶄新的領(lǐng)域,對(duì)于數(shù)字和信息的處理是非?茖W(xué)和方便的,也是非常高效率和合理分析的非常好的工具,對(duì)于會(huì)計(jì)管理領(lǐng)域的應(yīng)用在國際上只是剛剛開始,相信隨著會(huì)計(jì)的國際化的接軌和計(jì)算機(jī)科學(xué)的進(jìn)步,在我國的會(huì)計(jì)領(lǐng)域中的數(shù)據(jù)挖掘理論會(huì)得到不斷的提升,在管理會(huì)計(jì)實(shí)際應(yīng)用中的數(shù)據(jù)挖掘也越來越多樣化和普及化。
數(shù)據(jù)挖掘論文 篇3
[1]劉瑩.基于數(shù)據(jù)挖掘的商品銷售預(yù)測(cè)分析[J].科技通報(bào).20xx(07)
[2]姜曉娟,郭一娜.基于改進(jìn)聚類的電信客戶流失預(yù)測(cè)分析[J].太原理工大學(xué)學(xué)報(bào).20xx(04)
[3]李欣海.隨機(jī)森林模型在分類與回歸分析中的應(yīng)用[J].應(yīng)用昆蟲學(xué)報(bào).20xx(04)
[4]朱志勇,徐長(zhǎng)梅,劉志兵,胡晨剛.基于貝葉斯網(wǎng)絡(luò)的客戶流失分析研究[J].計(jì)算機(jī)工程與科學(xué).20xx(03)
[5]翟健宏,李偉,葛瑞海,楊茹.基于聚類與貝葉斯分類器的網(wǎng)絡(luò)節(jié)點(diǎn)分組算法及評(píng)價(jià)模型[J].電信科學(xué).20xx(02)
[6]王曼,施念,花琳琳,楊永利.成組刪除法和多重填補(bǔ)法對(duì)隨機(jī)缺失的二分類變量資料處理效果的比較[J].鄭州大學(xué)學(xué)報(bào)(醫(yī)學(xué)版).20xx(05)
[7]黃杰晟,曹永鋒.挖掘類改進(jìn)決策樹[J].現(xiàn)代計(jì)算機(jī)(專業(yè)版).20xx(01)
[8]李凈,張范,張智江.數(shù)據(jù)挖掘技術(shù)與電信客戶分析[J].信息通信技術(shù).20xx(05)
[9]武曉巖,李康.基因表達(dá)數(shù)據(jù)判別分析的'隨機(jī)森林方法[J].中國衛(wèi)生統(tǒng)計(jì).20xx(06)
[10]張璐.論信息與企業(yè)競(jìng)爭(zhēng)力[J].現(xiàn)代情報(bào).20xx(01)
[11]楊毅超.基于Web數(shù)據(jù)挖掘的作物商務(wù)平臺(tái)分析與研究[D].湖南農(nóng)業(yè)大學(xué)20xx
[12]徐進(jìn)華.基于灰色系統(tǒng)理論的數(shù)據(jù)挖掘及其模型研究[D].北京交通大學(xué)20xx
[13]俞馳.基于網(wǎng)絡(luò)數(shù)據(jù)挖掘的客戶獲取系統(tǒng)研究[D].西安電子科技大學(xué)20xx
[14]馮軍.數(shù)據(jù)挖掘在自動(dòng)外呼系統(tǒng)中的應(yīng)用[D].北京郵電大學(xué)20xx
[15]于寶華.基于數(shù)據(jù)挖掘的高考數(shù)據(jù)分析[D].天津大學(xué)20xx
[16]王仁彥.數(shù)據(jù)挖掘與網(wǎng)站運(yùn)營管理[D].華東師范大學(xué)20xx
[17]彭智軍.數(shù)據(jù)挖掘的若干新方法及其在我國證券市場(chǎng)中應(yīng)用[D].重慶大學(xué)20xx
[18]涂繼亮.基于數(shù)據(jù)挖掘的智能客戶關(guān)系管理系統(tǒng)研究[D].哈爾濱理工大學(xué)20xx
[19]賈治國.數(shù)據(jù)挖掘在高考填報(bào)志愿上的應(yīng)用[D].內(nèi)蒙古大學(xué)20xx
[20]馬飛.基于數(shù)據(jù)挖掘的航運(yùn)市場(chǎng)預(yù)測(cè)系統(tǒng)設(shè)計(jì)及研究[D].大連海事大學(xué)20xx
[21]周霞.基于云計(jì)算的太陽風(fēng)大數(shù)據(jù)挖掘分類算法的研究[D].成都理工大學(xué)20xx
[22]阮偉玲.面向生鮮農(nóng)產(chǎn)品溯源的基層數(shù)據(jù)庫建設(shè)[D].成都理工大學(xué)20xx
[23]明慧.復(fù)合材料加工工藝數(shù)據(jù)庫構(gòu)建及數(shù)據(jù)集成[D].大連理工大學(xué)20xx
[24]陳鵬程.齒輪數(shù)控加工工藝數(shù)據(jù)庫開發(fā)與數(shù)據(jù)挖掘研究[D].合肥工業(yè)大學(xué)20xx
[25]岳雪.基于海量數(shù)據(jù)挖掘關(guān)聯(lián)測(cè)度工具的設(shè)計(jì)[D].西安財(cái)經(jīng)學(xué)院20xx
[26]丁翔飛.基于組合變量與重疊區(qū)域的SVM-RFE方法研究[D].大連理工大學(xué)20xx
[27]劉士佳.基于MapReduce框架的頻繁項(xiàng)集挖掘算法研究[D].哈爾濱理工大學(xué)20xx
[28]張曉東.全序模塊模式下范式分解問題研究[D].哈爾濱理工大學(xué)20xx
[29]尚丹丹.基于虛擬機(jī)的Hadoop分布式聚類挖掘方法研究與應(yīng)用[D].哈爾濱理工大學(xué)20xx
[30]王化楠.一種新的混合遺傳的基因聚類方法[D].大連理工大學(xué)20xx
[31]楊毅超.基于Web數(shù)據(jù)挖掘的作物商務(wù)平臺(tái)分析與研究[D].湖南農(nóng)業(yè)大學(xué)20xx
[32]徐進(jìn)華.基于灰色系統(tǒng)理論的數(shù)據(jù)挖掘及其模型研究[D].北京交通大學(xué)20xx
[33]俞馳.基于網(wǎng)絡(luò)數(shù)據(jù)挖掘的客戶獲取系統(tǒng)研究[D].西安電子科技大學(xué)20xx
[34]馮軍.數(shù)據(jù)挖掘在自動(dòng)外呼系統(tǒng)中的應(yīng)用[D].北京郵電大學(xué)20xx
[35]于寶華.基于數(shù)據(jù)挖掘的高考數(shù)據(jù)分析[D].天津大學(xué)20xx
[36]王仁彥.數(shù)據(jù)挖掘與網(wǎng)站運(yùn)營管理[D].華東師范大學(xué)20xx
[37]彭智軍.數(shù)據(jù)挖掘的若干新方法及其在我國證券市場(chǎng)中應(yīng)用[D].重慶大學(xué)20xx
[38]涂繼亮.基于數(shù)據(jù)挖掘的智能客戶關(guān)系管理系統(tǒng)研究[D].哈爾濱理工大學(xué)20xx
[39]賈治國.數(shù)據(jù)挖掘在高考填報(bào)志愿上的應(yīng)用[D].內(nèi)蒙古大學(xué)20xx
[ 40]馬飛.基于數(shù)據(jù)挖掘的航運(yùn)市場(chǎng)預(yù)測(cè)系統(tǒng)設(shè)計(jì)及研究[D].大連海事大學(xué)20xx
數(shù)據(jù)挖掘論文 篇4
1.軟件工程數(shù)據(jù)的挖掘測(cè)試技術(shù)
1.1代碼編寫
通過對(duì)軟件數(shù)據(jù)進(jìn)行分類整理,在進(jìn)行缺陷軟件的排除工作以后,根據(jù)軟件開發(fā)過程中的各種信息進(jìn)行全新的代碼編寫;诖a編寫人員的編寫經(jīng)驗(yàn),在一般情況,對(duì)結(jié)構(gòu)功能與任務(wù)類似的模塊進(jìn)行重新編寫,這些重新編寫的模塊應(yīng)遵循特定的編寫規(guī)則,這樣才能保證代碼編寫的合理有效性。
1.2錯(cuò)誤重現(xiàn)
代碼編寫完成以后開發(fā)者會(huì)將這些代碼進(jìn)行版本的確認(rèn),然后將正確有效的代碼實(shí)際應(yīng)用到適當(dāng)版本的軟件中去。而對(duì)于存在缺陷的代碼,開發(fā)者需要針對(duì)代碼產(chǎn)生缺陷的原因進(jìn)行分析,通過不但調(diào)整代碼內(nèi)的輸入數(shù)據(jù),直到代碼內(nèi)的數(shù)據(jù)與程序報(bào)告中的描述接近為止。存在缺陷的代碼往往會(huì)以缺陷報(bào)告的形式對(duì)開發(fā)者予以說明,由于缺陷報(bào)告的模糊性,常常會(huì)誤導(dǎo)開發(fā)者,進(jìn)而造成程序設(shè)計(jì)混亂。
1.3理解行為
軟件開發(fā)者在設(shè)計(jì)軟件的過程中需要明確自己設(shè)計(jì)軟件中每一個(gè)代碼的內(nèi)容,同時(shí)還需要理解其他開發(fā)者編寫的代碼,這樣才能有效地完善軟件開發(fā)者的編寫技術(shù)。同時(shí),軟件開發(fā)者在進(jìn)行代碼編寫的過程中,需要對(duì)程序行為進(jìn)行準(zhǔn)確的理解,以此保證軟件內(nèi)文檔和注釋的準(zhǔn)確性。
1.4設(shè)計(jì)推究
開發(fā)者在準(zhǔn)備對(duì)軟件進(jìn)行完善設(shè)計(jì)的過程中,首先需要徹底了解軟件的總體設(shè)計(jì),對(duì)軟件內(nèi)部復(fù)雜的系統(tǒng)機(jī)構(gòu)進(jìn)行詳細(xì)研究與分析,充分把握軟件細(xì)節(jié),這有這樣才能真正實(shí)現(xiàn)軟件設(shè)計(jì)的合理性與準(zhǔn)確性。
2.軟件工程數(shù)據(jù)挖掘測(cè)試的有效措施
2.1進(jìn)行軟件工程理念和方法上的創(chuàng)新
應(yīng)通過實(shí)施需求分析,將數(shù)據(jù)挖據(jù)逐漸演變成形式化、規(guī)范化的需求工程,在軟件開發(fā)理念上,加強(qiáng)對(duì)數(shù)據(jù)挖掘的重視,對(duì)軟件工程的架構(gòu)進(jìn)行演化性設(shè)計(jì)與創(chuàng)新,利用新技術(shù),在軟件開發(fā)的過程中添加敏捷變成與間件技術(shù),由此,提高軟件編寫水平。
2.2利用人工智能
隨著我國科學(xué)技術(shù)的不斷發(fā)展與創(chuàng)新,機(jī)器學(xué)習(xí)已經(jīng)逐漸被我國各個(gè)領(lǐng)域所廣泛應(yīng)用,在進(jìn)行軟件工程數(shù)據(jù)挖掘技術(shù)創(chuàng)新的過程中,可以將機(jī)器學(xué)習(xí)及數(shù)據(jù)挖掘技術(shù)實(shí)際應(yīng)用于軟件工程中,以此為我國軟件研發(fā)提供更多的便捷。人工智能作為我國先進(jìn)生產(chǎn)力的重要表現(xiàn),在實(shí)際應(yīng)用于軟件工程數(shù)據(jù)的挖掘工作時(shí),應(yīng)該利用機(jī)器較強(qiáng)的學(xué)習(xí)能力與運(yùn)算能力,將數(shù)據(jù)統(tǒng)計(jì)及數(shù)據(jù)運(yùn)算通過一些較為成熟的方法進(jìn)行解決。在軟件工程數(shù)據(jù)挖掘的工作中,合理化的將人工智能實(shí)際應(yīng)用于數(shù)據(jù)挖掘,以此為數(shù)據(jù)挖掘提供更多的開發(fā)測(cè)試技術(shù)。
2.3針對(duì)數(shù)據(jù)挖掘結(jié)果進(jìn)行評(píng)價(jià)
通過分析我國傳統(tǒng)的.軟件工程數(shù)據(jù)挖掘測(cè)試工作,在很多情況下,傳統(tǒng)的數(shù)據(jù)挖掘測(cè)試技術(shù)無法做到對(duì)發(fā)掘數(shù)據(jù)的全面評(píng)價(jià)與實(shí)際應(yīng)用研究,這一問題致使相應(yīng)的軟件數(shù)據(jù)在被發(fā)掘出來以后無法得到有效地利用,進(jìn)而導(dǎo)致我國軟件開發(fā)工作受到嚴(yán)重的抑制影響。針對(duì)這一問題,數(shù)據(jù)開發(fā)者應(yīng)該利用挖掘缺陷檢驗(yàn)報(bào)告,針對(duì)缺陷檢驗(yàn)的結(jié)果,制定相應(yīng)的挖掘結(jié)構(gòu)報(bào)告。同時(shí),需要結(jié)合軟件用戶的體驗(yàn)評(píng)價(jià),對(duì)挖掘出的數(shù)據(jù)進(jìn)行系統(tǒng)化的整理與分析,建立一整套嚴(yán)謹(jǐn)、客觀的服務(wù)體系,運(yùn)用CodeCity軟件,讓用戶在的體驗(yàn)過后可以對(duì)軟件進(jìn)行評(píng)價(jià)。考慮到軟件的服務(wù)對(duì)象是人,因此,在軟件開發(fā)的過程中要將心理學(xué)與管理學(xué)應(yīng)用于數(shù)據(jù)挖掘,建立數(shù)據(jù)挖掘系統(tǒng)和數(shù)據(jù)挖掘評(píng)價(jià)系統(tǒng)。
3.結(jié)束語
綜上所述,由于軟件工程數(shù)據(jù)挖掘測(cè)試技術(shù)廣闊的應(yīng)用前景,我國相關(guān)部門已經(jīng)加大了對(duì)軟件技術(shù)的投資與開發(fā)力度,當(dāng)下,國內(nèi)已經(jīng)實(shí)現(xiàn)了軟件工程的數(shù)據(jù)挖掘、人工智能、模式識(shí)別等多種領(lǐng)域上的發(fā)展。
數(shù)據(jù)挖掘論文 篇5
【摘要】目的:分析HIS數(shù)據(jù)的挖掘與統(tǒng)計(jì)對(duì)醫(yī)院管理決策的意義。方法:首先對(duì)我院的管理人員和臨床一線醫(yī)護(hù)人員進(jìn)行調(diào)查,并對(duì)HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)實(shí)施前和實(shí)施后的評(píng)價(jià)進(jìn)行統(tǒng)計(jì),最后記錄各項(xiàng)數(shù)據(jù)結(jié)果。結(jié)果:通過調(diào)查后發(fā)現(xiàn),實(shí)施HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)后,管理人員對(duì)醫(yī)院管理的評(píng)分較比實(shí)施前更高,組間數(shù)據(jù)經(jīng)驗(yàn)檢驗(yàn)P<0.05差異具有統(tǒng)計(jì)學(xué)意義。比對(duì)工作人員對(duì)醫(yī)院管理的評(píng)分,實(shí)施后較比實(shí)施前更高,組間數(shù)據(jù)經(jīng)驗(yàn)檢驗(yàn)P<0.05差異具有統(tǒng)計(jì)學(xué)意義。另外,比對(duì)實(shí)施前和實(shí)施后的優(yōu)良率,前者低于后者,組間數(shù)據(jù)經(jīng)驗(yàn)檢驗(yàn)P<0.05差異具有統(tǒng)計(jì)學(xué)意義。結(jié)論:HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)可以使醫(yī)院的管理決策得以改善,醫(yī)院整體水平也會(huì)明顯提升,可進(jìn)一步實(shí)踐和普及。
【關(guān)鍵詞】HIS數(shù)據(jù)挖掘與統(tǒng)計(jì);醫(yī)院管理決策;意義分析
近年來,醫(yī)院信息系統(tǒng)被廣泛應(yīng)用,同時(shí)將諸多歷史重要信息進(jìn)行回顧與收集,這些信息在醫(yī)院日常工作中起著舉足輕重的作用,同時(shí)也是醫(yī)院管理決策的重要資源。通常情況下,人們通過分析大量的數(shù)據(jù)信息,對(duì)其進(jìn)行整理和歸類,在結(jié)果中找出醫(yī)院經(jīng)營與醫(yī)療業(yè)務(wù)的規(guī)律,在一定程度上對(duì)醫(yī)院管理者決策有著重要意義[1]。鑒于此,此研究分析HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)的價(jià)值,對(duì)我院的管理人員和工作人員進(jìn)行調(diào)查,現(xiàn)將具體流程和研究結(jié)果進(jìn)行以下表述。
1對(duì)象與方法
1.1基礎(chǔ)信息選擇20xx年5月至20xx年5月的各部門領(lǐng)導(dǎo)和工作人員作為此次研究調(diào)查對(duì)象,調(diào)查方式以調(diào)查問卷為主,20xx年5月至20xx年5月期間為HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)實(shí)施前,20xx年6月至20xx年5月為HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)實(shí)施后。調(diào)查研究人員中,院領(lǐng)導(dǎo)5名,職能科室負(fù)責(zé)人5名,臨床醫(yī)技科室主任6名,臨床醫(yī)技科室護(hù)士長(zhǎng)5名,臨床醫(yī)技科室主治醫(yī)師職稱20名,護(hù)理人員30名。1.2方法HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)主要流程為:①明確挖掘的最終目的,同時(shí)對(duì)醫(yī)學(xué)領(lǐng)域和相關(guān)知識(shí)經(jīng)驗(yàn)進(jìn)行掌握。隨后明確需要處理的問題,利用用戶的角度,制定醫(yī)學(xué)數(shù)據(jù)挖掘的最終目的,同時(shí)還需將結(jié)論的判定依據(jù)進(jìn)行擬定。②掌握數(shù)據(jù)挖掘所需的內(nèi)容,同時(shí)將醫(yī)院包含對(duì)象的基本情況進(jìn)行查閱,將數(shù)據(jù)的初步收集過程予以實(shí)施。在此期間,還需將原始數(shù)據(jù)的實(shí)施情況予以保留,并對(duì)數(shù)據(jù)的屬性予以明確[2]。③數(shù)據(jù)的準(zhǔn)備。通常情況下,醫(yī)學(xué)的數(shù)據(jù)較多,且具有復(fù)雜性,因此需事先整理原始數(shù)據(jù),隨后進(jìn)行分析。對(duì)數(shù)據(jù)不同種類實(shí)施針對(duì)性方法進(jìn)行預(yù)處理,隨后依據(jù)數(shù)據(jù)挖掘的最終目的和自身特征將適宜的模型進(jìn)行選擇,讓數(shù)據(jù)之間進(jìn)行相互轉(zhuǎn)換。④數(shù)據(jù)的挖掘。首先分析數(shù)據(jù),利用科學(xué)合理的算法進(jìn)行,同時(shí)該步驟在醫(yī)學(xué)相關(guān)知識(shí)的探索中至關(guān)重要。實(shí)施該流程需事先描述相關(guān)概念,隨后采用關(guān)聯(lián)分析進(jìn)行分類和預(yù)測(cè),隨后采用聚類分析和趨勢(shì)分析,還可以利用孤立點(diǎn)分析和偏差分析等。值的注意的是,需證實(shí)挖掘的數(shù)據(jù)結(jié)果,讓其合理性得以保證。⑤總結(jié)結(jié)果。首先講述搜索到的醫(yī)學(xué)知識(shí),將其和最初的目標(biāo)進(jìn)行比較,這樣可以保證實(shí)施期間的合理性。⑥知識(shí)的同化和具體應(yīng)用。首先整理挖掘到的相關(guān)結(jié)果,并運(yùn)用到HIS醫(yī)學(xué)中,在此期間需進(jìn)行計(jì)劃性實(shí)施,并加以控制。1.3判定依據(jù)[3]將管理人員和臨床一線醫(yī)護(hù)人員對(duì)醫(yī)院的管理評(píng)分進(jìn)行評(píng)價(jià)。結(jié)果超過90分,表示評(píng)價(jià)結(jié)果為優(yōu),結(jié)果介于70至89分之間,表示評(píng)價(jià)結(jié)果為良,結(jié)果低于70分,表示評(píng)價(jià)結(jié)果為差。1.4數(shù)據(jù)檢驗(yàn)及分析此次研究中涉及的所有數(shù)據(jù)均選擇(SPSS19.0)進(jìn)行檢驗(yàn)和分析,各項(xiàng)管理評(píng)分以均數(shù)(±)表示,組間行T值檢驗(yàn),管理效果以(%)表示,組間行卡方檢驗(yàn),組間數(shù)據(jù)經(jīng)驗(yàn)檢驗(yàn)P<0.05差異具有統(tǒng)計(jì)學(xué)意義。
2實(shí)驗(yàn)結(jié)果
2.1實(shí)施前和實(shí)施后管理人員對(duì)醫(yī)院管理的評(píng)價(jià)結(jié)果比對(duì)實(shí)施前和實(shí)施后不同管理人員對(duì)醫(yī)院管理的評(píng)價(jià),實(shí)施后的各項(xiàng)評(píng)分較比實(shí)施前明顯較高,組間數(shù)據(jù)經(jīng)驗(yàn)檢驗(yàn)P<0.05差異具有統(tǒng)計(jì)學(xué)意義。2.2臨床工作人員對(duì)醫(yī)院管理的評(píng)價(jià)結(jié)果比對(duì)實(shí)施前和實(shí)施后臨床一線醫(yī)護(hù)人員對(duì)醫(yī)院管理的評(píng)價(jià),實(shí)施后的`各項(xiàng)評(píng)分較比實(shí)施前明顯較高,組間數(shù)據(jù)經(jīng)驗(yàn)檢驗(yàn)P<0.05差異具有統(tǒng)計(jì)學(xué)意義。詳情數(shù)據(jù)結(jié)果由表2所示。2.3實(shí)施前和實(shí)施后的管理效果評(píng)價(jià)結(jié)果實(shí)施前,管理效果評(píng)價(jià)優(yōu)良率經(jīng)統(tǒng)計(jì)后為84.5%,實(shí)施HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)后,管理效果評(píng)價(jià)優(yōu)良率經(jīng)統(tǒng)計(jì)后為98.6%,兩組間數(shù)據(jù)經(jīng)驗(yàn)檢驗(yàn)P<0.05差異具有統(tǒng)計(jì)學(xué)意義。詳情數(shù)據(jù)結(jié)果由表3所示。
3討論
近幾年,HIS系統(tǒng)的應(yīng)運(yùn)而生,對(duì)醫(yī)院的管理和工作起到促進(jìn)作用,不僅使醫(yī)院各個(gè)崗位的工作效果進(jìn)行提高,同時(shí)加強(qiáng)了衛(wèi)生資源的使用水平[4]。與此同時(shí),HIS系統(tǒng)還可以使醫(yī)療差錯(cuò)的幾率顯著降低,患者的就醫(yī)體檢得以改善,規(guī)范醫(yī)院的各項(xiàng)管理,從而使百姓對(duì)醫(yī)院的信任度提升。除此之外,該系統(tǒng)的運(yùn)用可以優(yōu)化工作流程,加大醫(yī)院管理力度的同時(shí)提升管理水平,從而提高醫(yī)院核心競(jìng)爭(zhēng)力[5]。決策系統(tǒng)屬于全新的管理系統(tǒng),其主要是解決半結(jié)構(gòu)化決策問題,提升管理者的決策能力,使決策的質(zhì)量進(jìn)一步加強(qiáng),將信息資源充分利用后將醫(yī)院的整體管理水平得以改善[6]。從此次數(shù)據(jù)結(jié)果可以看出,通過實(shí)施HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)后,不同管理人員和臨床一線醫(yī)護(hù)人員的各項(xiàng)評(píng)分較比實(shí)施前更高,組間數(shù)據(jù)經(jīng)驗(yàn)檢驗(yàn)P<0.05差異具有統(tǒng)計(jì)學(xué)意義。這一研究結(jié)果說明,通過實(shí)施該系統(tǒng)后,可以將服務(wù)措施變得更加針對(duì)性,醫(yī)院的組織結(jié)果也可以進(jìn)行優(yōu)化。與此同時(shí),還可以使醫(yī)院的工作效率進(jìn)行提升,有助于和諧醫(yī)患關(guān)系的構(gòu)建。另外,從管理效果評(píng)價(jià)結(jié)果來看,實(shí)施后的優(yōu)良率98.6%明顯優(yōu)于實(shí)施前的84.5%,這一研究結(jié)果充分體現(xiàn)了HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)的應(yīng)用可行性和優(yōu)勢(shì)。綜上可知,HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)可以使醫(yī)院的管理決策得以改善,醫(yī)院水平也會(huì)明顯提升,具有較高的實(shí)踐意義。
參考文獻(xiàn)
[1]于樹新,劉素溫,鄒向坤等.HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)對(duì)醫(yī)院管理決策的意義[J].中國醫(yī)藥導(dǎo)報(bào),20xx(25):141-143,159.
[2]王瑞.基于HIS的門診醫(yī)療數(shù)據(jù)倉庫構(gòu)建及多維分析和挖掘[D].南開大學(xué),20xx.
[3]吳騁,羅虹,何倩等.對(duì)醫(yī)療數(shù)據(jù)為醫(yī)院管理與臨床診療提供支持的研究[J].中國數(shù)字醫(yī)學(xué),20xx,07(2):41-43.
[4]呂學(xué)明.數(shù)據(jù)挖掘在醫(yī)務(wù)管理中的應(yīng)用[D].山西大學(xué),20xx.
[5]郭慶,谷巖.數(shù)據(jù)挖掘技術(shù)在醫(yī)院信息系統(tǒng)的統(tǒng)計(jì)分析與決策中的應(yīng)用[J].中國醫(yī)療設(shè)備,20xx,25(5):64-67.
[6]沈明霞,林雨芳,章光華等.中醫(yī)院HIS系統(tǒng)數(shù)據(jù)的挖掘和應(yīng)用[J].中國數(shù)字醫(yī)學(xué),20xx,06(4):81-82,85.
作者:陳帥 單位:滄州市人民醫(yī)院醫(yī)務(wù)部
數(shù)據(jù)挖掘論文 篇6
摘要:文章首先對(duì)數(shù)據(jù)挖掘技術(shù)及其具體功能進(jìn)行簡(jiǎn)要分析,在此基礎(chǔ)上對(duì)科研管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用進(jìn)行論述。期望通過本文的研究能夠?qū)蒲泄芾硭降倪M(jìn)一步提升有所幫助。
關(guān)鍵詞:科研管理;數(shù)據(jù)挖掘;技術(shù)應(yīng)用
1數(shù)據(jù)挖掘技術(shù)及其具體功能分析
所謂的數(shù)據(jù)挖掘具體是指通過相關(guān)的算法在大量的數(shù)據(jù)當(dāng)中對(duì)隱藏的、有利用價(jià)值的信息進(jìn)行搜索的過程。數(shù)據(jù)挖掘是一門綜合性較強(qiáng)的科學(xué)技術(shù),其中涉及諸多領(lǐng)域的知識(shí),如人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫、數(shù)理統(tǒng)計(jì)等等。數(shù)據(jù)挖掘技術(shù)具有如下幾個(gè)方面的功能:1.1關(guān)聯(lián)規(guī)則分析。這是數(shù)據(jù)挖掘技術(shù)較為重要的功能之一,可從給定的數(shù)據(jù)集當(dāng)中,找到出現(xiàn)比較頻繁的項(xiàng)集,該項(xiàng)集具體是指行形如X->Y,在數(shù)據(jù)庫當(dāng)中,X和Y所代表的均為屬性取值。在關(guān)聯(lián)規(guī)則下,只要數(shù)據(jù)滿足X條件,就一定滿足Y條件,數(shù)據(jù)挖掘技術(shù)的這個(gè)功能在商業(yè)金融等領(lǐng)域中的應(yīng)用較為廣泛。1.2回歸模式分析回歸模式主要是通過對(duì)連續(xù)數(shù)值的預(yù)測(cè),來達(dá)到挖掘數(shù)據(jù)的目的。例如,已知企業(yè)某個(gè)人的教育背景、工作年限等條件,可對(duì)其年薪的范圍進(jìn)行判定,整個(gè)分析過程是利用回歸模型予以實(shí)現(xiàn)的。在該功能中,已知的條件越多,可進(jìn)行挖掘的信息就越多。1.3聚類分析聚類具體是指將相似程度較高的數(shù)據(jù)歸為同一個(gè)類別,通過聚類分析能夠從數(shù)據(jù)集中找出類似的`數(shù)據(jù),并組成不同的組。在聚類分析的過程中,需要使用聚類算法,借助該算法對(duì)數(shù)據(jù)進(jìn)行檢測(cè)后,可以判斷其隱藏的屬性,并將數(shù)據(jù)庫分為若干個(gè)相似的組。
2科研管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用
科研是科學(xué)研究的簡(jiǎn)稱,具體是指為認(rèn)識(shí)客觀事物在內(nèi)在本質(zhì)及其運(yùn)動(dòng)規(guī)律,而借助某些技術(shù)手段和設(shè)備,開展調(diào)查研究、實(shí)驗(yàn)等活動(dòng),并為發(fā)明和創(chuàng)造新產(chǎn)品提供理論依據(jù)?蒲泄芾硎菍(duì)科研項(xiàng)目全過程的管理,如課題管理、經(jīng)費(fèi)管理、成果管理等等。由于科學(xué)研究中涉及的內(nèi)容較多,從而給科研管理工作增添了一定的難度。為進(jìn)一步提升科研管理水平,可在不同的管理環(huán)節(jié)中,對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行應(yīng)用。下面就此展開詳細(xì)論述。
2.1在立項(xiàng)及可行性評(píng)估中的應(yīng)用
科研管理工作的開展需要以相關(guān)的科研課題作為依托,當(dāng)課題選定之后,需要對(duì)其可行性及合理性進(jìn)行全面系統(tǒng)地評(píng)估,由此使得科研課題的立項(xiàng)及評(píng)估成為科研管理的主要工作內(nèi)容,F(xiàn)階段,國內(nèi)的科研課題立項(xiàng)采用的是申請(qǐng)審批制,具體的流程是:由科研機(jī)構(gòu)的相關(guān)人員負(fù)責(zé)提出申請(qǐng),然后再由科技主管部門從申請(qǐng)中進(jìn)行篩選,經(jīng)過業(yè)內(nèi)專家的評(píng)審論證之后,擇優(yōu)選取科研項(xiàng)目的承接單位。在進(jìn)行科研課題立項(xiàng)的過程中,涉及諸多方面的內(nèi)容,具體包括申請(qǐng)單位、課題的研究領(lǐng)域、經(jīng)費(fèi)安排、主管單位以及評(píng)審專家等。通過調(diào)查發(fā)現(xiàn),由于國家宏觀調(diào)控政策的缺失,導(dǎo)致科研立項(xiàng)中存在低水平、重復(fù)性研究的情況,從而造成大量的研究經(jīng)費(fèi)浪費(fèi),所取得的研究成果也不顯著?蒲泄芾聿块T雖然建立了相對(duì)完善的數(shù)據(jù)庫系統(tǒng),并且系統(tǒng)也涵蓋與項(xiàng)目申請(qǐng)、審評(píng)等方面有關(guān)的基本操作流程,如上傳項(xiàng)目申報(bào)文件、將文件發(fā)給相關(guān)的評(píng)審專家、對(duì)評(píng)審結(jié)果進(jìn)行自動(dòng)統(tǒng)計(jì)等。從本質(zhì)的角度上講,數(shù)據(jù)庫管理系統(tǒng)所完成的這些工作流程,就是將傳統(tǒng)管理工作轉(zhuǎn)變?yōu)樾畔⒒。故此,?yīng)當(dāng)對(duì)已有的數(shù)據(jù)進(jìn)行深入挖掘,從而找出其中更具利用價(jià)值的信息,據(jù)此對(duì)科研立項(xiàng)進(jìn)行指導(dǎo),這樣不但能夠使有限的科技資源得到最大限度地利用,而且還能使科研經(jīng)費(fèi)的使用效益獲得全面提升。在科研立項(xiàng)階段,可對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行合理運(yùn)用,借此來對(duì)課題申請(qǐng)中涉及的各種因素進(jìn)行挖掘,找出其中潛在的規(guī)則,為指標(biāo)體系的構(gòu)建和遴選方法的選擇提供可靠依據(jù),最大限度地降低不合理因素對(duì)課題立項(xiàng)帶來的影響,對(duì)確需資助的科研項(xiàng)目進(jìn)行準(zhǔn)確選擇,并給予相應(yīng)的資助。在科研立項(xiàng)環(huán)節(jié)中,對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行應(yīng)用時(shí),可以借助改進(jìn)后的Apriori算法進(jìn)行數(shù)據(jù)挖掘,從中找出關(guān)聯(lián)規(guī)則,在對(duì)該規(guī)則進(jìn)行分析的基礎(chǔ)上,對(duì)立項(xiàng)的合理性進(jìn)行評(píng)價(jià)。
2.2在項(xiàng)目管理中的應(yīng)用
項(xiàng)目管理是科研管理的關(guān)鍵環(huán)節(jié),為提高項(xiàng)目管理的效率和水平,可對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行合理運(yùn)用。在信息時(shí)代到來的今天,計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)的普及程度越來越高,國內(nèi)很多科研機(jī)構(gòu)都紛紛構(gòu)建起了相關(guān)的管理信息系統(tǒng),其中涵蓋了諸多的信息,如課題、科研人員、研究條件等等,而在這些信息當(dāng)中,隱藏著諸多具有特定意義的規(guī)則,為找出這些規(guī)則,需要借助數(shù)據(jù)挖掘技術(shù),對(duì)信息進(jìn)行深入分析,進(jìn)而獲取對(duì)科研項(xiàng)目有幫助的信息。由于大部分科研管理部門建立的科研管理信息系統(tǒng)時(shí)間較早,從而使得系統(tǒng)本身的功能比較單一,如信息刪減、修改、查詢、統(tǒng)計(jì)等等,雖然這些功能可以滿足對(duì)科研課題進(jìn)展、經(jīng)費(fèi)使用等方面的管理,但其面向的均為數(shù)據(jù)庫管理人員,處理的也都是常規(guī)事務(wù)。而從科研課題的管理者與決策者的角度上看,管理信息系統(tǒng)這些功能顯然是有所不足的,因?yàn)樗麄冃枰獙?duì)歷史進(jìn)行分析和提煉,從中獲取相應(yīng)的數(shù)據(jù),為決策和管理工作的開展提供支撐。對(duì)此,可應(yīng)用數(shù)據(jù)挖掘技術(shù)的OLAP,即數(shù)據(jù)庫聯(lián)機(jī)分析處理,由此能夠幫助管理者從不同的方面對(duì)數(shù)據(jù)進(jìn)行觀察,進(jìn)而深入了解數(shù)據(jù)并獲取所需的信息。利用OLAP可以發(fā)現(xiàn)多種于科研課題有關(guān)信息之間的內(nèi)在聯(lián)系,這樣管理者便能及時(shí)發(fā)現(xiàn)其中存在的相關(guān)問題,并針對(duì)問題采取有效的方法和措施加以應(yīng)對(duì)。運(yùn)用數(shù)據(jù)挖掘技術(shù)能夠?qū)蒲许?xiàng)目的相關(guān)數(shù)據(jù)進(jìn)行分析,找出其中存在的矛盾,從而使管理工作的開展更具針對(duì)性。
3結(jié)論
綜上所述,科研管理是一項(xiàng)較為復(fù)雜且系統(tǒng)的工作,其中涵蓋的信息相對(duì)較多。為此,可將數(shù)據(jù)挖掘技術(shù)在科研管理中進(jìn)行合理應(yīng)用,對(duì)相關(guān)信息進(jìn)行深入分析,從中挖掘出有利用價(jià)值的信息,為科研管理工作的開展提供可靠的依據(jù),由此除了能夠確保科研項(xiàng)目順利進(jìn)行之外,還能提高科研管理水平。
參考文獻(xiàn):
。1]劉占波,王立偉,王曉麗.大數(shù)據(jù)環(huán)境下基于數(shù)據(jù)挖掘技術(shù)的高?蒲泄芾硐到y(tǒng)的設(shè)計(jì)[J].電子測(cè)試,20xx(1):21-22.
。2]史子靜.高校科研管理系統(tǒng)中計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的運(yùn)用研究[J].科技資訊,20xx(6):65-66.
[3]丁磊.?dāng)?shù)據(jù)挖掘技術(shù)在高校教師科研管理中的應(yīng)用研究[D].大連海事大學(xué),20xx.
數(shù)據(jù)挖掘論文 篇7
摘 要:數(shù)據(jù)挖掘技術(shù)在各行業(yè)都有廣泛運(yùn)用,是一種新興信息技術(shù)。而在線考試系統(tǒng)中存在著很多的數(shù)據(jù)信息,數(shù)據(jù)挖掘技在在線考試系統(tǒng)有著重要的意義,和良好的應(yīng)用前景,從而在眾多技術(shù)中脫穎而出。本文從對(duì)數(shù)據(jù)挖掘技術(shù)的初步了解,簡(jiǎn)述數(shù)據(jù)挖掘技術(shù)在在線考試系統(tǒng)中成績(jī)分析,以及配合成績(jī)分析,完善教學(xué)。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);在線考試;成績(jī)分析 ;完善教學(xué)
隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的快速發(fā)展,計(jì)算機(jī)輔助教育的不斷普及,在線考試是一種利用網(wǎng)絡(luò)技術(shù)的重要輔助教育手段,其改革有著重要的意義。數(shù)據(jù)挖掘技術(shù)作為一種新興的信息技術(shù),其包括了人工智能、數(shù)據(jù)庫、統(tǒng)計(jì)學(xué)等學(xué)科的內(nèi)容,是一門綜合性的技術(shù)。這種技術(shù)的主要特點(diǎn)是對(duì)數(shù)據(jù)庫中大量的數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換和分析,從中提取出能夠?qū)處熡凶饔玫年P(guān)鍵性數(shù)據(jù)。將其運(yùn)用于在線考試系統(tǒng)中,能夠很好的處理在線考試中涉及到的數(shù)據(jù),讓在線考試的實(shí)用性和高效性得到進(jìn)一步的增強(qiáng),幫助教師更加快速、完整的統(tǒng)計(jì)考試信息,完善教學(xué)。
1.初步了解數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘技術(shù)是從大量數(shù)據(jù)中"挖掘"出對(duì)使用者有用的知識(shí),即從大量的、隨機(jī)的、有噪聲的、模糊的、不完全的實(shí)際應(yīng)用數(shù)據(jù)中,"挖掘"出隱含在其中但人們事先卻不知道的,而又是對(duì)人們潛在有用的信息與知識(shí)的整個(gè)過程。
目前主要的商業(yè)數(shù)據(jù)挖掘系統(tǒng)有SAS公司的Enterprise Miner,SPSS公司的Clementine,Sybas公司的Warehouse Studio,MinerSGI公司的Mineset,RuleQuest Research公司的See5,IBM公司的Intelligent,還有 CoverStory, Knowledge Discovery,Quest,EXPLORA, DBMiner,Workbench等。
2.數(shù)據(jù)挖掘在在線考試中的主要任務(wù)
2.1數(shù)據(jù)分類
數(shù)據(jù)挖掘技術(shù)通過對(duì)數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行分析,把數(shù)據(jù)按照相似性歸納成若干類別,然后做出分類,并能夠?yàn)槊恳粋(gè)類別都做出一個(gè)準(zhǔn)確的描述,挖掘出分類的規(guī)則或建立一個(gè)分類模型。
2.2數(shù)據(jù)關(guān)聯(lián)分析
數(shù)據(jù)庫中的數(shù)據(jù)關(guān)聯(lián)是一項(xiàng)非常重要,并可以發(fā)現(xiàn)的知識(shí)。數(shù)據(jù)關(guān)聯(lián)就是兩組或兩組以上的數(shù)據(jù)之間有著某種規(guī)律性的聯(lián)系。數(shù)據(jù)關(guān)聯(lián)分析的作用就是找出數(shù)據(jù)庫中隱藏的聯(lián)系,從中得到一些對(duì)學(xué)校教學(xué)工作管理者有用的.信息。就像是在購物中,就可以通過顧客的購買物品的聯(lián)系,從中得到顧客的購買習(xí)慣。
2.3預(yù)測(cè)
預(yù)測(cè)是根據(jù)已經(jīng)得到的數(shù)據(jù),從而對(duì)未來的情況做出一個(gè)可能性的分析。數(shù)據(jù)挖掘技術(shù)能自動(dòng)在大型的數(shù)據(jù)庫中做出一個(gè)較為準(zhǔn)確的分析。就像是在市場(chǎng)投資中,可以通過各種商品促銷的數(shù)據(jù)來做出一個(gè)未來商品的促銷走勢(shì)。從而在投資中得到最大的回報(bào)。
3.數(shù)據(jù)挖掘的方法
數(shù)據(jù)挖掘技術(shù)融合了多個(gè)學(xué)科、多個(gè)領(lǐng)域的知識(shí)與技術(shù),因此數(shù)據(jù)挖掘的方法也呈現(xiàn)出很多種類的形式。就目前的統(tǒng)計(jì)分析類的數(shù)據(jù)挖掘技術(shù)的角度來講,光統(tǒng)計(jì)分析技術(shù)中所用到的數(shù)據(jù)挖掘模型就回歸分析、邏輯回歸分析、有線性分析、非線性分析、單變量分析、多變量分析、最近鄰算法、最近序列分析、聚類分析和時(shí)間序列分析等多種方法。數(shù)據(jù)挖掘技術(shù)利用這些方法對(duì)那些異常形式的數(shù)據(jù)進(jìn)行檢查,然后通過各種數(shù)據(jù)模型和統(tǒng)計(jì)模型對(duì)這些數(shù)據(jù)來進(jìn)行解釋,并從這些數(shù)據(jù)中找出隱藏在其中的商業(yè)機(jī)會(huì)和市場(chǎng)規(guī)律。另外還有知識(shí)發(fā)現(xiàn)類數(shù)據(jù)挖掘技術(shù),這種和統(tǒng)計(jì)分析類的數(shù)據(jù)挖掘技術(shù)完全不同,其中包括了支持向量機(jī)、人工神經(jīng)元網(wǎng)絡(luò)、遺傳算法、決策樹、粗糙集、關(guān)聯(lián)順序和規(guī)則發(fā)現(xiàn)等多種方法。
4.數(shù)據(jù)挖掘在考試成績(jī)分析中的幾點(diǎn)應(yīng)用
4.1運(yùn)用關(guān)聯(lián)規(guī)則分析教師的年齡對(duì)學(xué)生考試成績(jī)的影響
數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)分析在教學(xué)分析中,是一種使用頻繁,行之有效的方法,它能挖掘出大量數(shù)據(jù)中項(xiàng)集之間之間有意義的關(guān)聯(lián)聯(lián)系,幫助知道教師的教學(xué)過程。例如在如今的一些高職院校中,就往往會(huì)把學(xué)生的英語四六級(jí)過級(jí)率,計(jì)算機(jī)等級(jí)等,以這些為依據(jù)來評(píng)價(jià)教師的教學(xué)效果。將數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則運(yùn)用于考試的成績(jī)分析當(dāng)中,就能夠挖掘出一些對(duì)學(xué)生過級(jí)率產(chǎn)生影響的因素,對(duì)教師的教學(xué)過程進(jìn)行重要的指導(dǎo),讓教師的教學(xué)效率更高,作用更強(qiáng)。
還可以通過關(guān)聯(lián)規(guī)則算法,先設(shè)定一個(gè)最小可信度和支持度,得到初步的關(guān)聯(lián)規(guī)則,根據(jù)相關(guān)規(guī)則,分析出教師的組成結(jié)構(gòu)和過級(jí)率的影響,從來進(jìn)行教師隊(duì)伍的結(jié)構(gòu)調(diào)整,讓教師隊(duì)伍更加合理。
4.2采用分類算法探討對(duì)考試成績(jī)有影響的因素
數(shù)據(jù)挖掘技術(shù)中的分類算法就是對(duì)一組對(duì)象或一個(gè)事件進(jìn)行歸類,然后通過這些數(shù)據(jù),可以進(jìn)行分類模型的建立和未來的預(yù)測(cè)。分類算法可以進(jìn)行考試中得到的數(shù)據(jù)進(jìn)行分類,然后通過學(xué)生的一些基本情況進(jìn)行探討一些對(duì)考試成績(jī)有影響的因素。分類算法可以用一下步驟實(shí)施:
4.2.1數(shù)據(jù)采集
這種方法首先要進(jìn)行數(shù)據(jù)采集,需要這幾方面的數(shù)據(jù),學(xué)生基本信息(姓名、性別、學(xué)號(hào)、籍貫、所屬院系、專業(yè)、班級(jí)等)、學(xué)生調(diào)查信息(比如學(xué)習(xí)前的知識(shí)掌握情況、學(xué)習(xí)興趣、課堂學(xué)習(xí)效果、課后復(fù)習(xí)時(shí)間量等)、成績(jī)(學(xué)生平常學(xué)習(xí)成績(jī),平常考試成績(jī),各種大型考試成績(jī)等)、學(xué)生多次考試中出現(xiàn)的易錯(cuò)點(diǎn)(本次考試中出現(xiàn)的易錯(cuò)點(diǎn),以往考試中出現(xiàn)的易錯(cuò)點(diǎn))
4.2.2數(shù)據(jù)預(yù)處理
。1)數(shù)據(jù)集成。把數(shù)據(jù)采集過程中得到的多種信息,利用數(shù)據(jù)挖掘技術(shù)中的數(shù)據(jù)庫技術(shù)生產(chǎn)相應(yīng)的學(xué)生考試成績(jī)分析基本數(shù)據(jù)庫。(2)數(shù)據(jù)清理。在學(xué)生成績(jī)分析數(shù)據(jù)庫中,肯定會(huì)出現(xiàn)一些情況缺失,對(duì)于這些空缺處,就需要使用數(shù)據(jù)清理技術(shù)來進(jìn)行這些數(shù)據(jù)庫中數(shù)據(jù)的填補(bǔ)遺漏。例如,可以采用忽略元組的方法來刪除那些沒有參加考試的學(xué)生考試數(shù)據(jù)已經(jīng)在學(xué)生填寫的調(diào)查數(shù)據(jù)中村中的空缺項(xiàng)。(3)數(shù)據(jù)轉(zhuǎn)換。數(shù)據(jù)轉(zhuǎn)換主要功能是進(jìn)行進(jìn)行數(shù)據(jù)的離散化操作。在這個(gè)過程中可以根據(jù)實(shí)際需要進(jìn)行分類,比如把考試成績(jī)從0~59的分到較差的一類,將60到80分為中等類,81到100分為優(yōu)秀等。(4)數(shù)據(jù)消減。數(shù)據(jù)消減的功能就是把所需挖掘的數(shù)據(jù)庫,在消減的過程又不能影響到最終的數(shù)據(jù)挖掘結(jié)果。比如在分析學(xué)生的基本學(xué)習(xí)情況的影響因素情況中,學(xué)生信息表中中出現(xiàn)的字段很多,可以選擇性的刪除班別、籍貫等引述,形成一份新的學(xué)生基本成績(jī)分析數(shù)據(jù)表。
4.2.3利用數(shù)據(jù)挖掘技術(shù),得出結(jié)論
通過數(shù)據(jù)挖掘技術(shù)在在線考試中的應(yīng)用,得出這些學(xué)生數(shù)據(jù)的相關(guān)分析,比如說學(xué)生考試中的易錯(cuò)點(diǎn)在什么地方,學(xué)生考試成績(jī)的自身原因,學(xué)生考試成績(jī)的環(huán)境原因,教師隊(duì)伍的搭配情況等等,從中得出如何調(diào)整學(xué)校教學(xué)資源,教師的教學(xué)方案調(diào)整等等,從而完善學(xué)校對(duì)學(xué)生的教學(xué)。
5.結(jié)語
數(shù)據(jù)挖掘技術(shù)在社會(huì)各行各業(yè)中都有一定程度的使用,基于其在數(shù)據(jù)組織、分析能力、知識(shí)發(fā)現(xiàn)和信息深層次挖掘的能力,在使用中取得了顯著的成效,但數(shù)據(jù)挖掘技術(shù)中還存在著一些問題,例如數(shù)據(jù)的挖掘算法、預(yù)處理、可視化問題、模式識(shí)別和解釋等等。對(duì)于這些問題,學(xué)校教學(xué)管理工作者要清醒的認(rèn)識(shí),在在線考試系統(tǒng)中對(duì)數(shù)據(jù)挖掘信息做出合理的使用,讓數(shù)字挖掘技術(shù)在在線考試系統(tǒng)中能夠更加有效的發(fā)揮其長(zhǎng)處,避免其在在線考試系統(tǒng)中的的缺陷。
參考文獻(xiàn):
[1]胡玉榮.基于粗糙集理論的數(shù)據(jù)挖掘技術(shù)在高校學(xué)生成績(jī)分析中的作用[J].荊門職業(yè)技術(shù)學(xué)院學(xué)報(bào),20xx,12(22):12.
[2][加]韓家煒,堪博(Kam ber M.) .數(shù)據(jù)挖掘:概念與技術(shù)(第2版)[M]范明,譯.北京:機(jī)械工業(yè)出版社,20xx.
[3]王潔.《在線考試系統(tǒng)的設(shè)計(jì)與開發(fā)》[J].山西師范大學(xué)學(xué)報(bào),20xx(2).
[4] 王長(zhǎng)娥.數(shù)據(jù)挖掘技術(shù)在教育中的應(yīng)用[J].計(jì)算機(jī)與信息技術(shù),20xx(11)
數(shù)據(jù)挖掘論文 篇8
摘要:隨著科學(xué)技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘技術(shù)也應(yīng)運(yùn)而生。為了高效有序的醫(yī)療信息管理,需要加強(qiáng)數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的實(shí)際應(yīng)用,從而提升醫(yī)院的管理水平,為醫(yī)院的管理工作及資源的合理配置提供多樣化發(fā)展的可能性。筆者將針對(duì)數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的應(yīng)用這一課題進(jìn)行相應(yīng)的探究,從而提出合理的改進(jìn)建議。
關(guān)鍵詞:挖掘技術(shù);醫(yī)療信息管理;應(yīng)用方式
數(shù)據(jù)挖掘作為一種數(shù)據(jù)信息再利用的有效技術(shù),能夠有效地為醫(yī)院的管理決策提供重要信息。它以數(shù)據(jù)庫、人工智能以及數(shù)理統(tǒng)計(jì)為主要技術(shù)支柱進(jìn)行技術(shù)管理與決策。而在醫(yī)療信息管理過程之中應(yīng)用數(shù)據(jù)挖掘技術(shù)能夠較好地針對(duì)醫(yī)療衛(wèi)生信息進(jìn)行整理與歸類來建立管理模型,形成有效的總結(jié)數(shù)據(jù)的同時(shí)能夠?yàn)獒t(yī)療工作的高效進(jìn)行提供有價(jià)值的信息。所以筆者將以數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的應(yīng)用為著手點(diǎn),從而針對(duì)其應(yīng)用現(xiàn)狀進(jìn)行探究,以此提出加強(qiáng)數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中應(yīng)用的具體措施,希望能夠在理論層面上推動(dòng)醫(yī)療信息管理工作的飛躍。
1在醫(yī)療信息管理中應(yīng)用數(shù)據(jù)挖掘技術(shù)的基本內(nèi)涵
數(shù)據(jù)挖掘是結(jié)合信息收集技術(shù)、人工智能處理技術(shù)以及分析檢測(cè)技術(shù)等所形成的功能強(qiáng)大的技術(shù)。它能夠?qū)崿F(xiàn)對(duì)于數(shù)據(jù)的收集、問題的定義與處理,并且能夠較好地對(duì)于結(jié)果進(jìn)行解釋與評(píng)估。在醫(yī)療信息管理工作進(jìn)行的過程之中,應(yīng)用數(shù)據(jù)挖掘技術(shù)可以較好地加強(qiáng)醫(yī)療信息數(shù)據(jù)模型的`建立,同時(shí)以多種形式出現(xiàn),例如文字信息、基本信號(hào)信息、圖像收集等,也能夠用來進(jìn)行醫(yī)療信息的科普與宣傳。并且,數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息中所體現(xiàn)出的應(yīng)用方式有所不同,在數(shù)據(jù)挖掘技術(shù)應(yīng)用過程之中,既可以針對(duì)同一類的實(shí)物反應(yīng)出共同性質(zhì)的基本特征,同時(shí)也能夠根據(jù)具有一定關(guān)聯(lián)性的事物信息來探究差異。這些功能不僅僅能夠在醫(yī)療信息的管理層面上給予醫(yī)療人員較大的信息管理指導(dǎo),同時(shí)在實(shí)際的醫(yī)療診斷過程之中,也可以向醫(yī)生提供患者的患病信息,并且輔助治療的進(jìn)行[1]。所以,在醫(yī)療信息管理中應(yīng)用數(shù)據(jù)挖掘技術(shù)不僅僅能夠推動(dòng)醫(yī)療信息管理水平的提升,也是醫(yī)院實(shí)現(xiàn)現(xiàn)代化、信息化建設(shè)的重要體現(xiàn),需要從根本上明確醫(yī)療信息管理應(yīng)用數(shù)據(jù)挖掘技術(shù)的必要性與基本內(nèi)涵,從而針對(duì)醫(yī)院的管理現(xiàn)狀實(shí)現(xiàn)其管理方式與技術(shù)應(yīng)用的轉(zhuǎn)變與優(yōu)化。
2在醫(yī)療信息管理過程之中加強(qiáng)數(shù)據(jù)挖掘技術(shù)應(yīng)用的重要措施
2.1實(shí)現(xiàn)建模環(huán)節(jié)以及數(shù)據(jù)收集環(huán)節(jié)的優(yōu)化
在應(yīng)用數(shù)據(jù)挖掘技術(shù)的過程之中,必須基于數(shù)據(jù)庫信息的基礎(chǔ)之上,其數(shù)據(jù)挖掘技術(shù)才能夠進(jìn)行相應(yīng)的規(guī)律探究與信息分析,所以需要在源頭處加強(qiáng)數(shù)據(jù)收集環(huán)節(jié)以及建模環(huán)節(jié)的優(yōu)化。以醫(yī)院中醫(yī)部門為例,在對(duì)于中醫(yī)處方經(jīng)驗(yàn)的挖掘方法使用過程之中,需要針對(duì)不同的藥物進(jìn)行關(guān)聯(lián)性建模,比如數(shù)據(jù)庫中有基礎(chǔ)性藥物,針對(duì)藥物進(jìn)行頻數(shù)和次數(shù)的統(tǒng)計(jì),然后以此類推,將所有藥物都按照出現(xiàn)的頻數(shù)進(jìn)行降數(shù)排列,從而探究參考價(jià)值。建模環(huán)節(jié)以及數(shù)據(jù)收集環(huán)節(jié)是醫(yī)療信息管理過程的根本,所以需要做好對(duì)于建模環(huán)節(jié)以及數(shù)據(jù)收集環(huán)節(jié)的優(yōu)化,才能夠?yàn)閿?shù)據(jù)挖掘技術(shù)的應(yīng)用奠定相應(yīng)的基礎(chǔ)[2]。
2.2細(xì)化數(shù)據(jù)挖掘技術(shù)應(yīng)用類別
想要在醫(yī)療信息管理過程之中,加強(qiáng)對(duì)于數(shù)據(jù)挖掘技術(shù)的有效應(yīng)用,就需要從數(shù)據(jù)挖掘技術(shù)應(yīng)用類別處進(jìn)行著手,從而提升技術(shù)應(yīng)用的針對(duì)性與有效性。常見的技術(shù)應(yīng)用類別有:醫(yī)院資源配置方面、病患區(qū)域管理方面、醫(yī)療衛(wèi)生質(zhì)量管理方面、醫(yī)療急診管理方面、醫(yī)院經(jīng)濟(jì)管理方面以及醫(yī)療衛(wèi)生常見病宣傳方面等,數(shù)據(jù)挖掘技術(shù)都可以在這些類別之中實(shí)現(xiàn)應(yīng)用,但是在應(yīng)用的過程之中也有所不同。以病房區(qū)域管理為例,在應(yīng)用數(shù)據(jù)挖掘技術(shù)之前,首先需要明確不同的科室狀況以及病房區(qū)域分配狀況等,加強(qiáng)病患區(qū)域的指標(biāo)分析,因?yàn)椴》抗芾聿粌H僅影響到科室的工作效率與工作效果,同時(shí)也是醫(yī)療物資分配與人員編制的主要參考標(biāo)準(zhǔn)。其次利用數(shù)據(jù)挖掘技術(shù)能夠較好地實(shí)現(xiàn)不同科室工作效率、質(zhì)量管理質(zhì)量以及經(jīng)濟(jì)收益等多種指標(biāo)的評(píng)估,建立其科室的運(yùn)營模型,從而實(shí)現(xiàn)科室的又好又快發(fā)展。比如使用數(shù)據(jù)挖掘技術(shù)建立其病區(qū)管理的標(biāo)準(zhǔn)模型以及統(tǒng)計(jì)指標(biāo),從而計(jì)算出科室動(dòng)態(tài)的工作模型以及病床動(dòng)態(tài)的周轉(zhuǎn)次數(shù)等[3]。另外在醫(yī)療質(zhì)量管理過程之中,數(shù)據(jù)挖掘技術(shù)提供的不僅僅是資料數(shù)據(jù)的參考以及疾病的診斷,也能夠針對(duì)臨床的治療效果進(jìn)行分析與評(píng)價(jià),并且能夠預(yù)測(cè)治療狀況:可以利用醫(yī)院的醫(yī)療數(shù)據(jù)庫,對(duì)于病人的基本患病信息進(jìn)行分類,從而比對(duì)死亡率、治愈率等多個(gè)數(shù)據(jù),實(shí)現(xiàn)治療方案的制訂。而在醫(yī)療質(zhì)量管理過程之中也有很多的影響因素,例如基礎(chǔ)醫(yī)療設(shè)備、病床周轉(zhuǎn)次數(shù)、病種治愈記錄等,所以也可以利用數(shù)據(jù)挖掘技術(shù)來進(jìn)一步加強(qiáng)其多種數(shù)據(jù)之間的關(guān)聯(lián)性,從而為提升醫(yī)院的社會(huì)效益與經(jīng)濟(jì)效益提出合理的參考性建議。
2.3明確數(shù)據(jù)挖掘技術(shù)的應(yīng)用方向
醫(yī)院加強(qiáng)數(shù)據(jù)挖掘技術(shù)應(yīng)用方向的探索上,可以從客戶拓展這個(gè)角度出發(fā)實(shí)現(xiàn)對(duì)于醫(yī)療信息管理。例如通過數(shù)據(jù)挖掘技術(shù)多方進(jìn)行患者信息比對(duì),同時(shí)制訂完善的醫(yī)療服務(wù)影響策略方式,加強(qiáng)對(duì)于客戶行為的分析;在數(shù)據(jù)挖掘的基礎(chǔ)之上,增強(qiáng)其技術(shù)應(yīng)用的實(shí)用性,在分析的基礎(chǔ)之上比對(duì)自身的競(jìng)爭(zhēng)優(yōu)勢(shì),實(shí)現(xiàn)醫(yī)院資源的合理規(guī)劃與合理配置,例如藥品、資金以及疾病診斷等,從而實(shí)現(xiàn)經(jīng)營狀況的優(yōu)化。目前醫(yī)院也逐步向現(xiàn)代化、信息化方向發(fā)展,無論是信息管理還是醫(yī)療技術(shù)方面,醫(yī)院都已經(jīng)成為了一個(gè)信息化的綜合行業(yè)體系,所以在加強(qiáng)數(shù)據(jù)挖掘應(yīng)用的過程之中,還需要加強(qiáng)數(shù)據(jù)信息的管理,實(shí)現(xiàn)數(shù)據(jù)挖掘結(jié)果的維護(hù),從而提升醫(yī)院的決策能力,實(shí)現(xiàn)數(shù)據(jù)挖掘技術(shù)的高效應(yīng)用。
3結(jié)語
醫(yī)院在目前的醫(yī)療信息管理過程之中,還有很大的發(fā)展空間,需要綜合利用數(shù)據(jù)挖掘技術(shù),實(shí)現(xiàn)其信息管理水平的提升。通過明確數(shù)據(jù)挖掘技術(shù)的應(yīng)用方向、應(yīng)用類別以及建模數(shù)據(jù)環(huán)節(jié)的優(yōu)化等,促進(jìn)醫(yī)院管理水平的提升,實(shí)現(xiàn)數(shù)據(jù)挖掘技術(shù)應(yīng)用效果的提升.
參考文獻(xiàn):
[1]鄭勝前.數(shù)據(jù)挖掘技術(shù)在社區(qū)醫(yī)療服務(wù)系統(tǒng)中的應(yīng)用與研究[J].數(shù)字技術(shù)與應(yīng)用,20xx(09):81-82.
[2]廖亮.數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的應(yīng)用[J].中國科技信息,20xx(11):54,56.
[3]牟勇.數(shù)據(jù)挖掘技術(shù)在醫(yī)院信息化系統(tǒng)中應(yīng)用[J].電子測(cè)試,20xx(11):23-24,22.
數(shù)據(jù)挖掘論文 篇9
摘要:中醫(yī)臨床理論多是由著名醫(yī)家的經(jīng)驗(yàn)升華形成的,反映了臨床上不同學(xué)術(shù)派系以及不同學(xué)科的優(yōu)勢(shì)特征,但這其中不免摻雜了個(gè)人主觀經(jīng)驗(yàn),因此本文就中醫(yī)臨床理論研究中醫(yī)病案為基礎(chǔ),對(duì)應(yīng)用病案數(shù)據(jù)挖掘結(jié)果來總結(jié)和重建中醫(yī)臨床理論的方式進(jìn)行了探討,認(rèn)為該方法可為完善中醫(yī)臨床理論提供客觀的數(shù)據(jù)支持,使中醫(yī)臨床理論的來源更具有科學(xué)性。
關(guān)鍵詞:病案;數(shù)據(jù)挖掘;中醫(yī)臨床理論;轉(zhuǎn)化醫(yī)學(xué);臨床
科研一體化中醫(yī)臨床理論決定著中醫(yī)臨床學(xué)科的發(fā)展水平,是中醫(yī)臨床發(fā)展的動(dòng)力。從古至今,中醫(yī)名醫(yī)名家輩出,他們的臨床經(jīng)驗(yàn)和學(xué)術(shù)思想不斷提煉升華,逐步形成了傳統(tǒng)的中醫(yī)臨床理論。新中國成立以來,中醫(yī)不斷汲取最新的科技成果,進(jìn)行了大量臨床實(shí)踐,而中醫(yī)臨床理論發(fā)展緩慢,己經(jīng)成為制約當(dāng)代中醫(yī)學(xué)術(shù)發(fā)展的瓶頸,對(duì)如何開拓中醫(yī)臨床理論的研究,可謂見仁見智,但各種新的臨床理論常常裹挾著“各家學(xué)說”。在當(dāng)今大數(shù)據(jù)和信息技術(shù)發(fā)達(dá)的背景下,運(yùn)用數(shù)據(jù)挖掘技術(shù)對(duì)中醫(yī)病案進(jìn)行大數(shù)據(jù)分析,客觀揭示當(dāng)前中醫(yī)臨床理論的本來面目,盡可能減少個(gè)人見解的偏倚,對(duì)于推動(dòng)中醫(yī)臨床理論發(fā)展具有重要的現(xiàn)實(shí)意義,本文就基于病案數(shù)據(jù)挖掘的中醫(yī)臨床理論重建進(jìn)行探討如下。
1傳統(tǒng)中醫(yī)臨床理論的構(gòu)建框架
1.1中醫(yī)古典文獻(xiàn)是傳統(tǒng)中醫(yī)臨床理論的基礎(chǔ)
眾所周知,中醫(yī)之所以能夠屹立千年不倒,很大一部分原因是因?yàn)槠溆歇?dú)特的理論體系,而在這其中,中醫(yī)古典文獻(xiàn)做出的貢獻(xiàn)應(yīng)該是第一位的。因?yàn)檫@些古典文獻(xiàn)的記載和流傳,為后世的醫(yī)家提供了參考和借鑒,使得我們從前人的思維上不斷創(chuàng)新,與臨床進(jìn)行有機(jī)結(jié)合,不斷研究出新的適合于當(dāng)前時(shí)代的臨床理論。例如,中醫(yī)學(xué)無論在理論研究還是在臨床治療方面的豐富,許多根本性的理論都是源自于《內(nèi)經(jīng)》。該書創(chuàng)立了藏象、經(jīng)絡(luò)、診法等各方面的理論[1],勾畫了中醫(yī)理論的雛形,構(gòu)建了中醫(yī)理論體系的基本框架。到后期東漢時(shí)期張仲景的《傷寒論》則是創(chuàng)造了以六經(jīng)辨證和臟腑辨證為主的局面,其所倡導(dǎo)的“觀其脈證,知犯何逆,隨證治之”使得辨證論治登上新的高度。到了金元時(shí)期,就是百家爭(zhēng)鳴的時(shí)代,這期間以金元四大家為主的學(xué)派開始萌生,留下了許多可供后世醫(yī)家參考的古典文獻(xiàn)并創(chuàng)建了不同的臨床理論,而明清時(shí)期以葉天士和吳鞠通為首確立的衛(wèi)氣營血和三焦辨證,使溫病學(xué)的辨證理論逐步趨于完善,至今仍是指導(dǎo)臨床治療溫?zé)岵〉睦碚撘罁?jù)?傊瑐鹘y(tǒng)中醫(yī)臨床理論的構(gòu)建和完善,離不開前人的摸索與貢獻(xiàn),也得益于著名醫(yī)學(xué)家創(chuàng)建的傳統(tǒng)中醫(yī)理論,使得我們現(xiàn)在的中醫(yī)體系不斷的飽滿和充實(shí)。
1.2當(dāng)代著名中醫(yī)的臨床經(jīng)驗(yàn)不斷提升為中醫(yī)臨床理論
傳統(tǒng)中醫(yī)的臨床理論,在很大程度上展示著著名醫(yī)家的臨床經(jīng)驗(yàn)。在中醫(yī)理論與實(shí)踐發(fā)展的相互促進(jìn)過程中,當(dāng)代醫(yī)家通過讀書、臨證、心悟?qū)?shí)踐經(jīng)驗(yàn)不斷總結(jié)并升華為理論,又在實(shí)踐中不斷完善既有的理論,成為中醫(yī)理論發(fā)展的重要途徑和模式,而當(dāng)代中醫(yī)理論的發(fā)展則需要將傳統(tǒng)理論與現(xiàn)代實(shí)踐相互融合起來。例如上世紀(jì)60年代時(shí),面對(duì)中醫(yī)基礎(chǔ)理論中新的思想相對(duì)匱乏的這一局面,鄧鐵濤結(jié)合其治療的臨床經(jīng)驗(yàn),首次提出了“五臟相關(guān)學(xué)說”。盡管當(dāng)時(shí)的理論準(zhǔn)備并不完善,但是這一理論的提出,在很大程度上完善并且取代了“五行學(xué)說”中某些模糊性和不確定性,并且隨著時(shí)代的發(fā)展,逐漸驗(yàn)證了鄧?yán)系倪@一經(jīng)驗(yàn)的正確性,也成為指導(dǎo)中醫(yī)臨床理論的一大重要體系[2]。又如,腦出血這一現(xiàn)代疾病在古代名為中風(fēng),多數(shù)是“從風(fēng)而治”,認(rèn)為肝臟與中風(fēng)的關(guān)系最為密切。隨著時(shí)代的推進(jìn),自20世紀(jì)80年代以來,許多學(xué)者根據(jù)微觀辨證和中醫(yī)理論“離經(jīng)之血便是瘀”,提出急性出血中風(fēng)屬中醫(yī)血證,瘀血阻滯是急性期腦出血的最基本病機(jī),是治療的關(guān)鍵所在[3]。故現(xiàn)代中醫(yī)臨床治療上多以活血化瘀法治療腦出血、腦梗塞這一系列疾病。若是仔細(xì)研讀傳統(tǒng)中醫(yī)臨床理論后,我們不難得出其構(gòu)成和完善離不開當(dāng)代著名醫(yī)家的臨床經(jīng)驗(yàn),它是在歷經(jīng)歲月的洗禮下不斷塑造成型的。
1.3傳統(tǒng)中醫(yī)臨床理論不斷將現(xiàn)代醫(yī)學(xué)相關(guān)內(nèi)容中醫(yī)化
傳統(tǒng)中醫(yī)臨床理論不斷吸收現(xiàn)代醫(yī)學(xué)的理論,將其相關(guān)內(nèi)容不斷中醫(yī)化,將病人的各種證型通過五臟辨證、陰陽五行辨證以及八綱辨證劃分得越來越細(xì)化,以提供病人在中醫(yī)臨床上治療的理論依據(jù)。中醫(yī)吸取了現(xiàn)代醫(yī)學(xué)理論后正在不斷壯大其內(nèi)容,現(xiàn)代醫(yī)學(xué)相關(guān)內(nèi)容中醫(yī)化在許多難治疾病的辨證治療中都起到了良好的指導(dǎo)作用[4]。如艾滋病是古代傳統(tǒng)中醫(yī)辨證論治的空白,通過對(duì)艾滋病中醫(yī)病因病機(jī)、證候規(guī)律、治法方藥的系統(tǒng)研究,提出了“艾毒傷元”“脾為樞機(jī)”“氣虛為本”的病因病機(jī)學(xué)說,確立了艾滋病“培元解毒”“益氣健脾”的治療原則,為中醫(yī)藥防治艾滋病奠定了理論基礎(chǔ),為進(jìn)一步提高艾滋病的中醫(yī)藥臨床診療效果提供理論依據(jù)[5]。
2當(dāng)前中醫(yī)臨床理論發(fā)展存在的不足
2.1中醫(yī)主流理論不突出且與時(shí)俱進(jìn)力度不夠
不可否認(rèn)的是,當(dāng)代的中醫(yī)臨床理論發(fā)展也是存在諸多不足的,中醫(yī)理論的完善和發(fā)展是中華五千年來集體智慧的結(jié)晶,個(gè)別醫(yī)家提出的臨床理論可能各有千秋,其所立的角度和思維也不盡相同。例如,同是治療輸卵管阻塞這一疾病時(shí),朱南孫教授認(rèn)為多是由于濕蘊(yùn)沖任所致,其用自擬的清熱利濕方來進(jìn)行治療;而李廣文教授則認(rèn)為這一疾病多是由于瘀血阻絡(luò)為主,治療上以活血祛瘀為法,擬通任種子湯進(jìn)行治療[6]。又如對(duì)于“和解法”這一治療方法的理解,當(dāng)代名醫(yī)蒲輔周老先生認(rèn)為“寒熱并用,補(bǔ)瀉合劑,表里雙解,苦辛分消,調(diào)和氣血,皆謂和解”。而方和謙教授則認(rèn)為“在治法上扶正祛邪,表里兼顧,此法就為和解法”。不同的醫(yī)家在面對(duì)不同的疾病,甚至是不同的理法方藥時(shí),所持的看法常常是“各家學(xué)說”,這就導(dǎo)致了當(dāng)前中醫(yī)臨床理論發(fā)展比較混亂,不能全面地體現(xiàn)中國五千年來發(fā)展過程中的中醫(yī)主流理論。目前中醫(yī)基礎(chǔ)理論還存在一個(gè)缺陷就是它的與時(shí)俱進(jìn)力度還不夠,很多古代經(jīng)典方藥的.主治病癥,在當(dāng)今時(shí)代已經(jīng)不再多見了。比如蛔蟲導(dǎo)致的蛔厥這一致病因素在現(xiàn)代已經(jīng)不再常見,對(duì)應(yīng)的烏梅丸的主要適應(yīng)病癥也不再是蛔厥;在針對(duì)沒有明顯臨床表現(xiàn)的疾病如乙肝時(shí),按傳統(tǒng)中醫(yī)往往體現(xiàn)出“無證可治”的狀態(tài);傳統(tǒng)的診斷與現(xiàn)代檢查相結(jié)合的力度也不夠,中醫(yī)臨床基礎(chǔ)理論在某些程度上忽略了其與生化、B超、X光、CT等現(xiàn)代檢查結(jié)果的結(jié)合,并沒有用中醫(yī)理論對(duì)其做一合理的陳述;且現(xiàn)在臨床上很多中藥的藥理作用、性味歸經(jīng)的研究作用還不夠深入、細(xì)致,其作用不能在微觀上得以解釋。這些都導(dǎo)致了臨床上很多情況沒有從中醫(yī)理論來認(rèn)識(shí)中醫(yī),不是“以中解中”,而是“以西解中”,形成了臨床拋棄中醫(yī)理論的狀態(tài)[7]。由于中醫(yī)學(xué)是一門實(shí)踐性很強(qiáng)的學(xué)科,它是在哲學(xué)辨證的思想指導(dǎo)下,與臨床經(jīng)驗(yàn)不斷結(jié)合,這與西醫(yī)知識(shí)體系相比較,難免存在一定的滯后性,這都會(huì)使得中醫(yī)臨床理論發(fā)展相對(duì)的落后。
2.2部分中醫(yī)理論帶有權(quán)威專家的“個(gè)人學(xué)說”偏見
傳統(tǒng)中醫(yī)強(qiáng)調(diào)個(gè)人經(jīng)驗(yàn)和學(xué)說,以中醫(yī)內(nèi)科學(xué)為例,第八版中的腦系疾病在第九版中已經(jīng)刪除,其涉及到的各種腦系疾病大多數(shù)歸屬于心系疾病與肝系疾病。根據(jù)其版本的不同,我們可以明顯看出其凸顯的中心內(nèi)容及其思想不同,其多是體現(xiàn)編著者的理論思想,在一定程度上并沒有客觀地揭示疾病的本質(zhì),治療理論也不夠完善,一部分內(nèi)容與最新研究得出的論文理論不符,這使得當(dāng)代中醫(yī)臨床理論在某些程度上,帶有權(quán)威專家的“個(gè)人學(xué)說”色彩。由于現(xiàn)代西方先進(jìn)的科技文化流入,使得中醫(yī)在一定程度上備受質(zhì)疑,而正是因?yàn)槿藗儗?duì)于中醫(yī)理論的一些偏見,才使得中醫(yī)長(zhǎng)期讓人詬病。
3新的時(shí)代背景下中醫(yī)臨床理論發(fā)展方向
3.1臨床理論應(yīng)具有真實(shí)性與系統(tǒng)性
中醫(yī)臨床理論的發(fā)展方形應(yīng)當(dāng)是建立在客觀并且真實(shí)的臨床實(shí)踐基礎(chǔ)上,從一次次臨床實(shí)踐中得出。由于歷史時(shí)代的原因以及假設(shè)推理、模式建設(shè)的廣泛使用,當(dāng)代中醫(yī)臨床理論中理論與假說并存的現(xiàn)象較為普遍,如中醫(yī)的五運(yùn)六氣學(xué)說對(duì)現(xiàn)代疫病預(yù)測(cè)和人體各經(jīng)絡(luò)臟腑在時(shí)間上對(duì)于人體治病效果的不同等,就需要我們?cè)谠鷮?shí)的文獻(xiàn)與臨床實(shí)踐基礎(chǔ)上,對(duì)醫(yī)案進(jìn)行認(rèn)真總結(jié),利用科學(xué)的方法深入挖掘,開展中醫(yī)理論的去偽存真研究,以促進(jìn)中醫(yī)理論的科學(xué)與健康發(fā)展。另外,傳統(tǒng)的中醫(yī)臨床治療上所用的理法方藥,多是根據(jù)個(gè)人經(jīng)驗(yàn)所進(jìn)行的。隨著科技的不斷發(fā)展與時(shí)代的不斷進(jìn)步,當(dāng)代的中醫(yī)臨床理論應(yīng)該在成功的中醫(yī)醫(yī)案上進(jìn)行系統(tǒng)的總結(jié),不斷挖掘和研究其微觀的結(jié)構(gòu),并隨著年月的更迭不斷更新,不斷完善,使其具有科學(xué)性和理論依據(jù)。同時(shí),對(duì)近年來興起的傳染性非典型肺炎、艾滋病、禽流感等古人所沒有經(jīng)歷過的疾病的診治,中醫(yī)就其病因病機(jī)的認(rèn)識(shí)以及探究相應(yīng)的診療方法,無疑也是一種理論上的創(chuàng)新[8]。通過對(duì)其進(jìn)行深一層次的研究和發(fā)現(xiàn),歸納出合適的治則治法,找到針對(duì)這一疾病的理法方藥,使其更具有系統(tǒng)性,使得臨床上中醫(yī)治病可以循序漸進(jìn),注重整體,也是當(dāng)代臨床理論的一大發(fā)展方向。
3.2臨床理論具有信息化的特點(diǎn)并可持續(xù)拓展
隨著時(shí)代的進(jìn)步,當(dāng)代的中醫(yī)臨床理論可以通過網(wǎng)絡(luò)等方式進(jìn)行共享,在大數(shù)據(jù)的這一時(shí)代背景下,隨著病案的不斷報(bào)道與積累,可以將各類成功的中醫(yī)醫(yī)案進(jìn)行統(tǒng)計(jì)和挖掘,其結(jié)果也會(huì)不斷進(jìn)行更新和發(fā)展。不同的醫(yī)家對(duì)于某一疾病的認(rèn)識(shí)角度可能不同,其表現(xiàn)在病位、病性、病勢(shì)和證候的判斷標(biāo)準(zhǔn)也不一樣,因此方藥規(guī)律也不一樣。而通過統(tǒng)計(jì)某一中醫(yī)或西醫(yī)疾病的較大樣本病例,并對(duì)其進(jìn)行數(shù)據(jù)挖掘,可以得出整個(gè)中醫(yī)群體對(duì)于這一疾病診治的證候分布、治則治法、處方用藥等的規(guī)律,甚至可以根據(jù)統(tǒng)計(jì)的結(jié)果探索出新的方藥,分析他們的共同點(diǎn)和所在差異。將中醫(yī)臨床理論具有信息化的這一特點(diǎn)不斷地拓展下去,通過計(jì)算機(jī)等客觀科學(xué)的手段進(jìn)行分析,與主觀的名老中醫(yī)傳承模式相比,更具客觀性,更容易被臨床醫(yī)生接受,對(duì)各種疾病的中醫(yī)臨床用藥也更具有指導(dǎo)價(jià)值。
4基于病案數(shù)據(jù)挖掘的中醫(yī)臨床理論重建
4.1病案研究是中醫(yī)理論發(fā)展的重要基礎(chǔ)
在當(dāng)今大數(shù)據(jù)的時(shí)代背景下,中醫(yī)固有的傳統(tǒng)整體論科學(xué)特征有了越來越多的可供改變的空間。這種變化既為其按照自身特有的規(guī)律發(fā)展特點(diǎn)帶來了機(jī)遇,也給未來中醫(yī)理論的發(fā)展提出了挑戰(zhàn)。同時(shí),學(xué)習(xí)醫(yī)案研究也是中醫(yī)學(xué)相關(guān)大學(xué)生們應(yīng)該學(xué)習(xí)的一項(xiàng)內(nèi)容。閱讀醫(yī)案是必要的訓(xùn)練,也是中醫(yī)入門的方法之一。醫(yī)案的故事性引人入勝,在自然而然中接受中醫(yī)思維方法和傳統(tǒng)文化知識(shí),同時(shí)醫(yī)案中所呈現(xiàn)的名醫(yī)風(fēng)范,醫(yī)德對(duì)學(xué)生起到潛移默化的影響,并培養(yǎng)對(duì)專業(yè)的熱愛[9]。病案客觀、真實(shí)地直接記錄疾病診斷和治療過程,醫(yī)案研究作為中醫(yī)理論發(fā)展過程中至關(guān)重要的一環(huán),是中醫(yī)理論發(fā)展的重要基礎(chǔ),以研究病案為基礎(chǔ),對(duì)于中醫(yī)理論的形成和臨床上中醫(yī)積累經(jīng)驗(yàn),都起到了一定的輔助提升作用。
4.2數(shù)據(jù)挖掘方法是中醫(yī)理論發(fā)展的現(xiàn)代技術(shù)手段
利用多種數(shù)據(jù)挖掘技術(shù)對(duì)中醫(yī)病案中的有關(guān)信息行進(jìn)行歸納、整理,是近年來傳承中醫(yī)臨床經(jīng)驗(yàn)的重要方法之一[10]。通過對(duì)同一種疾病的病案進(jìn)行數(shù)據(jù)挖掘以分析醫(yī)者的思路和探索其用藥的方法,對(duì)中醫(yī)臨床病案進(jìn)行規(guī)范化的整理,能夠深入總結(jié)其臨床經(jīng)驗(yàn),挖掘隱藏在大量病案背后的診治規(guī)律,甚至探索出新的方藥配伍,為中醫(yī)理論的發(fā)展提供一定的科學(xué)依據(jù)的同時(shí),使得中醫(yī)理論的發(fā)展越來越現(xiàn)代化,不僅僅只是停留在以前的靠讀書和個(gè)人經(jīng)驗(yàn)的結(jié)合,也為廣大的中醫(yī)在日后的臨床治療上提供了新的思路和方向。
4.3臨床實(shí)踐推動(dòng)理論發(fā)展,賦予轉(zhuǎn)化醫(yī)學(xué)新的內(nèi)涵
目前,我們通過并按數(shù)據(jù)挖掘來總結(jié)一些中醫(yī)對(duì)于治療同一種疾病所采取的診斷和用藥,可以獲得新的思路,并且為完善我們現(xiàn)有的中醫(yī)理論基礎(chǔ)可以提供可靠的理論支持。采用數(shù)據(jù)挖掘技術(shù)對(duì)中醫(yī)學(xué)術(shù)思想和臨證經(jīng)驗(yàn)進(jìn)行研究,可以全面解析其中的規(guī)律,分析中醫(yī)個(gè)體化診療信息特征,提煉出臨證經(jīng)驗(yàn)中蘊(yùn)藏的新理論、新力法,可以實(shí)現(xiàn)經(jīng)驗(yàn)的有效總結(jié)與傳承[11]。與此同時(shí),要求我們用發(fā)展的眼光將現(xiàn)代的科技手段整合加入到傳統(tǒng)的中醫(yī)學(xué)理論中去,推陳出新,通過臨床實(shí)踐與基礎(chǔ)理論的不斷結(jié)合,不斷完善,推動(dòng)祖國醫(yī)學(xué)現(xiàn)代化,譜寫有關(guān)于中醫(yī)學(xué)在轉(zhuǎn)化醫(yī)學(xué)上新的篇章。
參考文獻(xiàn)
[1]劉向哲.中醫(yī)理論創(chuàng)新與發(fā)展的基礎(chǔ)和機(jī)遇[J].中醫(yī)學(xué)報(bào),2010,25(5):884-885.
[2]邱仕君,吳玉生.在基礎(chǔ)理論與臨床醫(yī)學(xué)之間———對(duì)鄧鐵濤教授五臟相關(guān)學(xué)說的理論思考[J].湖北民族學(xué)院學(xué)報(bào)(醫(yī)學(xué)版),2005,22(2):36-39.
[3]顧寧,周仲英.通下法治療急性腦出血研究進(jìn)展[J].中國中醫(yī)急診,2000,9(5):227.
[4]靳士英.鄧鐵濤教授學(xué)術(shù)成就管[J].現(xiàn)代醫(yī)院,2004(9):1-6.
[5]許前磊,徐立然,郭會(huì)軍,等.艾滋病發(fā)病與防治中醫(yī)理論的初步構(gòu)建[J].中醫(yī)雜志,2015,56(11):909-911.
[6]張少聰,周偉生.名老中醫(yī)驗(yàn)方治療輸卵管阻塞性不孕癥概況[J].中華中醫(yī)藥學(xué)刊,2010(3):489-491.
[7]孟靜巖,應(yīng)森林.試論中醫(yī)基礎(chǔ)理論指導(dǎo)臨床研究的思考與途徑[J].上海中醫(yī)藥大學(xué)學(xué)報(bào),2009(3):3-5.
[8]邢玉瑞.新形勢(shì)下中醫(yī)理論發(fā)展的思考[J].中醫(yī)雜志,2016,57(18):1540-1542.
[9]盧峰,聶達(dá)榮,彭美玉,等.中醫(yī)內(nèi)科學(xué)應(yīng)用名老中醫(yī)病案教學(xué)法的探索[J].中國中醫(yī)藥現(xiàn)代遠(yuǎn)程教育,2014(18):80-82.
[10]郭軍.基于數(shù)據(jù)挖掘分析前名老中醫(yī)病案整理的思路與方法[J].中醫(yī)藥信息,2011,28(2):49-50.
[11]吳嘉瑞,唐仕歡,郭位先,等.基于數(shù)據(jù)挖掘的名老中醫(yī)經(jīng)驗(yàn)傳承研究述評(píng)[J].中國中藥雜志,2014,39(4):614-617.
數(shù)據(jù)挖掘論文 篇10
計(jì)算機(jī)技術(shù)的不斷發(fā)展,信息技術(shù)不斷加強(qiáng),在社會(huì)新的發(fā)展趨勢(shì)下,以往的傳統(tǒng)管理模式落后于現(xiàn)代化發(fā)展的管理水平。為了創(chuàng)新檔案管理的模式,提高檔案管理的質(zhì)量,在現(xiàn)代檔案信息管理系統(tǒng)中引入數(shù)據(jù)挖掘技術(shù)。
1、信息挖掘技術(shù)
1.1數(shù)據(jù)挖掘技術(shù)概述
數(shù)據(jù)挖掘技術(shù)是一種基于統(tǒng)計(jì)學(xué)、人工智能等等技術(shù)基礎(chǔ)上,能夠自動(dòng)分析原有數(shù)據(jù),從而做出歸納整理,并對(duì)其潛在的模式進(jìn)行挖掘的決策支持過程,簡(jiǎn)單來說就是從一系列復(fù)雜的數(shù)據(jù)中提取人們需要的潛在性信息。
1.2數(shù)據(jù)挖掘技術(shù)的方法
二十世紀(jì)末,計(jì)算機(jī)挖掘技術(shù)產(chǎn)生。其一般用到的方法有:
。1)孤立點(diǎn)分析。孤立點(diǎn)分析法主要用于對(duì)于特殊信息的挖掘。
。2)聚類分析。聚類分析方法是在指定的對(duì)象中,對(duì)其價(jià)值聯(lián)系進(jìn)行搜索。
(3)分類分析。分類分析就是找出具有一定特點(diǎn)的數(shù)據(jù),對(duì)需要解讀的數(shù)據(jù)進(jìn)行識(shí)別。
。4)關(guān)聯(lián)性分析。關(guān)聯(lián)性分析方法是對(duì)指定數(shù)據(jù)中出現(xiàn)頻繁的數(shù)據(jù)進(jìn)行挖掘。
。5)序列分析。與關(guān)聯(lián)性分析法一樣,由數(shù)據(jù)之間內(nèi)在的聯(lián)系得出潛在的關(guān)聯(lián)。
1.3計(jì)算機(jī)挖掘技術(shù)的形式分析
計(jì)算機(jī)挖掘技術(shù)在使用過程中,收集到的數(shù)據(jù)不同,數(shù)據(jù)收集的方法也就不同。在對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行形式分析的時(shí)候,主要用到:分類形式、粗糙集形式、相關(guān)規(guī)則形式。
2、計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)在檔案信息管理
系統(tǒng)中的應(yīng)用計(jì)算機(jī)挖掘技術(shù),能夠?qū)㈦[藏的信息挖掘出來并進(jìn)行總結(jié)和利用,運(yùn)用到檔案管理中來,在充分發(fā)揮挖掘技術(shù)作用的同時(shí),極大的提高了檔案數(shù)據(jù)的利用價(jià)值。數(shù)據(jù)挖掘技術(shù)在檔案管理系統(tǒng)中,一般用到的方法為:
2.1收集法
該方法在對(duì)數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行分析的基礎(chǔ)上,建立對(duì)已知數(shù)據(jù)詳細(xì)描述的概念模型。然后將每個(gè)測(cè)試的樣本與此模型進(jìn)行比較,若有一個(gè)模型在測(cè)試中被認(rèn)可,就可以以此模型對(duì)管理的對(duì)象分類。例如,檔案管理員就某事向客戶進(jìn)行問卷調(diào)查并將答案輸入到數(shù)據(jù)庫中。在該數(shù)據(jù)庫中,對(duì)客戶的回答進(jìn)行具體屬性描述,當(dāng)有新的回答內(nèi)容輸入的時(shí)候,系統(tǒng)會(huì)自動(dòng)對(duì)該客戶需求分類,在減輕管理員工作壓力的同時(shí),提高了檔案管理的效率。
2.2保留法
該方法是防止老客戶檔案丟失并將客戶留住的過程。對(duì)于任何一個(gè)企業(yè)來說,發(fā)展一個(gè)新的客戶的成本要遠(yuǎn)遠(yuǎn)高于留住一個(gè)來客戶的成本。在客戶保留的過程中,對(duì)客戶檔案流失原因的分析至關(guān)重要,因此,采用挖掘技術(shù)對(duì)其進(jìn)行分析是必要的。
2.3分類法
通過計(jì)算機(jī)挖掘技術(shù)對(duì)檔案進(jìn)行分類,按照不同的性質(zhì)進(jìn)行系統(tǒng)的劃分,將所有相似或相通的檔案進(jìn)行整理,在人們需要的時(shí)候,能夠快速的被提取出來,提高了檢索的效率和分類的專業(yè)性。
3、檔案管理引入計(jì)算機(jī)挖掘技術(shù)的必要性
計(jì)算機(jī)挖掘技術(shù)的應(yīng)用,對(duì)檔案管理方式的不斷完善有著極其重要的意義,其重要性主要體現(xiàn)在:
3.1對(duì)檔案的`保護(hù)更全面
一部分具有歷史意義的檔案,隨著保存的時(shí)間不斷增加,其年代感加強(qiáng),意義和價(jià)值增大。相應(yīng)的,利用的頻率會(huì)隨著利用的價(jià)值增加,也更容易被損壞從而導(dǎo)致檔案信息壽命折損,此外,管理不當(dāng)造成泄密,使檔案失去了原本的利用價(jià)值,這種存在于檔案管理和利用之間的矛盾,使得檔案管理面臨著巨大的難題。挖掘技術(shù)的運(yùn)用,緩解了這種矛盾,在檔案管理工作中具有重要的意義。
3.2提升檔案管理的質(zhì)量
在檔案信息管理系統(tǒng)中引入計(jì)算機(jī)挖掘技術(shù),使得檔案信息管理打破了傳統(tǒng)的模式,通過挖掘技術(shù),對(duì)管理的模式有了極大的創(chuàng)新,工作人員以往繁重的工作壓力得到釋放,時(shí)間和精力更加豐富,在對(duì)檔案管理的細(xì)節(jié)方面也就更加注意,同時(shí)也加快了對(duì)檔案的數(shù)據(jù)信息進(jìn)行處理的速度,提升檔案管理的整體質(zhì)量。
4、結(jié)語
綜上所述,計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)涉及的內(nèi)容很廣,對(duì)挖掘技術(shù)的運(yùn)用,使得各行各業(yè)的發(fā)展水平得到了很大的提高,推動(dòng)社會(huì)經(jīng)濟(jì)的發(fā)展,帶動(dòng)社會(huì)發(fā)展模式的創(chuàng)新。在檔案管理中使用計(jì)算機(jī)挖掘技術(shù),使得檔案信息保存的方法及安全性有了很大的提高。同時(shí),也需要檔案信息管理人員在進(jìn)行檔案信息管理的時(shí)候,能合理利用計(jì)算機(jī)信息挖掘技術(shù),在提高工作效率的同時(shí),促進(jìn)管理模式的不斷創(chuàng)新,以適應(yīng)時(shí)代發(fā)展的要求。
數(shù)據(jù)挖掘論文 篇11
網(wǎng)絡(luò)的發(fā)展帶動(dòng)了電子商務(wù)市場(chǎng)的繁華,大量的商品、信息在現(xiàn)有的網(wǎng)絡(luò)平臺(tái)上患上以交易,大大簡(jiǎn)化了傳統(tǒng)的交易方式,節(jié)儉了時(shí)間,提高了效力,但電子市場(chǎng)繁華違后暗藏的問題,同樣成為人們關(guān)注的焦點(diǎn),凸起表現(xiàn)在海量信息的有效應(yīng)用上,如何更為有效的管理應(yīng)用潛伏信息,使他們的最大功效患上以施展,成為人們現(xiàn)在鉆研的重點(diǎn),數(shù)據(jù)發(fā)掘技術(shù)的發(fā)生,在必定程度上解決了這個(gè)問題,但它也存在著問題,需要不斷改善。
數(shù)據(jù)發(fā)掘(Data Mining)就是從大量的、不完整的、有噪聲的、隱約的、隨機(jī)的原始數(shù)據(jù)中,提取隱含在其中的、人們事前不知道的、但又是潛伏有用的信息以及知識(shí)的進(jìn)程;蛘哒哒f是從數(shù)據(jù)庫中發(fā)現(xiàn)有用的知識(shí)(KDD),并進(jìn)行數(shù)據(jù)分析、數(shù)據(jù)融會(huì)(Data Fusion)和決策支撐的進(jìn)程。數(shù)據(jù)發(fā)掘是1門廣義的交叉學(xué)科,它匯聚了不同領(lǐng)域的鉆研者,特別是數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計(jì)、可視化、并行計(jì)算等方面的學(xué)者以及工程技術(shù)人員。
數(shù)據(jù)發(fā)掘技術(shù)在電子商務(wù)的利用
一 找到潛伏客戶
在對(duì)于 Web 的客戶走訪信息的發(fā)掘中, 應(yīng)用分類技術(shù)可以在Internet 上找到未來的潛伏客戶。使用者可以先對(duì)于已經(jīng)經(jīng)存在的走訪者依據(jù)其行動(dòng)進(jìn)行分類,并依此分析老客戶的1些公共屬性, 抉擇他們分類的癥結(jié)屬性及互相間瓜葛。對(duì)于于1個(gè)新的走訪者, 通過在Web 上的分類發(fā)現(xiàn), 辨認(rèn)出這個(gè)客戶與已經(jīng)經(jīng)分類的老客戶的1些公共的描寫, 從而對(duì)于這個(gè)新客戶進(jìn)行正確的分類。然后從它的分類判斷這個(gè)新客戶是有益可圖的客戶群仍是無利可圖的客戶群,抉擇是不是要把這個(gè)新客戶作為潛伏的客戶來對(duì)于待?蛻舻念愋涂隙ê, 可以對(duì)于客戶動(dòng)態(tài)地展現(xiàn) Web 頁面, 頁面的內(nèi)容取決于客戶與銷售商提供的產(chǎn)品以及服務(wù)之間的關(guān)聯(lián)。若為潛伏客戶, 就能夠向這個(gè)客戶展現(xiàn)1些特殊的、個(gè)性化的頁面內(nèi)容。
二 實(shí)現(xiàn)客戶駐留
在電子商務(wù)中, 傳統(tǒng)客戶與銷售商之間的空間距離已經(jīng)經(jīng)不存在, 在 Internet 上, 每一1個(gè)銷售商對(duì)于于客戶來講都是1樣的, 那末使客戶在自己的銷售站點(diǎn)上駐留更長(zhǎng)的時(shí)間, 對(duì)于銷售商來講則是1個(gè)挑戰(zhàn)。為了使客戶在自己的網(wǎng)站上駐留更長(zhǎng)的時(shí)間, 就應(yīng)當(dāng)全面掌握客戶的閱讀行動(dòng), 知道客戶的興致及需求所在, 并依據(jù)需求動(dòng)態(tài)地向客戶做頁面舉薦, 調(diào)劑 Web 頁面, 提供獨(dú)有的1些商品信息以及廣告, 以使客戶滿意, 從而延長(zhǎng)客戶在自己的網(wǎng)站上的駐留的時(shí)間。
三 改良站點(diǎn)的設(shè)計(jì)
數(shù)據(jù)發(fā)掘技術(shù)可提高站點(diǎn)的效力, Web 設(shè)計(jì)者再也不完整依托專家的定性指點(diǎn)來設(shè)計(jì)網(wǎng)站, 而是依據(jù)走訪者的信息特征來修改以及設(shè)計(jì)網(wǎng)站結(jié)構(gòu)以及外觀。站點(diǎn)上頁面內(nèi)容的支配以及連接就如超級(jí)市場(chǎng)中物品的貨架左右1樣, 把擁有必定支撐度以及信任度的相干聯(lián)的物品擺放在1起有助于銷售。網(wǎng)站盡量做到讓客戶等閑地走訪到想走訪的頁面, 給客戶留下好的印象, 增添下次走訪的機(jī)率。
四 進(jìn)行市場(chǎng)預(yù)測(cè)
通過 Web 數(shù)據(jù)發(fā)掘, 企業(yè)可以分析顧客的將來行動(dòng), 容易評(píng)測(cè)市場(chǎng)投資回報(bào)率, 患上到可靠的市場(chǎng)反饋信息。不但大大降低公司的運(yùn)營本錢, 而且便于經(jīng)營決策的制訂。
數(shù)據(jù)發(fā)掘在利用中面臨的問題
一數(shù)據(jù)發(fā)掘分析變量的選擇
數(shù)據(jù)發(fā)掘的基本問題就在于數(shù)據(jù)的數(shù)量以及維數(shù),數(shù)據(jù)結(jié)構(gòu)顯的無比繁雜,數(shù)據(jù)分析變量即是在數(shù)據(jù)發(fā)掘中技術(shù)利用中發(fā)生的,選擇適合的分析變量,將提高數(shù)據(jù)發(fā)掘的效力,尤其合用于電子商務(wù)中大量商品和用戶信息的處理。
針對(duì)于這1問題,咱們完整可以用分類的法子,分析出不同信息的屬性和呈現(xiàn)頻率進(jìn)而抽象出變量,運(yùn)用到所選模型中,進(jìn)行分析。
二數(shù)據(jù)抽取的法子的選擇
數(shù)據(jù)抽取的目的是對(duì)于數(shù)據(jù)進(jìn)行濃縮,給出它的緊湊描寫,如乞降值、平均值、方差值、等統(tǒng)計(jì)值、或者者用直方圖、餅狀圖等圖形方式表示,更主要的是他從數(shù)據(jù)泛化的角度來討論數(shù)據(jù)總結(jié)。數(shù)據(jù)泛化是1種把最原始、最基本的信息數(shù)據(jù)從低層次抽象到高層次上的進(jìn)程?刹扇《嗑S數(shù)據(jù)分析法子以及面向?qū)傩缘臍w納法子。
在電子商務(wù)流動(dòng)中,采取維數(shù)據(jù)分析法子進(jìn)行數(shù)據(jù)抽取,他針對(duì)于的是電子商務(wù)流動(dòng)中的客戶數(shù)據(jù)倉庫。在數(shù)據(jù)分析中時(shí)常要用到諸如乞降、共計(jì)、平均、最大、最小等匯集操作,這種操作的'計(jì)算量尤其大,可把匯集操作結(jié)果預(yù)先計(jì)算并存儲(chǔ)起來,以便用于決策支撐系統(tǒng)使用
三數(shù)據(jù)趨勢(shì)的預(yù)測(cè)
數(shù)據(jù)是海量的,那末數(shù)據(jù)中就會(huì)隱含必定的變化趨勢(shì),在電子商務(wù)中對(duì)于數(shù)據(jù)趨勢(shì)的預(yù)測(cè)尤為首要,尤其是對(duì)于客戶信息和商品信息公道的預(yù)測(cè),有益于企業(yè)有效的決策,取得更多地利潤。但如何對(duì)于這1趨勢(shì)做出公道的預(yù)測(cè),現(xiàn)在尚無統(tǒng)1標(biāo)準(zhǔn)可尋,而且在進(jìn)行數(shù)據(jù)發(fā)掘進(jìn)程中大量數(shù)據(jù)構(gòu)成文本后格式的非標(biāo)準(zhǔn)化,也給數(shù)據(jù)的有效發(fā)掘帶來了難題。
針對(duì)于這1問題的發(fā)生,咱們?cè)陔娮由虅?wù)中可以利用聚類分析的法子,把擁有類似閱讀模式的用戶集中起來,對(duì)于其進(jìn)行詳細(xì)的分析,從而提供更合適、更令用戶滿意的服務(wù)。聚類分析法子的優(yōu)勢(shì)在于便于用戶在查看日志時(shí)對(duì)于商品及客戶信息有全面及清晰的把握,便于開發(fā)以及執(zhí)行未來的市場(chǎng)戰(zhàn)略,包含自動(dòng)給1個(gè)特定的顧客聚類發(fā)送銷售郵件,為1個(gè)顧客聚類動(dòng)態(tài)地扭轉(zhuǎn)1個(gè)特殊的站點(diǎn)等,這不管對(duì)于客戶以及銷售商來講都是成心義。
四數(shù)據(jù)模型的可靠性
數(shù)據(jù)模型包含概念數(shù)據(jù)模型、邏輯數(shù)據(jù)模型、物理模型。數(shù)據(jù)發(fā)掘的模型目前也有多種,包含采集模型、處理模型及其他模型,但不管哪一種模型都不是很成熟存在缺點(diǎn),對(duì)于數(shù)據(jù)模型不同采取不同的方式利用。可能發(fā)生不同的結(jié)果,乃至差異很大,因而這就觸及到數(shù)據(jù)可靠性的問題。數(shù)據(jù)的可靠性對(duì)于于電子商務(wù)來講尤為首要作用。
針對(duì)于這1問題,咱們要保障數(shù)據(jù)在發(fā)掘進(jìn)程中的可靠性,保證它的準(zhǔn)確性與實(shí)時(shí)性,進(jìn)而使其在最后的結(jié)果中的準(zhǔn)確度到達(dá)最高,同時(shí)在利用模型進(jìn)程中要盡可能全面的分析問題,防止片面,而且分析結(jié)果要由多人進(jìn)行評(píng)價(jià),從而最大限度的保證數(shù)據(jù)的可靠性。
五數(shù)據(jù)發(fā)掘觸及到數(shù)據(jù)的私有性以及安全性
大量的數(shù)據(jù)存在著私有性與安全性的問題,尤其是電子商務(wù)中的各種信息,這就給數(shù)據(jù)發(fā)掘造成為了必定的阻礙,如何解決這1問題成了技術(shù)在利用中的癥結(jié)。
為此相干人員在進(jìn)行數(shù)據(jù)發(fā)掘進(jìn)程中必定要遵照職業(yè)道德,保障信息的秘要性。
六數(shù)據(jù)發(fā)掘結(jié)果的不肯定性
數(shù)據(jù)發(fā)掘結(jié)果擁有不肯定性的特征,由于發(fā)掘的目的不同所以最后發(fā)掘的結(jié)果自然也會(huì)千差萬別,以因而這就需要咱們與所要發(fā)掘的目的相結(jié)合,做出公道判斷,患上出企業(yè)所需要的信息,便于企業(yè)的決策選擇。進(jìn)而到達(dá)提高企業(yè)經(jīng)濟(jì)效益,取得更多利潤的目的。
數(shù)據(jù)發(fā)掘可以發(fā)現(xiàn)1些潛伏的用戶,對(duì)于于電子商務(wù)來講是1個(gè)不可或者缺的技術(shù)支撐,數(shù)據(jù)發(fā)掘的勝利請(qǐng)求使用者對(duì)于指望解決問題的領(lǐng)域有深入的了解,數(shù)據(jù)發(fā)掘技術(shù)在必定程度上解決了電子商務(wù)信息不能有效應(yīng)用的問題,但它在運(yùn)用進(jìn)程中呈現(xiàn)的問題也亟待人們?nèi)ソ鉀Q。相信數(shù)據(jù)發(fā)掘技術(shù)的改良將推動(dòng)電子商務(wù)的深刻發(fā)展。
參考文獻(xiàn):
[一]胡迎松,寧海霞。 1種新型的Web發(fā)掘數(shù)據(jù)采集模型[J]。計(jì)算機(jī)工程與科學(xué),二00七
[二] 章寒雁,楊瑞珍。數(shù)據(jù)發(fā)掘技術(shù)在電子商務(wù)中的鉆研與利用[J]。計(jì)算機(jī)與網(wǎng)絡(luò),二00七
[三]董德民。 面向電子商務(wù)的Web使用發(fā)掘及其利用鉆研[J]。中國管理信息化,二00六
[四] 尹中強(qiáng)。電子商務(wù)中的 Web 數(shù)據(jù)發(fā)掘技術(shù)利用[J]。計(jì)算機(jī)與信息技術(shù),二00七
數(shù)據(jù)挖掘論文 篇12
在當(dāng)前的學(xué)校管理中,教學(xué)和教務(wù)管理工作中積累了大量的數(shù)據(jù)信息。但是,由于這些教學(xué)中的數(shù)據(jù)沒有得到很好地運(yùn)用,在一定程度上使數(shù)據(jù)挖掘沒有得到重視。數(shù)據(jù)挖掘,從本質(zhì)上看,就是從大量和模糊以及不完全的數(shù)據(jù)中提取出潛在信息的過程。并且,隨著計(jì)算機(jī)教學(xué)改革的不斷推進(jìn),計(jì)算機(jī)教學(xué)系統(tǒng)更加注重計(jì)算機(jī)網(wǎng)絡(luò)無紙化考試,有效地改變傳統(tǒng)教學(xué)評(píng)價(jià)手段。
1關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘分析方法在計(jì)算機(jī)教學(xué)中的作用
數(shù)據(jù)挖掘作為一種全新的計(jì)算機(jī)運(yùn)用技術(shù),在各個(gè)應(yīng)用領(lǐng)域都發(fā)揮巨大的潛力。通常情況下,數(shù)據(jù)挖掘分析方法主要是有關(guān)聯(lián)規(guī)則分析、序列模式分析以及分類分析等方法。筆者經(jīng)過一些分析方法的對(duì)比,在系統(tǒng)開發(fā)過程中,選擇關(guān)聯(lián)規(guī)則算法進(jìn)行相應(yīng)的探討。為了能夠進(jìn)一步說明關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘方法,同時(shí)有效地結(jié)合實(shí)踐過程,通過對(duì)以下兩個(gè)案例進(jìn)行深入分析,希望能更好地了解數(shù)據(jù)挖掘方法的運(yùn)用。例如,在“男同學(xué)-高分”的關(guān)聯(lián)規(guī)則中,這種表示方法是在考試過程中,男同學(xué)和女同學(xué)相比得高分的幾率更高,在一個(gè)具有一萬條記錄的事物數(shù)據(jù)庫中,只有將近300條記錄包括得到高分的男同學(xué),說明這種關(guān)聯(lián)支持度為3%,這個(gè)支持度相對(duì)來說較高。但是,也不能因此來做出這個(gè)關(guān)聯(lián)的意義,若通過科學(xué)的統(tǒng)計(jì)發(fā)現(xiàn)其中有6000條的記錄包含男同學(xué),使可以計(jì)算出男同學(xué)的置信度為300/6000=5%,從此方面來看,這個(gè)關(guān)聯(lián)規(guī)則的置信度并不是很高,同時(shí)也就不能做出這種關(guān)聯(lián)的實(shí)際意義。但是,如果是此記錄中只有600個(gè)是“男同學(xué)”,這樣就可以知道有將近50%的人得到高分,值得關(guān)注。又如,可以針對(duì)不同類別教師所教學(xué)生的成績(jī)進(jìn)行統(tǒng)計(jì)。根據(jù)圖中數(shù)據(jù)顯示,可以假設(shè),甲類教師-學(xué)生高分,設(shè)置為X-Y,可以知道,其支持度為50/310=16.13%,其置信度則為50/105=47.2%。因此,可以通過這種方法,以此來推導(dǎo)出其他的關(guān)聯(lián)支持度以及置信度。
2教師因素對(duì)挖掘計(jì)算機(jī)學(xué)生成績(jī)數(shù)據(jù)的促進(jìn)作用
當(dāng)前,我國計(jì)算機(jī)教學(xué)考試主要采用無紙化考試,其閱卷工作可以在計(jì)算機(jī)上自動(dòng)完成,其成績(jī)也可以由省教育廳逐一下發(fā),通過這樣的方式,可以更好地開展數(shù)據(jù)挖掘工作。例如,可以利用關(guān)聯(lián)規(guī)則法研究學(xué)生A科成績(jī)和B科成績(jī)的關(guān)聯(lián):①在對(duì)可信度的運(yùn)行過程中,學(xué)生在A科成績(jī)?yōu)閮?yōu)秀時(shí),B科也為優(yōu)秀的概率;②在對(duì)支持度的運(yùn)行過程中,可以描述學(xué)生A和B科目的成績(jī)?yōu)閮?yōu)秀的概率;③在對(duì)期望可信度的運(yùn)用過程中,可以在沒有任何約束的情況下,加強(qiáng)對(duì)學(xué)生A和B科目成績(jī)?yōu)閮?yōu)秀的概率分析;④在作用度的分析上,作為一種可信度和期望可信度的比值,當(dāng)學(xué)生在A類成績(jī)?yōu)閮?yōu)秀時(shí),可以對(duì)B科目的優(yōu)秀影響進(jìn)行深入分析。從以上的分析中可以看出,可信度能夠衡量關(guān)聯(lián)規(guī)則的準(zhǔn)確度,而且在關(guān)聯(lián)規(guī)則中,支持度是當(dāng)前關(guān)聯(lián)規(guī)則中最為重要的衡量標(biāo)準(zhǔn)。
3關(guān)聯(lián)規(guī)則推導(dǎo)技術(shù)的有效運(yùn)用
數(shù)據(jù)挖掘所得出的關(guān)聯(lián)規(guī)則只是作為數(shù)據(jù)庫中的數(shù)據(jù)之間相關(guān)性的描述,同時(shí)也可以作為一種分析工具,通過歷史數(shù)據(jù)來預(yù)測(cè)各種未來的行為。但是,數(shù)據(jù)挖掘所得出的結(jié)果只是作為一種概率,由于不同探究問題的.類型和規(guī)模有所不同,只有靈活地運(yùn)用數(shù)據(jù)挖掘技術(shù)才能進(jìn)行補(bǔ)充。在劃分方法上,可以將數(shù)據(jù)庫中分成幾個(gè)互不相干的模塊,并且可以單獨(dú)考慮到每個(gè)分塊生成的所有的頻集,之后可以通過所產(chǎn)生的頻集合并生成所有可能的頻集,計(jì)算出這些項(xiàng)集的支持度?梢葬槍(duì)分塊規(guī)模的大小來選擇被放入的主存,而且在每個(gè)階段只需要被掃描一次,有效降低挖掘時(shí)間,提高挖掘效率。
4結(jié)語
從本質(zhì)上看,數(shù)據(jù)挖掘作為一種全新的數(shù)據(jù)分析技術(shù),在關(guān)聯(lián)規(guī)則中不僅在檢驗(yàn)評(píng)價(jià)數(shù)據(jù)可靠性方面發(fā)揮著非常重要的作用,而且更能夠有效地幫助其進(jìn)行科學(xué)預(yù)測(cè)。為了能夠更好達(dá)到相應(yīng)的計(jì)算機(jī)教學(xué)評(píng)價(jià)效果,就必須不斷加強(qiáng)對(duì)教學(xué)評(píng)價(jià)調(diào)查,逐步積累大量數(shù)據(jù),充分利用數(shù)據(jù)挖掘技術(shù),挖掘一些科學(xué)有效的信息,以此來為教學(xué)知識(shí)構(gòu)建提供相應(yīng)的服務(wù)。
數(shù)據(jù)挖掘論文 篇13
前言
近些年來,已經(jīng)有越來越多的企業(yè)把通信、網(wǎng)絡(luò)技術(shù)和計(jì)算機(jī)應(yīng)用引入企業(yè)的日常管理工作和業(yè)務(wù)開發(fā)處理當(dāng)中,企業(yè)的各類信息化程度也在不斷提高,F(xiàn)代科技信息技術(shù)的廣泛應(yīng)用已經(jīng)顯著的提高了企業(yè)的工作效率和經(jīng)濟(jì)效益。但是,在使用信息技術(shù)給企業(yè)帶來的方便、快捷的同時(shí),也不斷的出現(xiàn)了新的問題和需求。企業(yè)經(jīng)過多年積累了大量的歷史數(shù)據(jù),這些數(shù)據(jù)對(duì)企業(yè)當(dāng)前的日常經(jīng)營活動(dòng)幾乎沒有任何的使用價(jià)值,成了留之無用棄之可惜的累贅。而且儲(chǔ)藏這些歷史數(shù)據(jù)會(huì)對(duì)企業(yè)造成很大的困難和費(fèi)用開銷。為此數(shù)據(jù)挖掘技術(shù)應(yīng)用在網(wǎng)絡(luò)營銷中勢(shì)在必行,全面細(xì)致的分析數(shù)據(jù)庫資源并從中提取有價(jià)值的信息來對(duì)商業(yè)決策進(jìn)行支持,從而來控制運(yùn)營成本、提高經(jīng)濟(jì)效益。本文將從網(wǎng)絡(luò)營銷中數(shù)據(jù)挖掘技術(shù)的幾個(gè)應(yīng)用進(jìn)行探討和分析。
客戶關(guān)系管理
客戶關(guān)系管理在網(wǎng)絡(luò)營銷,商業(yè)競(jìng)爭(zhēng)是一家以客戶為中心的競(jìng)技狀態(tài)的客戶,留住客戶,擴(kuò)大客戶基礎(chǔ),建立密切的客戶關(guān)系,客戶需求分析和創(chuàng)造客戶需求等,是非常關(guān)鍵的營銷問題?蛻絷P(guān)系管理,營銷和信息技術(shù)領(lǐng)域是一個(gè)新概念,這在90年代初,軟件產(chǎn)品在上世紀(jì)90年代后期出現(xiàn)的誕生。目前,在國內(nèi)和國外的此類產(chǎn)品的研究和發(fā)展階段。然而,繼續(xù)與數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)的進(jìn)步和發(fā)展,客戶關(guān)系管理,也是對(duì)實(shí)際應(yīng)用階段。CRM的目標(biāo)是管理者與客戶的互動(dòng),提升客戶價(jià)值,提高客戶滿意度,提高客戶的忠誠度,還發(fā)現(xiàn),市場(chǎng)營銷和銷售渠道,然后尋找新客戶,提高客戶的利潤貢獻(xiàn)率的最終目的是為了推動(dòng)社會(huì)和經(jīng)濟(jì)效益?蛻絷P(guān)系管理的目的,應(yīng)用是改善企業(yè)與客戶的關(guān)系,它是企業(yè)和服務(wù)本質(zhì)管理和協(xié)調(diào),以滿足客戶的需求,企業(yè)政策支持這項(xiàng)工作,并聯(lián)系客戶服務(wù)加強(qiáng)管理,提高客戶滿意度和品牌忠誠度。
然而,數(shù)據(jù)挖掘可以應(yīng)用到很多方面的CRM和不同階段,包括以下內(nèi)容:
。1)“一對(duì)一”營銷的內(nèi)部工作人員認(rèn)識(shí)到,客戶是在這個(gè)領(lǐng)域的企業(yè),而不是貿(mào)易發(fā)展生存的關(guān)鍵。與每一個(gè)客戶接觸的過程,也是了解客戶的進(jìn)程,而且也讓客戶了解業(yè)務(wù)流程。
。2)企業(yè)與客戶之間的銷售應(yīng)該是一種商業(yè)關(guān)系不斷向前發(fā)展?蛻艉蜖I銷公司成立這種方式,而且有許多方法可以使這種與客戶的關(guān)系,往往以改善包括:延長(zhǎng)時(shí)間,客戶關(guān)系和維護(hù)客戶關(guān)系,以進(jìn)一步加強(qiáng)相互交往過程中,公司可以在對(duì)方取得聯(lián)系更多的利潤。
。3)客戶對(duì)客戶盈利能力分析。我們的客戶盈利能力是非常不同的,如果你不明白客戶盈利能力,很難制定有效的營銷策略,以獲取最有價(jià)值的客戶,或進(jìn)一步提高客戶的忠誠度的價(jià)值。數(shù)據(jù)挖掘技術(shù)可以用來預(yù)測(cè)客戶在市場(chǎng)條件變化不同的盈利能力。它可以找到所有這些行為和使用模型來預(yù)測(cè)客戶行為模式的客戶交易盈利水平或新客戶找到高利潤。
。4)在所有部門維護(hù)客戶關(guān)系的競(jìng)爭(zhēng)日趨激烈,企業(yè)獲得新客戶的成本上升,因此,保持現(xiàn)有客戶的關(guān)系變得越來越重要。對(duì)于企業(yè)客戶可分為三大類:沒有價(jià)值或者低價(jià)值的客戶,不容易失去寶貴的客戶,并不斷尋找更多的優(yōu)惠,更有價(jià)值的服務(wù)給客戶。前兩個(gè)類型的客戶,客戶關(guān)系管理,現(xiàn)代化,然而,最具潛力的市場(chǎng)活動(dòng),是第三個(gè)層次的用戶,而且還特別需求和營銷工具,以保護(hù)客戶,可以減緩企業(yè)經(jīng)營成本,而且還獲得了寶貴的客戶。數(shù)據(jù)挖掘還可以發(fā)現(xiàn),由于客戶流失,該公司能夠滿足這些客戶的需要,采取適當(dāng)措施,保持銷售。
(5)客戶訪問企業(yè)業(yè)務(wù)系統(tǒng)資源,包括能夠獲得新客戶的關(guān)鍵指標(biāo)。為了提供這些新的資源,包括企業(yè)搜索客戶誰不知道該產(chǎn)品的客戶,可能是競(jìng)爭(zhēng)對(duì)手,服務(wù)客戶。這些細(xì)分客戶,潛在客戶可以幫助企業(yè)完成檢查。
企業(yè)經(jīng)營定位
通過挖掘客戶的有關(guān)數(shù)據(jù),可以對(duì)客戶進(jìn)行分類,找出其相同點(diǎn)和不同點(diǎn),以便為客戶提供個(gè)性化的產(chǎn)品和服務(wù),使企業(yè)和客戶之間能夠通過網(wǎng)絡(luò)進(jìn)行有效的溝通和信息交流。例如,關(guān)聯(lián)分析,客戶在購買某種商品時(shí),有可能會(huì)連帶著購買其他的相關(guān)產(chǎn)品,這樣購買的某種商品和連帶購買的其他相關(guān)產(chǎn)品之間就存在著某種關(guān)聯(lián),企業(yè)可以針對(duì)這種關(guān)聯(lián)進(jìn)行分析,分析出規(guī)律,已制定有效的營銷策略來長(zhǎng)效的起到吸引客戶連帶消費(fèi),購買其他產(chǎn)品的營銷策略。它能夠智能化地從大量的數(shù)據(jù)中提取出有用的信息和知識(shí),為企業(yè)的管理人員提供決策支持。數(shù)據(jù)挖掘技術(shù)使數(shù)據(jù)庫技術(shù)進(jìn)入了一個(gè)更高級(jí)的階段,它不僅能對(duì)過去的數(shù)據(jù)進(jìn)行查詢和遍歷,并且能夠找出過去數(shù)據(jù)之間的潛在聯(lián)系,從而促進(jìn)信息的'傳遞。
客戶群體的劃分也會(huì)用到數(shù)據(jù)挖掘,沒有基于數(shù)據(jù)挖掘的客戶劃分,就沒有真正的差異化、個(gè)性化營銷,就沒有現(xiàn)代營銷的根本。做為企業(yè)的領(lǐng)導(dǎo)者,不管你的企業(yè)是賣產(chǎn)品的還是賣服務(wù),第一個(gè)應(yīng)該準(zhǔn)確把握的商業(yè)問題就是你的目標(biāo)客戶群體,他們是誰,有什么特點(diǎn)和行為模式,有那些獨(dú)特的喜好可以作為營銷的突破口,有多大的多長(zhǎng)久的贏利價(jià)值。這些問題是你整個(gè)商業(yè)運(yùn)做的核心和基礎(chǔ),不了解你的客戶,下面的路就根本別指望能走下去了。數(shù)據(jù)挖掘營銷應(yīng)用中的客戶群體劃分可以科學(xué)有效的解決這個(gè)問題,也能給企業(yè)找到一個(gè)合理的營銷定位。
客戶信用風(fēng)險(xiǎn)控制
數(shù)據(jù)挖掘技術(shù)在90年代開始應(yīng)用于信用評(píng)估與風(fēng)險(xiǎn)分析中。企業(yè)在進(jìn)行網(wǎng)絡(luò)營銷的過程中會(huì)受到各種各樣的來自買方的信用風(fēng)險(xiǎn)的威脅,隨著市場(chǎng)競(jìng)爭(zhēng)的加劇,貿(mào)易信用已經(jīng)成為企業(yè)成功開發(fā)客戶和加強(qiáng)客戶關(guān)系的重要條件?蛻粜庞霉芾碇饕撬鸭瘍(chǔ)存客戶信息,因?yàn)榭蛻艏仁瞧髽I(yè)最大的財(cái)富來源,也是風(fēng)險(xiǎn)的主要來源。為了讓企業(yè)在這方面更少的受到威脅,可以利用數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)企業(yè)經(jīng)常面臨的詐騙行為或延付貨款行為,進(jìn)而進(jìn)行回避。同時(shí)盡可能把客戶信用風(fēng)險(xiǎn)控制在交易發(fā)生之前是成功信用管理的根本。因此,充分獲取客戶的詳細(xì)資料并做出安全的決策非常重要。
客戶信用風(fēng)險(xiǎn)管理應(yīng)用數(shù)據(jù)挖掘技術(shù)的優(yōu)勢(shì):
。1)數(shù)據(jù)挖掘技術(shù),自動(dòng)總結(jié)相對(duì)簡(jiǎn)單的評(píng)估模型,數(shù)據(jù)挖掘應(yīng)用程序的形式被廣泛用于學(xué)習(xí)技術(shù),它可以自動(dòng)完成統(tǒng)計(jì)歸納和推理機(jī)實(shí)現(xiàn)的任務(wù)數(shù)量,系統(tǒng)用戶無法理解模型詳情及有關(guān)統(tǒng)計(jì)知識(shí)的情況下,它可以很容易地得出結(jié)論。這種評(píng)價(jià)模型在實(shí)際應(yīng)用中降低了成本;
(2)數(shù)據(jù)挖掘技術(shù)更適合描述的財(cái)務(wù)指標(biāo)和信貸上的信用評(píng)價(jià)模型指標(biāo)為基礎(chǔ)的傳統(tǒng)方法,非線性特性的情況基本上是線性的基礎(chǔ)上適當(dāng)?shù)姆椒ê蛯?shí)際應(yīng)用,企業(yè)信用狀況和財(cái)務(wù)指標(biāo)常表現(xiàn)出非線性特性,但在體重指標(biāo)體系和分配方法來描述這些困難的非線性關(guān)系,實(shí)現(xiàn)了數(shù)據(jù)挖掘應(yīng)用,其中不少是在非線性系統(tǒng)為基礎(chǔ),尤其描述了合適的非線性特性;
。3)數(shù)據(jù)挖掘技術(shù)也可以適應(yīng)各種形式的數(shù)據(jù),數(shù)據(jù)挖掘可以是連續(xù)的數(shù)據(jù),離散數(shù)據(jù),而其他形式的數(shù)據(jù)處理,以便在更大的靈活性,在選擇指標(biāo)時(shí),更加符合客觀實(shí)際的信用風(fēng)險(xiǎn)模型。
(4)數(shù)據(jù)挖掘技術(shù)是優(yōu)于修正的噪音數(shù)據(jù),對(duì)那些在特殊階段或數(shù)據(jù)的完整性,市場(chǎng)條件可能不準(zhǔn)確,有可能是虛假的數(shù)據(jù)。由數(shù)據(jù)挖掘的方法可以修改一些在一定程度上,從而提高了模型的準(zhǔn)確性進(jìn)行評(píng)估;
。5)數(shù)據(jù)挖掘在不完全信息的情況下也可以計(jì)算,計(jì)算信貸風(fēng)險(xiǎn)往往會(huì)遇到德國不完整的信息問題,一些指標(biāo)只能在一個(gè)范圍的估計(jì)。通過粗糙集數(shù)據(jù)挖掘或分類樹方法,可以優(yōu)化性能的范圍,以獲取該指標(biāo)更準(zhǔn)確的估計(jì);
為現(xiàn)代信用風(fēng)險(xiǎn)管理方法有兩個(gè):第一是所謂的指數(shù)法,其基礎(chǔ)是信用相關(guān)業(yè)務(wù)的某些特性來企業(yè)信用評(píng)估;第二類是所謂的結(jié)構(gòu)化方法,根據(jù)歷史數(shù)據(jù)和市場(chǎng)數(shù)據(jù)模擬在企業(yè)資產(chǎn)價(jià)值變化的動(dòng)態(tài)持續(xù)的過程,然后確定其企業(yè)信用的位置。
在網(wǎng)絡(luò)營銷中進(jìn)行數(shù)據(jù)挖掘的優(yōu)勢(shì)
網(wǎng)絡(luò)營銷作為適應(yīng)網(wǎng)絡(luò)經(jīng)濟(jì)時(shí)代的網(wǎng)絡(luò)虛擬市場(chǎng)的新營銷理論,是市場(chǎng)營銷理念在新時(shí)期的發(fā)展和應(yīng)用。它能夠智能化地從大量的數(shù)據(jù)中提取出有用的信息和知識(shí),為企業(yè)的管理人員提供決策支持。數(shù)據(jù)挖掘技術(shù)使數(shù)據(jù)庫技術(shù)進(jìn)入了一個(gè)更高級(jí)的階段,它不僅能對(duì)過去的數(shù)據(jù)進(jìn)行查詢和遍歷,并且能夠找出過去數(shù)據(jù)之間的潛在聯(lián)系,從而促進(jìn)信息的傳遞。
1.維護(hù)原有客戶,挖掘潛在新客戶
網(wǎng)絡(luò)營銷中銷售商可以通過客戶的訪問記錄來挖掘出客戶的潛在信息,跟據(jù)客戶的興趣與需求向客戶有針對(duì)性的做個(gè)性化的推薦,制定出客戶滿意的產(chǎn)品服務(wù)。在做好維護(hù)原有老客戶的基礎(chǔ)上,通過對(duì)數(shù)據(jù)的挖掘,利用分類技術(shù),也可以尋找出潛在的客戶,通過對(duì)web日志的挖掘,可以對(duì)已經(jīng)存在的訪問者進(jìn)行分類,根據(jù)這種精細(xì)的分類,還可以找到潛在的新客戶。
2.制定營銷策略,優(yōu)化促銷活動(dòng)
對(duì)于保留的商品訪問記錄和銷售記錄進(jìn)行挖掘,可以發(fā)現(xiàn)客戶的訪問規(guī)律,了解客戶消費(fèi)的生命周期,起伏規(guī)律,結(jié)合市場(chǎng)形勢(shì)的變化,針對(duì)不同的商品和客戶群制定不同的營銷策略,保證促銷活動(dòng)針對(duì)客戶群有的放矢,收到意想不到的效果。
3.降低運(yùn)營成本,提高競(jìng)爭(zhēng)力
網(wǎng)絡(luò)營銷的管理者可以通過數(shù)據(jù)挖掘發(fā)現(xiàn)市場(chǎng)反饋的可靠信息,預(yù)測(cè)客戶未來的購買行為,有針對(duì)性的進(jìn)行營銷活動(dòng),還可以根據(jù)產(chǎn)品訪問者的瀏覽習(xí)慣來覺定產(chǎn)品廣告的位置,使廣告有針對(duì)性的起到宣傳的效果。從而提高廣告的投資回報(bào)率,從而能降低運(yùn)營成本,提高且的核心競(jìng)爭(zhēng)力。
4.對(duì)客戶進(jìn)行個(gè)性化推薦
根據(jù)客戶采礦活動(dòng)對(duì)網(wǎng)絡(luò)規(guī)則,有針對(duì)性的網(wǎng)絡(luò)營銷平臺(tái),提供“個(gè)性化”服務(wù)。個(gè)性化服務(wù)是在服務(wù)策略和服務(wù)內(nèi)容的不同客戶的不同,其本質(zhì)是客戶為中心的Web服務(wù)的需求。它通過收集和分析客戶資料,以了解客戶的利益和購買行為,然后采取主動(dòng),以達(dá)到建議的服務(wù)。
5.完善網(wǎng)絡(luò)營銷網(wǎng)站的設(shè)計(jì)
網(wǎng)站的建設(shè)者可以根據(jù)對(duì)客戶交易行為的記錄和反饋的情況對(duì)站點(diǎn)做出改進(jìn),站點(diǎn)的設(shè)計(jì)者可以根據(jù)這些信息進(jìn)一步優(yōu)化網(wǎng)站結(jié)構(gòu),站點(diǎn)導(dǎo)航等功能來提高站點(diǎn)的點(diǎn)擊率,為客戶提供更為方便的瀏覽方式。利用關(guān)聯(lián)規(guī)則,
參考文獻(xiàn)
1馮英健著,《網(wǎng)絡(luò)營銷基礎(chǔ)與實(shí)踐》,清華大學(xué)出版社,20xx年1月第1版
2 U.M.Fayyad. P.Smyt,and. G.Piatetsky-Shairo h,R.Uthurusamy.Advances in Knowledge discovery and data mining. AAAI/MIT Press,Menlo Park,CA.1996:
10劉書香,盧才武,張志霞.數(shù)據(jù)挖掘中的客戶聚類分析及其算法實(shí)現(xiàn)信息技術(shù)20xx(1):5~8
數(shù)據(jù)挖掘論文 篇14
隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,尤其移動(dòng)互聯(lián)網(wǎng)的爆發(fā)性發(fā)展,越來越多的公司憑借其備受歡迎的系統(tǒng)和APP如雨后春筍般發(fā)展起來,如滴滴打車、共享單車等。海量數(shù)據(jù)自此不再是Google等大公司的專利,越來越多的中小型企業(yè)也可以擁有海量數(shù)據(jù)。如何從浩如煙海的數(shù)據(jù)中挖掘出令人感興趣和有用的知識(shí),成為越來越多的公司急需解決的問題。因此,他們對(duì)數(shù)據(jù)挖掘分析師求賢若渴。在這一社會(huì)需求下,培養(yǎng)出優(yōu)秀的數(shù)據(jù)挖掘分析師,是各個(gè)高校目前急需完成的一項(xiàng)任務(wù)。
一、教學(xué)現(xiàn)狀反思
目前,各大高等院校本科階段爭(zhēng)相開設(shè)數(shù)據(jù)挖掘課程。然而,該課程是一門相對(duì)較新的交叉學(xué)科,涵蓋了概率統(tǒng)計(jì)、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫等學(xué)科的知識(shí)內(nèi)容,難度較大。因此,大部分高校一般將此課程開設(shè)在研究生階段,在本科生中開設(shè)此課程的學(xué)校相對(duì)較少。另外,不同的學(xué)校將其歸入不同的專業(yè)中,如計(jì)算機(jī)專業(yè)、信息管理專業(yè)、統(tǒng)計(jì)學(xué)、醫(yī)學(xué)等。可以說,這一課程基本上處于探索的過程中。我院災(zāi)害信息系于20xx年在信息管理與信息系統(tǒng)本科學(xué)生中首次開設(shè)了該課程。通過開設(shè)此課程,學(xué)生能夠掌握數(shù)據(jù)挖掘的基本原理和各種挖掘算法等,掌握數(shù)據(jù)分析和處理、高級(jí)數(shù)據(jù)庫編程等技能,達(dá)到數(shù)據(jù)聚類、分類、關(guān)聯(lián)分析的目的。然而,通過前期教學(xué)過程,我們發(fā)現(xiàn)教學(xué)效果不理想,存在很多問題。
1.數(shù)據(jù)內(nèi)驅(qū)力差
以往數(shù)據(jù)挖掘課程重點(diǎn)講授數(shù)據(jù)挖掘算法,對(duì)數(shù)據(jù)源的獲取和處理極少獲取。目前各大教材都在使用一些公共數(shù)據(jù)資源,這些數(shù)據(jù)資源有些已經(jīng)非常陳舊了,比如20世紀(jì)80年代的加州房?jī)r(jià)數(shù)據(jù)。這些數(shù)據(jù)脫離現(xiàn)實(shí),分析這些數(shù)據(jù),學(xué)生沒有任何興趣和學(xué)習(xí)動(dòng)力,也就無法發(fā)現(xiàn)價(jià)值。
2.過于強(qiáng)調(diào)學(xué)習(xí)數(shù)據(jù)挖掘理論及算法的學(xué)習(xí)
大量具有難度的數(shù)據(jù)挖掘算法的學(xué)習(xí),使學(xué)生喪失了學(xué)習(xí)興趣,學(xué)完即忘,不知所用。
3.忽視對(duì)數(shù)據(jù)預(yù)處理過程的學(xué)習(xí)
以往所使用的公共數(shù)據(jù)源或軟件自帶數(shù)據(jù)源,數(shù)據(jù)量小,需要的預(yù)處理工作比較少;這部分內(nèi)容基本只安排一次理論課、一次實(shí)驗(yàn)課。而實(shí)際通過爬蟲獲取的數(shù)據(jù)源數(shù)據(jù)量大;這部分工作量比較大,需要占到整個(gè)數(shù)據(jù)挖掘工作量的一半以上。因此,一次理論課和一次實(shí)驗(yàn)課是無法讓學(xué)生掌握數(shù)據(jù)預(yù)處理技能的。
4.算法編程實(shí)現(xiàn)難度較大
要求學(xué)生學(xué)習(xí)一門新的編程語言,如R語言、Python語言,對(duì)本科非計(jì)算機(jī)專業(yè)的學(xué)生來說難度是非常大的,尤其是課時(shí)安排只有48課時(shí)。
5.數(shù)據(jù)挖掘分析及應(yīng)用技能較差
學(xué)生能夠理解課堂案例,但在實(shí)際應(yīng)用中,無法完成整個(gè)數(shù)據(jù)分析流程。
二、數(shù)據(jù)挖掘課程改革
該課程的'教學(xué)對(duì)象是信息管理與信息系統(tǒng)專業(yè)本科大四學(xué)生。因此,培養(yǎng)實(shí)際應(yīng)用人才,使其完成整個(gè)實(shí)際數(shù)據(jù)挖掘分析流程是教師的教學(xué)目的。筆者對(duì)智聯(lián)招聘、中華英才網(wǎng)、51job等幾個(gè)大型招聘網(wǎng)站的幾百個(gè)數(shù)據(jù)挖掘分析師相關(guān)職位進(jìn)行分析,主要分析了相關(guān)職位的工作內(nèi)容、職位要求以及需求企業(yè)。數(shù)據(jù)分析師主要利用數(shù)據(jù)挖掘工具對(duì)運(yùn)營數(shù)據(jù)等多種數(shù)據(jù)源進(jìn)行預(yù)處理、建模、挖掘、分析及優(yōu)化。該職位是受業(yè)務(wù)驅(qū)動(dòng)的,特點(diǎn)是將現(xiàn)有數(shù)據(jù)與業(yè)務(wù)相結(jié)合,最大程度地變現(xiàn)數(shù)據(jù)價(jià)值。該職位對(duì)計(jì)算機(jī)編程等相關(guān)技術(shù)不作要求,但是需要有深厚的數(shù)據(jù)挖掘理論基礎(chǔ),熟練使用主流的數(shù)據(jù)挖掘(或統(tǒng)計(jì)分析)工具;诖,教師可以采取以下策略進(jìn)行教學(xué)改革。
1.加強(qiáng)對(duì)業(yè)務(wù)數(shù)據(jù)的理解
數(shù)據(jù)挖掘分析師是受業(yè)務(wù)驅(qū)動(dòng)的,所以要理解實(shí)際業(yè)務(wù),明確本次數(shù)據(jù)挖掘要解決什么問題。教師可以構(gòu)建案例庫,包括教師案例庫、學(xué)生討論案例庫。教師案例庫由教師構(gòu)建,可用于課堂講授。學(xué)生案例庫由學(xué)生分組構(gòu)建,并安排討論課,由學(xué)生講述、討論并提交報(bào)告。
2.加強(qiáng)對(duì)數(shù)據(jù)的獲取
對(duì)學(xué)生感興趣的數(shù)據(jù)源進(jìn)行挖掘,這樣才能更好地幫助學(xué)生理解吸收知識(shí)。因此,可以教授學(xué)生爬蟲技術(shù),編寫爬蟲程序,使其自主獲取感興趣的數(shù)據(jù)。
3.加強(qiáng)對(duì)數(shù)據(jù)的預(yù)處理工作
在數(shù)據(jù)挖掘之前使用數(shù)據(jù)預(yù)處理技術(shù),能夠顯著提高數(shù)據(jù)挖掘模式的質(zhì)量,降低實(shí)際挖掘所需要的時(shí)間,應(yīng)將其作為整門課程的重點(diǎn)進(jìn)行學(xué)習(xí)。增加理論課程和實(shí)驗(yàn)課時(shí),使學(xué)生掌握數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換、數(shù)據(jù)歸納等數(shù)據(jù)預(yù)處理技術(shù),并能夠應(yīng)對(duì)各種復(fù)雜數(shù)據(jù)源,最終利用爬蟲程序獲取的各種數(shù)據(jù)源進(jìn)行預(yù)處理工作。
4.強(qiáng)化數(shù)據(jù)挖掘分析
教師可以選擇SPSS Modeler這款所見即所得的數(shù)據(jù)挖掘軟件作為配套實(shí)驗(yàn)平臺(tái)。該軟件具有必需的數(shù)據(jù)預(yù)處理工具及預(yù)設(shè)的挖掘算法,學(xué)生可以把注意力放在要挖掘的數(shù)據(jù)及相關(guān)需求上,設(shè)定挖掘的主題,然后通過鼠標(biāo)的點(diǎn)擊拖拉即可完成相關(guān)主題的數(shù)據(jù)挖掘過程。學(xué)生最終可對(duì)自己獲取并已處理過的數(shù)據(jù)進(jìn)行挖掘分析。
5.加強(qiáng)教師外出培訓(xùn)學(xué)習(xí)
數(shù)據(jù)挖掘技術(shù)以及大數(shù)據(jù)技術(shù)是近來比較新穎而且發(fā)展迅速的技術(shù)。教師長(zhǎng)期身處三尺講臺(tái)之上,遠(yuǎn)離了新技術(shù),脫離了實(shí)際。因此,需派遣教師到知名高校學(xué)習(xí)數(shù)據(jù)挖掘教學(xué)技術(shù),到培訓(xùn)機(jī)構(gòu)進(jìn)行系統(tǒng)學(xué)習(xí),到企業(yè)進(jìn)行實(shí)戰(zhàn)學(xué)習(xí)。
基于以上分析,形成了新的數(shù)據(jù)挖掘理論課程內(nèi)容和實(shí)踐課程內(nèi)容,安排如表1和表2所示。共安排48學(xué)時(shí),其中理論課24學(xué)時(shí),實(shí)驗(yàn)課24學(xué)時(shí)。理論課重點(diǎn)講授數(shù)據(jù)的獲取、數(shù)據(jù)的理解、數(shù)據(jù)的預(yù)處理以及常用挖掘算法。實(shí)驗(yàn)課重點(diǎn)學(xué)習(xí)基于SPSS modeler的數(shù)據(jù)挖掘,對(duì)理論課的內(nèi)容進(jìn)行實(shí)踐。整個(gè)學(xué)習(xí)以工程項(xiàng)目為載體,該工程貫穿整個(gè)學(xué)習(xí)過程。學(xué)生通過爬蟲程序獲取自己感興趣的數(shù)據(jù)源,根據(jù)課程進(jìn)度,逐步完成后續(xù)數(shù)據(jù)的理解,再進(jìn)行預(yù)處理,建模分析,評(píng)估整個(gè)過程。在課程結(jié)束時(shí),完成整個(gè)項(xiàng)目,并提交報(bào)告。
三、結(jié)論
在數(shù)字時(shí)代,越來越多的企業(yè)急需數(shù)據(jù)挖掘分析人才。教師應(yīng)以培養(yǎng)實(shí)際應(yīng)用人才為目的,充分培養(yǎng)學(xué)生對(duì)數(shù)據(jù)挖掘的學(xué)習(xí)興趣,以工程項(xiàng)目為載體,貫穿整個(gè)課程周期。在教學(xué)中,打牢數(shù)據(jù)獲取、理解預(yù)處理這一基石,加強(qiáng)建模挖掘分析,弱化對(duì)晦澀算法的編程學(xué)習(xí),使學(xué)生真正掌握數(shù)據(jù)挖掘技術(shù),滿足社會(huì)需求。
參考文獻(xiàn):
[1]李海林.大數(shù)據(jù)環(huán)境下的數(shù)據(jù)挖掘課程教學(xué)探索[J].計(jì)算機(jī)時(shí)代,20xx(2):54-55.
[2]宋威,李晉宏.項(xiàng)目驅(qū)動(dòng)的數(shù)據(jù)挖掘教學(xué)模式探討[J].中國電力教育,20xx(27):116-177.
[3]徐琴.應(yīng)用型本科數(shù)據(jù)挖掘技術(shù)課程教學(xué)探討與實(shí)踐[J].電腦知識(shí)與技術(shù),20xx,12(8):148-149.
[4]李?yuàn)檴櫍钪?就業(yè)需求驅(qū)動(dòng)下的本科院校數(shù)據(jù)挖掘課程內(nèi)容體系探討[J].計(jì)算機(jī)時(shí)代,20xx(2):60-61.
【數(shù)據(jù)挖掘論文】相關(guān)文章:
淺談數(shù)據(jù)挖掘05-02
網(wǎng)絡(luò)營銷中數(shù)據(jù)挖掘技術(shù)的應(yīng)用論文11-27
數(shù)據(jù)挖掘挖出效益05-02
論數(shù)據(jù)倉庫和數(shù)據(jù)挖掘04-28
數(shù)據(jù)挖掘的發(fā)展和應(yīng)用綜述04-30