數(shù)據(jù)挖掘論文[范例15篇]
無(wú)論是在學(xué)校還是在社會(huì)中,大家肯定對(duì)論文都不陌生吧,論文可以推廣經(jīng)驗(yàn),交流認(rèn)識(shí)。還是對(duì)論文一籌莫展嗎?以下是小編為大家收集的數(shù)據(jù)挖掘論文,歡迎閱讀與收藏。
數(shù)據(jù)挖掘論文1
摘要:數(shù)據(jù)挖掘就是對(duì)潛在的數(shù)據(jù)及數(shù)據(jù)關(guān)聯(lián)進(jìn)行探索和發(fā)現(xiàn)。隨著信息技術(shù)的不斷發(fā)展,這一技術(shù)在電子商務(wù)領(lǐng)域逐漸得到普遍應(yīng)用;诖,本文就數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用進(jìn)行研究,首先就數(shù)據(jù)挖掘中的路徑分析技術(shù)、關(guān)聯(lián)分析技術(shù)、聚類(lèi)分析技術(shù)和分類(lèi)分析技術(shù)進(jìn)行簡(jiǎn)要介紹,然后分析數(shù)據(jù)挖掘在電子商務(wù)中的實(shí)際應(yīng)用,從而提高數(shù)據(jù)挖掘技術(shù)的應(yīng)用水平,增強(qiáng)電子商務(wù)的發(fā)展實(shí)力。
關(guān)鍵詞:數(shù)據(jù)挖掘;電子商務(wù);潛在客戶(hù)
一、數(shù)據(jù)挖掘在電子商務(wù)中的技術(shù)應(yīng)用
就現(xiàn)階段電子商務(wù)對(duì)數(shù)據(jù)挖掘技術(shù)的應(yīng)用現(xiàn)狀來(lái)看,主要應(yīng)用到的技術(shù)包括以下幾方面內(nèi)容,分別是路徑分析技術(shù)、關(guān)聯(lián)分析技術(shù)、聚類(lèi)分析技術(shù)和分類(lèi)分析技術(shù)。就路徑分析技術(shù)來(lái)看,主要對(duì)客戶(hù)互聯(lián)網(wǎng)訪問(wèn)路徑的頻繁性進(jìn)行分析,通過(guò)大數(shù)據(jù)采集和處理,了解客戶(hù)對(duì)各種網(wǎng)絡(luò)頁(yè)面的喜好程度和特點(diǎn),從而對(duì)自身的設(shè)計(jì)進(jìn)行針對(duì)性的改進(jìn),為客戶(hù)提供更加人性化的服務(wù);就關(guān)聯(lián)分析技術(shù)來(lái)看,主要指的是對(duì)隱藏?cái)?shù)據(jù)之間的關(guān)聯(lián)進(jìn)行分析,并且通過(guò)分析掌握其相互關(guān)聯(lián)的規(guī)律,并根據(jù)這一規(guī)律對(duì)網(wǎng)絡(luò)站點(diǎn)的結(jié)構(gòu)進(jìn)行相應(yīng)的改進(jìn),使電子商務(wù)中存在相關(guān)性的商品能夠一起被搜索出來(lái),既為客戶(hù)提供便利,同時(shí)提高交叉銷(xiāo)售的幾率;聚類(lèi)分析技術(shù)指的是根據(jù)數(shù)據(jù)的信息,按照一定的原則對(duì)數(shù)據(jù)進(jìn)行分類(lèi)。就分類(lèi)分析技術(shù)而言,主要通過(guò)分析數(shù)據(jù)掌握分類(lèi)規(guī)則,然后按照這一規(guī)則對(duì)數(shù)據(jù)進(jìn)行分類(lèi)。
二、數(shù)據(jù)挖掘在電子商務(wù)中的實(shí)際應(yīng)用
1.對(duì)潛在客戶(hù)進(jìn)行挖掘在電子商務(wù)中應(yīng)用數(shù)據(jù)挖掘技術(shù)能夠?qū)撛诳蛻?hù)進(jìn)行挖掘。例如商家可以對(duì)網(wǎng)站的日志記錄進(jìn)行分析,探究該記錄中存在的規(guī)律,從而按照這一規(guī)律對(duì)網(wǎng)站的訪問(wèn)客戶(hù)進(jìn)行相應(yīng)分類(lèi)。在分類(lèi)過(guò)程中,商家應(yīng)該對(duì)客戶(hù)屬性和相關(guān)關(guān)系進(jìn)行確定,對(duì)新客戶(hù)與老客戶(hù)之間存在重疊的屬性進(jìn)行識(shí)別,從而實(shí)現(xiàn)對(duì)訪問(wèn)網(wǎng)站新用戶(hù)快速分類(lèi),在分類(lèi)完畢后,商家可以通過(guò)分析新客戶(hù)的屬性特點(diǎn),從而對(duì)新客戶(hù)進(jìn)行潛在性判斷,如果判斷新客戶(hù)可以被作為商家的潛在客戶(hù),就可以為該客戶(hù)提供個(gè)性化的頁(yè)面服務(wù),從而將新客戶(hù)發(fā)展成為老客戶(hù)。2.對(duì)駐留時(shí)間進(jìn)行延長(zhǎng)對(duì)于電子商務(wù)而言,商家必須提高客戶(hù)在商品頁(yè)面的駐留時(shí)間,并且使客戶(hù)的購(gòu)買(mǎi)興趣和欲望得到激發(fā)。電子商務(wù)與傳統(tǒng)商務(wù)最大的不同在于銷(xiāo)售商具有虛擬性的特點(diǎn),因此客戶(hù)在購(gòu)物選擇時(shí),對(duì)銷(xiāo)售商的印象是沒(méi)有差異的。銷(xiāo)售商在不斷提升自身服務(wù)水平的同時(shí),應(yīng)該對(duì)客戶(hù)的瀏覽行為和特點(diǎn)進(jìn)行分析,從而對(duì)客戶(hù)的興趣和需求進(jìn)行進(jìn)一步的了解,以此為依據(jù)調(diào)整自身的商品頁(yè)面,用符合客戶(hù)需求的廣告和商品文案吸引客戶(hù)的'駐留時(shí)間,從而提高交易的幾率。3.對(duì)網(wǎng)絡(luò)站點(diǎn)進(jìn)行優(yōu)化電子商務(wù)主要依托于網(wǎng)站,因此網(wǎng)站優(yōu)化也是提高電子商務(wù)發(fā)展水平的有效措施。利用數(shù)據(jù)挖掘技術(shù)對(duì)網(wǎng)絡(luò)站點(diǎn)進(jìn)行優(yōu)化主要由兩方面構(gòu)成,一方面是對(duì)存在相關(guān)性的網(wǎng)頁(yè)進(jìn)行鏈接設(shè)計(jì)。例如對(duì)用戶(hù)瀏覽頁(yè)面的幾率和特點(diǎn)進(jìn)行分析,然后找出存在相關(guān)性的頁(yè)面,增加網(wǎng)頁(yè)鏈接這一功能,使客戶(hù)的搜索更加便捷;另一方面是對(duì)客戶(hù)的期望位置進(jìn)行探索,例如對(duì)用戶(hù)頻率較高的訪問(wèn)位置進(jìn)行分析,從而將頻率較高的位置設(shè)置為客戶(hù)的期望位置,并且在實(shí)際位置與期望位置間建立鏈接。另外,可以對(duì)用戶(hù)的網(wǎng)頁(yè)瀏覽習(xí)慣和信息喜好進(jìn)行分析,強(qiáng)化用戶(hù)在網(wǎng)頁(yè)中的自助服務(wù),例如將網(wǎng)頁(yè)信息參照超市模式進(jìn)行擺放,根據(jù)相關(guān)性分類(lèi),使用戶(hù)能夠通過(guò)自主瀏覽選擇到心儀的產(chǎn)品,從而提高交易的幾率。4.對(duì)營(yíng)銷(xiāo)手段進(jìn)行改進(jìn)在電子商務(wù)的實(shí)際運(yùn)營(yíng)過(guò)程中,很多客戶(hù)都會(huì)在購(gòu)買(mǎi)一種物品時(shí)同時(shí)選擇具有相關(guān)性的其他物品,因此銷(xiāo)售商應(yīng)該對(duì)銷(xiāo)售方式進(jìn)行改進(jìn),利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)交叉銷(xiāo)售,從而提高營(yíng)銷(xiāo)水平。在應(yīng)用交叉銷(xiāo)售這一手段時(shí),主要應(yīng)該利用數(shù)據(jù)挖掘技術(shù),對(duì)客戶(hù)的喜好進(jìn)行分析,從而提供具有針對(duì)性的商品。
參考文獻(xiàn):
[1]姜寧,牛永潔.Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用——以淘寶網(wǎng)為例[J].計(jì)算機(jī)時(shí)代,20xx(7):49-52.
[2]王紅玉.數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用[J].電腦編程技巧與維護(hù),20xx(3):49-51.
數(shù)據(jù)挖掘論文2
進(jìn)入信息時(shí)代以來(lái),世界電子商務(wù)呈現(xiàn)飛速發(fā)展的勢(shì)頭。站在長(zhǎng)遠(yuǎn)的角度,企業(yè)能否在新經(jīng)濟(jì)的背景下生存,關(guān)鍵在于企業(yè)能否利用電子商務(wù)的優(yōu)勢(shì),但是電子商務(wù)在發(fā)展的同時(shí)也使得企業(yè)暴露了一些問(wèn)題,其中企業(yè)的數(shù)據(jù)量大,而真正有用的信息卻很少。所以現(xiàn)代企業(yè)急需解決的問(wèn)題是如何在大量數(shù)據(jù)中發(fā)現(xiàn)有用數(shù)據(jù),獲得利于企業(yè)的商業(yè)運(yùn)作的數(shù)據(jù),從而提高企業(yè)的競(jìng)爭(zhēng)力。要解決這些問(wèn)題,傳統(tǒng)的數(shù)據(jù)分析已經(jīng)不能適應(yīng)企業(yè)的發(fā)展需求,傳統(tǒng)的數(shù)據(jù)分析工具對(duì)數(shù)據(jù)的內(nèi)在信息無(wú)法提取,而是對(duì)指定的數(shù)據(jù)進(jìn)行簡(jiǎn)單的處理。信息管理系統(tǒng)的運(yùn)用以及信息量的加大,企業(yè)希望有人可以創(chuàng)新及提高數(shù)據(jù)分析功能,只有擁有了高層次的數(shù)據(jù)分析功能,才能對(duì)企業(yè)決策工作提供有效的支持。所以,數(shù)據(jù)挖掘技術(shù)呈現(xiàn)在人們的眼前。
一、數(shù)據(jù)挖掘技術(shù)的發(fā)展背景
在近幾十年中,人們?cè)诶眯畔⒓夹g(shù)生產(chǎn)和搜集數(shù)據(jù)的能力上有了很大提升。商業(yè)管理、政府辦公以及科學(xué)研究等等都應(yīng)用了大量的數(shù)據(jù)庫(kù)。并且仍在繼續(xù)發(fā)展,所以人們?yōu)榇藢⒚媾R一個(gè)新的挑戰(zhàn),在信息爆炸的今天,我們都需面對(duì)地問(wèn)題是信息過(guò)量,那么我們將如何在大量的信息庫(kù)當(dāng)中獲取有用的知識(shí),提高信息利用率呢?要想讓數(shù)據(jù)成為企業(yè)的有效資源,并使它為企業(yè)的戰(zhàn)略發(fā)展及業(yè)務(wù)決策提供有效保障。否則,大量的數(shù)據(jù)將會(huì)阻礙公司的發(fā)展。因此,數(shù)據(jù)挖掘技術(shù)在人們被數(shù)據(jù)淹沒(méi)且急需知識(shí)的境地中帶來(lái)了希望,并在發(fā)展過(guò)程中顯示了它頑強(qiáng)的生命力。
人們長(zhǎng)期對(duì)數(shù)據(jù)庫(kù)的技術(shù)進(jìn)行研究和開(kāi)發(fā)而創(chuàng)新出數(shù)據(jù)挖掘技術(shù),剛開(kāi)始時(shí)商業(yè)數(shù)據(jù)一般存于計(jì)算機(jī)的數(shù)據(jù)庫(kù)里,然后變成了對(duì)數(shù)據(jù)庫(kù)進(jìn)行訪問(wèn)并查詢(xún),而數(shù)據(jù)庫(kù)技術(shù)進(jìn)入更高的臺(tái)階是由于數(shù)據(jù)挖掘技術(shù)的廣泛應(yīng)用,數(shù)據(jù)挖掘技術(shù)給企業(yè)的運(yùn)作和發(fā)展帶來(lái)很大便利,它不僅可以對(duì)以往的數(shù)據(jù)進(jìn)行查閱,從而可以把各個(gè)時(shí)期的數(shù)據(jù)進(jìn)行對(duì)比分析,利于商業(yè)水平的提高。商業(yè)數(shù)據(jù)庫(kù)正呈現(xiàn)空前發(fā)展的態(tài)勢(shì),并且在各種行業(yè)中數(shù)據(jù)倉(cāng)庫(kù)得到了廣泛的應(yīng)用。數(shù)據(jù)挖掘的核心包括數(shù)據(jù)統(tǒng)計(jì)、人工智能以及機(jī)器學(xué)習(xí)等等。且歷經(jīng)了十多年的發(fā)展歷程,使得數(shù)據(jù)挖掘技術(shù)趨向于穩(wěn)定。
二、數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用
1.數(shù)據(jù)挖掘技術(shù)在客戶(hù)關(guān)系管理中的應(yīng)用
一種把客戶(hù)當(dāng)作核心的經(jīng)營(yíng)策略就是客戶(hù)關(guān)系管理,為了滿(mǎn)足企業(yè)的產(chǎn)品開(kāi)發(fā)、市場(chǎng)營(yíng)銷(xiāo)以及管理的決策,而通過(guò)現(xiàn)代技術(shù)來(lái)滿(mǎn)足。為獲取商業(yè)知識(shí)而利用客戶(hù)的信息,并以此來(lái)提高企業(yè)在市場(chǎng)當(dāng)中的競(jìng)爭(zhēng)力,采用數(shù)據(jù)挖掘技術(shù),企業(yè)可以充分地利用客戶(hù)數(shù)據(jù)資源,并對(duì)客戶(hù)進(jìn)行分類(lèi)分析,這樣不僅有利于企業(yè)對(duì)客戶(hù)的盈利能力進(jìn)行分析,更有利于尋找有潛力的客戶(hù),為企業(yè)帶來(lái)發(fā)展。另夕卜,為應(yīng)對(duì)商業(yè)數(shù)據(jù)的不斷增多,數(shù)據(jù)挖掘技術(shù)將成為企業(yè)立足的關(guān)鍵技術(shù),這項(xiàng)技術(shù)不僅可以加強(qiáng)企業(yè)對(duì)客戶(hù)的管理及其跟蹤市場(chǎng)活動(dòng),預(yù)測(cè)客戶(hù)的消費(fèi)方向,并依據(jù)消費(fèi)的趨勢(shì)開(kāi)發(fā)產(chǎn)品。另外,客戶(hù)評(píng)價(jià)模型對(duì)客戶(hù)進(jìn)行評(píng)價(jià),并在分析客戶(hù)行為對(duì)企業(yè)收益產(chǎn)生的影響,達(dá)到企業(yè)與客戶(hù)和企業(yè)利潤(rùn)最優(yōu)化。同時(shí),在客戶(hù)數(shù)據(jù)挖掘技術(shù)應(yīng)用的基礎(chǔ)上,企業(yè)可以依據(jù)重點(diǎn)客戶(hù)和評(píng)價(jià)市場(chǎng)性能。為擴(kuò)大企業(yè)銷(xiāo)售的渠道,制定個(gè)性化的營(yíng)銷(xiāo)策略。通過(guò)呼叫中心優(yōu)化及暢通溝通的渠道,強(qiáng)化客戶(hù)關(guān)系管理的智能化并提高服務(wù)質(zhì)量。
2.數(shù)據(jù)挖掘技術(shù)在網(wǎng)站運(yùn)營(yíng)中的應(yīng)用
為提高網(wǎng)站的`點(diǎn)擊率,網(wǎng)站的設(shè)計(jì)者們?cè)谠O(shè)計(jì)網(wǎng)站時(shí)不再完全根據(jù)專(zhuān)家的意見(jiàn)來(lái)設(shè)計(jì),而是依據(jù)訪問(wèn)者在網(wǎng)站當(dāng)中留下的痕跡來(lái)設(shè)計(jì)網(wǎng)站,其中包括了網(wǎng)站結(jié)構(gòu)的設(shè)計(jì)和外觀。在設(shè)計(jì)網(wǎng)站時(shí),為節(jié)約客戶(hù)的訪問(wèn)時(shí)間,壓縮網(wǎng)站的開(kāi)支,網(wǎng)站的設(shè)計(jì)者會(huì)根據(jù)訪問(wèn)者的訪問(wèn)路徑,并分析這些路徑。如果可以分析并設(shè)計(jì)出最優(yōu)化的捷徑,這樣不僅可以讓訪問(wèn)者很輕松地訪問(wèn),還能給訪問(wèn)者留下好的印象,利于網(wǎng)站長(zhǎng)期發(fā)展。同時(shí),為降低網(wǎng)站的運(yùn)營(yíng)成本,采用數(shù)據(jù)挖掘技術(shù),可以挖掘有效的市場(chǎng)信息,并預(yù)測(cè)客戶(hù)的下一步行為,這樣有利于提高電子商務(wù)營(yíng)銷(xiāo)活動(dòng)的成功率。企業(yè)為增強(qiáng)廣告的目的性,為公司帶來(lái)更大的收益,應(yīng)依據(jù)訪問(wèn)者瀏覽習(xí)慣安排廣告的位置,為企業(yè)帶來(lái)一定的廣告收益。
3.數(shù)據(jù)挖掘技術(shù)在商業(yè)信用評(píng)估中的應(yīng)用
目前,不良的商業(yè)秩序受低劣信用狀況影響,網(wǎng)上詐騙的事件屢見(jiàn)不鮮及企業(yè)財(cái)務(wù)中的造價(jià)現(xiàn)象也時(shí)有發(fā)生,這些現(xiàn)象的發(fā)生導(dǎo)致了信用危機(jī)的產(chǎn)生,嚴(yán)重制約著電子商務(wù)的發(fā)展和繁榮。發(fā)達(dá)的社會(huì)信息水平作為發(fā)展電子商務(wù)的基礎(chǔ),通過(guò)偏差分析,控制企業(yè)數(shù)據(jù)的統(tǒng)計(jì)和歷史記錄的差別,為構(gòu)建完善的安全體系,采用數(shù)據(jù)挖掘技術(shù)對(duì)企業(yè)的經(jīng)營(yíng)情況進(jìn)行分析,并對(duì)企業(yè)進(jìn)行資產(chǎn)的評(píng)估以及收益分析等等。另外,為強(qiáng)化網(wǎng)站中的網(wǎng)上交易行為的安全,應(yīng)對(duì)網(wǎng)絡(luò)進(jìn)行全程的監(jiān)控。在此基礎(chǔ)上,建立客戶(hù)的信譽(yù)記錄,這樣不僅可以有效地防止信用危機(jī),更有利于提升企業(yè)風(fēng)險(xiǎn)管理的水平和能力。
三、結(jié)語(yǔ)
在電子商務(wù)點(diǎn)中應(yīng)用數(shù)據(jù)挖掘技術(shù),并對(duì)這些數(shù)據(jù)進(jìn)行挖掘,在挖掘當(dāng)中找到有價(jià)值的數(shù)據(jù)。所以,將數(shù)據(jù)挖掘技術(shù)應(yīng)用于電子商務(wù),并建立數(shù)據(jù)挖掘?yàn)楹诵牡目蛻?hù)管理系統(tǒng),將使得企業(yè)在市場(chǎng)變化中立于不敗之地。
數(shù)據(jù)挖掘論文3
摘要:橡膠是一種重要的戰(zhàn)略物資, 其種植受到土地資源、地理環(huán)境、橡膠機(jī)械化的影響, 產(chǎn)量波動(dòng)很大。本文對(duì)農(nóng)墾橡膠產(chǎn)業(yè)種植、生產(chǎn)加工引入數(shù)據(jù)挖掘技術(shù)的必要性進(jìn)行了初步探究, 指出通過(guò)提取土壤圖像的特征, 用支持向量機(jī)的算法可以發(fā)現(xiàn)橡膠種植、生產(chǎn)加工的規(guī)律, 進(jìn)而制定精準(zhǔn)的橡膠產(chǎn)業(yè)相關(guān)策略, 以提高橡膠產(chǎn)量、節(jié)約成本、提高利潤(rùn)。
關(guān)鍵詞:橡膠種植; 數(shù)據(jù)挖掘; 特征提取; 支持向量機(jī).
基金:廣東農(nóng)工商職業(yè)技術(shù)學(xué)院校級(jí)課題“基于數(shù)據(jù)挖掘技術(shù)的橡膠產(chǎn)業(yè)的數(shù)字化研究” (xykt1601)橡膠是一種重要的戰(zhàn)略物資, 與石油、鋼鐵、煤炭并稱(chēng)為四大工業(yè)原料。我國(guó)是全球最大的天然橡膠消費(fèi)國(guó)和進(jìn)口國(guó), 國(guó)內(nèi)天然橡膠長(zhǎng)期處于缺口狀態(tài), 需求的2/3依賴(lài)進(jìn)口來(lái)滿(mǎn)足[1]。天然橡膠產(chǎn)業(yè)屬于資源約束型、勞動(dòng)密集型產(chǎn)業(yè), 相對(duì)其他農(nóng)作物來(lái)說(shuō), 具有周期長(zhǎng)、收益長(zhǎng)等特點(diǎn)。農(nóng)墾橡膠業(yè)的產(chǎn)生、發(fā)展與壯大實(shí)際上是中國(guó)橡膠業(yè)發(fā)展的一個(gè)縮影, 一直是學(xué)術(shù)界研究的熱點(diǎn)。根據(jù)農(nóng)墾橡膠產(chǎn)業(yè)種植、生產(chǎn)加工的歷史數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘, 發(fā)現(xiàn)其種植、生產(chǎn)加工的規(guī)律, 進(jìn)而制定精準(zhǔn)的橡膠產(chǎn)業(yè)相關(guān)策略, 以提高橡膠產(chǎn)量、節(jié)約成本、提高利潤(rùn)的數(shù)字化研究, 目前國(guó)內(nèi)還比較少。
1 引入數(shù)據(jù)挖掘技術(shù)的必要性
天然橡膠以其獨(dú)具的高彈性、高強(qiáng)度、高伸長(zhǎng)率、耐磨、耐撕裂、耐沖擊、耐酸堿、耐油、耐腐蝕、耐高低溫和絕緣性好、粘合性、密封性強(qiáng)等特點(diǎn), 始終處于不可替代的地位。我國(guó)天然橡膠需求量大, 近幾年一直處于供不應(yīng)求的狀態(tài)。造成這種局面的原因主要有以下兩點(diǎn):一、國(guó)內(nèi)輪胎工業(yè)迅猛發(fā)展;二、天然橡膠的種植條件苛刻。其種植條件苛刻主要體現(xiàn)在對(duì)種植地要求高, 如對(duì)土地的含碳、含氮、濕度等要求都很?chē)?yán)格;容易受到寒害、蟲(chóng)害、臺(tái)風(fēng)的襲擊。橡膠的供應(yīng)不足阻礙了我國(guó)經(jīng)濟(jì) (特別是輪胎行業(yè)) 的發(fā)展;诖吮尘跋, 本文通過(guò)數(shù)據(jù)挖掘技術(shù)對(duì)橡膠樹(shù)生長(zhǎng)地的土壤進(jìn)行評(píng)價(jià)研究, 為尋找出最適合橡膠樹(shù)生長(zhǎng)的'土壤和尋找橡膠樹(shù)種植地提供依據(jù), 一方面可以降低種植橡膠的成本, 另一方面可以讓新的橡膠農(nóng)更容易掌握種植橡膠技巧, 讓更多的人加入種植橡膠的隊(duì)伍中。
2 數(shù)字化流程圖
2.1 樣本采集
研究的橡膠林可以分為4種不同林齡膠林:幼林早期 (0~2齡) 、幼林晚期 (2~7齡) 、開(kāi)割數(shù) (7~16齡) 、老齡即將更新數(shù) (>16齡) 。取土壤樣本的時(shí)間要在晴天上午, 如果遇雨天, 則等2個(gè)晴天后再進(jìn)行取樣。每個(gè)林齡段中隨機(jī)設(shè)置n個(gè)樣地:每個(gè)樣地的面積a (m) ×b (m) , 分0~15cm、15~30cm、30~45cm、45~60cm4個(gè)層次拍攝土壤樣品, 每個(gè)層次拍攝m張。每張土壤樣品圖片的命名規(guī)則為“膠林-層次.jpg”。
2.2 特征提取
通過(guò)拍攝得到的土壤圖像, 由于圖像的維度過(guò)大, 不容易分析, 需要從中提取土樣圖像的特征, 提取反應(yīng)圖像本質(zhì)的一些關(guān)鍵指標(biāo), 以達(dá)到自動(dòng)進(jìn)行圖像識(shí)別的目的。
圖像的特征主要包括顏色特征、紋理特征、形狀特征等。本文主要運(yùn)用圖片的顏色特征和紋理特征建立圖片自動(dòng)識(shí)別模型。
2.2.1 顏色特征
圖片的顏色特征用顏色矩表示;陬伾靥崛D像特征的數(shù)學(xué)基礎(chǔ)在于圖像中任何的顏色分布均可以用它的矩來(lái)表示。顏色的矩包含各個(gè)顏色通道的一階矩、二階矩和三階矩, 對(duì)于一幅RGB顏色空間的圖像, 具有R、G和B三個(gè)顏色通道, 共有9個(gè)分量。
2.2.2 紋理特征
圖片的紋理特征主要灰度共生矩陣?yán)锩嬷刑崛。因(yàn)榧y理是由灰度分布在空間位置上反復(fù)交替變化而形成的, 因而在圖像空間中相隔某距離的兩個(gè)像素間一定存在一定的灰度關(guān)系, 稱(chēng)為是圖像中灰度的空間相關(guān)特性。
其中L表示圖像的灰度級(jí), i, j分別表示像素的灰度。d表示兩個(gè)像素間的空間位置關(guān)系。不同的d決定了兩個(gè)像素間的距離和方向。元素Pd (1, 0) 代表了圖像上位置關(guān)系為d的兩個(gè)像素灰度分別為1和0的情況出現(xiàn)的次數(shù)。
在建模中一般不直接用圖片的灰度共生矩陣建模, 往往要從灰度共生矩陣中提取它的特征參數(shù)用戶(hù)建模;叶裙采仃嚨奶卣鲄(shù)有二階距、對(duì)比度、相關(guān)、熵。
3 模型構(gòu)建
特征提取完之后, 用支持向量機(jī)算法對(duì)圖像進(jìn)行圖片識(shí)別。根據(jù)識(shí)別出的結(jié)果就可以有針對(duì)性的對(duì)土壤做些有利于橡膠樹(shù)生長(zhǎng)的干預(yù)工作, 如:如果識(shí)別出土壤缺少氮元素, 可以給土壤適當(dāng)?shù)氖┬┑?如果識(shí)別出土壤的水分較少, 就要給土壤澆水, 給農(nóng)墾橡膠產(chǎn)業(yè)提供數(shù)學(xué)指導(dǎo)意義。
4 結(jié)論
本文分析了橡膠種植中引入數(shù)據(jù)挖掘技術(shù)的必要性, 對(duì)橡膠種植數(shù)字化研究做了初步闡述?梢越o橡膠業(yè)提供一定的參考意義。
參考文獻(xiàn)
[1]黃冠, 吳紅宇.廣東農(nóng)墾天然橡膠種植現(xiàn)狀及“走出去”戰(zhàn)略實(shí)踐.中國(guó)熱帶農(nóng)業(yè), 20xx, 3 (4) , 18-21.
[2]李煒.廣東農(nóng)墾“走出去”做強(qiáng)做大橡膠產(chǎn)業(yè).今日熱作, 20xx, 19 (1) , 52-53.
[3]Rapepun Wititsuwannakul, Piyaporn Pasitkul, et.al.Hevea latex lectin binding protein in C-serum as an anti-latex coagulating factor and its role in a proposed new model for latex coagulation, Phytochemistry 20xx, 69 (1) , 656–662.
[4]勒碧.數(shù)據(jù)挖掘算法及其生產(chǎn)優(yōu)化應(yīng)用中的研究.浙江大學(xué)碩士學(xué)位論文, 20xx.
數(shù)據(jù)挖掘論文4
題目:檔案信息管理系統(tǒng)中的計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)探討
摘要:伴隨著計(jì)算機(jī)技術(shù)的不斷進(jìn)步和發(fā)展, 數(shù)據(jù)挖掘技術(shù)成為數(shù)據(jù)處理工作中的重點(diǎn)技術(shù), 能借助相關(guān)算法搜索相關(guān)信息, 在節(jié)省人力資本的同時(shí), 提高數(shù)據(jù)檢索的實(shí)際效率, 基于此, 被廣泛應(yīng)用在數(shù)據(jù)密集型行業(yè)中。筆者簡(jiǎn)要分析了計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù), 并集中闡釋了檔案信息管理系統(tǒng)計(jì)算機(jī)數(shù)據(jù)倉(cāng)庫(kù)的建立和技術(shù)實(shí)現(xiàn)過(guò)程, 以供參考。
關(guān)鍵詞:檔案信息管理系統(tǒng); 計(jì)算機(jī); 數(shù)據(jù)挖掘技術(shù); 1 數(shù)據(jù)挖掘技術(shù)概述
數(shù)據(jù)挖掘技術(shù)就是指在大量隨機(jī)數(shù)據(jù)中提取隱含信息, 并且將其整合后應(yīng)用在知識(shí)處理體系的技術(shù)過(guò)程。若是從技術(shù)層面判定數(shù)據(jù)挖掘技術(shù), 則需要將其劃分在商業(yè)數(shù)據(jù)處理技術(shù)中, 整合商業(yè)數(shù)據(jù)提取和轉(zhuǎn)化機(jī)制, 并且建構(gòu)更加系統(tǒng)化的分析模型和處理機(jī)制, 從根本上優(yōu)化商業(yè)決策。借助數(shù)據(jù)挖掘技術(shù)能建構(gòu)完整的數(shù)據(jù)倉(cāng)庫(kù), 滿(mǎn)足集成性、時(shí)變性以及非易失性等需求, 整和數(shù)據(jù)處理和冗余參數(shù), 確保技術(shù)框架結(jié)構(gòu)的完整性。
目前, 數(shù)據(jù)挖掘技術(shù)常用的工具, 如SAS企業(yè)的Enterprise Miner、IBM企業(yè)的Intellient Miner以及SPSS企業(yè)的Clementine等應(yīng)用都十分廣泛。企業(yè)在實(shí)際工作過(guò)程中, 往往會(huì)利用數(shù)據(jù)源和數(shù)據(jù)預(yù)處理工具進(jìn)行數(shù)據(jù)定型和更新管理, 并且應(yīng)用聚類(lèi)分析模塊、決策樹(shù)分析模塊以及關(guān)聯(lián)分析算法等, 借助數(shù)據(jù)挖掘技術(shù)對(duì)相關(guān)數(shù)據(jù)進(jìn)行處理。
2 檔案信息管理系統(tǒng)計(jì)算機(jī)數(shù)據(jù)倉(cāng)庫(kù)的建立
2.1 客戶(hù)需求單元
為了充分發(fā)揮檔案信息管理系統(tǒng)的優(yōu)勢(shì), 要結(jié)合客戶(hù)的實(shí)際需求建立完整的處理框架體系。在數(shù)據(jù)庫(kù)體系建立中, 要適應(yīng)迭代式處理特征, 并且從用戶(hù)需求出發(fā)整合數(shù)據(jù)模型, 保證其建立過(guò)程能按照整體規(guī)劃有序進(jìn)行, 且能按照目標(biāo)和分析框架參數(shù)完成操作。首先, 要確立基礎(chǔ)性的數(shù)據(jù)倉(cāng)庫(kù)對(duì)象, 由于是檔案信息管理, 因此, 要集中劃分檔案數(shù)據(jù)分析的主題, 并且有效錄入檔案信息, 確保滿(mǎn)足檔案的數(shù)據(jù)分析需求。其次, 要對(duì)日常工作中的用戶(hù)數(shù)據(jù)進(jìn)行集中的挖掘處理, 從根本上提高數(shù)據(jù)倉(cāng)庫(kù)分析的完整性。
(1) 確定數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ)性用戶(hù), 其中, 主要包括檔案工作人員和使用人員, 結(jié)合不同人員的工作需求建立相應(yīng)的數(shù)據(jù)倉(cāng)庫(kù)。
(2) 檔案工作要利用數(shù)據(jù)分析和檔案用戶(hù)特征分析進(jìn)行分類(lèi)描述。
(3) 確定檔案的基礎(chǔ)性分類(lèi)主題, 一般而言, 要將文書(shū)檔案歸檔情況、卷數(shù)等基礎(chǔ)性信息作為分類(lèi)依據(jù)。
2.2 數(shù)據(jù)庫(kù)設(shè)計(jì)單元
在設(shè)計(jì)過(guò)程中, 要針對(duì)不同維度建立相應(yīng)的參數(shù)體系和組成結(jié)構(gòu), 并且有效整合組成事實(shí)表的主鍵項(xiàng)目, 建立框架結(jié)構(gòu)。
第一, 建立事實(shí)表。事實(shí)表是數(shù)據(jù)模型的核心單元, 主要是記錄相關(guān)業(yè)務(wù)和統(tǒng)計(jì)數(shù)據(jù)的表, 能整合數(shù)據(jù)倉(cāng)庫(kù)中的信息單元, 并且提升多維空間處理效果, 確保數(shù)據(jù)儲(chǔ)存過(guò)程切實(shí)有效。 (1) 檔案管理中文書(shū)檔案目錄卷數(shù)事實(shí)表:事實(shí)表主鍵, 字段類(lèi)型Int, 字段為Id;文書(shū)歸檔年份, 字段類(lèi)型Int, 字段為Gdyear_key;文書(shū)歸檔類(lèi)型, 字段類(lèi)型Int, 字段為Ajtm_key;文書(shū)歸檔單位, 字段類(lèi)型Int, 字段為Gddw_key;文書(shū)檔案生成年份, 字段類(lèi)型Int, 字段為Ajscsj_key, 以及文書(shū)檔案包括的文件數(shù)目。 (2) 檔案管理中文書(shū)檔案卷數(shù)事實(shí)表:事實(shí)表主鍵, 字段類(lèi)型Int, 字段為Id;文書(shū)歸檔利用日期, 字段類(lèi)型Int, 字段為Date_key;文書(shū)歸檔利用單位, 字段類(lèi)型Int, 字段為Dw_key;文書(shū)歸檔利用類(lèi)別, 字段類(lèi)型Int, 字段為Dalb_key;文書(shū)歸檔利用年份, 字段類(lèi)型Int, 字段為Dayear_key等[1]。
第二, 建立維度表, 在實(shí)際數(shù)據(jù)倉(cāng)庫(kù)建立和運(yùn)維工作中, 提高數(shù)據(jù)管理效果和水平, 確保建立循環(huán)和反饋的系統(tǒng)框架體系, 并且處理增長(zhǎng)過(guò)程和完善過(guò)程, 有效實(shí)現(xiàn)數(shù)據(jù)庫(kù)模型設(shè)計(jì)以及相關(guān)維護(hù)操作。首先, 要對(duì)模式的基礎(chǔ)性維度進(jìn)行分析并且制作相應(yīng)的表, 主要包括檔案年度維表、利用方式維表等。其次, 要建構(gòu)數(shù)據(jù)庫(kù)星型模型體系。最后, 要集中判定數(shù)據(jù)庫(kù)工具, 保證數(shù)據(jù)庫(kù)平臺(tái)在客戶(hù)管理工作方面具備一定的優(yōu)勢(shì), 集中制訂商務(wù)智能解決方案, 保證集成環(huán)境的穩(wěn)定性和數(shù)據(jù)倉(cāng)庫(kù)建模的效果, 真正提高數(shù)據(jù)抽取以及轉(zhuǎn)換工作的實(shí)際水平。需要注意的是, 在全面整合和分析處理數(shù)據(jù)的過(guò)程中, 要分離文書(shū)檔案中的數(shù)據(jù), 相關(guān)操作如下:
from dag gd temp//刪除臨時(shí)表中的數(shù)據(jù)
Ch count=dag 1.importfile (dbo.u wswj) //將文書(shū)目錄中數(shù)據(jù)導(dǎo)出到數(shù)據(jù)窗口
Dag 1.() //將數(shù)據(jù)窗口中的數(shù)據(jù)保存到臨時(shí)表
相關(guān)技術(shù)人員要對(duì)數(shù)據(jù)進(jìn)行有效處理, 以保證相關(guān)數(shù)據(jù)合并操作、連接操作以及條件性拆分操作等都能按照數(shù)據(jù)預(yù)處理管理要求合理化進(jìn)行, 從根本上維護(hù)數(shù)據(jù)處理效果。
2.3 多維數(shù)據(jù)模型建立單元
在檔案多維數(shù)據(jù)模型建立的過(guò)程中, 相關(guān)技術(shù)人員要判定聯(lián)機(jī)分析處理項(xiàng)目和數(shù)據(jù)挖掘方案, 整合信息系統(tǒng)中的數(shù)據(jù)源、數(shù)據(jù)視圖、維度參數(shù)以及屬性參數(shù)等, 保證具體單元能發(fā)揮其實(shí)際作用, 并且真正發(fā)揮檔案維表的穩(wěn)定性、安全性?xún)?yōu)勢(shì)。
第一, 檔案事實(shí)表中的數(shù)據(jù)穩(wěn)定, 事實(shí)表是加載和處理檔案數(shù)據(jù)的基本模塊, 按照檔案目錄數(shù)據(jù)表和檔案利用情況表分析和判定其類(lèi)別和歸檔時(shí)間, 從而提高數(shù)據(jù)獨(dú)立分析水平。一方面, 能追加有效的數(shù)據(jù), 保證數(shù)據(jù)倉(cāng)庫(kù)信息的基本質(zhì)量, 也能追加時(shí)間判定標(biāo)準(zhǔn), 能在實(shí)際操作中減少掃描整個(gè)表浪費(fèi)的時(shí)間, 從根本上提高實(shí)際效率。另一方面, 能刪除數(shù)據(jù), 實(shí)現(xiàn)數(shù)據(jù)更新, 檢索相關(guān)關(guān)鍵詞即可。并且也能同時(shí)修改數(shù)據(jù), 維護(hù)檔案撤出和檔案追加的動(dòng)態(tài)化處理效果。
第二, 檔案維表的安全性。在維表管理工作中, 檔案參數(shù)和數(shù)據(jù)的安全穩(wěn)定性十分關(guān)鍵, 由于其不會(huì)隨著時(shí)間的推移出現(xiàn)變化, 因此, 要對(duì)其進(jìn)行合理的處理和協(xié)調(diào)。維表本身的存儲(chǔ)空間較小, 盡管結(jié)構(gòu)發(fā)生變化的概率不大, 但仍會(huì)對(duì)代表的對(duì)象產(chǎn)生影響, 這就會(huì)使得數(shù)據(jù)出現(xiàn)動(dòng)態(tài)的變化。對(duì)于這種改變, 需要借助新維生成的方式進(jìn)行處理, 從而保證不同維表能有效連接, 整合正確數(shù)據(jù)的同時(shí), 也能對(duì)事實(shí)表外鍵進(jìn)行分析[2]。
3 檔案信息管理系統(tǒng)計(jì)算機(jī)數(shù)據(jù)倉(cāng)庫(kù)的實(shí)現(xiàn)
3.1 描述需求
隨著互聯(lián)網(wǎng)技術(shù)和數(shù)據(jù)庫(kù)技術(shù)不斷進(jìn)步, 要提高檔案數(shù)字化水平以及完善信息化整合機(jī)制, 加快數(shù)據(jù)庫(kù)管控體系的更新, 確保設(shè)備存儲(chǔ)以及網(wǎng)絡(luò)環(huán)境一體化水平能滿(mǎn)足需求, 尤其是在檔案資源重組和預(yù)測(cè)項(xiàng)目中, 只有從根本上落實(shí)數(shù)據(jù)挖掘體系, 才能為后續(xù)信息檔案管理項(xiàng)目升級(jí)奠定堅(jiān)實(shí)基礎(chǔ)。另外, 在數(shù)據(jù)表和文書(shū)等基礎(chǔ)性數(shù)據(jù)結(jié)構(gòu)模型建立的基礎(chǔ)上, 要按照規(guī)律制定具有個(gè)性化的主動(dòng)性服務(wù)機(jī)制。
3.2 關(guān)聯(lián)計(jì)算
在實(shí)際檔案分析工作開(kāi)展過(guò)程中, 關(guān)聯(lián)算法描述十分關(guān)鍵, 能對(duì)某些行為特征進(jìn)行統(tǒng)籌整合, 從而制定分析決策。在進(jìn)行關(guān)聯(lián)規(guī)則強(qiáng)度分析時(shí), 要結(jié)合支持度和置信度等系統(tǒng)化數(shù)據(jù)進(jìn)行綜合衡量。例如, 檔案數(shù)據(jù)庫(kù)中有A和B兩個(gè)基礎(chǔ)項(xiàng)集合, 支持度為P (A∪B) , 則直接表述了A和B在同一時(shí)間出現(xiàn)的基礎(chǔ)性概率。若是兩者出現(xiàn)的概率并不大, 則證明兩者之間的關(guān)聯(lián)度較低。若是兩者出現(xiàn)的概率較大, 則說(shuō)明兩者的關(guān)聯(lián)度較高。另外, 在分析置信度時(shí), 利用Confidence (A→B) = (A|B) , 也能有效判定兩者之間的關(guān)系。在出現(xiàn)置信度A的情況下, B的出現(xiàn)概率則是整體參數(shù)關(guān)系的關(guān)鍵, 若是置信度的數(shù)值達(dá)到100%, 則直接證明A和B能同一時(shí)間出現(xiàn)。
3.3 神經(jīng)網(wǎng)絡(luò)算法
除了要對(duì)檔案的實(shí)際內(nèi)容進(jìn)行數(shù)據(jù)分析和數(shù)據(jù)庫(kù)建構(gòu), 也要對(duì)其利用情況進(jìn)行判定, 目前較為常見(jiàn)的利用率分析算法就是神經(jīng)網(wǎng)絡(luò)算法, 其借助數(shù)據(jù)分類(lèi)系統(tǒng)判定和分析數(shù)據(jù)對(duì)象。值得注意的是, 在分類(lèi)技術(shù)結(jié)構(gòu)中, 要結(jié)合訓(xùn)練數(shù)據(jù)集判定分類(lèi)模型數(shù)據(jù)挖掘結(jié)構(gòu)。神經(jīng)網(wǎng)絡(luò)算法類(lèi)似于人腦系統(tǒng)的運(yùn)行結(jié)構(gòu), 能建立完整的信息處理單元, 并且能夠整合非線性交換結(jié)構(gòu), 確保能憑借歷史數(shù)據(jù)對(duì)計(jì)算模型和分類(lèi)體系展開(kāi)深度分析[3]。
3.4 實(shí)現(xiàn)多元化應(yīng)用
在檔案管理工作中應(yīng)用計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù), 能對(duì)檔案分類(lèi)管理予以分析, 保證信息需求分類(lèi)總結(jié)工作的完整程度。尤其是檔案使用者在對(duì)檔案具體特征進(jìn)行差異化分析的過(guò)程中, 能結(jié)合不同的元素對(duì)具體問(wèn)題展開(kāi)深度調(diào)研。一方面, 計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)借助決策樹(shù)算法處理規(guī)則化的檔案分析機(jī)制。在差異化訓(xùn)練體系中, 要對(duì)數(shù)據(jù)集合中的數(shù)據(jù)進(jìn)行系統(tǒng)化分析以及處理, 確保構(gòu)建要求能適應(yīng)數(shù)據(jù)挖掘的基本結(jié)構(gòu)[4]。例如, 檔案管理人員借助數(shù)據(jù)挖掘技術(shù)能整合檔案使用人員長(zhǎng)期瀏覽與關(guān)注的信息, 并且能集中收集和匯總間隔時(shí)間、信息查詢(xún)停留時(shí)間等, 從而建構(gòu)完整的數(shù)據(jù)分析機(jī)制, 有效向其推送或者是提供便捷化查詢(xún)服務(wù), 保證檔案管理數(shù)字化水平的提高。另一方面, 在檔案收集管理工作中應(yīng)用數(shù)據(jù)挖掘技術(shù), 主要是對(duì)數(shù)據(jù)信息進(jìn)行分析, 結(jié)合基本結(jié)果建立概念模型, 保證模型以及測(cè)試樣本之間的比較參數(shù)符合標(biāo)準(zhǔn), 從而真正建立更加系統(tǒng)化的分類(lèi)框架體系。
4 結(jié)語(yǔ)
總而言之, 在檔案管理工作中應(yīng)用數(shù)據(jù)挖掘技術(shù), 能在準(zhǔn)確判定用戶(hù)需求的同時(shí), 維護(hù)數(shù)據(jù)處理效果, 并且減少檔案數(shù)字化的成本, 為后續(xù)工作的進(jìn)一步優(yōu)化奠定堅(jiān)實(shí)基礎(chǔ)。并且, 數(shù)據(jù)庫(kù)的建立, 也能節(jié)省經(jīng)費(fèi)和設(shè)備維護(hù)成本, 真正實(shí)現(xiàn)數(shù)字化全面發(fā)展的目標(biāo), 促進(jìn)檔案信息管理工作的長(zhǎng)效進(jìn)步。
參考文獻(xiàn)
[1]曾雪峰.計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)開(kāi)發(fā)及其在檔案信息管理中的運(yùn)用研究[J].科技創(chuàng)新與應(yīng)用, 20xx (9) :285.
[2]王曉燕.數(shù)據(jù)挖掘技術(shù)在檔案信息管理中的應(yīng)用[J].蘭臺(tái)世界, 20xx (23) :25-26.
[3]韓吉義.基于數(shù)據(jù)挖掘技術(shù)的高校圖書(shū)館檔案信息管理平臺(tái)的構(gòu)筑[J].山西檔案, 20xx (6) :61-63.
[4]哈立原.基于數(shù)據(jù)挖掘技術(shù)的高校圖書(shū)館檔案信息管理平臺(tái)構(gòu)建[J].山西檔案, 20xx (5) :105-107.
數(shù)據(jù)挖掘論文四: 題目:機(jī)器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的`應(yīng)用
摘要:隨著科學(xué)技術(shù)的快速發(fā)展, 各種新鮮的事物和理念得到了廣泛的應(yīng)用。其中機(jī)器學(xué)習(xí)算法就是一則典型案例——作為一種新型的算法, 其廣泛應(yīng)用于各行各業(yè)之中。本篇論文旨在探討機(jī)器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的具體應(yīng)用, 我們利用龐大的移動(dòng)終端數(shù)據(jù)網(wǎng)絡(luò), 加強(qiáng)了基于GSM網(wǎng)絡(luò)的戶(hù)外終端定位, 從而提出了3個(gè)階段的定位算法, 有效提高了定位的精準(zhǔn)度和速度。
關(guān)鍵詞:學(xué)習(xí)算法; GSM網(wǎng)絡(luò); 定位; 數(shù)據(jù);
移動(dòng)終端定位技術(shù)由來(lái)已久, 其主要是利用各種科學(xué)技術(shù)手段定位移動(dòng)物體的精準(zhǔn)位置以及高度。目前, 移動(dòng)終端定位技術(shù)主要應(yīng)用于軍事定位、緊急救援、網(wǎng)絡(luò)優(yōu)化、地圖導(dǎo)航等多個(gè)現(xiàn)代化的領(lǐng)域, 由于移動(dòng)終端定位技術(shù)可以提供精準(zhǔn)的位置服務(wù)信息, 所以其在市場(chǎng)上還是有較大的需求的, 這也為移動(dòng)終端定位技術(shù)的優(yōu)化和發(fā)展, 提供了推動(dòng)力。隨著通信網(wǎng)絡(luò)普及, 移動(dòng)終端定位技術(shù)的發(fā)展也得到了一些幫助, 使得其定位的精準(zhǔn)度和速度都得到了全面的優(yōu)化和提升。同時(shí), 傳統(tǒng)的定位方法結(jié)合先進(jìn)的算法來(lái)進(jìn)行精準(zhǔn)定位, 目前依舊還是有較大的進(jìn)步空間。在工作中我選取機(jī)器學(xué)習(xí)算法結(jié)合數(shù)據(jù)挖掘技術(shù)對(duì)傳統(tǒng)定位技術(shù)加以改進(jìn), 取得了不錯(cuò)的效果, 但也遇到了許多問(wèn)題, 例如:使用機(jī)器學(xué)習(xí)算法來(lái)進(jìn)行精準(zhǔn)定位暫時(shí)無(wú)法滿(mǎn)足更大的區(qū)域要求, 還有想要利用較低的設(shè)備成本, 實(shí)現(xiàn)得到更多的精準(zhǔn)定位的要求比較困難。所以本文對(duì)機(jī)器學(xué)習(xí)算法進(jìn)行了深入的研究, 希望能夠幫助其更快速的定位、更精準(zhǔn)的定位, 滿(mǎn)足市場(chǎng)的需要。
1 數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘又名數(shù)據(jù)探勘、信息挖掘。它是數(shù)據(jù)庫(kù)知識(shí)篩選中非常重要的一步。數(shù)據(jù)挖掘其實(shí)指的就是在大量的數(shù)據(jù)中通過(guò)算法找到有用信息的行為。一般情況下, 數(shù)據(jù)挖掘都會(huì)和計(jì)算機(jī)科學(xué)緊密聯(lián)系在一起, 通過(guò)統(tǒng)計(jì)集合、在線剖析、檢索篩選、機(jī)器學(xué)習(xí)、參數(shù)識(shí)別等多種方法來(lái)實(shí)現(xiàn)最初的目標(biāo)。統(tǒng)計(jì)算法和機(jī)器學(xué)習(xí)算法是數(shù)據(jù)挖掘算法里面應(yīng)用得比較廣泛的兩類(lèi)。統(tǒng)計(jì)算法依賴(lài)于概率分析, 然后進(jìn)行相關(guān)性判斷, 由此來(lái)執(zhí)行運(yùn)算。
而機(jī)器學(xué)習(xí)算法主要依靠人工智能科技, 通過(guò)大量的樣本收集、學(xué)習(xí)和訓(xùn)練, 可以自動(dòng)匹配運(yùn)算所需的相關(guān)參數(shù)及模式。它綜合了數(shù)學(xué)、物理學(xué)、自動(dòng)化和計(jì)算機(jī)科學(xué)等多種學(xué)習(xí)理論, 雖然能夠應(yīng)用的領(lǐng)域和目標(biāo)各不相同, 但是這些算法都可以被獨(dú)立使用運(yùn)算, 當(dāng)然也可以相互幫助, 綜合應(yīng)用, 可以說(shuō)是一種可以“因時(shí)而變”、“因事而變”的算法。在機(jī)器學(xué)習(xí)算法的領(lǐng)域, 人工神經(jīng)網(wǎng)絡(luò)是比較重要和常見(jiàn)的一種。因?yàn)樗膬?yōu)秀的數(shù)據(jù)處理和演練、學(xué)習(xí)的能力較強(qiáng)。
而且對(duì)于問(wèn)題數(shù)據(jù)還可以進(jìn)行精準(zhǔn)的識(shí)別與處理分析, 所以應(yīng)用的頻次更多。人工神經(jīng)網(wǎng)絡(luò)依賴(lài)于多種多樣的建模模型來(lái)進(jìn)行工作, 由此來(lái)滿(mǎn)足不同的數(shù)據(jù)需求。綜合來(lái)看, 人工神經(jīng)網(wǎng)絡(luò)的建模, 它的精準(zhǔn)度比較高, 綜合表述能力優(yōu)秀, 而且在應(yīng)用的過(guò)程中, 不需要依賴(lài)專(zhuān)家的輔助力量, 雖然仍有缺陷, 比如在訓(xùn)練數(shù)據(jù)的時(shí)候耗時(shí)較多, 知識(shí)的理解能力還沒(méi)有達(dá)到智能化的標(biāo)準(zhǔn), 但是, 相對(duì)于其他方式而言, 人工神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)依舊是比較突出的。
2 以機(jī)器學(xué)習(xí)算法為基礎(chǔ)的GSM網(wǎng)絡(luò)定位
2.1 定位問(wèn)題的建模
建模的過(guò)程主要是以支持向量機(jī)定位方式作為基礎(chǔ), 把定位的位置柵格化, 面積較小的柵格位置就是獨(dú)立的一種類(lèi)別, 在定位的位置內(nèi), 我們收集數(shù)目龐大的終端測(cè)量數(shù)據(jù), 然后利用計(jì)算機(jī)對(duì)測(cè)量報(bào)告進(jìn)行分析處理, 測(cè)量柵格的距離度量和精準(zhǔn)度, 然后對(duì)移動(dòng)終端柵格進(jìn)行預(yù)估判斷, 最終利用機(jī)器學(xué)習(xí)進(jìn)行分析求解。
2.2 采集數(shù)據(jù)和預(yù)處理
本次研究, 我們采用的模型對(duì)象是我國(guó)某一個(gè)周邊長(zhǎng)達(dá)10千米的二線城市。在該城市區(qū)域內(nèi), 我們測(cè)量了四個(gè)不同時(shí)間段內(nèi)的數(shù)據(jù), 為了保證機(jī)器學(xué)習(xí)算法定位的精準(zhǔn)性和有效性, 我們把其中的三批數(shù)據(jù)作為訓(xùn)練數(shù)據(jù), 最后一組數(shù)據(jù)作為定位數(shù)據(jù), 然后把定位數(shù)據(jù)周邊十米內(nèi)的前三組訓(xùn)練數(shù)據(jù)的相關(guān)信息進(jìn)行清除。一旦確定某一待定位數(shù)據(jù), 就要在不同的時(shí)間內(nèi)進(jìn)行測(cè)量, 按照測(cè)量出的數(shù)據(jù)信息的經(jīng)緯度和平均值, 再進(jìn)行換算, 最終, 得到真實(shí)的數(shù)據(jù)量, 提升定位的速度以及有效程度。
2.3 以基站的經(jīng)緯度為基礎(chǔ)的初步定位
用機(jī)器學(xué)習(xí)算法來(lái)進(jìn)行移動(dòng)終端定位, 其復(fù)雜性也是比較大的, 一旦區(qū)域面積增加, 那么模型和分類(lèi)也相應(yīng)增加, 而且更加復(fù)雜, 所以, 利用機(jī)器學(xué)習(xí)算法來(lái)進(jìn)行移動(dòng)終端定位的過(guò)程, 會(huì)隨著定位區(qū)域面積的增大, 而耗費(fèi)更多的時(shí)間。利用基站的經(jīng)緯度作為基礎(chǔ)來(lái)進(jìn)行早期的定位, 則需要以下幾個(gè)步驟:要將邊長(zhǎng)為十千米的正方形分割成一千米的小柵格, 如果想要定位數(shù)據(jù)集內(nèi)的相關(guān)信息, 就要選擇對(duì)邊長(zhǎng)是一千米的小柵格進(jìn)行計(jì)算, 而如果是想要獲得邊長(zhǎng)一千米的大柵格, 就要對(duì)邊長(zhǎng)是一千米的柵格精心計(jì)算。
2.4 以向量機(jī)為基礎(chǔ)的二次定位
在完成初步定位工作后, 要確定一個(gè)邊長(zhǎng)為兩千米的正方形, 由于第一級(jí)支持向量機(jī)定位的區(qū)域是四百米, 定位輸出的是以一百米柵格作為中心點(diǎn)的經(jīng)緯度數(shù)據(jù)信息, 相對(duì)于一級(jí)向量機(jī)的定位而言, 二級(jí)向量機(jī)在定位計(jì)算的時(shí)候難度是較低的, 更加簡(jiǎn)便。后期的預(yù)算主要依賴(lài)決策函數(shù)計(jì)算和樣本向量機(jī)計(jì)算。隨著柵格的變小, 定位的精準(zhǔn)度將越來(lái)越高, 而由于增加分類(lèi)的問(wèn)題數(shù)量是上升的, 所以, 定位的復(fù)雜度也是相對(duì)增加的。
2.5 以K-近鄰法為基礎(chǔ)的三次定位
第一步要做的就是選定需要定位的區(qū)域面積, 在二次輸出之后, 確定其經(jīng)緯度, 然后依賴(lài)經(jīng)緯度來(lái)確定邊長(zhǎng)面積, 這些都是進(jìn)行區(qū)域定位的基礎(chǔ)性工作, 緊接著就是定位模型的訓(xùn)練。以K-近鄰法為基礎(chǔ)的三次定位需要的是綜合訓(xùn)練信息數(shù)據(jù), 對(duì)于這些信息數(shù)據(jù), 要以大小為選擇依據(jù)進(jìn)行篩選和合并, 這樣就能夠減少計(jì)算的重復(fù)性。當(dāng)然了, 選擇的區(qū)域面積越大, 其定位的速度和精準(zhǔn)性也就越低。
3 結(jié)語(yǔ)
近年來(lái), 隨著我國(guó)科學(xué)技術(shù)的不斷發(fā)展和進(jìn)步, 數(shù)據(jù)挖掘技術(shù)愈加重要。根據(jù)上面的研究, 我們證明了, 在數(shù)據(jù)挖掘的過(guò)程中, 應(yīng)用機(jī)器學(xué)習(xí)算法具有舉足輕重的作用。作為一門(mén)多領(lǐng)域互相交叉的知識(shí)學(xué)科, 它能夠幫助我們提升定位的精準(zhǔn)度以及定位速度, 可以被廣泛的應(yīng)用于各行各業(yè)。所以, 對(duì)于機(jī)器學(xué)習(xí)算法, 相關(guān)人員要加以重視, 不斷的進(jìn)行改良以及改善, 切實(shí)的發(fā)揮其有利的方面, 將其廣泛應(yīng)用于智能定位的各個(gè)領(lǐng)域, 幫助我們解決關(guān)于戶(hù)外移動(dòng)終端的定位的問(wèn)題。
參考文獻(xiàn)
[1]陳小燕, CHENXiaoyan.機(jī)器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的應(yīng)用[J].現(xiàn)代電子技術(shù), 20xx, v.38;No.451 (20) :11-14.
[2]李運(yùn).機(jī)器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的應(yīng)用[D].北京郵電大學(xué), 20xx.
[3]莫雪峰.機(jī)器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的應(yīng)用[J].科教文匯, 20xx (07) :175-178.
數(shù)據(jù)挖掘論文五: 題目:軟件工程數(shù)據(jù)挖掘研究進(jìn)展
摘要:數(shù)據(jù)挖掘是指在大數(shù)據(jù)中開(kāi)發(fā)出有價(jià)值信息數(shù)據(jù)的過(guò)程。計(jì)算機(jī)技術(shù)的不斷進(jìn)步, 通過(guò)人工的方式進(jìn)行軟件的開(kāi)發(fā)與維護(hù)難度較大。而數(shù)據(jù)挖掘能夠有效的提升軟件開(kāi)發(fā)的效率, 并能夠在大量的數(shù)據(jù)中獲得有效的數(shù)據(jù)。文章主要探究軟件工程中數(shù)據(jù)挖掘技術(shù)的任務(wù)和存在的問(wèn)題, 并重點(diǎn)論述軟件開(kāi)發(fā)過(guò)程中出現(xiàn)的問(wèn)題和相關(guān)的解決措施。
關(guān)鍵詞:軟件工程; 數(shù)據(jù)挖掘; 解決措施;
在軟件開(kāi)發(fā)過(guò)程中, 為了能夠獲得更加準(zhǔn)確的數(shù)據(jù)資源, 軟件的研發(fā)人員就需要搜集和整理數(shù)據(jù)。但是在大數(shù)據(jù)時(shí)代, 人工獲取數(shù)據(jù)信息的難度極大。當(dāng)前, 軟件工程中運(yùn)用最多的就是數(shù)據(jù)挖掘技術(shù)。軟件挖掘技術(shù)是傳統(tǒng)數(shù)據(jù)挖掘技術(shù)在軟件工程方向的其中一部分。但是它具有自身的特征, 體現(xiàn)在以下三個(gè)方面:
(1) 在軟件工程中, 對(duì)有效數(shù)據(jù)的挖掘和處理;
(2) 挖掘數(shù)據(jù)算法的選擇問(wèn)題;
(3) 軟件的開(kāi)發(fā)者該如何選擇數(shù)據(jù)。
1 在軟件工程中數(shù)據(jù)挖掘的主要任務(wù)
在數(shù)據(jù)挖掘技術(shù)中, 軟件工程數(shù)據(jù)挖掘是其中之一, 其挖掘的過(guò)程與傳統(tǒng)數(shù)據(jù)的挖掘無(wú)異。通常包括三個(gè)階段:第一階段, 數(shù)據(jù)的預(yù)處理;第二階段, 數(shù)據(jù)的挖掘;第三階段, 對(duì)結(jié)果的評(píng)估。第一階段的主要任務(wù)有對(duì)數(shù)據(jù)的分類(lèi)、對(duì)異常數(shù)據(jù)的檢測(cè)以及整理和提取復(fù)雜信息等。雖然軟件工程的數(shù)據(jù)挖掘和傳統(tǒng)的數(shù)據(jù)挖掘存在相似性, 但是也存在一定的差異, 其主要體現(xiàn)在以下三個(gè)方面:
1.1 軟件工程的數(shù)據(jù)更加復(fù)雜
軟件工程數(shù)據(jù)主要包括兩種, 一種是軟件報(bào)告, 另外一種是軟件的版本信息。當(dāng)然還包括一些軟件代碼和注釋在內(nèi)的非結(jié)構(gòu)化數(shù)據(jù)信息。這兩種軟件工程數(shù)據(jù)的算法是不同的, 但是兩者之間又有一定的聯(lián)系, 這也是軟件工程數(shù)據(jù)挖掘復(fù)雜性的重要原因。
1.2 數(shù)據(jù)分析結(jié)果的表現(xiàn)更加特殊
傳統(tǒng)的數(shù)據(jù)挖掘結(jié)果可以通過(guò)很多種結(jié)果展示出來(lái), 最常見(jiàn)的有報(bào)表和文字的方式。但是對(duì)于軟件工程的數(shù)據(jù)挖掘來(lái)講, 它最主要的職能是給軟件的研發(fā)人員提供更加精準(zhǔn)的案例, 軟件漏洞的實(shí)際定位以及設(shè)計(jì)構(gòu)造方面的信息, 同時(shí)也包括數(shù)據(jù)挖掘的統(tǒng)計(jì)結(jié)果。所以這就要求軟件工程的數(shù)據(jù)挖掘需要更加先進(jìn)的結(jié)果提交方式和途徑。
1.3 對(duì)數(shù)據(jù)挖掘結(jié)果難以達(dá)成一致的評(píng)價(jià)
我國(guó)傳統(tǒng)的數(shù)據(jù)挖掘已經(jīng)初步形成統(tǒng)一的評(píng)價(jià)標(biāo)準(zhǔn), 而且評(píng)價(jià)體系相對(duì)成熟。但是軟件工程的數(shù)據(jù)挖掘過(guò)程中, 研發(fā)人員需要更多復(fù)雜而又具體的數(shù)據(jù)信息, 所以數(shù)據(jù)的表示方法也相對(duì)多樣化, 數(shù)據(jù)之間難以進(jìn)行對(duì)比, 所以也就難以達(dá)成一致的評(píng)價(jià)標(biāo)準(zhǔn)和結(jié)果。不難看出, 軟件工程數(shù)據(jù)挖掘的關(guān)鍵在于對(duì)挖掘數(shù)據(jù)的預(yù)處理和對(duì)數(shù)據(jù)結(jié)果的表示方法。
2 軟件工程研發(fā)階段出現(xiàn)的問(wèn)題和解決措施
軟件在研發(fā)階段主要的任務(wù)是對(duì)軟件運(yùn)行程序的編寫(xiě)。以下是軟件在編碼和結(jié)果的提交過(guò)程中出現(xiàn)的問(wèn)題和相應(yīng)的解決措施。
2.1 對(duì)軟件代碼的編寫(xiě)過(guò)程
該過(guò)程需要軟件的研發(fā)人員能夠?qū)ψ约盒枰帉?xiě)的代碼結(jié)構(gòu)與功能有充分的了解和認(rèn)識(shí)。并能夠依據(jù)自身掌握的信息, 在數(shù)據(jù)庫(kù)中搜集到可以使用的數(shù)據(jù)信息。通常情況下, 編程需要的數(shù)據(jù)信息可以分為三個(gè)方面:
(1) 軟件的研發(fā)人員能夠在已經(jīng)存在的代碼中搜集可以重新使用的代碼;
(2) 軟件的研發(fā)人員可以搜尋可以重用的靜態(tài)規(guī)則, 比如繼承關(guān)系等。
(3) 軟件的開(kāi)發(fā)人員搜尋可以重用的動(dòng)態(tài)規(guī)則。
包括軟件的接口調(diào)用順序等。在尋找以上信息的過(guò)程中, 通常是利用軟件的幫助文檔、尋求外界幫助和搜集代碼的方式實(shí)現(xiàn), 但是以上方式在搜集信息過(guò)程中往往會(huì)遇到較多的問(wèn)題, 比如:幫助文檔的準(zhǔn)確性較低, 同時(shí)不夠完整, 可利用的重用信息不多等。
2.2 對(duì)軟件代碼的重用
在對(duì)軟件代碼重用過(guò)程中, 最關(guān)鍵的問(wèn)題是軟件的研發(fā)人員必須掌握需要的類(lèi)或方法, 并能夠通過(guò)與之有聯(lián)系的代碼實(shí)現(xiàn)代碼的重用。但是這種方式哦足跡信息將會(huì)耗費(fèi)工作人員大量的精力。而通過(guò)關(guān)鍵詞在代碼庫(kù)中搜集可重用的軟件代碼, 同時(shí)按照代碼的相關(guān)度對(duì)搜集到的代碼進(jìn)行排序, 該過(guò)程使用的原理就是可重用的代碼必然模式基本類(lèi)似, 最終所展現(xiàn)出來(lái)的搜索結(jié)果是以上下文結(jié)構(gòu)的方式展現(xiàn)的。比如:類(lèi)與類(lèi)之間的聯(lián)系。其實(shí)現(xiàn)的具體流程如下:
(1) 軟件的開(kāi)發(fā)人員創(chuàng)建同時(shí)具備例程和上下文架構(gòu)的代碼庫(kù);
(2) 軟件的研發(fā)人員能夠向代碼庫(kù)提供類(lèi)的相關(guān)信息, 然后對(duì)反饋的結(jié)果進(jìn)行評(píng)估, 創(chuàng)建新型的代碼庫(kù)。
(3) 未來(lái)的研發(fā)人員在搜集過(guò)程中能夠按照評(píng)估結(jié)果的高低排序, 便于查詢(xún), 極大地縮減工作人員的任務(wù)量, 提升其工作效率。
2.3 對(duì)動(dòng)態(tài)規(guī)則的重用
軟件工程領(lǐng)域內(nèi)對(duì)動(dòng)態(tài)規(guī)則重用的研究已經(jīng)相對(duì)成熟, 通過(guò)在編譯器內(nèi)安裝特定插件的方式檢驗(yàn)代碼是否為動(dòng)態(tài)規(guī)則最適用的, 并能夠?qū)⒉贿m合的規(guī)則反饋給軟件的研發(fā)人員。其操作流程為:
(1) 軟件的研發(fā)人員能夠規(guī)定動(dòng)態(tài)規(guī)則的順序, 主要表現(xiàn)在:使用某一函數(shù)是不能夠調(diào)用其他的函數(shù)。
(2) 實(shí)現(xiàn)對(duì)相關(guān)數(shù)據(jù)的保存, 可以通過(guò)隊(duì)列等簡(jiǎn)單的數(shù)據(jù)結(jié)構(gòu)完成。在利用編譯拓展中檢測(cè)其中的順序。
(3) 能夠?qū)㈠e(cuò)誤的信息反饋給軟件的研發(fā)人員。
3 結(jié)束語(yǔ)
在軟件工程的數(shù)據(jù)挖掘過(guò)程中, 數(shù)據(jù)挖掘的概念才逐步被定義, 但是所需要挖掘的數(shù)據(jù)是已經(jīng)存在的。數(shù)據(jù)挖掘技術(shù)在軟件工程中的運(yùn)用能夠降低研發(fā)人員的工作量, 同時(shí)軟件工程與數(shù)據(jù)挖掘的結(jié)合是計(jì)算機(jī)技術(shù)必然的發(fā)展方向。從數(shù)據(jù)挖掘的過(guò)程來(lái)講, 在其整個(gè)實(shí)施過(guò)程和周期中都包括軟件工程。而對(duì)數(shù)據(jù)挖掘的技術(shù)手段來(lái)講, 它在軟件工程中的運(yùn)用更加普遍。在對(duì)數(shù)據(jù)挖掘技術(shù)的研究過(guò)程中可以發(fā)現(xiàn), 該技術(shù)雖然已經(jīng)獲得一定的效果, 但是還有更多未被挖掘的空間, 還需要進(jìn)一步的研究和發(fā)現(xiàn)。
參考文獻(xiàn)
[1]王藝蓉.試析面向軟件工程數(shù)據(jù)挖掘的開(kāi)發(fā)測(cè)試技術(shù)[J].電子技術(shù)與軟件工程, 20xx (18) :64.
[2]吳彥博.軟件工程中數(shù)據(jù)挖掘技術(shù)的運(yùn)用探索[J].數(shù)字通信世界, 20xx (09) :187.
[3]周雨辰.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研究[J].電腦迷, 20xx (08) :27-28.
[4]劉桂林.分析軟件工程中數(shù)據(jù)挖掘技術(shù)的應(yīng)用方式[J].中國(guó)新通信, 20xx, 19 (13) :119.
數(shù)據(jù)挖掘論文5
摘要:文章首先對(duì)數(shù)據(jù)挖掘技術(shù)及其具體功能進(jìn)行簡(jiǎn)要分析,在此基礎(chǔ)上對(duì)科研管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用進(jìn)行論述。期望通過(guò)本文的研究能夠?qū)蒲泄芾硭降倪M(jìn)一步提升有所幫助。
關(guān)鍵詞:科研管理;數(shù)據(jù)挖掘;技術(shù)應(yīng)用
1數(shù)據(jù)挖掘技術(shù)及其具體功能分析
所謂的數(shù)據(jù)挖掘具體是指通過(guò)相關(guān)的算法在大量的數(shù)據(jù)當(dāng)中對(duì)隱藏的、有利用價(jià)值的信息進(jìn)行搜索的過(guò)程。數(shù)據(jù)挖掘是一門(mén)綜合性較強(qiáng)的科學(xué)技術(shù),其中涉及諸多領(lǐng)域的知識(shí),如人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫(kù)、數(shù)理統(tǒng)計(jì)等等。數(shù)據(jù)挖掘技術(shù)具有如下幾個(gè)方面的功能:1.1關(guān)聯(lián)規(guī)則分析。這是數(shù)據(jù)挖掘技術(shù)較為重要的功能之一,可從給定的數(shù)據(jù)集當(dāng)中,找到出現(xiàn)比較頻繁的項(xiàng)集,該項(xiàng)集具體是指行形如X->Y,在數(shù)據(jù)庫(kù)當(dāng)中,X和Y所代表的均為屬性取值。在關(guān)聯(lián)規(guī)則下,只要數(shù)據(jù)滿(mǎn)足X條件,就一定滿(mǎn)足Y條件,數(shù)據(jù)挖掘技術(shù)的這個(gè)功能在商業(yè)金融等領(lǐng)域中的應(yīng)用較為廣泛。1.2回歸模式分析回歸模式主要是通過(guò)對(duì)連續(xù)數(shù)值的預(yù)測(cè),來(lái)達(dá)到挖掘數(shù)據(jù)的目的。例如,已知企業(yè)某個(gè)人的教育背景、工作年限等條件,可對(duì)其年薪的范圍進(jìn)行判定,整個(gè)分析過(guò)程是利用回歸模型予以實(shí)現(xiàn)的。在該功能中,已知的條件越多,可進(jìn)行挖掘的信息就越多。1.3聚類(lèi)分析聚類(lèi)具體是指將相似程度較高的數(shù)據(jù)歸為同一個(gè)類(lèi)別,通過(guò)聚類(lèi)分析能夠從數(shù)據(jù)集中找出類(lèi)似的數(shù)據(jù),并組成不同的組。在聚類(lèi)分析的過(guò)程中,需要使用聚類(lèi)算法,借助該算法對(duì)數(shù)據(jù)進(jìn)行檢測(cè)后,可以判斷其隱藏的屬性,并將數(shù)據(jù)庫(kù)分為若干個(gè)相似的組。
2科研管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用
科研是科學(xué)研究的簡(jiǎn)稱(chēng),具體是指為認(rèn)識(shí)客觀事物在內(nèi)在本質(zhì)及其運(yùn)動(dòng)規(guī)律,而借助某些技術(shù)手段和設(shè)備,開(kāi)展調(diào)查研究、實(shí)驗(yàn)等活動(dòng),并為發(fā)明和創(chuàng)造新產(chǎn)品提供理論依據(jù)?蒲泄芾硎菍(duì)科研項(xiàng)目全過(guò)程的管理,如課題管理、經(jīng)費(fèi)管理、成果管理等等。由于科學(xué)研究中涉及的內(nèi)容較多,從而給科研管理工作增添了一定的難度。為進(jìn)一步提升科研管理水平,可在不同的管理環(huán)節(jié)中,對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行應(yīng)用。下面就此展開(kāi)詳細(xì)論述。
2.1在立項(xiàng)及可行性評(píng)估中的應(yīng)用
科研管理工作的開(kāi)展需要以相關(guān)的科研課題作為依托,當(dāng)課題選定之后,需要對(duì)其可行性及合理性進(jìn)行全面系統(tǒng)地評(píng)估,由此使得科研課題的立項(xiàng)及評(píng)估成為科研管理的主要工作內(nèi)容,F(xiàn)階段,國(guó)內(nèi)的科研課題立項(xiàng)采用的是申請(qǐng)審批制,具體的流程是:由科研機(jī)構(gòu)的相關(guān)人員負(fù)責(zé)提出申請(qǐng),然后再由科技主管部門(mén)從申請(qǐng)中進(jìn)行篩選,經(jīng)過(guò)業(yè)內(nèi)專(zhuān)家的評(píng)審論證之后,擇優(yōu)選取科研項(xiàng)目的承接單位。在進(jìn)行科研課題立項(xiàng)的過(guò)程中,涉及諸多方面的內(nèi)容,具體包括申請(qǐng)單位、課題的`研究領(lǐng)域、經(jīng)費(fèi)安排、主管單位以及評(píng)審專(zhuān)家等。通過(guò)調(diào)查發(fā)現(xiàn),由于國(guó)家宏觀調(diào)控政策的缺失,導(dǎo)致科研立項(xiàng)中存在低水平、重復(fù)性研究的情況,從而造成大量的研究經(jīng)費(fèi)浪費(fèi),所取得的研究成果也不顯著?蒲泄芾聿块T(mén)雖然建立了相對(duì)完善的數(shù)據(jù)庫(kù)系統(tǒng),并且系統(tǒng)也涵蓋與項(xiàng)目申請(qǐng)、審評(píng)等方面有關(guān)的基本操作流程,如上傳項(xiàng)目申報(bào)文件、將文件發(fā)給相關(guān)的評(píng)審專(zhuān)家、對(duì)評(píng)審結(jié)果進(jìn)行自動(dòng)統(tǒng)計(jì)等。從本質(zhì)的角度上講,數(shù)據(jù)庫(kù)管理系統(tǒng)所完成的這些工作流程,就是將傳統(tǒng)管理工作轉(zhuǎn)變?yōu)樾畔⒒。故此,?yīng)當(dāng)對(duì)已有的數(shù)據(jù)進(jìn)行深入挖掘,從而找出其中更具利用價(jià)值的信息,據(jù)此對(duì)科研立項(xiàng)進(jìn)行指導(dǎo),這樣不但能夠使有限的科技資源得到最大限度地利用,而且還能使科研經(jīng)費(fèi)的使用效益獲得全面提升。在科研立項(xiàng)階段,可對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行合理運(yùn)用,借此來(lái)對(duì)課題申請(qǐng)中涉及的各種因素進(jìn)行挖掘,找出其中潛在的規(guī)則,為指標(biāo)體系的構(gòu)建和遴選方法的選擇提供可靠依據(jù),最大限度地降低不合理因素對(duì)課題立項(xiàng)帶來(lái)的影響,對(duì)確需資助的科研項(xiàng)目進(jìn)行準(zhǔn)確選擇,并給予相應(yīng)的資助。在科研立項(xiàng)環(huán)節(jié)中,對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行應(yīng)用時(shí),可以借助改進(jìn)后的Apriori算法進(jìn)行數(shù)據(jù)挖掘,從中找出關(guān)聯(lián)規(guī)則,在對(duì)該規(guī)則進(jìn)行分析的基礎(chǔ)上,對(duì)立項(xiàng)的合理性進(jìn)行評(píng)價(jià)。
2.2在項(xiàng)目管理中的應(yīng)用
項(xiàng)目管理是科研管理的關(guān)鍵環(huán)節(jié),為提高項(xiàng)目管理的效率和水平,可對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行合理運(yùn)用。在信息時(shí)代到來(lái)的今天,計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)的普及程度越來(lái)越高,國(guó)內(nèi)很多科研機(jī)構(gòu)都紛紛構(gòu)建起了相關(guān)的管理信息系統(tǒng),其中涵蓋了諸多的信息,如課題、科研人員、研究條件等等,而在這些信息當(dāng)中,隱藏著諸多具有特定意義的規(guī)則,為找出這些規(guī)則,需要借助數(shù)據(jù)挖掘技術(shù),對(duì)信息進(jìn)行深入分析,進(jìn)而獲取對(duì)科研項(xiàng)目有幫助的信息。由于大部分科研管理部門(mén)建立的科研管理信息系統(tǒng)時(shí)間較早,從而使得系統(tǒng)本身的功能比較單一,如信息刪減、修改、查詢(xún)、統(tǒng)計(jì)等等,雖然這些功能可以滿(mǎn)足對(duì)科研課題進(jìn)展、經(jīng)費(fèi)使用等方面的管理,但其面向的均為數(shù)據(jù)庫(kù)管理人員,處理的也都是常規(guī)事務(wù)。而從科研課題的管理者與決策者的角度上看,管理信息系統(tǒng)這些功能顯然是有所不足的,因?yàn)樗麄冃枰獙?duì)歷史進(jìn)行分析和提煉,從中獲取相應(yīng)的數(shù)據(jù),為決策和管理工作的開(kāi)展提供支撐。對(duì)此,可應(yīng)用數(shù)據(jù)挖掘技術(shù)的OLAP,即數(shù)據(jù)庫(kù)聯(lián)機(jī)分析處理,由此能夠幫助管理者從不同的方面對(duì)數(shù)據(jù)進(jìn)行觀察,進(jìn)而深入了解數(shù)據(jù)并獲取所需的信息。利用OLAP可以發(fā)現(xiàn)多種于科研課題有關(guān)信息之間的內(nèi)在聯(lián)系,這樣管理者便能及時(shí)發(fā)現(xiàn)其中存在的相關(guān)問(wèn)題,并針對(duì)問(wèn)題采取有效的方法和措施加以應(yīng)對(duì)。運(yùn)用數(shù)據(jù)挖掘技術(shù)能夠?qū)蒲许?xiàng)目的相關(guān)數(shù)據(jù)進(jìn)行分析,找出其中存在的矛盾,從而使管理工作的開(kāi)展更具針對(duì)性。
3結(jié)論
綜上所述,科研管理是一項(xiàng)較為復(fù)雜且系統(tǒng)的工作,其中涵蓋的信息相對(duì)較多。為此,可將數(shù)據(jù)挖掘技術(shù)在科研管理中進(jìn)行合理應(yīng)用,對(duì)相關(guān)信息進(jìn)行深入分析,從中挖掘出有利用價(jià)值的信息,為科研管理工作的開(kāi)展提供可靠的依據(jù),由此除了能夠確?蒲许(xiàng)目順利進(jìn)行之外,還能提高科研管理水平。
參考文獻(xiàn):
。1]劉占波,王立偉,王曉麗.大數(shù)據(jù)環(huán)境下基于數(shù)據(jù)挖掘技術(shù)的高?蒲泄芾硐到y(tǒng)的設(shè)計(jì)[J].電子測(cè)試,20xx(1):21-22.
[2]史子靜.高?蒲泄芾硐到y(tǒng)中計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的運(yùn)用研究[J].科技資訊,20xx(6):65-66.
。3]丁磊.?dāng)?shù)據(jù)挖掘技術(shù)在高校教師科研管理中的應(yīng)用研究[D].大連海事大學(xué),20xx.
數(shù)據(jù)挖掘論文6
【摘要】目的:分析HIS數(shù)據(jù)的挖掘與統(tǒng)計(jì)對(duì)醫(yī)院管理決策的意義。方法:首先對(duì)我院的管理人員和臨床一線醫(yī)護(hù)人員進(jìn)行調(diào)查,并對(duì)HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)實(shí)施前和實(shí)施后的評(píng)價(jià)進(jìn)行統(tǒng)計(jì),最后記錄各項(xiàng)數(shù)據(jù)結(jié)果。結(jié)果:通過(guò)調(diào)查后發(fā)現(xiàn),實(shí)施HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)后,管理人員對(duì)醫(yī)院管理的評(píng)分較比實(shí)施前更高,組間數(shù)據(jù)經(jīng)驗(yàn)檢驗(yàn)P<0.05差異具有統(tǒng)計(jì)學(xué)意義。比對(duì)工作人員對(duì)醫(yī)院管理的評(píng)分,實(shí)施后較比實(shí)施前更高,組間數(shù)據(jù)經(jīng)驗(yàn)檢驗(yàn)P<0.05差異具有統(tǒng)計(jì)學(xué)意義。另外,比對(duì)實(shí)施前和實(shí)施后的優(yōu)良率,前者低于后者,組間數(shù)據(jù)經(jīng)驗(yàn)檢驗(yàn)P<0.05差異具有統(tǒng)計(jì)學(xué)意義。結(jié)論:HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)可以使醫(yī)院的管理決策得以改善,醫(yī)院整體水平也會(huì)明顯提升,可進(jìn)一步實(shí)踐和普及。
【關(guān)鍵詞】HIS數(shù)據(jù)挖掘與統(tǒng)計(jì);醫(yī)院管理決策;意義分析
近年來(lái),醫(yī)院信息系統(tǒng)被廣泛應(yīng)用,同時(shí)將諸多歷史重要信息進(jìn)行回顧與收集,這些信息在醫(yī)院日常工作中起著舉足輕重的作用,同時(shí)也是醫(yī)院管理決策的重要資源。通常情況下,人們通過(guò)分析大量的數(shù)據(jù)信息,對(duì)其進(jìn)行整理和歸類(lèi),在結(jié)果中找出醫(yī)院經(jīng)營(yíng)與醫(yī)療業(yè)務(wù)的規(guī)律,在一定程度上對(duì)醫(yī)院管理者決策有著重要意義[1]。鑒于此,此研究分析HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)的價(jià)值,對(duì)我院的管理人員和工作人員進(jìn)行調(diào)查,現(xiàn)將具體流程和研究結(jié)果進(jìn)行以下表述。
1對(duì)象與方法
1.1基礎(chǔ)信息選擇20xx年5月至20xx年5月的各部門(mén)領(lǐng)導(dǎo)和工作人員作為此次研究調(diào)查對(duì)象,調(diào)查方式以調(diào)查問(wèn)卷為主,20xx年5月至20xx年5月期間為HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)實(shí)施前,20xx年6月至20xx年5月為HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)實(shí)施后。調(diào)查研究人員中,院領(lǐng)導(dǎo)5名,職能科室負(fù)責(zé)人5名,臨床醫(yī)技科室主任6名,臨床醫(yī)技科室護(hù)士長(zhǎng)5名,臨床醫(yī)技科室主治醫(yī)師職稱(chēng)20名,護(hù)理人員30名。1.2方法HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)主要流程為:①明確挖掘的最終目的,同時(shí)對(duì)醫(yī)學(xué)領(lǐng)域和相關(guān)知識(shí)經(jīng)驗(yàn)進(jìn)行掌握。隨后明確需要處理的問(wèn)題,利用用戶(hù)的角度,制定醫(yī)學(xué)數(shù)據(jù)挖掘的最終目的,同時(shí)還需將結(jié)論的判定依據(jù)進(jìn)行擬定。②掌握數(shù)據(jù)挖掘所需的'內(nèi)容,同時(shí)將醫(yī)院包含對(duì)象的基本情況進(jìn)行查閱,將數(shù)據(jù)的初步收集過(guò)程予以實(shí)施。在此期間,還需將原始數(shù)據(jù)的實(shí)施情況予以保留,并對(duì)數(shù)據(jù)的屬性予以明確[2]。③數(shù)據(jù)的準(zhǔn)備。通常情況下,醫(yī)學(xué)的數(shù)據(jù)較多,且具有復(fù)雜性,因此需事先整理原始數(shù)據(jù),隨后進(jìn)行分析。對(duì)數(shù)據(jù)不同種類(lèi)實(shí)施針對(duì)性方法進(jìn)行預(yù)處理,隨后依據(jù)數(shù)據(jù)挖掘的最終目的和自身特征將適宜的模型進(jìn)行選擇,讓數(shù)據(jù)之間進(jìn)行相互轉(zhuǎn)換。④數(shù)據(jù)的挖掘。首先分析數(shù)據(jù),利用科學(xué)合理的算法進(jìn)行,同時(shí)該步驟在醫(yī)學(xué)相關(guān)知識(shí)的探索中至關(guān)重要。實(shí)施該流程需事先描述相關(guān)概念,隨后采用關(guān)聯(lián)分析進(jìn)行分類(lèi)和預(yù)測(cè),隨后采用聚類(lèi)分析和趨勢(shì)分析,還可以利用孤立點(diǎn)分析和偏差分析等。值的注意的是,需證實(shí)挖掘的數(shù)據(jù)結(jié)果,讓其合理性得以保證。⑤總結(jié)結(jié)果。首先講述搜索到的醫(yī)學(xué)知識(shí),將其和最初的目標(biāo)進(jìn)行比較,這樣可以保證實(shí)施期間的合理性。⑥知識(shí)的同化和具體應(yīng)用。首先整理挖掘到的相關(guān)結(jié)果,并運(yùn)用到HIS醫(yī)學(xué)中,在此期間需進(jìn)行計(jì)劃性實(shí)施,并加以控制。1.3判定依據(jù)[3]將管理人員和臨床一線醫(yī)護(hù)人員對(duì)醫(yī)院的管理評(píng)分進(jìn)行評(píng)價(jià)。結(jié)果超過(guò)90分,表示評(píng)價(jià)結(jié)果為優(yōu),結(jié)果介于70至89分之間,表示評(píng)價(jià)結(jié)果為良,結(jié)果低于70分,表示評(píng)價(jià)結(jié)果為差。1.4數(shù)據(jù)檢驗(yàn)及分析此次研究中涉及的所有數(shù)據(jù)均選擇(SPSS19.0)進(jìn)行檢驗(yàn)和分析,各項(xiàng)管理評(píng)分以均數(shù)(±)表示,組間行T值檢驗(yàn),管理效果以(%)表示,組間行卡方檢驗(yàn),組間數(shù)據(jù)經(jīng)驗(yàn)檢驗(yàn)P<0.05差異具有統(tǒng)計(jì)學(xué)意義。
2實(shí)驗(yàn)結(jié)果
2.1實(shí)施前和實(shí)施后管理人員對(duì)醫(yī)院管理的評(píng)價(jià)結(jié)果比對(duì)實(shí)施前和實(shí)施后不同管理人員對(duì)醫(yī)院管理的評(píng)價(jià),實(shí)施后的各項(xiàng)評(píng)分較比實(shí)施前明顯較高,組間數(shù)據(jù)經(jīng)驗(yàn)檢驗(yàn)P<0.05差異具有統(tǒng)計(jì)學(xué)意義。2.2臨床工作人員對(duì)醫(yī)院管理的評(píng)價(jià)結(jié)果比對(duì)實(shí)施前和實(shí)施后臨床一線醫(yī)護(hù)人員對(duì)醫(yī)院管理的評(píng)價(jià),實(shí)施后的各項(xiàng)評(píng)分較比實(shí)施前明顯較高,組間數(shù)據(jù)經(jīng)驗(yàn)檢驗(yàn)P<0.05差異具有統(tǒng)計(jì)學(xué)意義。詳情數(shù)據(jù)結(jié)果由表2所示。2.3實(shí)施前和實(shí)施后的管理效果評(píng)價(jià)結(jié)果實(shí)施前,管理效果評(píng)價(jià)優(yōu)良率經(jīng)統(tǒng)計(jì)后為84.5%,實(shí)施HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)后,管理效果評(píng)價(jià)優(yōu)良率經(jīng)統(tǒng)計(jì)后為98.6%,兩組間數(shù)據(jù)經(jīng)驗(yàn)檢驗(yàn)P<0.05差異具有統(tǒng)計(jì)學(xué)意義。詳情數(shù)據(jù)結(jié)果由表3所示。
3討論
近幾年,HIS系統(tǒng)的應(yīng)運(yùn)而生,對(duì)醫(yī)院的管理和工作起到促進(jìn)作用,不僅使醫(yī)院各個(gè)崗位的工作效果進(jìn)行提高,同時(shí)加強(qiáng)了衛(wèi)生資源的使用水平[4]。與此同時(shí),HIS系統(tǒng)還可以使醫(yī)療差錯(cuò)的幾率顯著降低,患者的就醫(yī)體檢得以改善,規(guī)范醫(yī)院的各項(xiàng)管理,從而使百姓對(duì)醫(yī)院的信任度提升。除此之外,該系統(tǒng)的運(yùn)用可以?xún)?yōu)化工作流程,加大醫(yī)院管理力度的同時(shí)提升管理水平,從而提高醫(yī)院核心競(jìng)爭(zhēng)力[5]。決策系統(tǒng)屬于全新的管理系統(tǒng),其主要是解決半結(jié)構(gòu)化決策問(wèn)題,提升管理者的決策能力,使決策的質(zhì)量進(jìn)一步加強(qiáng),將信息資源充分利用后將醫(yī)院的整體管理水平得以改善[6]。從此次數(shù)據(jù)結(jié)果可以看出,通過(guò)實(shí)施HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)后,不同管理人員和臨床一線醫(yī)護(hù)人員的各項(xiàng)評(píng)分較比實(shí)施前更高,組間數(shù)據(jù)經(jīng)驗(yàn)檢驗(yàn)P<0.05差異具有統(tǒng)計(jì)學(xué)意義。這一研究結(jié)果說(shuō)明,通過(guò)實(shí)施該系統(tǒng)后,可以將服務(wù)措施變得更加針對(duì)性,醫(yī)院的組織結(jié)果也可以進(jìn)行優(yōu)化。與此同時(shí),還可以使醫(yī)院的工作效率進(jìn)行提升,有助于和諧醫(yī)患關(guān)系的構(gòu)建。另外,從管理效果評(píng)價(jià)結(jié)果來(lái)看,實(shí)施后的優(yōu)良率98.6%明顯優(yōu)于實(shí)施前的84.5%,這一研究結(jié)果充分體現(xiàn)了HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)的應(yīng)用可行性和優(yōu)勢(shì)。綜上可知,HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)可以使醫(yī)院的管理決策得以改善,醫(yī)院水平也會(huì)明顯提升,具有較高的實(shí)踐意義。
參考文獻(xiàn)
[1]于樹(shù)新,劉素溫,鄒向坤等.HIS數(shù)據(jù)的挖掘統(tǒng)計(jì)對(duì)醫(yī)院管理決策的意義[J].中國(guó)醫(yī)藥導(dǎo)報(bào),20xx(25):141-143,159.
[2]王瑞.基于HIS的門(mén)診醫(yī)療數(shù)據(jù)倉(cāng)庫(kù)構(gòu)建及多維分析和挖掘[D].南開(kāi)大學(xué),20xx.
[3]吳騁,羅虹,何倩等.對(duì)醫(yī)療數(shù)據(jù)為醫(yī)院管理與臨床診療提供支持的研究[J].中國(guó)數(shù)字醫(yī)學(xué),20xx,07(2):41-43.
[4]呂學(xué)明.數(shù)據(jù)挖掘在醫(yī)務(wù)管理中的應(yīng)用[D].山西大學(xué),20xx.
[5]郭慶,谷巖.數(shù)據(jù)挖掘技術(shù)在醫(yī)院信息系統(tǒng)的統(tǒng)計(jì)分析與決策中的應(yīng)用[J].中國(guó)醫(yī)療設(shè)備,20xx,25(5):64-67.
[6]沈明霞,林雨芳,章光華等.中醫(yī)院HIS系統(tǒng)數(shù)據(jù)的挖掘和應(yīng)用[J].中國(guó)數(shù)字醫(yī)學(xué),20xx,06(4):81-82,85.
作者:陳帥 單位:滄州市人民醫(yī)院醫(yī)務(wù)部
數(shù)據(jù)挖掘論文7
0 引言
隨著我國(guó)利率市場(chǎng)的推進(jìn)和改革的不斷深入,我國(guó)銀行業(yè)面臨的競(jìng)爭(zhēng)壓力也越來(lái)越大,若想在競(jìng)爭(zhēng)中處于不敗之地,中國(guó)金融業(yè)必須改變經(jīng)營(yíng)觀念,以客戶(hù)需要為中心,以客戶(hù)滿(mǎn)意為宗旨,改善企業(yè)與客戶(hù)關(guān)系,不斷地提高自身的服務(wù)水平和決策能力。 由于在銀行日常的業(yè)務(wù)處理過(guò)程中,收集并積累了大量和客戶(hù)有關(guān)的業(yè)務(wù)數(shù)據(jù),銀行希望能夠?qū)?shù)據(jù)庫(kù)中存儲(chǔ)的這些大量數(shù)據(jù)信息進(jìn)行分析和處理,提取潛在的、有應(yīng)用價(jià)值的信息,從而提高銀行的服務(wù)和決策水平。 對(duì)企業(yè)或銀行而言,能否對(duì)客戶(hù)相關(guān)數(shù)據(jù)加以進(jìn)一步利用,已成為在競(jìng)爭(zhēng)中取得優(yōu)勢(shì)的關(guān)鍵和基礎(chǔ)。 數(shù)據(jù)挖掘就是對(duì)大量的數(shù)據(jù)信息進(jìn)行提取、發(fā)現(xiàn)和獲得有用的知識(shí)和規(guī)則的技術(shù),為制定經(jīng)營(yíng)策略提供有利的參考依據(jù),進(jìn)而提高客戶(hù)服務(wù)水平,加強(qiáng)客戶(hù)關(guān)系管理[1].
1 客戶(hù)關(guān)系管理的涵義
客戶(hù)關(guān)系管理是指企業(yè)為了獲取最大限度的經(jīng)濟(jì)效益,制定以客戶(hù)服務(wù)為中心的發(fā)展策略,引導(dǎo)客戶(hù)的投資行為,最大限度地滿(mǎn)足客戶(hù)的需求,建立與客戶(hù)持久的關(guān)系,企業(yè)也從營(yíng)銷(xiāo)中獲得利潤(rùn),實(shí)現(xiàn)雙贏。 客戶(hù)是企業(yè)重要的資源,客戶(hù)關(guān)系也越來(lái)越受到關(guān)注和重視,應(yīng)該加強(qiáng)客戶(hù)關(guān)系的建立和維護(hù),改善企業(yè)和客戶(hù)的關(guān)系,進(jìn)而形成長(zhǎng)期穩(wěn)定的客戶(hù)群體,實(shí)現(xiàn)企業(yè)盈利的目的。
2 數(shù)據(jù)挖掘技術(shù)在銀行客戶(hù)關(guān)系管理中的應(yīng)用
數(shù)據(jù)挖掘是一種信息處理方法和技術(shù),主要是對(duì)大量實(shí)際應(yīng)用的數(shù)據(jù)進(jìn)行提取,并進(jìn)行深入地分析和處理,從而獲得有用的信息和規(guī)則,為企業(yè)的管理和制定經(jīng)營(yíng)策略提供參考依據(jù)。 數(shù)據(jù)挖掘作為一種新興的技術(shù)被廣泛應(yīng)用到銀行客戶(hù)關(guān)系管理中,對(duì)數(shù)據(jù)庫(kù)中存儲(chǔ)的大量客戶(hù)相關(guān)數(shù)據(jù)進(jìn)行深層次的挖掘,提取出來(lái)的有用的知識(shí)或信息可為管理人員提供參考依據(jù),進(jìn)而制定出合理的、有利于企業(yè)發(fā)展的決策,提高企業(yè)的競(jìng)爭(zhēng)能力。 常用的數(shù)據(jù)挖掘方法有決策樹(shù)、遺傳算法、神經(jīng)網(wǎng)絡(luò)及聚類(lèi)分析等[2].
2. 1 數(shù)據(jù)挖掘技術(shù)在銀行客戶(hù)關(guān)系管理中的重要性
數(shù)據(jù)挖掘技術(shù)在銀行客戶(hù)關(guān)系管理中的作用主要體現(xiàn)在以下幾個(gè)方面:
。 1) 客戶(hù)盈利能力分析。 不同客戶(hù)的價(jià)值是不同的,數(shù)據(jù)挖掘可以對(duì)不同市場(chǎng)活動(dòng)情況下客戶(hù)盈利能力的變化進(jìn)行分析和預(yù)測(cè),進(jìn)而制定合適的市場(chǎng)策略;( 2) 客戶(hù)獲得、流失和保持分析。 銀行為客戶(hù)提供的產(chǎn)品基本都相同,由于企業(yè)間競(jìng)爭(zhēng)的不斷加劇,發(fā)展新客戶(hù)的同時(shí)也應(yīng)重視原有客戶(hù),可以通過(guò)不斷地改善現(xiàn)有客戶(hù)的服務(wù)來(lái)避免客戶(hù)流失。 利用數(shù)據(jù)挖掘技術(shù)建立客戶(hù)流失的預(yù)測(cè)模型,可以采取預(yù)防措施防止客戶(hù)流失;( 3) 交叉營(yíng)銷(xiāo)。 銀行為客戶(hù)提供新的產(chǎn)品或服務(wù),即進(jìn)行交叉銷(xiāo)售。 數(shù)據(jù)挖掘技術(shù)可以提供幫助信息,為不同客戶(hù)分析并制定出合理的服務(wù)匹配;( 4) 客戶(hù)群體分類(lèi)分析。 優(yōu)質(zhì)客戶(hù)能夠?yàn)殂y行帶來(lái)客觀利潤(rùn),因而為高價(jià)值客戶(hù)提供優(yōu)質(zhì)服務(wù)很重要。 多數(shù)的中間客戶(hù)則處于高價(jià)值與低價(jià)值中間,也是銀行重要的客戶(hù)群體。 通過(guò)數(shù)據(jù)挖掘技術(shù)對(duì)大量的客戶(hù)進(jìn)行分類(lèi),針對(duì)不同的客戶(hù)提供不同的產(chǎn)品和服務(wù)。
2. 2 數(shù)據(jù)挖掘技術(shù)方法
數(shù)據(jù)挖掘技術(shù)主要有聚類(lèi)、分類(lèi)和關(guān)聯(lián)分析等分析方法,廣泛應(yīng)用于客戶(hù)關(guān)系管理。 聚類(lèi)分析實(shí)現(xiàn)對(duì)客戶(hù)進(jìn)行分類(lèi),利用分類(lèi)法能夠識(shí)別優(yōu)質(zhì)客戶(hù),通過(guò)關(guān)聯(lián)分析進(jìn)行交叉銷(xiāo)售[3].
2. 2. 1 分類(lèi)分析
假定數(shù)據(jù)庫(kù)中每條記錄都屬于某一確定的類(lèi)別,由一個(gè)稱(chēng)作類(lèi)屬性的值確定。 分類(lèi)分析就是通過(guò)對(duì)訓(xùn)練數(shù)據(jù)集中的數(shù)據(jù)的分析,對(duì)不同類(lèi)別進(jìn)行描述并建立分析模型或獲得分類(lèi)規(guī)則,然后將這個(gè)分類(lèi)規(guī)則應(yīng)用于其它數(shù)據(jù)庫(kù)中的記錄。 分類(lèi)分析有兩步過(guò)程: 第一步是建立模型。 通過(guò)分析記錄數(shù)據(jù)來(lái)構(gòu)造模型; 第二步是使用模型進(jìn)行分類(lèi)。 如果模型的預(yù)測(cè)準(zhǔn)確率可以接受,就可以用它對(duì)類(lèi)別未知的數(shù)據(jù)對(duì)象進(jìn)行分類(lèi)。
分類(lèi)法可將客戶(hù)劃分為不同的群體,各個(gè)群體有著明顯的行為特征。 企業(yè)可以更好地理解客戶(hù)和發(fā)現(xiàn)群體客戶(hù)的特點(diǎn),從而制定相應(yīng)的市場(chǎng)策略。 同時(shí),通過(guò)對(duì)不同客戶(hù)群的`交叉分析,還可以發(fā)現(xiàn)群間的特點(diǎn)和規(guī)律。 分類(lèi)方法通常建立的模型以分類(lèi)規(guī)則、判定樹(shù)形式出現(xiàn),主要包括決策樹(shù)、貝葉斯分類(lèi)、遺傳算法分類(lèi)等,最為典型的決策樹(shù)方法是 ID3 算法和算法 C4. 5.
例如,針對(duì)某一產(chǎn)品的營(yíng)銷(xiāo),銀行如何在眾多的客戶(hù)中識(shí)別出相應(yīng)的客戶(hù)。 這里可首先假設(shè)類(lèi)屬性是“是否為優(yōu)質(zhì)客戶(hù)”,然后采用分類(lèi)法,最后確定出優(yōu)質(zhì)客戶(hù)的評(píng)估標(biāo)準(zhǔn)。 分類(lèi)法可以幫助企業(yè)快速確定相應(yīng)客戶(hù),進(jìn)而提供相應(yīng)服務(wù)。 同樣為了防止客戶(hù)流失,首先要了解顧客的需求。 首先設(shè)類(lèi)屬性是“顧客是否流失”,再利用數(shù)據(jù)挖掘方法對(duì)大量的客戶(hù)信息進(jìn)行分析,建立數(shù)據(jù)模型,以確定客戶(hù)的特點(diǎn)和屬性,為其提供個(gè)性化服務(wù)。
2. 2. 2 關(guān)聯(lián)分析
關(guān)聯(lián)分析就是在訓(xùn)練集的基礎(chǔ)上,通過(guò)分析記錄集合,推導(dǎo)出相關(guān)性的結(jié)果,目的是為了挖掘出隱含在數(shù)據(jù)間的相互關(guān)系,發(fā)現(xiàn)客戶(hù)數(shù)據(jù)信息之間的相互依賴(lài)或某種規(guī)律性。 交叉銷(xiāo)售是指銀行向客戶(hù)推銷(xiāo)新的產(chǎn)品或服務(wù),客戶(hù)可以得到相應(yīng)的服務(wù)而受益,銀行也因營(yíng)業(yè)額的增長(zhǎng)而獲得利潤(rùn)。 關(guān)聯(lián)分析法可以在對(duì)客戶(hù)過(guò)去的購(gòu)買(mǎi)數(shù)據(jù)的分析找出影響客戶(hù)購(gòu)買(mǎi)產(chǎn)品的因素,即找出客戶(hù)的投資行為與其他屬性如性別、年齡、職位等的關(guān)聯(lián)關(guān)系,并建立預(yù)測(cè)模型對(duì)客戶(hù)以后的購(gòu)買(mǎi)進(jìn)行預(yù)測(cè),分析哪些用戶(hù)對(duì)金融產(chǎn)品感興趣,哪些用戶(hù)對(duì)理財(cái)產(chǎn)品感興趣,從而實(shí)施有效的營(yíng)銷(xiāo)[4].
2. 2. 3 聚類(lèi)分析
與分類(lèi)分析不同,聚類(lèi)分析的數(shù)據(jù)集合還沒(méi)有進(jìn)行任何分類(lèi)。 聚類(lèi)分析是對(duì)數(shù)據(jù)庫(kù)中的記錄數(shù)據(jù)進(jìn)行分析,按照類(lèi)內(nèi)相似度最大,類(lèi)間相似度最小的原則分類(lèi)。 聚類(lèi)即平常所說(shuō)的“物以類(lèi)聚”,是把一組個(gè)體按照相似性分成若干類(lèi)別。 業(yè)務(wù)人員面對(duì)服務(wù)營(yíng)銷(xiāo)的特定需要和大量的客戶(hù)信息,希望得到有效的幫助和提示,進(jìn)而對(duì)特定的客戶(hù)分類(lèi)群體采取相應(yīng)措施進(jìn)行營(yíng)銷(xiāo)。 通過(guò)聚類(lèi)分析方法,對(duì)大量的客戶(hù)數(shù)據(jù)信息進(jìn)行處理,對(duì)客戶(hù)分類(lèi)劃分,可以發(fā)現(xiàn)每個(gè)類(lèi)別客戶(hù)的不同特點(diǎn),從而提供針對(duì)性的服務(wù),為其提供相應(yīng)的服務(wù)和產(chǎn)品,快速準(zhǔn)確地找到潛在客戶(hù),提高工作效率,降低營(yíng)銷(xiāo)成本。
聚類(lèi)分析主要有統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法等,在實(shí)際應(yīng)用中經(jīng)常和分類(lèi)分析方法結(jié)合起來(lái)使用。 例如,分析人員可先利用聚類(lèi)分析對(duì)要分析的數(shù)據(jù)劃分類(lèi)別,然后用分類(lèi)分析方法進(jìn)一步分析不同類(lèi)別的數(shù)據(jù)集合,挖掘出各類(lèi)別的分類(lèi)規(guī)則,最后使用分類(lèi)規(guī)則對(duì)整個(gè)數(shù)據(jù)集合重新進(jìn)行劃分,通常能獲得較好的分類(lèi)結(jié)果。 通過(guò)兩種方法的結(jié)合使用得到滿(mǎn)意的劃分結(jié)果。
3 結(jié)語(yǔ)
數(shù)據(jù)挖掘是客戶(hù)關(guān)系管理中的關(guān)鍵技術(shù),本文主要探討數(shù)據(jù)挖掘在客戶(hù)關(guān)系管理上的應(yīng)用,對(duì)聚類(lèi)、分類(lèi)、關(guān)聯(lián)分析等挖掘技術(shù)進(jìn)行了詳細(xì)的介紹。 數(shù)據(jù)挖掘通過(guò)對(duì)大量的客戶(hù)信息進(jìn)行分析和處理,為銀行管理人員提供客戶(hù)分類(lèi)、盈利能力以及潛在的用戶(hù)等有用信息,找出各種數(shù)據(jù)之間的關(guān)聯(lián)性,從而能夠?yàn)榭蛻?hù)提供滿(mǎn)意的服務(wù),加強(qiáng)了客戶(hù)關(guān)系管理的維護(hù)和建設(shè),為決策人員提供準(zhǔn)確的指導(dǎo)信息,輔助決策者制定最優(yōu)的營(yíng)銷(xiāo)策略,降低了運(yùn)營(yíng)成本和決策風(fēng)險(xiǎn)。
參 考 文 獻(xiàn)
[1]王小燕,周建民。 數(shù)據(jù)挖掘技術(shù)在商業(yè)銀行中的應(yīng)用研究[J]. 華南金融電腦,20xx,13( 5) : 94 -96.
[2]陳建成。 數(shù)據(jù)挖掘技術(shù)在客戶(hù)關(guān)系管理系統(tǒng)中的應(yīng)用[J]. 電腦與電信,20xx( 2) : 41 -43.
[3]左愛(ài)群,杜 波。 數(shù)據(jù)挖掘在銀行客戶(hù)關(guān)系管理系統(tǒng)中的應(yīng)用[J]. 武漢工業(yè)學(xué)院學(xué)報(bào),20xx,25( 3) : 52 -55.
[4]尹曉麗,方旭昇。 數(shù)據(jù)挖掘技術(shù)在銀行 CRM 中的應(yīng)用[J]. 經(jīng)濟(jì)研究導(dǎo)刊,20xx( 20) : 112 -113.
數(shù)據(jù)挖掘論文8
一、旅游業(yè)數(shù)據(jù)挖掘國(guó)內(nèi)外研究現(xiàn)狀
隨著我國(guó)的旅游業(yè)的迅猛發(fā)展,旅游產(chǎn)業(yè)正邁向國(guó)際化的軌道,傳統(tǒng)旅游業(yè)積累的海量數(shù)據(jù),沒(méi)有被有效利用,資源被極大浪費(fèi)。將數(shù)據(jù)挖掘引入到旅游產(chǎn)業(yè)是大勢(shì)所趨。當(dāng)前數(shù)據(jù)挖掘在旅游信息化建設(shè)中的應(yīng)用與研究情況主要集中在高校理論界的研究,大多數(shù)研究?jī)H僅是學(xué)術(shù)研究,真正運(yùn)用到旅游行業(yè)的文章多是從某個(gè)具體的方面出發(fā),針對(duì)個(gè)別應(yīng)用進(jìn)行數(shù)據(jù)挖掘的融合。筆者主要研究決策樹(shù)方法在旅游信息化建設(shè)中的應(yīng)用。目前,決策樹(shù)算法有CLS算法、ID3算法、C4.5算法、CART算法、SLIQ算法、Z統(tǒng)計(jì)算法、并行決策樹(shù)算法和SPRINT算法等。不同算法在執(zhí)行效率、輸出結(jié)果、可擴(kuò)容性、可理解性、預(yù)測(cè)的準(zhǔn)確性等方面各不相同?偟膩(lái)說(shuō),這么多決策樹(shù)算法各有優(yōu)缺點(diǎn),真正將數(shù)據(jù)挖掘運(yùn)用到整個(gè)旅游信息化建設(shè)中還有很多問(wèn)題需要解決。
二、旅游業(yè)數(shù)據(jù)挖掘算法選擇
數(shù)據(jù)挖掘中常用的基本分類(lèi)算法有決策樹(shù)、貝葉斯、基于規(guī)則的算法等等。其中,決策樹(shù)是目前主流的分類(lèi)技術(shù),己經(jīng)成功的應(yīng)用于更多行業(yè)的數(shù)據(jù)分析。在關(guān)聯(lián)規(guī)則挖掘研究中,最重要的是Apriori算法,這個(gè)算法后來(lái)成為絕大多數(shù)關(guān)聯(lián)規(guī)則分類(lèi)的基礎(chǔ)。聚類(lèi)算法也是數(shù)據(jù)挖掘技術(shù)中極為重要的組成部分。與分類(lèi)技術(shù)不同的是,聚類(lèi)不要求對(duì)數(shù)據(jù)進(jìn)行事先標(biāo)定,就數(shù)據(jù)挖掘功能而言,聚類(lèi)能夠可以針對(duì)數(shù)據(jù)的相異度來(lái)分析評(píng)估數(shù)據(jù),可以作為其他對(duì)發(fā)現(xiàn)的簇運(yùn)行的數(shù)據(jù)挖掘算法的預(yù)處理步驟。各種算法分類(lèi)模型建立有所不同,但原理是大致相同的。筆者考慮決策樹(shù)算法結(jié)構(gòu)簡(jiǎn)單,便于理解,且很擅長(zhǎng)處理非數(shù)值型數(shù)據(jù),建模效率高,分類(lèi)速度快,特別適合大規(guī)模的數(shù)據(jù)處理的優(yōu)點(diǎn),結(jié)合旅游產(chǎn)業(yè)數(shù)據(jù)特點(diǎn),故作重點(diǎn)分析。
三、旅游業(yè)數(shù)據(jù)挖掘系統(tǒng)需求分析
旅游業(yè)數(shù)據(jù)挖掘系統(tǒng)的基本特點(diǎn)如下:統(tǒng)計(jì)旅游興趣;購(gòu)物消費(fèi)趨向;推薦其感興趣的旅游景點(diǎn);在后臺(tái)管理中,通過(guò)決策樹(shù)算法對(duì)游客數(shù)量、平均年齡、景點(diǎn)收費(fèi)、游客來(lái)自地區(qū)等進(jìn)行分析總結(jié),為旅游消費(fèi)者和旅游管理者提供服務(wù):為消費(fèi)者提供吃住行購(gòu)?qiáng)蕵?lè)天氣各方面信息查詢(xún)、機(jī)票、車(chē)船票、酒店、景區(qū)門(mén)票、餐飲等方面的預(yù)定與現(xiàn)金支付、第三方支付、消費(fèi)者評(píng)價(jià)、在線咨詢(xún)等方面的便利、快捷服務(wù)。為管理者提供推薦、游客管理、線路管理、景點(diǎn)管理、特色服務(wù)管理、機(jī)票管理、在線咨詢(xún)管理、旅游客戶(hù)關(guān)系管理等服務(wù),提高整體服務(wù)效率和水平。
四、旅游業(yè)數(shù)據(jù)挖掘系統(tǒng)的實(shí)現(xiàn)
旅游業(yè)信息管理系統(tǒng)包括游客信息管理與游客信息分析兩個(gè)子模塊。根據(jù)系統(tǒng)日常運(yùn)行出現(xiàn)的問(wèn)題及時(shí)對(duì)系統(tǒng)進(jìn)行維護(hù),如添加或者刪除某個(gè)模塊功能,系統(tǒng)整體運(yùn)行速度的'更近等。系統(tǒng)運(yùn)用數(shù)據(jù)庫(kù)層、持久化層、業(yè)務(wù)邏輯層、表示層四層體系結(jié)構(gòu),主要利用ID3算法達(dá)到旅游數(shù)據(jù)信息的快速、準(zhǔn)確分類(lèi)?紤]了游客與酒店之間的關(guān)系、游客與旅游路線之間的關(guān)系、游客與旅游景點(diǎn)之間的關(guān)系、游客與機(jī)票、車(chē)票之間的關(guān)系、管理員與游客之間的關(guān)系、邏輯結(jié)構(gòu)設(shè)計(jì)。程序之間的獨(dú)立性增加,易于擴(kuò)展,規(guī)范化得到保證的同時(shí)提高了系統(tǒng)的安全性。詳細(xì)功能設(shè)計(jì)包括:用戶(hù)登錄、用戶(hù)查詢(xún)、預(yù)定及支付、后臺(tái)管理、旅游客戶(hù)管理和數(shù)據(jù)分析等方面。本系統(tǒng)中主要運(yùn)用Java語(yǔ)言就行邏輯上的處理。系統(tǒng)主要使用Struts2和Hibernate這兩個(gè)框架來(lái)進(jìn)行整個(gè)系統(tǒng)的搭建。其中Struts2主要處理業(yè)務(wù)邏輯,而Hibernate主要是處理數(shù)據(jù)存儲(chǔ)、查詢(xún)等操作。系統(tǒng)采用Tomcat服務(wù)器。系統(tǒng)模塊需要實(shí)現(xiàn)酒店推薦實(shí)現(xiàn)、景點(diǎn)推薦實(shí)現(xiàn)、天氣預(yù)報(bào)實(shí)現(xiàn)、旅游線路實(shí)現(xiàn)、特產(chǎn)推薦、數(shù)據(jù)分析展現(xiàn)功能、報(bào)表數(shù)據(jù)獲取、景區(qū)客流量變化分析實(shí)現(xiàn)等。需要進(jìn)行后臺(tái)信息管理等功能測(cè)試以及時(shí)間測(cè)試、數(shù)據(jù)測(cè)試等性能測(cè)試。
五、旅游業(yè)數(shù)據(jù)挖掘算法方案中存在的一般性問(wèn)題及其改進(jìn)
在對(duì)數(shù)據(jù)挖掘的基本方法與技術(shù)進(jìn)行總結(jié)的基礎(chǔ)上,結(jié)合當(dāng)今數(shù)據(jù)挖掘的發(fā)展方向和研究熱點(diǎn),可以發(fā)現(xiàn)旅游業(yè)數(shù)據(jù)挖掘算法系統(tǒng)有待進(jìn)一步完善之處:訂票系統(tǒng)尚待完善。界面美化需要進(jìn)一步改進(jìn)。數(shù)據(jù)表之間的結(jié)構(gòu)關(guān)系需要優(yōu)化,以提高數(shù)據(jù)處理能力和效率。數(shù)據(jù)挖掘工具及算法有待精細(xì)化改進(jìn)。
作者:朱暉 單位:河南職業(yè)技術(shù)學(xué)院
數(shù)據(jù)挖掘論文9
摘 要:數(shù)據(jù)挖掘技術(shù)在各行業(yè)都有廣泛運(yùn)用,是一種新興信息技術(shù)。而在線考試系統(tǒng)中存在著很多的數(shù)據(jù)信息,數(shù)據(jù)挖掘技在在線考試系統(tǒng)有著重要的意義,和良好的應(yīng)用前景,從而在眾多技術(shù)中脫穎而出。本文從對(duì)數(shù)據(jù)挖掘技術(shù)的初步了解,簡(jiǎn)述數(shù)據(jù)挖掘技術(shù)在在線考試系統(tǒng)中成績(jī)分析,以及配合成績(jī)分析,完善教學(xué)。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);在線考試;成績(jī)分析 ;完善教學(xué)
隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的快速發(fā)展,計(jì)算機(jī)輔助教育的不斷普及,在線考試是一種利用網(wǎng)絡(luò)技術(shù)的重要輔助教育手段,其改革有著重要的意義。數(shù)據(jù)挖掘技術(shù)作為一種新興的信息技術(shù),其包括了人工智能、數(shù)據(jù)庫(kù)、統(tǒng)計(jì)學(xué)等學(xué)科的內(nèi)容,是一門(mén)綜合性的技術(shù)。這種技術(shù)的主要特點(diǎn)是對(duì)數(shù)據(jù)庫(kù)中大量的數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換和分析,從中提取出能夠?qū)處熡凶饔玫年P(guān)鍵性數(shù)據(jù)。將其運(yùn)用于在線考試系統(tǒng)中,能夠很好的處理在線考試中涉及到的數(shù)據(jù),讓在線考試的實(shí)用性和高效性得到進(jìn)一步的增強(qiáng),幫助教師更加快速、完整的統(tǒng)計(jì)考試信息,完善教學(xué)。
1.初步了解數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘技術(shù)是從大量數(shù)據(jù)中"挖掘"出對(duì)使用者有用的知識(shí),即從大量的、隨機(jī)的、有噪聲的、模糊的、不完全的實(shí)際應(yīng)用數(shù)據(jù)中,"挖掘"出隱含在其中但人們事先卻不知道的,而又是對(duì)人們潛在有用的信息與知識(shí)的整個(gè)過(guò)程。
目前主要的商業(yè)數(shù)據(jù)挖掘系統(tǒng)有SAS公司的Enterprise Miner,SPSS公司的Clementine,Sybas公司的Warehouse Studio,MinerSGI公司的Mineset,RuleQuest Research公司的See5,IBM公司的Intelligent,還有 CoverStory, Knowledge Discovery,Quest,EXPLORA, DBMiner,Workbench等。
2.數(shù)據(jù)挖掘在在線考試中的主要任務(wù)
2.1數(shù)據(jù)分類(lèi)
數(shù)據(jù)挖掘技術(shù)通過(guò)對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行分析,把數(shù)據(jù)按照相似性歸納成若干類(lèi)別,然后做出分類(lèi),并能夠?yàn)槊恳粋(gè)類(lèi)別都做出一個(gè)準(zhǔn)確的描述,挖掘出分類(lèi)的規(guī)則或建立一個(gè)分類(lèi)模型。
2.2數(shù)據(jù)關(guān)聯(lián)分析
數(shù)據(jù)庫(kù)中的數(shù)據(jù)關(guān)聯(lián)是一項(xiàng)非常重要,并可以發(fā)現(xiàn)的知識(shí)。數(shù)據(jù)關(guān)聯(lián)就是兩組或兩組以上的數(shù)據(jù)之間有著某種規(guī)律性的聯(lián)系。數(shù)據(jù)關(guān)聯(lián)分析的作用就是找出數(shù)據(jù)庫(kù)中隱藏的聯(lián)系,從中得到一些對(duì)學(xué)校教學(xué)工作管理者有用的信息。就像是在購(gòu)物中,就可以通過(guò)顧客的購(gòu)買(mǎi)物品的聯(lián)系,從中得到顧客的購(gòu)買(mǎi)習(xí)慣。
2.3預(yù)測(cè)
預(yù)測(cè)是根據(jù)已經(jīng)得到的數(shù)據(jù),從而對(duì)未來(lái)的情況做出一個(gè)可能性的分析。數(shù)據(jù)挖掘技術(shù)能自動(dòng)在大型的數(shù)據(jù)庫(kù)中做出一個(gè)較為準(zhǔn)確的分析。就像是在市場(chǎng)投資中,可以通過(guò)各種商品促銷(xiāo)的數(shù)據(jù)來(lái)做出一個(gè)未來(lái)商品的促銷(xiāo)走勢(shì)。從而在投資中得到最大的回報(bào)。
3.數(shù)據(jù)挖掘的方法
數(shù)據(jù)挖掘技術(shù)融合了多個(gè)學(xué)科、多個(gè)領(lǐng)域的知識(shí)與技術(shù),因此數(shù)據(jù)挖掘的方法也呈現(xiàn)出很多種類(lèi)的形式。就目前的統(tǒng)計(jì)分析類(lèi)的數(shù)據(jù)挖掘技術(shù)的角度來(lái)講,光統(tǒng)計(jì)分析技術(shù)中所用到的數(shù)據(jù)挖掘模型就回歸分析、邏輯回歸分析、有線性分析、非線性分析、單變量分析、多變量分析、最近鄰算法、最近序列分析、聚類(lèi)分析和時(shí)間序列分析等多種方法。數(shù)據(jù)挖掘技術(shù)利用這些方法對(duì)那些異常形式的數(shù)據(jù)進(jìn)行檢查,然后通過(guò)各種數(shù)據(jù)模型和統(tǒng)計(jì)模型對(duì)這些數(shù)據(jù)來(lái)進(jìn)行解釋?zhuān)倪@些數(shù)據(jù)中找出隱藏在其中的商業(yè)機(jī)會(huì)和市場(chǎng)規(guī)律。另外還有知識(shí)發(fā)現(xiàn)類(lèi)數(shù)據(jù)挖掘技術(shù),這種和統(tǒng)計(jì)分析類(lèi)的數(shù)據(jù)挖掘技術(shù)完全不同,其中包括了支持向量機(jī)、人工神經(jīng)元網(wǎng)絡(luò)、遺傳算法、決策樹(shù)、粗糙集、關(guān)聯(lián)順序和規(guī)則發(fā)現(xiàn)等多種方法。
4.數(shù)據(jù)挖掘在考試成績(jī)分析中的幾點(diǎn)應(yīng)用
4.1運(yùn)用關(guān)聯(lián)規(guī)則分析教師的年齡對(duì)學(xué)生考試成績(jī)的影響
數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)分析在教學(xué)分析中,是一種使用頻繁,行之有效的方法,它能挖掘出大量數(shù)據(jù)中項(xiàng)集之間之間有意義的關(guān)聯(lián)聯(lián)系,幫助知道教師的教學(xué)過(guò)程。例如在如今的一些高職院校中,就往往會(huì)把學(xué)生的英語(yǔ)四六級(jí)過(guò)級(jí)率,計(jì)算機(jī)等級(jí)等,以這些為依據(jù)來(lái)評(píng)價(jià)教師的教學(xué)效果。將數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則運(yùn)用于考試的成績(jī)分析當(dāng)中,就能夠挖掘出一些對(duì)學(xué)生過(guò)級(jí)率產(chǎn)生影響的因素,對(duì)教師的教學(xué)過(guò)程進(jìn)行重要的指導(dǎo),讓教師的教學(xué)效率更高,作用更強(qiáng)。
還可以通過(guò)關(guān)聯(lián)規(guī)則算法,先設(shè)定一個(gè)最小可信度和支持度,得到初步的關(guān)聯(lián)規(guī)則,根據(jù)相關(guān)規(guī)則,分析出教師的組成結(jié)構(gòu)和過(guò)級(jí)率的影響,從來(lái)進(jìn)行教師隊(duì)伍的結(jié)構(gòu)調(diào)整,讓教師隊(duì)伍更加合理。
4.2采用分類(lèi)算法探討對(duì)考試成績(jī)有影響的因素
數(shù)據(jù)挖掘技術(shù)中的分類(lèi)算法就是對(duì)一組對(duì)象或一個(gè)事件進(jìn)行歸類(lèi),然后通過(guò)這些數(shù)據(jù),可以進(jìn)行分類(lèi)模型的建立和未來(lái)的預(yù)測(cè)。分類(lèi)算法可以進(jìn)行考試中得到的數(shù)據(jù)進(jìn)行分類(lèi),然后通過(guò)學(xué)生的一些基本情況進(jìn)行探討一些對(duì)考試成績(jī)有影響的`因素。分類(lèi)算法可以用一下步驟實(shí)施:
4.2.1數(shù)據(jù)采集
這種方法首先要進(jìn)行數(shù)據(jù)采集,需要這幾方面的數(shù)據(jù),學(xué)生基本信息(姓名、性別、學(xué)號(hào)、籍貫、所屬院系、專(zhuān)業(yè)、班級(jí)等)、學(xué)生調(diào)查信息(比如學(xué)習(xí)前的知識(shí)掌握情況、學(xué)習(xí)興趣、課堂學(xué)習(xí)效果、課后復(fù)習(xí)時(shí)間量等)、成績(jī)(學(xué)生平常學(xué)習(xí)成績(jī),平?荚嚦煽(jī),各種大型考試成績(jī)等)、學(xué)生多次考試中出現(xiàn)的易錯(cuò)點(diǎn)(本次考試中出現(xiàn)的易錯(cuò)點(diǎn),以往考試中出現(xiàn)的易錯(cuò)點(diǎn))
4.2.2數(shù)據(jù)預(yù)處理
。1)數(shù)據(jù)集成。把數(shù)據(jù)采集過(guò)程中得到的多種信息,利用數(shù)據(jù)挖掘技術(shù)中的數(shù)據(jù)庫(kù)技術(shù)生產(chǎn)相應(yīng)的學(xué)生考試成績(jī)分析基本數(shù)據(jù)庫(kù)。(2)數(shù)據(jù)清理。在學(xué)生成績(jī)分析數(shù)據(jù)庫(kù)中,肯定會(huì)出現(xiàn)一些情況缺失,對(duì)于這些空缺處,就需要使用數(shù)據(jù)清理技術(shù)來(lái)進(jìn)行這些數(shù)據(jù)庫(kù)中數(shù)據(jù)的填補(bǔ)遺漏。例如,可以采用忽略元組的方法來(lái)刪除那些沒(méi)有參加考試的學(xué)生考試數(shù)據(jù)已經(jīng)在學(xué)生填寫(xiě)的調(diào)查數(shù)據(jù)中村中的空缺項(xiàng)。(3)數(shù)據(jù)轉(zhuǎn)換。數(shù)據(jù)轉(zhuǎn)換主要功能是進(jìn)行進(jìn)行數(shù)據(jù)的離散化操作。在這個(gè)過(guò)程中可以根據(jù)實(shí)際需要進(jìn)行分類(lèi),比如把考試成績(jī)從0~59的分到較差的一類(lèi),將60到80分為中等類(lèi),81到100分為優(yōu)秀等。(4)數(shù)據(jù)消減。數(shù)據(jù)消減的功能就是把所需挖掘的數(shù)據(jù)庫(kù),在消減的過(guò)程又不能影響到最終的數(shù)據(jù)挖掘結(jié)果。比如在分析學(xué)生的基本學(xué)習(xí)情況的影響因素情況中,學(xué)生信息表中中出現(xiàn)的字段很多,可以選擇性的刪除班別、籍貫等引述,形成一份新的學(xué)生基本成績(jī)分析數(shù)據(jù)表。
4.2.3利用數(shù)據(jù)挖掘技術(shù),得出結(jié)論
通過(guò)數(shù)據(jù)挖掘技術(shù)在在線考試中的應(yīng)用,得出這些學(xué)生數(shù)據(jù)的相關(guān)分析,比如說(shuō)學(xué)生考試中的易錯(cuò)點(diǎn)在什么地方,學(xué)生考試成績(jī)的自身原因,學(xué)生考試成績(jī)的環(huán)境原因,教師隊(duì)伍的搭配情況等等,從中得出如何調(diào)整學(xué)校教學(xué)資源,教師的教學(xué)方案調(diào)整等等,從而完善學(xué)校對(duì)學(xué)生的教學(xué)。
5.結(jié)語(yǔ)
數(shù)據(jù)挖掘技術(shù)在社會(huì)各行各業(yè)中都有一定程度的使用,基于其在數(shù)據(jù)組織、分析能力、知識(shí)發(fā)現(xiàn)和信息深層次挖掘的能力,在使用中取得了顯著的成效,但數(shù)據(jù)挖掘技術(shù)中還存在著一些問(wèn)題,例如數(shù)據(jù)的挖掘算法、預(yù)處理、可視化問(wèn)題、模式識(shí)別和解釋等等。對(duì)于這些問(wèn)題,學(xué)校教學(xué)管理工作者要清醒的認(rèn)識(shí),在在線考試系統(tǒng)中對(duì)數(shù)據(jù)挖掘信息做出合理的使用,讓數(shù)字挖掘技術(shù)在在線考試系統(tǒng)中能夠更加有效的發(fā)揮其長(zhǎng)處,避免其在在線考試系統(tǒng)中的的缺陷。
參考文獻(xiàn):
[1]胡玉榮.基于粗糙集理論的數(shù)據(jù)挖掘技術(shù)在高校學(xué)生成績(jī)分析中的作用[J].荊門(mén)職業(yè)技術(shù)學(xué)院學(xué)報(bào),20xx,12(22):12.
[2][加]韓家煒,堪博(Kam ber M.) .數(shù)據(jù)挖掘:概念與技術(shù)(第2版)[M]范明,譯.北京:機(jī)械工業(yè)出版社,20xx.
[3]王潔.《在線考試系統(tǒng)的設(shè)計(jì)與開(kāi)發(fā)》[J].山西師范大學(xué)學(xué)報(bào),20xx(2).
[4] 王長(zhǎng)娥.數(shù)據(jù)挖掘技術(shù)在教育中的應(yīng)用[J].計(jì)算機(jī)與信息技術(shù),20xx(11)
數(shù)據(jù)挖掘論文10
一、數(shù)據(jù)庫(kù)中數(shù)據(jù)挖掘的基本定義及定理
在計(jì)算機(jī)數(shù)據(jù)庫(kù)的數(shù)學(xué)墨鏡建立過(guò)程中,可以將數(shù)據(jù)分為項(xiàng)目數(shù)據(jù)與事務(wù)數(shù)據(jù),其中項(xiàng)目數(shù)據(jù)代表的是某種物品,而事務(wù)數(shù)據(jù)代表的是動(dòng)作。假設(shè)項(xiàng)目集合為I={i1,i2,i3,……,im},事務(wù)集合為D,T是集合D中的非空子集,代表某一組物品,此時(shí)必然滿(mǎn)足條件T∈I。下面將根據(jù)上述的數(shù)學(xué)因子來(lái)解釋數(shù)據(jù)庫(kù)中關(guān)聯(lián)規(guī)則如何被挖掘。
。ㄒ唬╆P(guān)聯(lián)規(guī)則的內(nèi)涵
以超市的銷(xiāo)售情況為例,我們假設(shè)數(shù)據(jù)庫(kù)內(nèi)為超市門(mén)店的詳細(xì)交易數(shù)據(jù),任意一次交易的事務(wù)t是商品集合I的子集,而關(guān)聯(lián)規(guī)則在事務(wù)集合D的支持度代表的是在子事務(wù)中同時(shí)包含了事務(wù)元素X與Y的概率;而置信度則是表示含有事務(wù)元素X的子事務(wù)中同時(shí)包含了事務(wù)元素Y的條件概率。根據(jù)超市門(mén)店銷(xiāo)售人員對(duì)消費(fèi)者購(gòu)買(mǎi)商品的市場(chǎng)了解需求,可以制定出相應(yīng)的支持度與置信度的最小閾值,此時(shí),利用數(shù)據(jù)庫(kù)即可找出符合銷(xiāo)售人員需要了解的商品之間的關(guān)聯(lián)規(guī)則。
。ǘ┫嚓P(guān)定義
定義1:若項(xiàng)目集X包含于T,那么我們可以認(rèn)為事務(wù)T支持X;定義2:若事務(wù)集D中存在s%的事務(wù)支持項(xiàng)目集X,則稱(chēng)項(xiàng)目集X的支持度為s%,并記為sup(X);定義3:當(dāng)支持度不小于數(shù)據(jù)庫(kù)用戶(hù)所定義的最小支持度閾值min_sup時(shí),稱(chēng)該項(xiàng)目集為繁榮項(xiàng)目集;當(dāng)支持度小于數(shù)據(jù)庫(kù)用戶(hù)定義的最小支持度閾值min_sup時(shí),稱(chēng)該項(xiàng)目集為非繁榮項(xiàng)目集,其中項(xiàng)目集中的項(xiàng)目數(shù)量成為項(xiàng)目集的長(zhǎng)度或維度;定義4:關(guān)聯(lián)規(guī)則可以用如下的蘊(yùn)含形式表示:X→Y,X、Y∈I,并且X∩Y=Ф;定義5:若X→Y的關(guān)聯(lián)規(guī)則在事務(wù)集合D內(nèi)支持度為s%,如果項(xiàng)目集(X∪Y)具有大小為s%的支持度,則存在support(X→Y)=P(X∪Y)。定義6:若X→Y的關(guān)聯(lián)規(guī)則在事務(wù)集合D內(nèi)支持度為c%,如果事務(wù)集D內(nèi)有c%的事務(wù)支持項(xiàng)目集(X∪Y),則存在confidence(X→Y)=P(X∪Y)/P(X);定義7:設(shè)集合S全部由繁榮集構(gòu)成,那么將S的否定邊界記做Bd-(S),符合如下等式:Bd(S)={X|XS,|x|=1}Y{X|任意Y屬于X,Y∈S,且XS},也就是說(shuō)集合S的否定邊界包含了所有本身不是繁榮集但子集全是繁榮集的事務(wù)集合,以及所有不是繁榮集的單個(gè)因子。
。ㄈ┫嚓P(guān)定理
針對(duì)繁榮集與非繁榮集的關(guān)系,也存在以下定理:定理1:繁榮集一定是由繁榮集組成(子集概念);定理2:非繁榮集的子集一定是非繁榮集。
二、挖掘關(guān)聯(lián)規(guī)則過(guò)程中的問(wèn)題分析
關(guān)聯(lián)規(guī)則初次生成中的問(wèn)題數(shù)據(jù)庫(kù)關(guān)聯(lián)規(guī)則的挖掘過(guò)程可分為兩部分,首先,需要找出一個(gè)繁榮項(xiàng)目集,該集合內(nèi)所有因子的支持度均大于給定的支持度最低閾值;接下來(lái)一步,就是從此繁榮項(xiàng)目集中挖掘出關(guān)聯(lián)規(guī)則,當(dāng)該規(guī)則滿(mǎn)足可信度條件conf≥min_conf時(shí),該規(guī)則即為用戶(hù)所需規(guī)則。算法的挖掘效能高低主要由發(fā)掘符合支持度的繁榮項(xiàng)目集決定,第二步的算法主要為判別過(guò)程,耗費(fèi)時(shí)間短,因此數(shù)據(jù)發(fā)掘關(guān)聯(lián)規(guī)則算法的研究焦點(diǎn)對(duì)準(zhǔn)了繁榮項(xiàng)目集的發(fā)現(xiàn)。已有的算法主要是以重復(fù)多次掃描為主,不僅做法復(fù)雜,而且效率較低。在事務(wù)D數(shù)據(jù)庫(kù)中,參數(shù)可信度c和參數(shù)支持度s對(duì)關(guān)聯(lián)規(guī)則影響較大,一旦用戶(hù)定義的支持度s發(fā)生改變,繁榮集和信任度也會(huì)發(fā)生改變,最終引起關(guān)聯(lián)規(guī)則的變化。
三、更新關(guān)聯(lián)規(guī)則的算法
。ㄒ唬╆P(guān)聯(lián)規(guī)則更新的數(shù)學(xué)建模
假設(shè)用戶(hù)原定義的支持度最小閾值為s,用戶(hù)新定義的支持度最小閾值為s’,那么更新關(guān)聯(lián)規(guī)則可以分為以下兩種情況:(1)當(dāng)s’>s時(shí),由于前一次產(chǎn)生的繁榮集合為Apriori算法求得,那么根據(jù)該算法的定義可知,任意一個(gè)的繁榮集均存在一個(gè)標(biāo)記屬性count記錄符合條件的事務(wù)元素個(gè)數(shù),當(dāng)新的支持度大于原有支持度時(shí),可以使用原繁榮集的count值排除不符合新要求的繁榮集;(2)當(dāng)s’<s時(shí),那么前一次產(chǎn)生的`繁榮集是否能夠滿(mǎn)足新定義支持度閾值而成為繁榮集則需要因情況而定,甚至衍生新的繁榮集。根據(jù)上述的定理2不難發(fā)現(xiàn),當(dāng)用戶(hù)新給出的支持度閾值s’小于原有的s時(shí),原來(lái)繁榮集中的所有元素組成的幾何仍舊為繁榮集,但是此時(shí)的S否定邊界Bd(S)中的部分元素則可能滿(mǎn)足條件而成為滿(mǎn)足新支持度的繁榮集元素。根據(jù)這個(gè)原理,在前一次已生成的關(guān)聯(lián)規(guī)則上,適當(dāng)更新算法,即可避免重復(fù)的掃描過(guò)程,明顯降低重新計(jì)算時(shí)的工作量。當(dāng)支持度最小閾值降低時(shí),非繁榮集的否定邊界集合中部分元素可能轉(zhuǎn)換為繁榮集元素,當(dāng)且僅當(dāng)所有子集均為繁榮集時(shí),父集才是繁榮集。所以在進(jìn)行數(shù)據(jù)挖掘過(guò)程中,只有當(dāng)否定邊界集元素滿(mǎn)足新輸入的支持度s’時(shí),該元素才有可能從非繁榮集轉(zhuǎn)入繁榮集。接下來(lái),需要使用可信度做進(jìn)一步的驗(yàn)證,而非繁榮集中的元素由于不滿(mǎn)足新支持度s’,因此不需要進(jìn)行再次驗(yàn)證。重新定義條件與求解內(nèi)容:條件:數(shù)據(jù)庫(kù)DB中已存在某種關(guān)聯(lián)規(guī)則r,在該關(guān)聯(lián)規(guī)則存在時(shí),S為滿(mǎn)足員支持度s的繁榮集,用戶(hù)改變可信度閾值為c'',支持度閾值s’滿(mǎn)足s’<s。求解:滿(mǎn)足c''以及s''的關(guān)聯(lián)規(guī)則r''。
(二)算法程序
根據(jù)上述條件與求解內(nèi)容,可知更新計(jì)算分析的重點(diǎn)在于怎樣在更短時(shí)間內(nèi)求得新增如繁榮集的元素,也就是上文所提的關(guān)聯(lián)規(guī)則挖掘步驟的第一部分,繁榮集的求解。編輯更新算法如下:S={x|support(x)≥s,X是項(xiàng)目集合}Candidate=ΦL.Gets’(s’<s)fromuser//用戶(hù)輸入s’ComputeTemp:={X∈Bd-(S)|Support(X,A.r)≥s’}//Temp表示從Bd-(s)中找到的滿(mǎn)足新支持度s’的元素集合B.S1=S,S=STempC.RepeatD.S2=S1TempE.Temp=Bd(S2)-[Bd-(S1)-temp]//Temp表示新衍生出的候選集F.S1=S2G.Candidate=CandidateTemp//candidate表示當(dāng)前的新候選集全集H.UntilTemp=ΦputeNew:=(X∈Candidate{support(X,r)≥s’})//求出新增繁榮集J.Result=SNew//將新增繁榮集和原有繁榮集合并,得出符合新支持度s’的所有繁榮集K.Find_Rule(Result,c)更新后的算法首先也需要經(jīng)過(guò)一次數(shù)據(jù)庫(kù)掃描來(lái)獲取部分的新產(chǎn)生繁榮集,并據(jù)已得的繁榮集求出推演所得的候選集。對(duì)候選集并不急于做驗(yàn)證步驟,而是從衍生候選集中循環(huán)計(jì)算以求得更多的候選集,直到無(wú)法再產(chǎn)生候選集為止,退出循環(huán)。在挖掘新繁榮子集的過(guò)程中,需要兩次掃描數(shù)據(jù)庫(kù),一次目的是搜索Bd(S)否定邊界集合中是否存在滿(mǎn)足用戶(hù)新輸入支持度s’的可疑元素,并利用這些可疑元素生成下一步的候選集;另一次掃描的目的是驗(yàn)證既得的候選集中是否所有元素均滿(mǎn)足用戶(hù)新輸入支持度s’。
。ㄈ└倪M(jìn)算法的證明與更新
[Bd(S1)-Temp]集合包含了所有BD(S1)中非繁榮集合,該集合肯定為Bd(S1temp)的子集,因此不滿(mǎn)足用戶(hù)新的定義,可刪除。若要得出[Bd(S1)-Temp]真包含于Bd(S1YTemp),則必有任意Z∈[Bd(S1)-Temp],同時(shí)Z∈Bd(S1YTemp)。根據(jù)對(duì)否定邊界Bd(S)的定義可知,當(dāng)五、|Z|=1,并Z∈Bd(S1)時(shí),ZTemp又Z(S1),ZTemp→ZBd(S1YTemp)→Z∈Bd(S1)六、|Z|>1,并Z∈Bd(S1)時(shí),ZTemp又任意Y屬于Z,Y∈S1,并Z(S1)∵Z(S1)并ZTemp→ZBd(S1YTemp)∴綜上所述,上述命題成立。
四、更新算法的測(cè)試及結(jié)果
。ㄒ唬└滤惴ǖ沫h(huán)境要求
在P4-2.4c/512M內(nèi)存/120G硬盤(pán)計(jì)算機(jī)環(huán)境下,運(yùn)行delphi7.0編輯器實(shí)現(xiàn)Aproiri算法的模擬測(cè)試,以某彩票售票點(diǎn)的銷(xiāo)售額與日期之間的關(guān)系為目標(biāo)關(guān)聯(lián)規(guī)則,在經(jīng)過(guò)兩種算法的多次運(yùn)行和數(shù)據(jù)采集后,取各量化平均值,得出如下數(shù)據(jù)圖表:
(二)更新算法的效果分析
由圖可知,在使用本文所提出的更新算法后,原算法的效率得到大大的提高。提高原因主要是從原算法的反復(fù)掃描升級(jí)至現(xiàn)算法的兩次掃描,就可得出所需挖掘關(guān)聯(lián)規(guī)則,尤其是在大規(guī)模的數(shù)據(jù)庫(kù)環(huán)境下,本算法的優(yōu)越性表現(xiàn)越明顯。
數(shù)據(jù)挖掘論文11
在當(dāng)前的學(xué)校管理中,教學(xué)和教務(wù)管理工作中積累了大量的數(shù)據(jù)信息。但是,由于這些教學(xué)中的數(shù)據(jù)沒(méi)有得到很好地運(yùn)用,在一定程度上使數(shù)據(jù)挖掘沒(méi)有得到重視。數(shù)據(jù)挖掘,從本質(zhì)上看,就是從大量和模糊以及不完全的數(shù)據(jù)中提取出潛在信息的過(guò)程。并且,隨著計(jì)算機(jī)教學(xué)改革的不斷推進(jìn),計(jì)算機(jī)教學(xué)系統(tǒng)更加注重計(jì)算機(jī)網(wǎng)絡(luò)無(wú)紙化考試,有效地改變傳統(tǒng)教學(xué)評(píng)價(jià)手段。
1關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘分析方法在計(jì)算機(jī)教學(xué)中的作用
數(shù)據(jù)挖掘作為一種全新的計(jì)算機(jī)運(yùn)用技術(shù),在各個(gè)應(yīng)用領(lǐng)域都發(fā)揮巨大的潛力。通常情況下,數(shù)據(jù)挖掘分析方法主要是有關(guān)聯(lián)規(guī)則分析、序列模式分析以及分類(lèi)分析等方法。筆者經(jīng)過(guò)一些分析方法的對(duì)比,在系統(tǒng)開(kāi)發(fā)過(guò)程中,選擇關(guān)聯(lián)規(guī)則算法進(jìn)行相應(yīng)的探討。為了能夠進(jìn)一步說(shuō)明關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘方法,同時(shí)有效地結(jié)合實(shí)踐過(guò)程,通過(guò)對(duì)以下兩個(gè)案例進(jìn)行深入分析,希望能更好地了解數(shù)據(jù)挖掘方法的運(yùn)用。例如,在“男同學(xué)-高分”的關(guān)聯(lián)規(guī)則中,這種表示方法是在考試過(guò)程中,男同學(xué)和女同學(xué)相比得高分的幾率更高,在一個(gè)具有一萬(wàn)條記錄的事物數(shù)據(jù)庫(kù)中,只有將近300條記錄包括得到高分的男同學(xué),說(shuō)明這種關(guān)聯(lián)支持度為3%,這個(gè)支持度相對(duì)來(lái)說(shuō)較高。但是,也不能因此來(lái)做出這個(gè)關(guān)聯(lián)的意義,若通過(guò)科學(xué)的統(tǒng)計(jì)發(fā)現(xiàn)其中有6000條的記錄包含男同學(xué),使可以計(jì)算出男同學(xué)的置信度為300/6000=5%,從此方面來(lái)看,這個(gè)關(guān)聯(lián)規(guī)則的置信度并不是很高,同時(shí)也就不能做出這種關(guān)聯(lián)的實(shí)際意義。但是,如果是此記錄中只有600個(gè)是“男同學(xué)”,這樣就可以知道有將近50%的人得到高分,值得關(guān)注。又如,可以針對(duì)不同類(lèi)別教師所教學(xué)生的`成績(jī)進(jìn)行統(tǒng)計(jì)。根據(jù)圖中數(shù)據(jù)顯示,可以假設(shè),甲類(lèi)教師-學(xué)生高分,設(shè)置為X-Y,可以知道,其支持度為50/310=16.13%,其置信度則為50/105=47.2%。因此,可以通過(guò)這種方法,以此來(lái)推導(dǎo)出其他的關(guān)聯(lián)支持度以及置信度。
2教師因素對(duì)挖掘計(jì)算機(jī)學(xué)生成績(jī)數(shù)據(jù)的促進(jìn)作用
當(dāng)前,我國(guó)計(jì)算機(jī)教學(xué)考試主要采用無(wú)紙化考試,其閱卷工作可以在計(jì)算機(jī)上自動(dòng)完成,其成績(jī)也可以由省教育廳逐一下發(fā),通過(guò)這樣的方式,可以更好地開(kāi)展數(shù)據(jù)挖掘工作。例如,可以利用關(guān)聯(lián)規(guī)則法研究學(xué)生A科成績(jī)和B科成績(jī)的關(guān)聯(lián):①在對(duì)可信度的運(yùn)行過(guò)程中,學(xué)生在A科成績(jī)?yōu)閮?yōu)秀時(shí),B科也為優(yōu)秀的概率;②在對(duì)支持度的運(yùn)行過(guò)程中,可以描述學(xué)生A和B科目的成績(jī)?yōu)閮?yōu)秀的概率;③在對(duì)期望可信度的運(yùn)用過(guò)程中,可以在沒(méi)有任何約束的情況下,加強(qiáng)對(duì)學(xué)生A和B科目成績(jī)?yōu)閮?yōu)秀的概率分析;④在作用度的分析上,作為一種可信度和期望可信度的比值,當(dāng)學(xué)生在A類(lèi)成績(jī)?yōu)閮?yōu)秀時(shí),可以對(duì)B科目的優(yōu)秀影響進(jìn)行深入分析。從以上的分析中可以看出,可信度能夠衡量關(guān)聯(lián)規(guī)則的準(zhǔn)確度,而且在關(guān)聯(lián)規(guī)則中,支持度是當(dāng)前關(guān)聯(lián)規(guī)則中最為重要的衡量標(biāo)準(zhǔn)。
3關(guān)聯(lián)規(guī)則推導(dǎo)技術(shù)的有效運(yùn)用
數(shù)據(jù)挖掘所得出的關(guān)聯(lián)規(guī)則只是作為數(shù)據(jù)庫(kù)中的數(shù)據(jù)之間相關(guān)性的描述,同時(shí)也可以作為一種分析工具,通過(guò)歷史數(shù)據(jù)來(lái)預(yù)測(cè)各種未來(lái)的行為。但是,數(shù)據(jù)挖掘所得出的結(jié)果只是作為一種概率,由于不同探究問(wèn)題的類(lèi)型和規(guī)模有所不同,只有靈活地運(yùn)用數(shù)據(jù)挖掘技術(shù)才能進(jìn)行補(bǔ)充。在劃分方法上,可以將數(shù)據(jù)庫(kù)中分成幾個(gè)互不相干的模塊,并且可以單獨(dú)考慮到每個(gè)分塊生成的所有的頻集,之后可以通過(guò)所產(chǎn)生的頻集合并生成所有可能的頻集,計(jì)算出這些項(xiàng)集的支持度?梢葬槍(duì)分塊規(guī)模的大小來(lái)選擇被放入的主存,而且在每個(gè)階段只需要被掃描一次,有效降低挖掘時(shí)間,提高挖掘效率。
4結(jié)語(yǔ)
從本質(zhì)上看,數(shù)據(jù)挖掘作為一種全新的數(shù)據(jù)分析技術(shù),在關(guān)聯(lián)規(guī)則中不僅在檢驗(yàn)評(píng)價(jià)數(shù)據(jù)可靠性方面發(fā)揮著非常重要的作用,而且更能夠有效地幫助其進(jìn)行科學(xué)預(yù)測(cè)。為了能夠更好達(dá)到相應(yīng)的計(jì)算機(jī)教學(xué)評(píng)價(jià)效果,就必須不斷加強(qiáng)對(duì)教學(xué)評(píng)價(jià)調(diào)查,逐步積累大量數(shù)據(jù),充分利用數(shù)據(jù)挖掘技術(shù),挖掘一些科學(xué)有效的信息,以此來(lái)為教學(xué)知識(shí)構(gòu)建提供相應(yīng)的服務(wù)。
數(shù)據(jù)挖掘論文12
摘 要:高度開(kāi)放的中國(guó)金融市場(chǎng),特別是中國(guó)銀行業(yè)市場(chǎng)受到日趨激烈的國(guó)外銀行沖擊和挑戰(zhàn),大多數(shù)銀行企業(yè)都在構(gòu)建以客戶(hù)為中心的客戶(hù)關(guān)系管理體系,這一經(jīng)營(yíng)體系理念的構(gòu)建,不僅僅能提高企業(yè)的知名度和顧客的滿(mǎn)意度,而且能提高企業(yè)的經(jīng)濟(jì)效益。但是,隨著網(wǎng)絡(luò)技
關(guān)鍵詞:客戶(hù)關(guān)系管理畢業(yè)論文
高度開(kāi)放的中國(guó)金融市場(chǎng),特別是中國(guó)銀行業(yè)市場(chǎng)受到日趨激烈的國(guó)外銀行沖擊和挑戰(zhàn),大多數(shù)銀行企業(yè)都在構(gòu)建以客戶(hù)為中心的客戶(hù)關(guān)系管理體系,這一經(jīng)營(yíng)體系理念的構(gòu)建,不僅僅能提高企業(yè)的知名度和顧客的滿(mǎn)意度,而且能提高企業(yè)的經(jīng)濟(jì)效益。但是,隨著網(wǎng)絡(luò)技術(shù)和信息技術(shù)的發(fā)展,客戶(hù)關(guān)系管理如何能結(jié)合數(shù)據(jù)挖掘技術(shù)和數(shù)據(jù)倉(cāng)庫(kù)技術(shù),增強(qiáng)企業(yè)的核心競(jìng)爭(zhēng)力已經(jīng)成為企業(yè)亟待解決的問(wèn)題。因?yàn),企業(yè)的數(shù)據(jù)挖掘技術(shù)的運(yùn)用能夠解決客戶(hù)的矛盾,為客戶(hù)設(shè)計(jì)獨(dú)立的、擁有個(gè)性化的數(shù)據(jù)產(chǎn)品和數(shù)據(jù)服務(wù),能夠真正意義上以客戶(hù)為核心,防范企業(yè)風(fēng)險(xiǎn),創(chuàng)造企業(yè)財(cái)富。
關(guān)鍵詞:客戶(hù)關(guān)系管理畢業(yè)論文
一、數(shù)據(jù)挖掘技術(shù)與客戶(hù)關(guān)系管理兩者的聯(lián)系
隨著時(shí)代的發(fā)展,銀行客戶(hù)關(guān)系管理的發(fā)展已經(jīng)越來(lái)越依賴(lài)數(shù)據(jù)挖掘技術(shù),而數(shù)據(jù)挖掘技術(shù)是在數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的基礎(chǔ)上應(yīng)運(yùn)而生的,兩者有機(jī)的結(jié)合能夠收集和處理大量的客戶(hù)數(shù)據(jù),通過(guò)數(shù)據(jù)類(lèi)型與數(shù)據(jù)特征,進(jìn)行整合,挖掘具有特殊意義的潛在客戶(hù)和消費(fèi)群體,能夠觀察市場(chǎng)變化趨勢(shì),這樣的技術(shù)在國(guó)外的銀行業(yè)的客戶(hù)關(guān)系管理廣泛使用。而作為國(guó)內(nèi)的銀行企業(yè),受到國(guó)外銀行業(yè)市場(chǎng)的大幅度沖擊,顯得有些捉襟見(jiàn)肘,面對(duì)大量的數(shù)據(jù)與快速發(fā)展的互聯(lián)網(wǎng)金融體系的沖擊,銀行業(yè)缺乏數(shù)據(jù)分析和存儲(chǔ)功能,往往造成數(shù)據(jù)的流逝,特別是在數(shù)據(jù)的智能預(yù)測(cè)與客戶(hù)關(guān)系管理還處于初步階段。我國(guó)的銀行業(yè)如何能更完善的建立客戶(hù)關(guān)系管理體系與數(shù)據(jù)挖掘技術(shù)相互融合,這樣才能使得企業(yè)獲得更強(qiáng)的企業(yè)核心競(jìng)爭(zhēng)力。
二、數(shù)據(jù)挖掘技術(shù)在企業(yè)客戶(hù)關(guān)系管理實(shí)行中存在的問(wèn)題
現(xiàn)今,我國(guó)的金融業(yè)發(fā)展存在著數(shù)據(jù)數(shù)量大,數(shù)據(jù)信息混亂等問(wèn)題,無(wú)法結(jié)合客戶(hù)關(guān)系管理的需要,建立統(tǒng)一而行之有效的數(shù)據(jù)歸納,并以客戶(hù)為中心實(shí)行客戶(hù)關(guān)系管理。
1.客戶(hù)信息不健全
在如今的銀行企業(yè),雖然已經(jīng)實(shí)行實(shí)名制戶(hù)籍管理制度,但由于實(shí)行的年頭比較短,特別是以前的數(shù)據(jù)匱乏。重點(diǎn)體現(xiàn)在,銀行的客戶(hù)信息采集主要是姓名和身份證號(hào)碼,而對(duì)于客戶(hù)的職業(yè)、學(xué)歷等相關(guān)信息一概不知,極大的影響了客戶(hù)關(guān)系管理體系的構(gòu)建。另外,數(shù)據(jù)還不能統(tǒng)一和兼容,每個(gè)系統(tǒng)都是獨(dú)立的系統(tǒng),比如:信貸系統(tǒng)、儲(chǔ)蓄系統(tǒng)全部分離。這樣存在交叉、就不能掌握出到底擁有多少客戶(hù),特別是那些需要服務(wù)的目標(biāo)客戶(hù),無(wú)法享受到銀行給予的高質(zhì)量的優(yōu)質(zhì)服務(wù)。
2.數(shù)據(jù)集中帶來(lái)的差異化的'憂(yōu)慮
以客戶(hù)為中心的客戶(hù)關(guān)系管理體系,是建立在客戶(hù)差異化服務(wù)的基礎(chǔ)上的,而作為銀行大多數(shù)以數(shù)據(jù)集中,全部有總行分配,這樣不僅不利于企業(yè)的差異化服務(wù),給顧客提供優(yōu)質(zhì)得到個(gè)性化業(yè)務(wù),同時(shí),分行也很難對(duì)挖掘潛在客戶(hù)和分析客戶(hù)成分提供一手的數(shù)據(jù),損失客戶(hù)的利益,做到數(shù)據(jù)集中,往往是不明智的選擇。
3.經(jīng)營(yíng)管理存在弊端
從組織結(jié)構(gòu)上,我國(guó)的銀行體系設(shè)置機(jī)構(gòu)龐雜,管理人員與生產(chǎn)服務(wù)人員脫節(jié)現(xiàn)象極其普遍,管理人員不懂業(yè)務(wù),只是一味的抓市場(chǎng),而沒(méi)有有效的營(yíng)銷(xiāo)手段,更別說(shuō)以市場(chǎng)為導(dǎo)向,以客戶(hù)為核心,建立客戶(hù)關(guān)系管理體系。大多數(shù)的人完全是靠關(guān)系而非真正意義上靠能力,另外,業(yè)務(wù)流程繁瑣,不利于客戶(hù)享受更多的星級(jí)待遇,這與數(shù)據(jù)發(fā)掘的運(yùn)用背道而馳,很難體現(xiàn)出客戶(hù)關(guān)系管理的價(jià)值。
三、數(shù)據(jù)挖掘技術(shù)在企業(yè)的應(yīng)用和實(shí)施
如何能更好的利用數(shù)據(jù)挖掘技術(shù)與客戶(hù)關(guān)系管理進(jìn)行合理的搭配和結(jié)合是現(xiàn)今我們面臨的最大問(wèn)題。所有我們對(duì)客戶(hù)信息進(jìn)行分析,利用模糊聚類(lèi)分析方法對(duì)客戶(hù)進(jìn)行分類(lèi),通過(guò)建立個(gè)性化的信息服務(wù)體系,真正意義的提高客戶(hù)的價(jià)值。
1.優(yōu)化客戶(hù)服務(wù)
以客戶(hù)為中心提高服務(wù)質(zhì)量是銀行發(fā)展的根源。要利用數(shù)據(jù)挖掘技術(shù)的優(yōu)勢(shì),發(fā)現(xiàn)信貸趨勢(shì),及時(shí)掌握客戶(hù)的需求,為客戶(hù)提高網(wǎng)上服務(wù),網(wǎng)上交易,網(wǎng)上查詢(xún)等功能,高度體現(xiàn)互聯(lián)網(wǎng)的作用,動(dòng)態(tài)挖掘數(shù)據(jù),通過(guò)智能化的信貸服務(wù),拓寬銀行業(yè)務(wù)水平,保證客戶(hù)的滿(mǎn)意度。
2.利用數(shù)據(jù)挖掘技術(shù)建立多渠道客戶(hù)服務(wù)系統(tǒng)
利用數(shù)據(jù)挖掘技術(shù)整合銀行業(yè)務(wù)和營(yíng)銷(xiāo)環(huán)節(jié)為客戶(hù)提供綜合性的服務(wù)。采用不同的渠道實(shí)現(xiàn)信息共享,針對(duì)目標(biāo)客戶(hù)推薦銀行新產(chǎn)品,拓寬新領(lǐng)域,告別傳統(tǒng)的柜臺(tái)服務(wù)體系,實(shí)行互聯(lián)網(wǎng)與柜臺(tái)體系相結(jié)合的多渠道服務(wù)媒介體系。優(yōu)化客戶(hù)關(guān)系管理理念,推進(jìn)營(yíng)銷(xiāo)戰(zhàn)略的執(zhí)行。提高企業(yè)的美譽(yù)度。
四、數(shù)據(jù)挖掘技術(shù)是銀行企業(yè)客戶(hù)關(guān)系管理體系構(gòu)建的基礎(chǔ)
隨著信息技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)技術(shù)的快速推進(jìn),客戶(hù)關(guān)系管理體系要緊跟時(shí)代潮流,緊密?chē)@客戶(hù)為中心,利用信息優(yōu)勢(shì),自動(dòng)獲取客戶(hù)需求,打造出更多的個(gè)性化、差異化客戶(hù)服務(wù)理念,使得為企業(yè)核心競(jìng)爭(zhēng)能力得到真正意義的提高。
數(shù)據(jù)挖掘論文13
摘要:隨著科學(xué)技術(shù)的不斷發(fā)展,計(jì)算機(jī)的使用也愈來(lái)愈廣泛,他已經(jīng)發(fā)展到各個(gè)行業(yè),現(xiàn)如今保險(xiǎn)行業(yè)也就相應(yīng)的業(yè)務(wù)引進(jìn)了計(jì)算機(jī)業(yè)務(wù)系統(tǒng),而在20xx年8月,我國(guó)也出臺(tái)了《國(guó)務(wù)院關(guān)于加快發(fā)展現(xiàn)代保險(xiǎn)服務(wù)業(yè)的若干意見(jiàn)》這一舉措的有效實(shí)施,從政策上為保險(xiǎn)行業(yè)的快速發(fā)展提供相應(yīng)了保障。而如何在這些被積累下來(lái)的寶貴數(shù)據(jù)中,分析挖掘出新的商機(jī)及財(cái)富,就成為了我國(guó)當(dāng)前保險(xiǎn)行業(yè)發(fā)展的重要突破口。本篇文章就從數(shù)據(jù)挖掘技術(shù)的應(yīng)用方面、概念、必要性,以及方法手段進(jìn)行了深入探討與分析其對(duì)財(cái)產(chǎn)保險(xiǎn)應(yīng)用的意義。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);財(cái)產(chǎn)保險(xiǎn);應(yīng)用;分析
在最近幾年中,我國(guó)對(duì)于保險(xiǎn)行業(yè)給予了高度的關(guān)注與重視并出臺(tái)了許多與之相對(duì)應(yīng)的相關(guān)政策,這些政策的發(fā)行對(duì)于我國(guó)的保險(xiǎn)行業(yè)帶來(lái)的極大程度的發(fā)展空間。而我國(guó)的保險(xiǎn)行業(yè)也開(kāi)始了轉(zhuǎn)型,正在從粗放型經(jīng)營(yíng)向集約化經(jīng)營(yíng)管理進(jìn)行過(guò)度,最明顯的改變就是之前只注重新客戶(hù)的開(kāi)發(fā)而忘記顧忌老客戶(hù)的需求與發(fā)展,但是現(xiàn)在是同時(shí)注重新老客戶(hù)的需求與發(fā)展,從根本上實(shí)現(xiàn)“兩手抓”的政策,所以這種新的形式背景下,計(jì)算機(jī)中保險(xiǎn)行業(yè)所留的數(shù)據(jù)就成為極為重要的挖掘資源。
一、解析數(shù)據(jù)挖掘技術(shù)在財(cái)產(chǎn)保險(xiǎn)分析中的應(yīng)用
(一)提升財(cái)險(xiǎn)客戶(hù)服務(wù)能力
對(duì)于任何一個(gè)公司來(lái)說(shuō)沒(méi)有客戶(hù)所有的產(chǎn)品經(jīng)營(yíng)都是紙上談兵,這對(duì)于服務(wù)行業(yè)的財(cái)產(chǎn)保險(xiǎn)公司更是如此,所以對(duì)此所以財(cái)產(chǎn)保險(xiǎn)行業(yè)就面臨著轉(zhuǎn)型升級(jí)的事情財(cái)產(chǎn)行業(yè)的轉(zhuǎn)型就意味著面臨著面向客戶(hù)的服務(wù)質(zhì)量的提升。在現(xiàn)如今的經(jīng)濟(jì)情況下,保險(xiǎn)消費(fèi)者對(duì)于保險(xiǎn)行業(yè)知識(shí)的了解日益增加,保險(xiǎn)意識(shí)也是越發(fā)的加強(qiáng)?蛻(hù)對(duì)于保險(xiǎn)行業(yè)也出現(xiàn)了個(gè)性化與差異化的需求。從這里就要求保險(xiǎn)公司通過(guò)數(shù)據(jù)挖掘技術(shù)對(duì)客戶(hù)的需求進(jìn)行更深一層的分析與探索,通過(guò)探究與分析的結(jié)果明確而客戶(hù)的需要,并為有更高需求的客戶(hù)提供更適合他的保險(xiǎn)產(chǎn)品,從而提高業(yè)務(wù)服務(wù)水平,吸引更多的優(yōu)質(zhì)客源,來(lái)增強(qiáng)市場(chǎng)的競(jìng)爭(zhēng)力。例如,在對(duì)客戶(hù)進(jìn)行細(xì)分的時(shí)候,可以通過(guò)數(shù)據(jù)挖掘技術(shù)中的“二八定律”,對(duì)客戶(hù)進(jìn)行細(xì)分。通過(guò)細(xì)分得出結(jié)果,參照數(shù)據(jù)根據(jù)每個(gè)客戶(hù)群體的風(fēng)險(xiǎn)偏好、特點(diǎn)以及需求為他們量身定制適合他們自身的新產(chǎn)品,并制定對(duì)應(yīng)適合的費(fèi)照新差旅費(fèi)管理辦法正確規(guī)范填寫(xiě)市內(nèi)交通補(bǔ)助、伙食補(bǔ)助、城市間交通費(fèi)、和住宿費(fèi)金額。并填寫(xiě)上合計(jì)金額,不得出現(xiàn)多報(bào)的行為,從而提高差旅費(fèi)報(bào)銷(xiāo)工作的質(zhì)量。
(二)風(fēng)險(xiǎn)管理和合規(guī)經(jīng)營(yíng)
每個(gè)保險(xiǎn)公司的生命底線就是合規(guī)經(jīng)營(yíng)以及對(duì)風(fēng)險(xiǎn)的管理,所以每個(gè)保險(xiǎn)公司必須在運(yùn)營(yíng)生產(chǎn)中嚴(yán)格的遵守國(guó)家的法律法規(guī),不許做出違反法律底線的事情,而風(fēng)險(xiǎn)管理對(duì)于保險(xiǎn)公司來(lái)說(shuō)具有兩層含義,其實(shí)并不簡(jiǎn)單,一方面是需要對(duì)于企業(yè)自身的風(fēng)險(xiǎn)進(jìn)行管理;另一方面是對(duì)于客戶(hù)所帶來(lái)的風(fēng)險(xiǎn)進(jìn)行管理。對(duì)于保險(xiǎn)公司來(lái)說(shuō)這兩方面的風(fēng)險(xiǎn)是相互作用、相輔相成的,第一個(gè)方面的風(fēng)險(xiǎn)管理出現(xiàn)問(wèn)題后者的風(fēng)險(xiǎn)管理就會(huì)成為空談,反之第二方面的風(fēng)險(xiǎn)管理沒(méi)有得到很好的管理,極大可能會(huì)引起前者管理出現(xiàn)問(wèn)題。而恰恰數(shù)據(jù)挖掘技術(shù)的應(yīng)用,就可以為財(cái)產(chǎn)保險(xiǎn)企業(yè)規(guī)避風(fēng)險(xiǎn)起到很大的幫助。保險(xiǎn)公司可以以計(jì)算機(jī)為使用的工具,通過(guò)數(shù)據(jù)挖掘的技術(shù),可以對(duì)數(shù)據(jù)內(nèi)大量的信息進(jìn)行查找并比對(duì)分析,高效的識(shí)別出在計(jì)算機(jī)內(nèi)不符合正常業(yè)務(wù)邏輯的數(shù)據(jù),這樣管理者就可以及時(shí)就這些風(fēng)險(xiǎn)數(shù)據(jù)和業(yè)務(wù)漏洞進(jìn)行監(jiān)測(cè)與管控,以減少違法亂紀(jì)的事情發(fā)生,逐步消除或減少隱藏的風(fēng)險(xiǎn)。保障保險(xiǎn)業(yè)健康有序的發(fā)展,為市場(chǎng)經(jīng)濟(jì)持續(xù)健康的進(jìn)一步發(fā)展保駕護(hù)航。
(三)開(kāi)發(fā)新產(chǎn)品
新的保險(xiǎn)產(chǎn)品的開(kāi)發(fā)對(duì)于增強(qiáng)保險(xiǎn)公司的公司收益、內(nèi)容、滿(mǎn)足消費(fèi)者的需求以及競(jìng)爭(zhēng)力等方面起著重要的作用,這也是經(jīng)營(yíng)保險(xiǎn)公司的首要內(nèi)容。新產(chǎn)品的開(kāi)發(fā)是指保險(xiǎn)公司針對(duì)當(dāng)前市場(chǎng)的需求、想要達(dá)到的效果與自身情況相結(jié)合的產(chǎn)物,而在原有的產(chǎn)品上加以重新的組合與設(shè)計(jì)的創(chuàng)造與改良,來(lái)滿(mǎn)足市場(chǎng)的需求,進(jìn)而提高公司自身的競(jìng)爭(zhēng)力的過(guò)程與行為。后者自不必說(shuō),基于我國(guó)財(cái)產(chǎn)保險(xiǎn)公司數(shù)據(jù)庫(kù)信息方面已經(jīng)積累了很多,而后通過(guò)對(duì)信息的數(shù)據(jù)進(jìn)行發(fā)掘,使實(shí)現(xiàn)新產(chǎn)品的開(kāi)發(fā)成為可能。譬如,通過(guò)數(shù)據(jù)挖掘技術(shù),我們可以使用現(xiàn)有產(chǎn)品進(jìn)行進(jìn)一步的完善、修正或者拆分、組合的,使其變成一全新的保險(xiǎn)產(chǎn)品,他會(huì)更接近客戶(hù)的需求,滿(mǎn)足客戶(hù)的真實(shí)所需,同時(shí)也能夠增加市場(chǎng)的銷(xiāo)量,增強(qiáng)市場(chǎng)競(jìng)爭(zhēng)力。就以原有的普通財(cái)產(chǎn)保險(xiǎn)為例子,在保險(xiǎn)有效期內(nèi)未出現(xiàn)任何對(duì)客戶(hù)的產(chǎn)才造成損失的情況下,客戶(hù)所繳納的保險(xiǎn)費(fèi)用是不予以退還的,在財(cái)產(chǎn)保險(xiǎn)的有效期過(guò)后,客戶(hù)所繳納的保險(xiǎn)費(fèi)是由保險(xiǎn)公司所擁有的。這樣的保險(xiǎn)產(chǎn)品是不被大多數(shù)客戶(hù)所看好與接受的,即使有客戶(hù)在第一次購(gòu)買(mǎi)了此保險(xiǎn),但之后是不會(huì)在對(duì)本產(chǎn)品進(jìn)行第二次的投資的。而現(xiàn)在通過(guò)數(shù)據(jù)挖掘的技術(shù),保險(xiǎn)公司可以根據(jù)對(duì)客戶(hù)信息的了解進(jìn)行分析,保險(xiǎn)公司推出了一款新的家庭財(cái)產(chǎn)兩全保險(xiǎn)保險(xiǎn),這是一種全新的保險(xiǎn)類(lèi)別。全新的家庭財(cái)產(chǎn)保險(xiǎn),他所需要交納的是保險(xiǎn)儲(chǔ)備金,比如每份保險(xiǎn)金額為50000元的家庭財(cái)產(chǎn)兩全保險(xiǎn),則保險(xiǎn)儲(chǔ)金為5000元,投保人必須根據(jù)保險(xiǎn)金額一次性交納保險(xiǎn)儲(chǔ)備金,保險(xiǎn)人可以將保險(xiǎn)儲(chǔ)備金的利息作為保險(xiǎn)費(fèi)。在保險(xiǎn)期滿(mǎn)后,無(wú)論是不是在保險(xiǎn)期內(nèi)發(fā)生賠付的情況,保險(xiǎn)公司都會(huì)將保險(xiǎn)人的全部的保險(xiǎn)儲(chǔ)金如數(shù)退還。自從出現(xiàn)了這種投保方式,客戶(hù)的接受度得到了大大的提高,全新的家庭財(cái)產(chǎn)保險(xiǎn),一方面使保險(xiǎn)人保險(xiǎn)中得到了應(yīng)得的利益,另一方面投保人的財(cái)產(chǎn)也得到了保險(xiǎn),從而在市場(chǎng)的銷(xiāo)售份額上面也得到了迅速提升。
二、保險(xiǎn)業(yè)數(shù)據(jù)挖掘技術(shù)及應(yīng)用的必要性
(一)保險(xiǎn)業(yè)數(shù)據(jù)挖掘技術(shù)的含義
什么是保險(xiǎn)行業(yè)的數(shù)據(jù)挖掘技術(shù),就是從客戶(hù)管理的角度出發(fā),針對(duì)保險(xiǎn)行業(yè)數(shù)據(jù)庫(kù)系統(tǒng)內(nèi)大量的保險(xiǎn)單,對(duì)客戶(hù)的信用數(shù)據(jù)進(jìn)行屬性變量提取,進(jìn)而采用自動(dòng)化或半自動(dòng)化等多種挖掘技巧和方法來(lái)對(duì)客戶(hù)的數(shù)據(jù)進(jìn)行分析,找到潛在的有價(jià)值的信息.
(二)數(shù)據(jù)挖掘的過(guò)程及方法
數(shù)據(jù)挖掘是一個(gè)跨越多種學(xué)科的交叉技術(shù),主要的用途是利用各種數(shù)據(jù)為商業(yè)上存在的問(wèn)題提供切實(shí)可行的方法與數(shù)據(jù)。數(shù)據(jù)挖掘的過(guò)程有以下幾個(gè)步驟:業(yè)務(wù)理解→數(shù)據(jù)準(zhǔn)備→數(shù)據(jù)理解→構(gòu)建模型→測(cè)試設(shè)計(jì)→做出評(píng)價(jià)→實(shí)施應(yīng)用。在數(shù)據(jù)挖掘方面有三個(gè)常用的方法:DM、SEMMA以及CRISP等分析方法。同時(shí)我們需要根據(jù)實(shí)際情況來(lái)運(yùn)用數(shù)據(jù)挖掘技術(shù),選擇最適當(dāng)?shù)姆椒ǎ雽?shù)據(jù)挖掘技術(shù)達(dá)到最佳的效果必須針對(duì)具體的流程做出相應(yīng)的.調(diào)節(jié)。
(三)保險(xiǎn)行業(yè)應(yīng)用數(shù)據(jù)挖掘技術(shù)的必要性
在保險(xiǎn)行業(yè)的運(yùn)營(yíng)中,常常會(huì)出現(xiàn)一下的幾個(gè)問(wèn)題:例如,細(xì)分客戶(hù)的問(wèn)題:對(duì)于不同的社會(huì)收入階層、不同年齡段、不同的行業(yè)的客戶(hù),該怎么樣去確定其的保險(xiǎn)金額呢?客戶(hù)的成長(zhǎng)問(wèn)題:如何把握時(shí)機(jī)對(duì)客戶(hù)進(jìn)行交叉銷(xiāo)售;險(xiǎn)種關(guān)聯(lián)分析問(wèn)題:在對(duì)購(gòu)買(mǎi)某種保險(xiǎn)的客戶(hù)進(jìn)行分析與探查,觀察其是否在同一時(shí)間購(gòu)買(mǎi)另一種保險(xiǎn)產(chǎn)品,客戶(hù)的獲取問(wèn)題:如何在付出最小的成本獲得最有價(jià)值的客戶(hù)的挽留及索賠優(yōu)化的問(wèn)題:如何對(duì)索賠受理的過(guò)程進(jìn)行優(yōu)化,挽留住有價(jià)值的投保人。保險(xiǎn)公司在完成數(shù)據(jù)的匯總后,所獲取的業(yè)務(wù)及大量客戶(hù)信息,不過(guò)是對(duì)公司當(dāng)前所處的市場(chǎng)環(huán)境、企業(yè)經(jīng)營(yíng)情況及客戶(hù)基本資料的記錄及反映。而進(jìn)行數(shù)據(jù)集中的信息系統(tǒng),也只能是對(duì)數(shù)據(jù)庫(kù)中的這部分?jǐn)?shù)據(jù)進(jìn)行簡(jiǎn)單的操作處理,并不能從中發(fā)現(xiàn)并提取這些數(shù)據(jù)中蘊(yùn)含的具有深層次價(jià)值的信息。所以,如若想在決策層面給出解決答案,是不可能實(shí)現(xiàn)的。而如果采用數(shù)據(jù)挖掘技術(shù)來(lái)對(duì)數(shù)據(jù)庫(kù)中所存在的大量的數(shù)據(jù)進(jìn)行高水平而深層次的分析,就能夠?yàn)閷?shí)現(xiàn)保險(xiǎn)公司的決策及科學(xué)經(jīng)營(yíng)提供切實(shí)可行的依據(jù),因此此技術(shù)的出現(xiàn)從而得到了許多保險(xiǎn)公司的應(yīng)用與重視。
三、結(jié)論
我國(guó)經(jīng)濟(jì)的發(fā)展正在向新常態(tài)的方向進(jìn)行轉(zhuǎn)變,而我國(guó)財(cái)產(chǎn)保險(xiǎn)市場(chǎng)的競(jìng)爭(zhēng)也日益激烈。為了面對(duì)這些挑戰(zhàn),各個(gè)保險(xiǎn)公司都復(fù)出了努力在積極的面向轉(zhuǎn)型,由傳統(tǒng)的粗放式經(jīng)營(yíng)向集約化經(jīng)營(yíng)的方式進(jìn)行過(guò)度,面向客戶(hù)的營(yíng)銷(xiāo)模式也是在這之中產(chǎn)生出來(lái)的。在這種轉(zhuǎn)型過(guò)度的過(guò)程中,財(cái)產(chǎn)保險(xiǎn)公司對(duì)于數(shù)據(jù)挖掘技術(shù)進(jìn)行充分的利用,使公司的風(fēng)險(xiǎn)管理能力、產(chǎn)品創(chuàng)新能力經(jīng)營(yíng)能力、盈利能力、客戶(hù)服務(wù)能力、和業(yè)務(wù)發(fā)展?jié)摿Χ嫉玫搅巳娴拇蠓忍嵘T趯?duì)我國(guó)經(jīng)濟(jì)建設(shè)的繁榮以及促進(jìn)財(cái)產(chǎn)保險(xiǎn)公司自身的長(zhǎng)遠(yuǎn)發(fā)展,都做出了不可磨滅的貢獻(xiàn),也是對(duì)國(guó)家的號(hào)召積極的響應(yīng),進(jìn)而對(duì)市場(chǎng)經(jīng)濟(jì)持續(xù)發(fā)展也做出了不少的貢獻(xiàn)。
參考文獻(xiàn):
[1]高文文.數(shù)據(jù)挖掘技術(shù)在財(cái)產(chǎn)保險(xiǎn)分析中的應(yīng)用[D].河北科技大學(xué),20xx.
[2]楊杉,何躍.數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)在保險(xiǎn)公司中的應(yīng)用[J].計(jì)算機(jī)技術(shù)與發(fā)展,20xx.
[3]葛春燕.數(shù)據(jù)挖掘技術(shù)在保險(xiǎn)公司客戶(hù)評(píng)估中的應(yīng)用研究[J].軟件,20xx.
[4]陳慶文.數(shù)據(jù)挖掘在財(cái)產(chǎn)保險(xiǎn)公司應(yīng)用研究——以人保財(cái)險(xiǎn)公司為例[D].對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué),20xx.
數(shù)據(jù)挖掘論文14
摘要:本文簡(jiǎn)述如何將數(shù)據(jù)挖掘技術(shù)應(yīng)用于圖書(shū)館各部門(mén)管理中,幫助圖書(shū)館管理者依據(jù)數(shù)據(jù)挖掘技術(shù)更好地為讀者提供科學(xué)化和人性化的服務(wù),促進(jìn)圖書(shū)館事業(yè)的創(chuàng)新與發(fā)展。
關(guān)鍵詞:高校圖書(shū)館;數(shù)據(jù)挖掘;創(chuàng)新;發(fā)展。
隨著網(wǎng)絡(luò)技術(shù)、計(jì)算機(jī)技術(shù)的快速發(fā)展,高校圖書(shū)館事業(yè)也順應(yīng)時(shí)變,不斷向高科技、高水平領(lǐng)域進(jìn)展,尤其是當(dāng)今處于數(shù)字信息發(fā)展的時(shí)代。如果利用圖書(shū)館現(xiàn)有以及收集的數(shù)據(jù)資源,通過(guò)數(shù)據(jù)挖掘技術(shù)來(lái)分析、篩選對(duì)圖書(shū)館有用的數(shù)據(jù)信息,依據(jù)提煉的數(shù)據(jù)資源來(lái)指導(dǎo)、推進(jìn)圖書(shū)館事業(yè)的創(chuàng)新與發(fā)展,是當(dāng)今信息時(shí)代圖書(shū)館亟待研究、探討的一個(gè)問(wèn)題。本文將簡(jiǎn)述如何將數(shù)據(jù)挖掘技術(shù)應(yīng)用于圖書(shū)館各部門(mén)管理之中,幫助圖書(shū)館管理者依據(jù)數(shù)據(jù)挖掘技術(shù)更好地為讀者提供科學(xué)化和人性化的服務(wù),促進(jìn)圖書(shū)館的事業(yè)創(chuàng)新與發(fā)展。
一、數(shù)據(jù)挖掘技術(shù)綜述。
數(shù)據(jù)挖掘定義。數(shù)據(jù)挖掘(Data Mining,DM)是一種新的信息處理技術(shù),其主要特點(diǎn)是對(duì)單位、企業(yè)數(shù)據(jù)庫(kù)中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換分析和其他模型化處理,以從中提取輔助管理決策的關(guān)鍵性數(shù)據(jù)。數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的和隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的但又是潛在有用的信息和知識(shí)的過(guò)程。換句話(huà)說(shuō),數(shù)據(jù)挖掘技術(shù)就是從收集的大量、繁雜的數(shù)據(jù)中挖掘出其隱含的、未知的、對(duì)決策有潛在價(jià)值的關(guān)系、模式和趨勢(shì),并用這些知識(shí)和規(guī)則建立用于決策支持的模型,提供預(yù)測(cè)性決策支持的方法、工具和過(guò)程。
數(shù)據(jù)挖掘的意義。在當(dāng)今的競(jìng)爭(zhēng)時(shí)代社會(huì)中,隨著計(jì)算機(jī)的飛速發(fā)展,計(jì)算機(jī)強(qiáng)大的數(shù)據(jù)處理能力、內(nèi)存儲(chǔ)存容量和網(wǎng)絡(luò)寬帶等價(jià)格的持續(xù)快速下降,因此大型的數(shù)據(jù)分析、提取技術(shù)不再是一個(gè)障礙。面對(duì)圖書(shū)館每天接收的龐大數(shù)據(jù)源,管理者必須學(xué)會(huì)從所擁有的大量數(shù)據(jù)信息源中提取并利用隱含在這些數(shù)據(jù)中的有用價(jià)值以及有用新信息,從而獲取對(duì)圖書(shū)館事業(yè)研究領(lǐng)域的本質(zhì)認(rèn)知和未來(lái)認(rèn)知,幫助圖書(shū)館管理者從傳統(tǒng)的經(jīng)驗(yàn)管理、主觀管理提升為理性管理和科學(xué)管理。
數(shù)據(jù)挖掘的應(yīng)用分類(lèi)。目前較常用的一般有分類(lèi)與回歸、關(guān)聯(lián)規(guī)則、聚類(lèi)分析、時(shí)序模式等。
二、數(shù)據(jù)挖掘技術(shù)對(duì)圖書(shū)館事業(yè)創(chuàng)新與發(fā)展的影響。
面對(duì)大量數(shù)據(jù),如何去存儲(chǔ)和收集數(shù)據(jù),如何利用數(shù)據(jù)挖掘技術(shù)將圖書(shū)館海量信息數(shù)據(jù)中提取供管理者決策的有價(jià)值的數(shù)據(jù),提取并利用隱藏在這些數(shù)據(jù)中的有用知識(shí)的能力變得越來(lái)越重要。運(yùn)用數(shù)據(jù)挖掘技術(shù)從數(shù)據(jù)中獲得有用的知識(shí),這在圖書(shū)館管理方面顯得尤為重要,本文將簡(jiǎn)述如何將數(shù)據(jù)挖掘技術(shù)應(yīng)用于圖書(shū)館各部門(mén)工作,為今后各部門(mén)的創(chuàng)新與發(fā)展提供策略分析。
流通部門(mén)。流通部門(mén)作為圖書(shū)館的一線服務(wù)崗位,對(duì)圖書(shū)館功能的發(fā)揮起著舉足輕重的作用。作為窗口形象崗位,直接體現(xiàn)了圖書(shū)館的整體工作狀態(tài)。
要實(shí)現(xiàn)從以往的經(jīng)驗(yàn)管理、主觀管理提升為科學(xué)管理和理性管理,數(shù)據(jù)挖掘技術(shù)將利用現(xiàn)代技術(shù)展現(xiàn)其獨(dú)天得厚的優(yōu)勢(shì)。圖書(shū)館每天都會(huì)產(chǎn)生大量的圖書(shū)流通數(shù)據(jù),這些數(shù)據(jù)包含進(jìn)、出館讀者人數(shù),借、還書(shū)數(shù)量,檢索查詢(xún)次數(shù)以及網(wǎng)上咨詢(xún)等大量繁雜的數(shù)據(jù)。在流通部門(mén)最為常用的數(shù)據(jù)就是借書(shū)、還書(shū)量,通過(guò)借書(shū)、還書(shū)數(shù)據(jù)的統(tǒng)計(jì),可獲取讀者信息行為、借閱書(shū)興趣導(dǎo)向,充分利用數(shù)據(jù)挖掘技術(shù)如關(guān)聯(lián)規(guī)則、分類(lèi)、聚類(lèi)、時(shí)間序列分析等,對(duì)圖書(shū)館蘊(yùn)含的大量豐富的用戶(hù)行為進(jìn)行建模,從而挖掘出有用的或有興趣的信息和知識(shí)。如可利用這些有價(jià)值的信息,借鑒“啤酒與尿布”的經(jīng)典商業(yè)案例,嘗試在流通部開(kāi)辟一塊試驗(yàn)田地――搭檔書(shū)架,即通過(guò)借、還書(shū)數(shù)據(jù)挖掘,將讀者感興趣、組合搭檔頻率高的書(shū)籍挑選出來(lái),開(kāi)辟一塊搭檔書(shū)架,方便讀者在借用專(zhuān)業(yè)書(shū)籍的同時(shí)順便也借閱自己感興趣的圖書(shū),既學(xué)習(xí)了自己的專(zhuān)業(yè)知識(shí),同時(shí)也順便閱讀了自己感興趣的書(shū)籍,充分實(shí)現(xiàn)了圖書(shū)館“第二課堂”的育人價(jià)值。
采編部門(mén)。傳統(tǒng)的采編部門(mén)在采集書(shū)籍時(shí)大多數(shù)情況是依據(jù)采集經(jīng)驗(yàn)或是依據(jù)各院系、讀者反饋的需求書(shū)籍進(jìn)行征訂。大部分購(gòu)買(mǎi)的圖書(shū)還是比較適合讀者所用的`,但也會(huì)存在一些盲目性,有時(shí)會(huì)造成采集的偏差,這是采編部門(mén)一直比較困惑的問(wèn)題。如何既將購(gòu)書(shū)經(jīng)費(fèi)合理利用好,同時(shí)又能滿(mǎn)足讀者借閱所需,是采編部門(mén)長(zhǎng)期探索、研究的問(wèn)題。如果將數(shù)據(jù)挖掘技術(shù)運(yùn)用到采編部門(mén),通過(guò)一線的文獻(xiàn)借閱數(shù)據(jù),分析、挖掘、提煉讀者借、還書(shū)的信息量,且一直追蹤這些信息數(shù)源的變化,即可獲得可被部門(mén)利用的有價(jià)值數(shù)據(jù),并匯總出讀者借、還書(shū)的規(guī)律。依據(jù)這些一線信息數(shù)源的價(jià)值,加之網(wǎng)上薦購(gòu)及讀者書(shū)面薦購(gòu)等信息,匯總出哪些是讀者專(zhuān)業(yè)常用書(shū)籍,哪些是讀者感興趣的書(shū)籍,哪些又是常年被冷落的書(shū)籍,從中提煉出書(shū)籍采集的方向;合理化的采集方案繼續(xù)延用,不合理的采集要進(jìn)行科學(xué)化的數(shù)據(jù)分析,及時(shí)理清思路,盡可能做到書(shū)籍采集的合理化、科學(xué)化。
技術(shù)部門(mén)。在信息飛速發(fā)展的時(shí)代,作為圖書(shū)館負(fù)責(zé)信息網(wǎng)絡(luò)技術(shù)的部門(mén),其肩上的重量顯得格外沉重。技術(shù)部門(mén)不但肩負(fù)著網(wǎng)絡(luò)技術(shù)的責(zé)任,當(dāng)今也要肩負(fù)起圖書(shū)館所有數(shù)據(jù)的收集、存儲(chǔ)、挖掘及分析技術(shù)。數(shù)據(jù)挖掘及分析技術(shù)在技術(shù)部十分重要,技術(shù)部應(yīng)將圖書(shū)館各部門(mén)所產(chǎn)生的相關(guān)數(shù)據(jù)進(jìn)行長(zhǎng)期性、系統(tǒng)性的收集和科學(xué)分析,并將研究數(shù)據(jù)的挖掘及分析作為當(dāng)前和今后技術(shù)部研究及發(fā)展的方向,承擔(dān)起“數(shù)據(jù)監(jiān)護(hù)員”的角色,通過(guò)實(shí)踐為圖書(shū)館提供數(shù)據(jù)監(jiān)護(hù)操作技能及策略。注意將可獲得的數(shù)據(jù)及時(shí)進(jìn)行收集,并通過(guò)收集數(shù)據(jù)使用案例,分析并總結(jié)用戶(hù)需求及使用規(guī)律,為數(shù)據(jù)監(jiān)護(hù)提供基礎(chǔ)資料。
學(xué)科部門(mén)。學(xué)科部門(mén)作為一個(gè)新興的部門(mén),目前已在全國(guó)各高校圖書(shū)館廣泛推廣運(yùn)用。學(xué)科館員的主要任務(wù)是派專(zhuān)人與對(duì)口院系或?qū)W科專(zhuān)業(yè)搭建合作、交流平臺(tái),并利用圖書(shū)館信息檢索的技術(shù)優(yōu)勢(shì),為研究者開(kāi)展長(zhǎng)期追蹤、收集、傳遞文獻(xiàn)信息的科技服務(wù)。當(dāng)前大部分學(xué)科館員關(guān)注的是如何為院系教學(xué)提供良好的信息傳遞幫助,而忽略了在當(dāng)前信息飛速發(fā)展的時(shí)代,科研與教學(xué)走向數(shù)字化的趨勢(shì)。學(xué)者所做的所有工作,包括教案、論文、實(shí)驗(yàn)、畢業(yè)設(shè)計(jì)等等工作,基本上都是以電子信息的方式進(jìn)行編輯、存儲(chǔ)的。雖然極大地方便了學(xué)者們的工作,但同時(shí)也面臨這些電子數(shù)據(jù)的丟失風(fēng)險(xiǎn),一旦電子數(shù)據(jù)丟失,其損失的學(xué)術(shù)價(jià)值是不可估量的。為盡量避免這些事件的發(fā)生,學(xué)科部門(mén)可依托技術(shù)部門(mén)的支撐,利用數(shù)據(jù)挖掘技術(shù),開(kāi)展學(xué)者數(shù)據(jù)監(jiān)護(hù)服務(wù),保存這些非紙質(zhì)信息。這樣學(xué)科部門(mén)不僅為學(xué)者提供了科研信息的前沿追蹤,同時(shí)也提供了科學(xué)數(shù)據(jù)保存平臺(tái);既為學(xué)者科研開(kāi)辟道路,也為學(xué)者預(yù)防丟失科研數(shù)據(jù)提供保障,可謂雙保險(xiǎn)。數(shù)據(jù)挖掘技術(shù)還可以幫助學(xué)科部通過(guò)數(shù)據(jù)挖掘、分析出讀者關(guān)注以及咨詢(xún)較多的問(wèn)題,從中歸納出重點(diǎn)并分門(mén)別類(lèi),作為圖書(shū)館工作的重要依據(jù)。
三、結(jié)語(yǔ)。
數(shù)據(jù)挖掘技術(shù)在當(dāng)今大數(shù)據(jù)時(shí)代,已成為一個(gè)相對(duì)成熟的學(xué)科,融入到社會(huì)的各行各業(yè)。利用數(shù)據(jù)挖掘技術(shù)對(duì)圖書(shū)館數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)挖掘已經(jīng)成為圖書(shū)館需要開(kāi)展的一項(xiàng)重要工作。圖書(shū)館事業(yè)已全部進(jìn)入電子信息化,由此產(chǎn)生的大量業(yè)務(wù)數(shù)據(jù)和信息資源是圖書(shū)館行業(yè)的一筆寶貴財(cái)富,它較真實(shí)地反映了讀者對(duì)圖書(shū)館事業(yè)運(yùn)作以及提供的服務(wù)是否到位。因此,通過(guò)數(shù)據(jù)挖掘分析,能夠幫助圖書(shū)館管理者分析并發(fā)現(xiàn)現(xiàn)有管理的不足之處,通過(guò)已知的現(xiàn)象預(yù)測(cè)未來(lái)的發(fā)展趨勢(shì)。數(shù)據(jù)挖掘技術(shù)已成為今后圖書(shū)館事業(yè)保持競(jìng)爭(zhēng)力的必備法寶。
參考文獻(xiàn):
【1】顧倩.數(shù)據(jù)挖掘應(yīng)用于高校圖書(shū)館個(gè)性化服務(wù)的探討[J].圖書(shū)館雜志,20xx,8:63-65.。
【2】王偉.基于數(shù)據(jù)挖掘的圖書(shū)館用戶(hù)行為分析與偏好研究情報(bào)科學(xué),20xx,30(3):391-394.。
【3】楊海燕.大數(shù)據(jù)時(shí)代的圖書(shū)館服務(wù)淺析[J].圖書(shū)與情報(bào)。
【4】程蓮娟.美國(guó)高校圖書(shū)館數(shù)據(jù)監(jiān)護(hù)的實(shí)踐及其啟示[J].圖書(shū)館雜志,20xx,1(31):76-78.。
數(shù)據(jù)挖掘論文15
[摘要] 本文立足于web數(shù)據(jù)挖掘技術(shù),從個(gè)性化網(wǎng)站的設(shè)計(jì)、crm中的應(yīng)用和推薦系統(tǒng)中的應(yīng)用三個(gè)角度,分析了電子商務(wù)中的web數(shù)據(jù)挖掘應(yīng)用。
[關(guān)鍵詞] 電子商務(wù) web 數(shù)據(jù)挖掘
電子商務(wù)改變了人們傳統(tǒng)的商務(wù)模式,同時(shí),也改變了商家與顧客之間的關(guān)系?蛻(hù)選擇余地的擴(kuò)大使得他們更加關(guān)注商品的價(jià)值,而不象以前首先考慮品牌和地理因素。因此對(duì)銷(xiāo)售商而言盡可能的了解客戶(hù)的愛(ài)好、價(jià)值取向,才能在競(jìng)爭(zhēng)中立于不敗之地。數(shù)據(jù)挖掘技術(shù)可以有效地幫助銷(xiāo)售商理解客戶(hù)行為,提高站點(diǎn)的效率。在電子商務(wù)網(wǎng)站的設(shè)計(jì)、客戶(hù)關(guān)系管理(crm)、網(wǎng)絡(luò)營(yíng)銷(xiāo)等方面得到廣泛的應(yīng)用。
一、數(shù)據(jù)挖掘在電子商務(wù)網(wǎng)站設(shè)計(jì)中的應(yīng)用
數(shù)據(jù)挖掘可以得出諸如:什么客戶(hù)喜歡這個(gè)站點(diǎn)、客戶(hù)通過(guò)什么訪問(wèn)路徑達(dá)成交易,以及客戶(hù)訪問(wèn)站點(diǎn)的頻率等信息,從而優(yōu)化網(wǎng)站的結(jié)構(gòu)提高網(wǎng)站的訪問(wèn)量,吸引更多的客戶(hù)。對(duì)于改進(jìn)網(wǎng)站設(shè)計(jì)、定制個(gè)性化頁(yè)面、判斷站點(diǎn)效率有著重要幫助。
利用web數(shù)據(jù)挖掘技術(shù),個(gè)性化電子商務(wù)系統(tǒng)的實(shí)現(xiàn)過(guò)程包括信息采集、信息分析和個(gè)性化服務(wù)三個(gè)主要步驟:
1.信息采集。收集客戶(hù)個(gè)人信息是提供個(gè)性化服務(wù)的基礎(chǔ)。收集個(gè)人信息主要有兩種方式。第一種方式是通過(guò)客戶(hù)注冊(cè)來(lái)獲得,這種方式可以得到客戶(hù)的性別、出生日期、最高學(xué)歷、家庭收入、婚姻狀況、職業(yè)等;第二種是通過(guò)客戶(hù)在網(wǎng)站上的行為來(lái)判斷個(gè)人的興趣愛(ài)好等特點(diǎn),從而獲得客戶(hù)個(gè)人信息。如果客戶(hù)經(jīng)常瀏覽某類(lèi)產(chǎn)品或相關(guān)廣告,我們就可以知道客戶(hù)對(duì)這類(lèi)產(chǎn)品感興趣。Www.133229.CoM
2.信息分析。一個(gè)成功和完善的個(gè)性化電子商務(wù)網(wǎng)站應(yīng)該能夠在對(duì)客戶(hù)透明的情況下,對(duì)客戶(hù)的資料、行為進(jìn)行分析,并盡量不影響客戶(hù)的頁(yè)面處理時(shí)間,對(duì)于耗時(shí)較多的分析、分類(lèi)處理應(yīng)放在系統(tǒng)相對(duì)空閑和客戶(hù)退出網(wǎng)站等時(shí)間處理,減少客戶(hù)等待時(shí)間。信息分析過(guò)程如下:(1)將網(wǎng)站客戶(hù)群進(jìn)行分類(lèi),然后按照客戶(hù)群興趣特點(diǎn)進(jìn)行內(nèi)容設(shè)計(jì),并且將內(nèi)容相應(yīng)歸類(lèi);(2)定義客戶(hù)類(lèi)別所對(duì)應(yīng)的內(nèi)容,即某類(lèi)客戶(hù)最需要看到什么內(nèi)容;(3)分析客戶(hù)的行為和登錄資料,判別客戶(hù)所屬的類(lèi)別;(4)客戶(hù)瀏覽網(wǎng)站不同頁(yè)面時(shí),以及提交購(gòu)買(mǎi)定單時(shí),修改相應(yīng)行為資料。
3.個(gè)性化服務(wù)。根據(jù)客戶(hù)類(lèi)別顯示相應(yīng)的內(nèi)容給客戶(hù),達(dá)到個(gè)性化服務(wù)的目的。為了使分類(lèi)更具有可信性和穩(wěn)定性,對(duì)注冊(cè)時(shí)間較長(zhǎng),瀏覽及購(gòu)買(mǎi)行為相對(duì)穩(wěn)定的客戶(hù)優(yōu)先抽樣。
二、數(shù)據(jù)挖掘在crm中的應(yīng)用
1.客戶(hù)的獲取。在大多數(shù)的商業(yè)領(lǐng)域中,業(yè)務(wù)發(fā)展的主要指標(biāo)包括新客戶(hù)的獲取能力。企業(yè)的市場(chǎng)部門(mén)人員可以采用傳統(tǒng)的方法來(lái)發(fā)展新客戶(hù),如開(kāi)展大規(guī)模廣告活動(dòng);也可以根據(jù)所了解的目標(biāo)客戶(hù)群,將他們分類(lèi),然后進(jìn)行直銷(xiāo)活動(dòng)。但是當(dāng)數(shù)據(jù)量增大時(shí),即使有豐富經(jīng)驗(yàn)的市場(chǎng)人員想要選擇出相關(guān)的人口調(diào)查屬性的篩選條件也會(huì)變得很困難,隨客戶(hù)數(shù)量不斷增長(zhǎng)和每位客戶(hù)的細(xì)節(jié)因素增多,要得出這樣的行為模式的復(fù)雜度也同樣增大。而數(shù)據(jù)挖掘技術(shù)可以幫助完成潛在客戶(hù)的篩選工作。首先從一份潛在的客戶(hù)名單開(kāi)始,列出可能對(duì)企業(yè)的產(chǎn)品或服務(wù)感興趣的消費(fèi)者的信息,通過(guò)調(diào)查和處理對(duì)這些信息進(jìn)行數(shù)據(jù)擴(kuò)展,并和一些外部信息匹配,使之更適合數(shù)據(jù)挖掘分析。然后進(jìn)行市場(chǎng)試驗(yàn)活動(dòng),根據(jù)所需要預(yù)測(cè)的客戶(hù)行為在一定范圍內(nèi)對(duì)客戶(hù)進(jìn)行試驗(yàn),記錄下客戶(hù)的反饋,稱(chēng)之為“反應(yīng)行為模式”。剔除無(wú)反應(yīng)行為和反應(yīng)行為類(lèi)別中重復(fù)的數(shù)據(jù)后,在確定細(xì)節(jié)粒度的基礎(chǔ)上,利用數(shù)據(jù)挖掘技術(shù)構(gòu)建出n元反應(yīng)行為預(yù)測(cè)模型。根據(jù)這個(gè)模型,可以將潛在的客戶(hù)排序,以便找出那些對(duì)企業(yè)的產(chǎn)品或服務(wù)最感興趣的客戶(hù)。
2.客戶(hù)的保持。隨著行業(yè)中的競(jìng)爭(zhēng)愈來(lái)愈激烈和獲得一個(gè)新客戶(hù)的開(kāi)支愈來(lái)愈大,保持原有客戶(hù)的工作也愈來(lái)愈有價(jià)值。在crm的實(shí)施中,企業(yè)通過(guò)預(yù)測(cè),找出可能會(huì)流失的客戶(hù),并分析出主要有哪些因素導(dǎo)致他們想要離開(kāi),在此基礎(chǔ)上,有針對(duì)性地挽留那些有離開(kāi)傾向的客戶(hù)。
利用數(shù)據(jù)挖掘技術(shù),可以通過(guò)挖掘大量的客戶(hù)信息來(lái)構(gòu)建預(yù)測(cè)模型,較準(zhǔn)確地找出易流失客戶(hù)群,并制定相應(yīng)的方案,最大程度地保持住老客戶(hù)。數(shù)據(jù)挖掘技術(shù)中的決策樹(shù)技術(shù)能夠較好地應(yīng)用在這一方面。
3.客戶(hù)的細(xì)分。細(xì)分是指將一個(gè)大的消費(fèi)群體劃分為一個(gè)個(gè)細(xì)分群體的動(dòng)作,同屬一個(gè)細(xì)分群的消費(fèi)者彼此相似,而隸屬于不同細(xì)分群的消費(fèi)者被視為不同的。通過(guò)crm的實(shí)施,將產(chǎn)生細(xì)分的客戶(hù)群,企業(yè)根據(jù)客戶(hù)提出的要求和實(shí)際所做的不斷地改善產(chǎn)品和服務(wù),從而使企業(yè)不斷提高使該客戶(hù)群滿(mǎn)意的能力。
數(shù)據(jù)挖掘技術(shù)中的聚類(lèi)分析技術(shù)能夠被運(yùn)用來(lái)從客戶(hù)信息數(shù)據(jù)庫(kù)中發(fā)現(xiàn)不同的客戶(hù)群,并且用購(gòu)買(mǎi)模式來(lái)刻畫(huà)不同客戶(hù)群的特征,達(dá)到細(xì)分客戶(hù)群的目的。根據(jù)客戶(hù)數(shù)據(jù)特點(diǎn),一般可采用聚類(lèi)技術(shù)中的k平均算法來(lái)進(jìn)行劃分。其原理為將含原始客戶(hù)信息的.數(shù)據(jù)庫(kù)劃分成k個(gè)聚簇,然后采用一定的算法使得同一簇中的對(duì)象是“相似的”,而不同簇中的是“相異的”。
三、推薦系統(tǒng)中的數(shù)據(jù)挖掘技術(shù)
1.貝葉斯網(wǎng)絡(luò)。貝葉斯網(wǎng)絡(luò)技術(shù)利用訓(xùn)練集創(chuàng)建相應(yīng)的模型,模型用決策樹(shù)表示,節(jié)點(diǎn)和邊表示客戶(hù)信息。模型的建立可以離線進(jìn)行,一般需要數(shù)小時(shí)或數(shù)天,得到的模型非常小,對(duì)模型的使用非?,這種方法適合客戶(hù)的興趣愛(ài)好變化比較慢的場(chǎng)合,推薦精度和最近鄰技術(shù)差不多。
2.關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則既可用來(lái)分析商品間的參考模式,也可以向客戶(hù)推薦商品,提高交叉銷(xiāo)售能力。關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)可以離線進(jìn)行,隨著商品數(shù)目的增加,規(guī)則的數(shù)量呈指數(shù)增加,但通過(guò)決策者對(duì)支持度和置信度的選擇,感興趣模式以及算法的選取,也可以高效實(shí)現(xiàn)。推薦精度比最近鄰技術(shù)略差。
3.聚類(lèi)分析。該技術(shù)將具有相似愛(ài)好、購(gòu)物興趣的客戶(hù)分配到相同的族中,聚類(lèi)產(chǎn)生之后,根據(jù)該族中其他客戶(hù)對(duì)某商品的評(píng)價(jià)就可以得到系統(tǒng)對(duì)該商品的評(píng)價(jià),聚類(lèi)過(guò)程可以離線進(jìn)行,聚類(lèi)產(chǎn)生之后,性能比較好,但如果某客戶(hù)處于一個(gè)聚類(lèi)的邊緣,則對(duì)該客戶(hù)的推薦精度比較低,推薦精度比最近鄰技術(shù)略差。
4.推薦系統(tǒng)要兼顧準(zhǔn)確性和實(shí)時(shí)性。一個(gè)好的系統(tǒng)可能是多種方法和技術(shù)的結(jié)合,取長(zhǎng)補(bǔ)短。譬如,可以把聚類(lèi)分析作為最臨近算法的預(yù)處理,即通過(guò)聚類(lèi)分析來(lái)減小候選集,最臨近算法就可以在一個(gè)較小的數(shù)據(jù)集合中進(jìn)行,從而提高了實(shí)時(shí)性。
參考文獻(xiàn):
[1]周彥暉:電子商務(wù)與web數(shù)據(jù)挖掘.計(jì)算機(jī)應(yīng)用.20xx(5)
[2]董逸生:web挖掘研究綜述.計(jì)算機(jī)科學(xué),20xx(11)
【數(shù)據(jù)挖掘論文】相關(guān)文章:
數(shù)據(jù)挖掘論文09-24
數(shù)據(jù)挖掘技術(shù)的研究論文09-12
物聯(lián)網(wǎng)數(shù)據(jù)挖掘研究論文09-12
高校管理數(shù)據(jù)挖掘技術(shù)的應(yīng)用論文09-18
數(shù)據(jù)挖掘在移動(dòng)通信中的作用論文09-12
數(shù)據(jù)挖掘10-27
消防滅火救援中數(shù)據(jù)挖掘的應(yīng)用論文09-12
淺談數(shù)據(jù)挖掘12-08
網(wǎng)絡(luò)營(yíng)銷(xiāo)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用論文03-23