淺談計算機數(shù)據(jù)挖掘論文
淺談計算機數(shù)據(jù)挖掘論文
近年來,隨著計算機網(wǎng)絡(luò)技術(shù)的不斷發(fā)展和改革,我國已經(jīng)全面進入了網(wǎng)絡(luò)信息時代,海量的網(wǎng)絡(luò)數(shù)據(jù)記錄著人們生產(chǎn)和生活的各種信息,如何對計算機數(shù)據(jù)信息進行合理分類、科學(xué)統(tǒng)計等問題,已成為我國廣大計算機數(shù)據(jù)信息工作者研究討論的熱點話題。以下是學(xué)習(xí)啦小編為大家精心準備的:淺談計算機數(shù)據(jù)挖掘相關(guān)論文。內(nèi)容僅供參考,歡迎閱讀!
淺談計算機數(shù)據(jù)挖掘全文如下:
摘 要:社會的發(fā)展進入了網(wǎng)絡(luò)信息時代,隨之產(chǎn)生了各種類型的數(shù)據(jù)海量。在這些數(shù)據(jù)的背后隱藏著許多重要的信息,如何從這些數(shù)據(jù)中找出某種規(guī)律,發(fā)現(xiàn)有用信息,越來越受到人們的關(guān)注。數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。數(shù)據(jù)挖掘技術(shù)為應(yīng)對信息爆炸,海量信息的處理提供了科學(xué)和有效的手段。本文介紹了數(shù)據(jù)挖掘的概念、對象、任務(wù)、過程、方法、應(yīng)用領(lǐng)域及其面臨的挑戰(zhàn)。
關(guān)鍵詞:計算機;數(shù)據(jù);挖掘技術(shù)
計算機數(shù)據(jù)挖掘技術(shù)的產(chǎn)生是社會的一種進步,了解計算機數(shù)據(jù)挖掘?qū)ξ覀儊碚f非常的重要,計算機數(shù)據(jù)挖掘在網(wǎng)絡(luò)信息時代的今天對于一個企業(yè)來說非常的重要,計算機數(shù)據(jù)挖掘甚至成為很多企業(yè)的核心競爭力,我們要充分認識數(shù)據(jù)挖掘的概念、對象、任務(wù)、過程、方法和應(yīng)用領(lǐng)域,只有充分地認識數(shù)據(jù)挖掘的概念、對象、任務(wù)、過程、方法和應(yīng)用領(lǐng)域,我們才能夠更好地完善和發(fā)展它。
1 計算機數(shù)據(jù)挖掘的概念及對象
1.1 計算機數(shù)據(jù)挖掘的概念
計算機數(shù)據(jù)挖掘是在社會的發(fā)展進入了網(wǎng)絡(luò)信息時代之后產(chǎn)生的網(wǎng)絡(luò)衍生產(chǎn)品,計算機數(shù)據(jù)挖掘主要是通過一定的手段對企業(yè)內(nèi)部進行數(shù)據(jù)挖掘,然后通過一定的分析,對那些通過數(shù)據(jù)挖掘得到的數(shù)據(jù)進行整理,進而分析企業(yè)的市場以及企業(yè)的發(fā)展等等問題。計算機數(shù)據(jù)挖掘?qū)μ幱诰W(wǎng)絡(luò)信息時代之中的企業(yè)來說非常重要,它是處于網(wǎng)絡(luò)信息時代之中的企業(yè)長遠發(fā)展的助推器,作為處于信息時代的企業(yè)要抓住這個促進自己發(fā)展的大好契機。
1.2 計算機數(shù)據(jù)挖掘的對象
計算機數(shù)據(jù)挖掘具有一定的針對性,計算機數(shù)據(jù)挖掘的對象(目標數(shù)據(jù))并不是所有的數(shù)據(jù),它是具有選擇性的,計算機數(shù)據(jù)挖掘的對象主要是指企業(yè)中能夠揭示一些未發(fā)現(xiàn)的隱藏信息和企業(yè)中比較有意義和研究價值的數(shù)據(jù),明確這一點非常的重要,計算機數(shù)據(jù)挖掘的對象的選擇性是影響計算機數(shù)據(jù)挖掘效率的主要因素,對于一個沒有充分認識計算機數(shù)據(jù)挖掘?qū)ο蟮倪x擇性的企業(yè)來說,它的計算機數(shù)據(jù)挖掘的效率會比成熟的計算機數(shù)據(jù)挖掘的企業(yè)或者是充分認識到計算機數(shù)據(jù)挖掘的對象的選擇性的企業(yè)要低得多。同時,明確目標數(shù)據(jù)的類型也非常重要,它直接決定了要使用的數(shù)據(jù)挖掘技術(shù)和方法,大體上數(shù)據(jù)類型分為三類:記錄數(shù)據(jù),給予圖形的數(shù)據(jù)和有序的數(shù)據(jù)。
2 計算機數(shù)據(jù)挖掘的任務(wù)及過程
2.1 計算機數(shù)據(jù)挖掘的任務(wù)
計算機數(shù)據(jù)挖掘主要是對海量的數(shù)據(jù)進行挖掘和分析,必須經(jīng)過計算機數(shù)據(jù)準備和計算機數(shù)據(jù)規(guī)律尋找的固定過程,在計算機數(shù)據(jù)挖掘的過程中,計算機數(shù)據(jù)準備和計算機數(shù)據(jù)規(guī)律的尋找一個都不能少,我們要做好計算機數(shù)據(jù)挖掘的每一步,計算機數(shù)據(jù)挖掘的任務(wù)主要有對計算機數(shù)據(jù)挖掘的結(jié)果與企業(yè)的市場現(xiàn)狀進行一個具體的聯(lián)系、對計算機數(shù)據(jù)挖掘的結(jié)果進行一定的分類,對計算機數(shù)據(jù)挖掘的結(jié)果進行一定的變異分析。在處理計算機數(shù)據(jù)挖掘的任務(wù)時,我們要完成計算機數(shù)據(jù)挖掘的每一個任務(wù),首先,對計算機數(shù)據(jù)挖掘的結(jié)果與企業(yè)的市場現(xiàn)狀進行一個具體的聯(lián)系是計算機數(shù)據(jù)挖掘的根本任務(wù),而對計算機數(shù)據(jù)挖掘的結(jié)果進行一定的分類是計算機數(shù)據(jù)挖掘的主要任務(wù),最后對計算機數(shù)據(jù)挖掘的結(jié)果進行一定的變異分析是計算機數(shù)據(jù)挖掘的必要任務(wù)。
2.2 計算機數(shù)據(jù)挖掘的過程
計算機數(shù)據(jù)挖掘的過程具有一定的復(fù)雜性,計算機數(shù)據(jù)挖掘的基本過程:第一,對計算機數(shù)據(jù)的來源進行一定的分析。這一步非常的重要,一個完整的計算機數(shù)據(jù)挖掘的過程必須以這一步為基礎(chǔ),只有對計算機數(shù)據(jù)的來源進行一定的分析,我們才能夠進行下一步的操作;第二,從計算機數(shù)據(jù)的來源的分析結(jié)果中獲取一定的信息,然后我們要對計算機數(shù)據(jù)的來源的分析結(jié)果進行研究,在研究的過程中,我們要查閱相關(guān)的專業(yè)知識和專業(yè)的研究數(shù)據(jù)挖掘的技術(shù),只有具備了相關(guān)的專業(yè)知識和專業(yè)的研究數(shù)據(jù)挖掘的技術(shù),我們才能夠更好地對計算機數(shù)據(jù)進行挖掘;第三,對計算機數(shù)據(jù)挖掘的信息進行一定的整合,檢查出不太合理的相關(guān)信息;第四,數(shù)據(jù)挖掘的實施。根據(jù)挖掘具體任務(wù)選擇相應(yīng)的數(shù)據(jù)挖掘?qū)嵤┧惴?第五,結(jié)果評估與整理。在完成實施階段后,要對數(shù)據(jù)挖掘結(jié)果進行評估和整理,完成整個數(shù)據(jù)挖掘的過程。
3 計算機數(shù)據(jù)挖掘的技術(shù)方法、應(yīng)用領(lǐng)域及挑戰(zhàn)
3.1 計算機數(shù)據(jù)挖掘的技術(shù)
計算機數(shù)據(jù)挖掘有很多的專業(yè)技術(shù),我們來簡單介紹一下主要的計算機數(shù)據(jù)挖掘的技術(shù):第一,計算機數(shù)據(jù)挖掘的統(tǒng)計技術(shù)。統(tǒng)計是計算機數(shù)據(jù)挖掘必不可少的技術(shù),在數(shù)據(jù)清理過程中,統(tǒng)計提供數(shù)據(jù)發(fā)現(xiàn)極端值;第二,人工智能技術(shù)。人工智能技術(shù)是近些年來新興的計算機數(shù)據(jù)挖掘的技術(shù),它在數(shù)據(jù)挖掘中的應(yīng)用比較廣,它可以對數(shù)據(jù)進行推斷和智能代理,是計算機數(shù)據(jù)挖掘的重要技術(shù);第三,決策樹方法。決策樹方法是代表決策集合的單桿結(jié)構(gòu),它具有一定的分類規(guī)則,有一定的預(yù)測作用,是計算機數(shù)據(jù)挖掘的主要技術(shù)之一。
3.2 計算機數(shù)據(jù)挖掘的方法
隨著近些年數(shù)據(jù)挖掘技術(shù)的廣泛使用,數(shù)據(jù)挖掘的方法也在不斷的進步和完善,現(xiàn)階段主流的數(shù)據(jù)挖掘的方法有分類、關(guān)聯(lián)規(guī)則、聚類分析等。分類是找出一組數(shù)據(jù)對象的共同特點并按照既定的分類模式將其劃分為不同的類別。關(guān)聯(lián)分析是描述數(shù)據(jù)之間所存在的關(guān)聯(lián)規(guī)則,即根據(jù)一個事務(wù)中某些項的出現(xiàn)可導(dǎo)出另一些項在同一事務(wù)中也出現(xiàn),即隱藏在數(shù)據(jù)間的關(guān)聯(lián)或相互關(guān)系。聚類分析是把一組數(shù)據(jù)按照相似性和差異性分為幾個類別,使得屬于同一類別的數(shù)據(jù)間的相似性盡可能大。
3.3 計算機數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域
計算機數(shù)據(jù)挖掘最大的應(yīng)用領(lǐng)域就是商業(yè)領(lǐng)域,它能夠為商業(yè)機構(gòu)提供欺詐偵查和客戶市場分類等數(shù)據(jù)。在這個高速發(fā)展的信息時代,網(wǎng)絡(luò)是商業(yè)發(fā)展的主要推動因素,我們要使計算機數(shù)據(jù)挖掘在商業(yè)上的應(yīng)用領(lǐng)域更廣。以下是近些年來計算機數(shù)據(jù)挖掘的主要應(yīng)用領(lǐng)域:第一,計算機數(shù)據(jù)挖掘在我國銀行領(lǐng)域中的應(yīng)用。銀行是一個數(shù)據(jù)集中度和數(shù)據(jù)處理要求均非常高的領(lǐng)域,對于一個銀行來說,每天都要面臨著海量的數(shù)據(jù),這些數(shù)據(jù)的挖掘分析對于銀行來說是其發(fā)展的根本所在;第二,計算機數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用。電子商務(wù)是網(wǎng)絡(luò)高速發(fā)展的產(chǎn)物,對于電子商務(wù)而言,海量數(shù)據(jù)的挖掘分析成為了電子商務(wù)未來發(fā)展的保證,因此,計算機數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用得到了快速的發(fā)展。
3.4 數(shù)據(jù)挖掘技術(shù)面臨的挑戰(zhàn)
數(shù)據(jù)挖掘技術(shù)面臨的最大挑戰(zhàn)就是隱私的保護和數(shù)據(jù)的安全性問題。當數(shù)據(jù)在不同的抽象級別視角去考察的時候,數(shù)據(jù)挖掘?qū)﹄[私和數(shù)據(jù)安全就構(gòu)成了威脅。它威脅到保持數(shù)據(jù)安全和防止干涉隱私的目標的實現(xiàn)。如,近期被世人高度關(guān)注的“棱鏡門”事件,充分說明了數(shù)據(jù)挖掘技術(shù)應(yīng)用與個人隱私保護之間的矛盾和沖突,它也將是該技術(shù)在未來面臨的最大挑戰(zhàn)之一。
4 結(jié)語
計算機數(shù)據(jù)挖掘技術(shù)是一項正在世界范圍內(nèi)高速發(fā)展的技術(shù),我們不僅要對數(shù)據(jù)挖掘的概念、對象、任務(wù)、過程、方法和應(yīng)用領(lǐng)域進行充分的認識,而且要充分認識到計算機數(shù)據(jù)挖掘面臨的挑戰(zhàn),比如說隱私問題。筆者相信,通過我們的努力,計算機數(shù)據(jù)挖掘技術(shù)將會在各個領(lǐng)域得到廣泛的應(yīng)用,并對人類的活動產(chǎn)生深遠的影響。
參考文獻:
[l]周碧珍.淺析計算機數(shù)據(jù)挖掘技術(shù)在檔案信息管理系統(tǒng)中的應(yīng)用[J].黑龍江科技信息,2009(01).
[2]余輝,張力新,劉文耀.計算機輔助醫(yī)學(xué)知識發(fā)現(xiàn)系統(tǒng)研究——糖尿病并發(fā)癥流行病學(xué)數(shù)據(jù)挖掘[J].生物醫(yī)學(xué)工程學(xué)雜志,2008(04).
[3]張成霞.基于數(shù)據(jù)挖掘的煤礦計算機綜合管理系統(tǒng)的研究[J].煤炭技術(shù),2013(05).
相關(guān)文章:
1.淺談數(shù)據(jù)挖掘在電力企業(yè)中的應(yīng)用論文
2.計算機職稱論文:粗集數(shù)據(jù)挖掘之MIE-RS實施
3.試論數(shù)據(jù)挖掘在化學(xué)研究生產(chǎn)中的應(yīng)用論文
5.數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中的應(yīng)用