優(yōu)勝從選擇開始,我們是您最好的選擇!—— 中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)
0373-5939925
2851259250@qq.com
我要檢測 我要投稿 合法期刊查詢

淺談大數(shù)據(jù)挖掘中數(shù)學(xué)的運用

作者:吳楚升來源:《企業(yè)科技與發(fā)展》日期:2018-10-26人氣:5363

當前是一個信息化時代,人們無論是在生活中,還是在學(xué)習(xí)工作中無時無刻不在與信息數(shù)據(jù)打交道,大數(shù)據(jù)技挖掘技術(shù)的完善發(fā)展,被廣泛應(yīng)用在各個行業(yè)領(lǐng)域中,創(chuàng)造出眾多的社會經(jīng)濟效益。如何從海量數(shù)據(jù)信息中高效挖掘出具有高價值的數(shù)據(jù)成為了眾多專家學(xué)者的關(guān)注重點,大數(shù)據(jù)挖掘工作離不開先進數(shù)學(xué)專業(yè)知識和方法的運用,相關(guān)研究人員通過在大數(shù)據(jù)挖掘和處理分析中合理運用數(shù)學(xué)知識,能夠有效提升數(shù)據(jù)處理分析效率,幫助人們在最短時間內(nèi)獲取到具有價值的數(shù)據(jù)信息。

1  大數(shù)據(jù)概念與特征分析

基于計算機互聯(lián)網(wǎng)技術(shù)的普及應(yīng)用,社會各行各業(yè)產(chǎn)生的數(shù)據(jù)信息也變得越來越多,不同領(lǐng)域中的海量數(shù)據(jù)存在著不同的價值,有待人們從數(shù)據(jù)中進行挖掘開發(fā)利用,幫助社會企業(yè)發(fā)展作出科學(xué)決策。大數(shù)據(jù)實質(zhì)是指無法在一定時間內(nèi)利用常規(guī)軟件工具進行計算處理、管理利用的數(shù)據(jù)集合,大數(shù)據(jù)需要借助先進的處理模式才能夠具備更好的決策力、洞察發(fā)現(xiàn)力以及流程優(yōu)化能力。與傳統(tǒng)數(shù)據(jù)倉庫應(yīng)用分析相比較,大數(shù)據(jù)應(yīng)用分析最為顯著的特點就是數(shù)據(jù)量大且形式多樣、檢索查詢困難復(fù)雜,大數(shù)據(jù)主要包括了結(jié)構(gòu)化、非結(jié)構(gòu)化以及半結(jié)構(gòu)化數(shù)據(jù)。大數(shù)據(jù)的5V特征具體是指Volume(大量),即數(shù)據(jù)量龐大;Velocity(高速),即數(shù)據(jù)獲取處理速度快;Variety(多樣),即數(shù)據(jù)類型多樣性;Value(低價值密度),即數(shù)據(jù)價值較低;Veracity(真實性),即數(shù)據(jù)質(zhì)量較高且真實。

在大數(shù)據(jù)研究領(lǐng)域中,數(shù)據(jù)挖掘是核心工作內(nèi)容,其工作原理是通過對海量、復(fù)雜以及無規(guī)律的數(shù)據(jù)展開深入分析、計算處理作業(yè),從中挖掘出具有一定價值的信息數(shù)據(jù),從而輔助市場各個行業(yè)領(lǐng)域企業(yè)作出科學(xué)決策,推動整個社會和諧穩(wěn)定的發(fā)展。當前,大數(shù)據(jù)挖掘被廣泛應(yīng)用在通訊行業(yè)、制造行業(yè)、營銷行業(yè)以及互聯(lián)網(wǎng)信息行業(yè)中,如何應(yīng)用數(shù)據(jù)挖掘幫助人們解決現(xiàn)實問題,已經(jīng)成為社會各界人士高度關(guān)注的焦點。

2  大數(shù)據(jù)挖掘中數(shù)學(xué)的實踐應(yīng)用

在大數(shù)據(jù)挖掘過程中,數(shù)學(xué)知識方法的運用是至關(guān)重要的,數(shù)學(xué)是對大量數(shù)據(jù)展開分析處理工作的基礎(chǔ),是實現(xiàn)從海量數(shù)據(jù)中挖掘出具有價值數(shù)據(jù)的關(guān)鍵途徑。因此,相關(guān)研究人員要將數(shù)學(xué)專業(yè)知識有效融入到大數(shù)據(jù)挖掘與處理工作中,不斷對實際問題的解決能力,提高對數(shù)據(jù)的處理分析水平。

2.1  數(shù)學(xué)在數(shù)據(jù)處理分析中的應(yīng)用

當工作人員對大數(shù)據(jù)展開挖掘作業(yè)時,首先需要對需求數(shù)據(jù)進行科學(xué)收集整理工作。大數(shù)據(jù)具備了很強的時效性,每個工作人員都必須正確認識到提高數(shù)據(jù)處理質(zhì)量和效率的重要性,要確保在最短時間內(nèi)完成對大量數(shù)據(jù)的處理分析工作,挖掘獲取到需求價值數(shù)據(jù)。如果收集到的原始數(shù)據(jù)存在著不完整、不統(tǒng)一以及噪聲等情況時,相關(guān)人員還需對該部分數(shù)據(jù)進行預(yù)處理作業(yè),這樣有利于提高數(shù)據(jù)的準確性。如果數(shù)據(jù)量或者指標集過大,工作人員可以結(jié)合相關(guān)標準選擇一些具有代表性的數(shù)據(jù)進行處理分析,確保能夠反映出研究結(jié)果。

在數(shù)據(jù)處理分析中,工作人員可以合理運用數(shù)學(xué)專業(yè)知識中的各種分析方法。例如,回歸分析法、描述性分析法以及相關(guān)性分析法等。工作人員在運用回歸分析法和相關(guān)性分析法時,要科學(xué)將兩種數(shù)學(xué)分析方法融合在一起,基于相關(guān)性分析下,通過有效觀察某兩個或者多個相關(guān)變量的數(shù)量變化關(guān)系,構(gòu)建出對應(yīng)的數(shù)學(xué)模式,然后利用已知量準確推斷出未知量。在數(shù)據(jù)處理中進行回歸分析的核心目的在于合理采用樣本數(shù)據(jù)對各項參數(shù)展開科學(xué)估計,接著構(gòu)建出對應(yīng)的數(shù)據(jù)模型,以此來判斷和預(yù)測出參數(shù)數(shù)據(jù)。與此同時,在數(shù)據(jù)處理分析中,研究工作人員還會涉及運用到大量的數(shù)學(xué)理論知識。例如,數(shù)學(xué)測度論知識,也就是通過運算結(jié)合兩個或者多個單調(diào)測度,以此完成對新單調(diào)測度的創(chuàng)建工作,當研究人員在進行數(shù)據(jù)降維處理作業(yè)時,可以合理運用測度論。與傳統(tǒng)主因子分析方法相比較,測度論分析法的合理運用不僅能夠最大程度保障數(shù)據(jù)處理分析的完整性,還可以有效提升數(shù)據(jù)分析結(jié)果的科學(xué)準確性。

2.2  數(shù)學(xué)在數(shù)據(jù)挖掘中應(yīng)用

數(shù)據(jù)挖掘工作的主要特點包括了應(yīng)用性、集合性、工程性以及交叉性。數(shù)學(xué)理論知識和方法在數(shù)據(jù)挖掘過程中起到了無可替代的作用。研究人員在展開數(shù)據(jù)挖掘工作時,頻繁使用的數(shù)學(xué)方法主要包括了聚類分析法、關(guān)聯(lián)分析法以及決策樹法等,不同數(shù)學(xué)方法在數(shù)據(jù)挖掘中起到了不同的作用。其中,聚類分析是挖掘挖掘中應(yīng)用最為重要的一種數(shù)學(xué)方法。聚類分析法實質(zhì)是指將物理或者對象集合體科學(xué)劃分成若干個具有類似或相似性的小組,即“物理類聚”。聚類分析法被廣泛應(yīng)用在醫(yī)學(xué)、心理學(xué)、營銷學(xué)以及統(tǒng)計學(xué)等領(lǐng)域中。聚類分析法在數(shù)據(jù)挖掘中的應(yīng)用內(nèi)容主要是通過灰色關(guān)聯(lián)分析法、目標函數(shù)模糊方法以及區(qū)間值算法進行體現(xiàn)的。

2.2.1  灰色關(guān)聯(lián)分析法的運用

灰色關(guān)聯(lián)分析方法還根據(jù)系統(tǒng)因素之間發(fā)展趨勢的相似或者相異程度,即“灰色關(guān)聯(lián)度”,作為衡量因素間關(guān)聯(lián)程度的一種數(shù)學(xué)方法,該種分析方法適用于數(shù)據(jù)動態(tài)發(fā)展歷程分析。在灰色關(guān)聯(lián)分析法中,灰色關(guān)聯(lián)系統(tǒng)的具體表現(xiàn)形式為S=(X,R),其中字母X指的是影響因子集合,字母R指的是因子間趨勢關(guān)聯(lián)映射的集合。研究人員在數(shù)據(jù)挖掘工作中通常采用的是數(shù)學(xué)灰色管理分析法,通過科學(xué)分析比較不同幾何曲線之間的幾何形狀展開數(shù)據(jù)分析處理。如果幾何曲線之間的幾何形狀越接近,這代表著數(shù)據(jù)關(guān)聯(lián)越大,反之如果幾何形狀越不接近,則數(shù)據(jù)關(guān)聯(lián)越小。研究人員通過在數(shù)據(jù)挖掘過程中運用數(shù)學(xué)灰色關(guān)聯(lián)分析法,有利于對樣本數(shù)據(jù)殘缺或者數(shù)據(jù)量小情況的分析處理,從中挖據(jù)出重要價值的數(shù)據(jù)。

2.2.2  目標函數(shù)模糊聚類法的運用

在實際工作生活中,模糊聚類法被廣泛應(yīng)用在圖像處理、數(shù)據(jù)分析以及數(shù)據(jù)挖掘工作中。伴隨著時間的不斷推移,計算機信息技術(shù)的不斷完善,目標函數(shù)模糊聚類方法應(yīng)用成為了當今社會大數(shù)據(jù)挖掘研究的重點,其是解決生活中實際聚類問題的有效方法。目標函數(shù)模糊聚類方法適用于對高維處理、高效率以及具有伸縮性大數(shù)據(jù)庫的數(shù)據(jù)挖掘工作。大數(shù)據(jù)挖掘研究人員利用目標函數(shù)模糊聚類法,將不同數(shù)據(jù)進行標準化后再科學(xué)標定,同時構(gòu)建出完善的模糊矩陣,最后科學(xué)采取直接聚類或者模糊等價矩陣的手段實施數(shù)據(jù)集和關(guān)鍵指標的聚類,并且還可以采用編網(wǎng)法或者最大樹法展開聚類作業(yè)。

2.2.3  區(qū)間值算法的運用

在數(shù)學(xué)知識內(nèi)容中,區(qū)間值算法是基于區(qū)間值聚類方法中最為常用的一種數(shù)學(xué)方法,其在數(shù)據(jù)挖掘工作內(nèi)容范圍中的應(yīng)用主要體現(xiàn)在對不完全系統(tǒng)信息進行挖掘和分析。大數(shù)據(jù)挖掘研究人員通過利用區(qū)間值算法,能夠?qū)?shù)據(jù)挖掘過程當中的一些能進行轉(zhuǎn)化的“比較型”數(shù)據(jù),或者是固定取值范圍的數(shù)據(jù)進行科學(xué)分析處理。在實踐數(shù)據(jù)挖掘中,研究人員采用區(qū)間值算法主要涵蓋了三種不同聚類法,分別是矩陣與區(qū)間聚類法、數(shù)與區(qū)間聚類法以及區(qū)間與區(qū)間聚類法。在這三種方法中使用最為頻繁的是數(shù)與區(qū)間聚類法,該方法的合理運用能夠幫助研究人員真實、快速以及準確地對不完全的系統(tǒng)信息展開科學(xué)通知分析。在明確區(qū)間值時,研究人員可以通過利用先進的統(tǒng)計方法進行科學(xué)確定,或者也可以展開相互之間的討論分析,結(jié)合長期工作經(jīng)驗進行區(qū)間值的確定。

3  結(jié)語

綜上所述,當今社會發(fā)展離不開大數(shù)據(jù)技術(shù)的支持應(yīng)用,人們生活工作都會涉及到各種重要價值的數(shù)據(jù)信息。研究人員必須不斷加強對大數(shù)據(jù)挖掘的深入研究分析工作,提高對大數(shù)據(jù)的處理分析水平。數(shù)學(xué)作為大數(shù)據(jù)挖掘的支撐基礎(chǔ),在大數(shù)據(jù)挖掘中研究人員要善于運用各種數(shù)學(xué)專業(yè)理論知識和方法,發(fā)揮出數(shù)學(xué)知識的價值作用,幫助人們從海量數(shù)據(jù)中快速挖掘出可利用價值數(shù)據(jù),解決生活中存在的實際問題,為人類社會帶來更多的便利之處。



本文來源:《企業(yè)科技與發(fā)展》:http://m.k2057.cn/w/qk/21223.html

網(wǎng)絡(luò)客服QQ: 沈編輯

投訴建議:0373-5939925????投訴建議QQ:

招聘合作:2851259250@qq.com (如您是期刊主編、文章高手,可通過郵件合作)

地址:河南省新鄉(xiāng)市金穗大道東段266號中州期刊聯(lián)盟 ICP備案號:豫ICP備2020036848

【免責聲明】:中州期刊聯(lián)盟所提供的信息資源如有侵權(quán)、違規(guī),請及時告知。

版權(quán)所有:中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)

關(guān)注”中州期刊聯(lián)盟”公眾號
了解論文寫作全系列課程

核心期刊為何難發(fā)?

論文發(fā)表總嫌貴?

職院單位發(fā)核心?

掃描關(guān)注公眾號

論文發(fā)表不再有疑惑

論文寫作全系列課程

掃碼了解更多

輕松寫核心期刊論文

在線留言