靜網PWA視頻評論

淺析大數據時代統計學的發展

2023年08月17日

- txt下載

大數據時代以迅雷不及掩耳之勢席捲世界,在全球範圍內掀起了前所未有的數據革命浪潮。相對於政府單位的統計數據來說,大數據主要利用的是多層次、多樣化的數據採集方式,整合了多種數據的開發優勢,並且利用現代科學技術手段和高速處理以及信息架構數據等資源,兼具極高的使用價值和判斷決策能力。一方面,統計調查數據的多樣化發展趨勢和電子商務產業的不斷發展,為統計數據的使用方式和生產方式製造了不小的麻煩,不斷地挑戰者政府部門數據管理系統和統計數據的概念。另一方面,信息技術、網絡發展以及空間信息技術的不斷進步,為統計生產力的升級發展提供了廣闊的視角和空間。數據量急劇增長的電子化、信息化和產業化數據,都成為了統計數據發展的重要來源。種類不斷增多的大數據資源,正在成為政府統計部門利用研究的重要領域。
一、大數據與統計學的區別
統計知識在大數據的利用研究中有多樣化的應用形式,主要是對大數據進行肢解,對爆炸增長的數據信息進行搜索、分類以及整合主要依賴於統計學。因此,大數據的相關研究在一定程度上運用了統計學的知識。但是,大數據的使用尚未被統計學這門學科充分利用,這主要是因為大數據的運用方式,使用模式和統計學之間存在著重要差異。統計學主要利用的是樣本統計資源,樣本主要在根據既定的機率標準從總體中抽樣調查,但是隨機抽樣調查是帶有成本屬性的,例如消耗時間、資本投入的成本等。在樣本數量逐漸增加的情況下,樣本估計的誤差範圍是伴隨著總體樣本數量的增大而逐漸增加的,這是樣本統計學不能忽視的缺點。大數據時代最具代表性的就是海量的信息數據化以及即時電子商務信息,大數據在整體上呈現出總體樣本數據化的趨勢,這樣的特徵恰好可以補充樣本統計的弊端。大數據環境下的整體樣本統計即使可以囊括全部的樣本容量,但是因為很多情況下數據具有非結構性和半數據化的特徵,而且大量的數據資源呈現的是重視尾部分布的狀態,方差、標準差等標準化的方法變得毫無意義,整體依靠性和不穩定性經常會超越經典時間內的時間序列的整體假設性,所以機率論的應用範圍呈現狹窄化的發展趨勢。因此,統計學在利用大數據進行樣本統計的過程中,可以對整體上的數據資源進行融合和選擇,這和樣本統計中的數據化處理技術存在異曲同工之妙。
二、大數據時代統計學教育的發展
1.全面培養人才素質
統計學專業的學生需要具備良好與人交往能力。統計學的學生很多都是理科出身的學生,不善於交際。但是在日常的工作中,有數據經驗的科學家應該經常和每個部門的工作人員交流,協同工作。怎麼樣才能讓頗具專業性的數據分析結果讓普通的老百姓也可以讀懂,讓每個部門的工作人員都能無障礙地理解,這是不容易做到的。要訓練自己的交往能力和溝通技能,主動地參加演講活動是不錯的渠道,演講活動鍛鍊了演講者的自信,在整個演講的過程中,能否清晰地表達自己的思想以及給人以信服力是至關重要的。需要培養數據常識,廣其見聞。數據科學家經常面對各種各樣的海量數據,並需要從這些數據中挖掘出有價值的信息,這就需要數據科學家具有強烈的數據敏感性。對數據的敏感程度的訓練不是一蹴而就的,要經過長時間的積累和數據分析工作的磨練,同時也可以根據閱讀數據分析材料積累閱歷,提升對數據資源的敏感程度。
2.培養應用型人才
大數據時代培養的數據科學家需要兩方面的基本素質,第一是概念性,也就前面所說的數據科學家需要掌握的基本素養和專業知識;第二是實踐性,也就是本文中我們提及的應用型人才,也就是實際操作中處理數據的能力。在高校開展大數據分析研究生學科,最大的問題是沒有可用的數據,這就需要高效與大數據企業合作,進行研究生的聯合培養,注重學生的實際操作能力,這裡面涉及到我們的應用統計學專業碩士的雙導師培養制度,一名校內導師一名校外導師,校內導師注重學生的概念性,校外導師注重學生的實踐性,學生通過在校外導師單位的實習,從而熟悉並且掌握實際工作中所需要的技能。
3.促進統計與數學、計算機學科合作
大數據時代需要的海量數據分析資源僅僅憑藉統計學科單一學科的發展是不能滿足發展需求的,大數據的數據結構性特徵已經拋棄了傳統意義上的數據分析模式的非智能化框架,而且數據分析需要利用新型的數據運算方式以及計算機技能分析,這也是進行數據分析工作的攔路虎。所以,數據科學家的成長僅僅依靠單一的統計學科知識的學習是遠遠不夠的,其需要的是數學、計算機和統計學三門學科融合發展,緊密結合。三門學科之間交叉發展,融會貫通,這樣既可以發揮學科的優勢資源,同時也能彌補其他學科的弊端。
三、結語
數據信息的爆炸式增長使我們在使用統計數據處理信息時需要更多的數據資源,更有甚者,在很多情況下可以利用全面化的數據,數據資源不再是制約統計分析的唯一因素,大數據前提下的統計學效用和粘合度預測的準確程度不斷提升,而且可以發現諸多在樣本統計基礎上未能顯現的細節。統計學關鍵優勢就是見微知著,也是統計學在數據環境下的約束性妥協。在海量數據洶湧襲來的年代,充分發揮統計學的優勢,和大數據資源整合發展,實現以小見大和由繁入簡的有效結合。

收藏

相關推薦

清純唯美圖片大全

字典網 - 試題庫 - 元問答 - 简体 - 頂部

Copyright © cnj8 All Rights Reserved.