0 引言
2017年10月,黨的十九大報告指出,污染防治攻堅戰(zhàn)是這一時期的“三大戰(zhàn)役”之一。2017年12月,中央經濟工作會議指出,打好污染防治攻堅戰(zhàn),重點是打贏藍天保衛(wèi)戰(zhàn)。2018年3月,政府工作報告再次強調堅決打好三大攻堅戰(zhàn),推進污染防治取得更大成效,鞏固藍天保衛(wèi)戰(zhàn)成果,攜手行動,建設天藍、地綠、水清的美麗中國。
近幾年,空氣質量、大氣污染已成為社會各界廣泛關注的問題,一些研究機構、大型企業(yè)以及創(chuàng)業(yè)公司都紛紛瞄準了這一領域,投入大量人力物力開展研究并推出了相關產品。如一些大型研究機構利用大數據分析優(yōu)勢,融合物聯(lián)網技術,提供高精度空氣質量預報,實時監(jiān)測城市區(qū)域的污染物來源和分布狀況;阿里云以“蔚藍地圖”APP為載體,使用戶可查詢和分享城市及大氣污染源的實時監(jiān)測數據;此外,一些創(chuàng)新企業(yè)的精細化PM2.5檢測以及面向公眾的空氣檢測設備也引發(fā)大量關注,但現有產品多集中于空氣質量的實時監(jiān)測和高精度預報,缺乏和環(huán)保數據、社會公眾數據的深度融合,導致產品無法有針對性地、定制化地評估大氣污染對社會、企業(yè)及公眾影響,不能精準觸達到個人。
根據行業(yè)及產品調研分析,本文將基于運營商用戶數據特征,結合大氣環(huán)境、空氣質量數據,進行大氣污染防控領域的方案研究,并探討其應用場景。
1 運營商用戶數據特征
移動互聯(lián)網的快速發(fā)展促進了信息和數據呈爆炸式增長,作為承載的移動互聯(lián)網的核心,運營商具備先天的數據優(yōu)勢,相比于BAT等互聯(lián)網公司和第三方評測公司,運營商的數據具備覆蓋全面性以及統(tǒng)計完備性等優(yōu)勢;相比于終端公司,則有更多更合理的數據采集便利。運營商數據主要包括運營支撐系統(tǒng)(OSS)域數據以及業(yè)務支撐系統(tǒng)(BSS)域數據。OSS域主要是網絡相關的數據,比如基站的基礎信息數據、地圖圖層及道路數據、移動網絡實時話統(tǒng)數據、移動用戶的XDR業(yè)務記錄數據等;BSS域數據包含用戶身份信息的用戶基本信息表、用戶每月出賬賬單、用戶語音業(yè)務和數據業(yè)務詳單等。
從用戶的維度來看,運營商數據包含了人的相關信息,可分為靜態(tài)數據和動態(tài)數據。其中,靜態(tài)數據和動態(tài)數據中的通信消費信息來自于運營商的BSS域,動態(tài)數據中的業(yè)務偏好信息來自于運營商的OSS域,其分類及來源如圖1所示。
圖1 運營商用戶數據特征
a) 靜態(tài)數據:主要包括用戶基本信息以及網絡信息等方面數據。用戶基本信息是不以電信網絡為依托的數據信息,脫離電信網絡該信息依然有效;用戶網絡信息是必須依附于電信網絡才具有價值的數據信息。這2類信息具有穩(wěn)定不變或者變化緩慢的特點,如:用戶性別、用戶職業(yè)、付費模式、終端信息、套餐信息、網絡制式、手機號碼、用戶級別等在用戶在網期間不會發(fā)生變更,或者有可能會發(fā)生變更但變更概率很低或變更周期較長;用戶年齡、入網時間等屬性隨時間自然變更,無需預測。
b) 動態(tài)數據:用戶不斷變化的行為信息,譬如一個用戶每月使用的通信費用,這些費用包含流量費用、語音費用、短信費用以及其他增值費用等,依據簽約信息,每個人能夠使用的流量、語音、短信等數量的多少,用戶的哪些行為特征或偏好影響他們每天消費信息(包括使用了哪些應用及其時間、地點)。這些信息是每天、每月都發(fā)生變化且無明顯的規(guī)律性,需要通過大數據挖掘的方式將其內在聯(lián)系或特征展現出來。
在動態(tài)數據中,業(yè)務偏好信息及位置信息包含了人使用移動智能終端做業(yè)務的行動軌跡。在出門帶手機即可的現階段,人們用智能手機進行業(yè)務交互的頻次很高,因此其業(yè)務軌跡可以用來判定人群職住信息,在不同時刻的大概地理范圍。業(yè)務類別和APP類別是指人們在使用智能手機時喜歡用哪一類業(yè)務、哪一類APP,每次使用某一業(yè)務/APP的時長,一段時間內使用業(yè)務/APP的頻次,由此可推斷其關注點和興趣點。
2 基于運營商大數據的大氣污染防控方案
基于跨行業(yè)、多源、異構的大氣環(huán)境質量監(jiān)測和預報數據、運營商數據、企業(yè)數據等進行融合分析,搭建大氣環(huán)境質量監(jiān)測預報、影響評估與跟蹤分析的大數據平臺;诖舜髷祿脚_實現精細化大氣環(huán)境預報、溯源及科學污染防控,以達到更全面的對企業(yè)、群體個人的影響評估、預防以及重點污染區(qū)域的持續(xù)跟蹤,并能為政府和企業(yè)提供個性化的產能動態(tài)規(guī)劃和調整方案;谶\營商大數據的大氣污染防控方案如圖2所示。
圖2 大氣污染防控思路與方案圖
a) 數據整合:通過對跨行業(yè)數據進行關聯(lián)整合,包括空氣質量數據、運營商數據、企業(yè)數據等,實現信息的地理化交互關聯(lián),從而實現數據的深度關聯(lián)分析。
b) 平臺搭建:對整合后的數據進行規(guī)范化存儲和自動化解析及入庫。將成熟的數據挖掘算法形成固化模型,并通過Hadoop、Impala等大數據技術,實現多參數、智能化、實時性的大數據分析平臺。
c) 分析及挖掘:通過用戶畫像、用戶軌跡、業(yè)務偏好等與大氣質量現狀分析、大氣質量精細化預測模型相結合,實現對個人群體的影響評估及預防、對敏感人群的污染趨勢預測推送、對污染區(qū)域的疏散預警等。通過大氣數據與企業(yè)數據的關聯(lián),輔助實現污染溯源分析、污染源的產能動態(tài)規(guī)劃等。
d) 產品及服務:基于數據分析及挖掘結果,明確細化產品需求,針對政府、企業(yè)和個人等不同服務對象,形成一系列面向政府、企業(yè)和公眾的數據產品及服務,以達到輔助政府決策、提高企業(yè)產能、便捷服務民生的效果。
3 運營商數據在大氣污染防控的應用探討
基于整合后的多方數據源,形成基礎數據調用庫。搭建大數據平臺,完成數據的規(guī)范化存儲、自動化解析和入庫、關鍵信息提取。通過上層數據分析及挖掘,形成一系列面向政府、企業(yè)和公眾的數據產品及服務。主要的應用方向如表1所示。
表1 主要的應用方向
以下將著重探討運營商數據在污染區(qū)域的人群防控和企業(yè)停開工的監(jiān)察管理方面的應用。
3.1 污染區(qū)域的人群防控
目前,當城市遇到嚴重污染天氣,每個人都會收到該城市空氣質量嚴重污染提示短信,而實際情況是不同區(qū)域空氣質量在不同時間是不一樣的,有時差別還特別大。如果統(tǒng)一對城市的居民進行空氣質量嚴重污染的提示推送,可能會對一些人提供錯誤的信息,不夠精細化。
基于運營商數據,可獲取人們的實時活動范圍,這樣便能對城市空氣嚴重污染的區(qū)域中的人群進行精準的實時空氣嚴重污染信息推送,實現空氣質量信息的精準化推送,為人們的出行提供參考。同時,我們能精確獲取空氣嚴重污染區(qū)域的人群信息以及他們的特征,為空氣質量影響評估提供更精確的數據和依據。
3.1.1 污染區(qū)域人群畫像
通過對嚴重污染區(qū)域的人群進行用戶畫像及軌跡追蹤,可將污染天氣對人群的影響進行評估,從而進行有效的人群疏散及衛(wèi)生防疫工作。圖3是嚴重污染區(qū)域的人群分布熱力示意圖。
圖3 某污染區(qū)域內人群聚集熱力圖
分析嚴重污染區(qū)域的人群情況,比如影響人數,人群性別占比、年齡分布、每小時的用戶數量、不同時段的用戶數分布等,進而評估對污染區(qū)域人群的影響。
3.1.2 易感人群污染防控
根據用戶性別、年齡分布,公眾開放場所如公園、步道等的聚集情況,活躍時段、使用APP數據(如用戶搜索目的地天氣、目的地導航)等信息,以及醫(yī)療場所周圍的軌跡信息,鎖定易感人群,并向其推送空氣質量信息及防污染產品廣告信息,提醒其及時采取衛(wèi)生防疫措施。
針對幼兒園、中小學校、養(yǎng)老院、醫(yī)院等易感人群聚集,且運營商數據不易捕獲的區(qū)域,可通過企業(yè)全息名片庫進行圈定,對其周圍企業(yè)污染情況進行跟蹤,減少對于易感人群的危害程度。
3.1.3 大氣污染預測人群防控
將人群指數的預測情況與空氣質量(PM2.5濃度)的預測情況,以及空氣質量監(jiān)測站實時監(jiān)測數據進行地理化匹配,分析空氣污染的預測以及實時污染情況對人群的影響程度,同時平臺會實現高密群體影響的實時告警,從而實現污染對人群影響的有效防控。
預測分析未來空氣污染的人群影響情況,如圖4所示。
圖4 某地未來空氣污染的人群影響預測分析示意圖
從圖4可見,早高峰出行時,空氣質量為黃色(2級),對人群影響不大。中午時段,移動用戶主要集中在幾大商業(yè)辦公區(qū)域,同時從空氣質量預測情況看,未來3小時可能會有中度霧霾從南向北來襲,此時可向熱點區(qū)域常駐人員進行消息推送。晚高峰時段,城區(qū)已經進入中度霧霾。傍晚時段,人群逐漸分散,霧霾也逐漸減弱。
3.2 企業(yè)產能動態(tài)調整及監(jiān)察
結合地方企業(yè)信息,建立污染區(qū)域企業(yè)全息名片庫,包含企業(yè)分布、企業(yè)性質、企業(yè)規(guī)模、排放氣體種類、排放量等。結合用戶聚集、軌跡、業(yè)務特征等數據監(jiān)控重點區(qū)域的工廠開工情況,對重污染天氣下隱瞞開工的企業(yè)進行識別。通過污染物溯源信息,對不同天氣條件下,工廠開工方案提供建議,實現工廠產能動態(tài)規(guī)劃,在保證空氣質量的前提下,減少對社會經濟的影響。
3.2.1 企業(yè)開工監(jiān)察
隨著各地空氣重污染應急預案的推出,每遇空氣重污染時,各地政府需對污染排放的企業(yè)進行指導,特別是當空氣污染達到一定的預警級別,應急預案就會對相應的一些制造業(yè)企業(yè)進行停產和限產。以往的做法是政府相關部門進行實地檢查、抽查,來判斷相關企業(yè)是否按照要求進行停產或限產措施。但是企業(yè)分布很廣,執(zhí)法工作人員有限,每次只能完成小比例的抽查工作,監(jiān)管很難到位。而運營商有用戶群體的特征信息,通過建模訓練企業(yè)停工、開工時的用戶群體的聚集狀態(tài)、語音及數據業(yè)務特征、業(yè)務APP使用情況等一系列特征,即可初步判斷企業(yè)的開工概率。通過與實際停開工情況進行對比,得到模型的準確度,進而再改進模型,提高判斷的準確率,大大提高監(jiān)管效率,節(jié)省人力物力和財力,為藍天計劃提供保障。
3.2.2 企業(yè)產能動態(tài)調整
隨著時代的發(fā)展,人們對于環(huán)保問題愈發(fā)重視,但是目前的企業(yè)停產限產措施也拉低了地方的GDP,如何平衡好GDP和環(huán)保兩者的關系,就顯得非常重要。
可以通過分析空氣污染溯源,結合人群聚集特征,針對不同類型的企業(yè)進行有針對性的檢查指導,實現企業(yè)精準的產能動態(tài)調整,保證空氣質量的同時,也兼顧企業(yè)產能的輸出。比如根據污染物溯源分析,某日空氣污染主要污染物來源為道路移動源而非工業(yè)移動源,因此可對樞紐路段進行車輛限行以減輕空氣污染,而并非工廠停工。從而使污染防治做到有的放矢,提高防治效率。
4 結束語
本文從“人”的角度介紹了運營商數據的特征,并基于運營商數據進行大氣污染防控的思路和方案研究,最后對基于運營商數據的大氣污染防控進行應用探討。作為能夠觸及到人群末端的運營商,存儲著人群的畫像、軌跡等信息,通過將精準化大氣質量實時及預測數據與運營商數據結合,能夠將大氣質量對公眾的影響精確到特定人群,實現精準觸達,并且將空氣污染的影響評估精確到每個人和區(qū)域;同時,可根據企業(yè)數據,實現企業(yè)產能的動態(tài)調整,保障藍天的同時也保證企業(yè)產能。為“藍天保衛(wèi)戰(zhàn)”貢獻力量,運營商一直在行動。
參考文獻:
[1] 柴發(fā)合.中國大氣污染防治工作進展與展望[Z/OL]. http://www.sohu.com/a/235433227_99899283. 2018/6/12.
[2] IBM綠色地平線[Z/OL]. http://www-31.ibm.com/ibm/cn/cognitive/greenhorizon/.
[3] 北京市人民政府.北京市空氣重污染應急預案(2017年修訂)[Z/OL].http://zhengce.beijing.gov.cn/zhengce/197/1861/1921/1005141/1283071/index.html. 2017/9/15.
[4] 劉覓,楊海川,李振華. 運營商構建電信大數據生態(tài)之道[J]. 電信科學,2018(1):109-119.
[5] 常杪,馮雁,解惠婷,等. 大數據驅動環(huán)境管理創(chuàng)新[J]. 環(huán)境保護,2015,43(19):25-29.
[6] 張云勇. 電信運營商大數據發(fā)展建議[J]. 電信科學,2018(1):103-108.
[7] 郭華. 運營商大數據在旅游行業(yè)應用探索研究[J]. 移動通信,2015(6):27-31.
[8] 胡兵. 基于大數據的環(huán)境污染趨勢評估[J]. 中國資源綜合利用,2018(6).
[9] 尹文君,張大偉,嚴京海,等. 基于深度學習的大數據空氣污染預報[J]. 中國環(huán)境管理,2015,7(6):46-52.