澳客
當前位置: 首頁 > 澳客建言 >

單勇:大數據如何助力社會治安防控?

時間:2016-10-19 16:59來源:澳客 作者:單勇 點擊:

黨的十八大以來,創新社會治安防控體系是“創新社會治理體制、提高社會治理水平”在治安及綜治領域的具體體現,也是當前社會建設的重要著力點。正所謂“沒有信息化就沒有現代化”[1],2015年4月,中共中央辦公廳、國務院辦公廳印發的《關于加強社會治安防控體系建設的意見》將“以信息化爲引領”作爲加強治安防控工作的指導思想。“數據是信息的載體,信息是有背景的數據;進入信息時代,數據成爲信息的代名詞,兩者可以交替使用。”[2]“在信息化時代,數據隨時隨地與我們相伴而行,‘用數據說話’已成爲認知世界的一種方法。”[3]因此,數據治理構成創新治安防控的有益嘗試。

一、數據治理:社會治安防控創新中“關鍵的具體”

黃仁宇先生提出過一個非常著名的論斷,即近代中國動蕩局勢的原因是“因爲中國未能像西方那樣實行數目字管理的現代治國手段”。[4]本文無意對近代中國衰落原因做曆史考據,但上述觀點映射出掌握及運用數據對治國理政具有重要價值的道理卻不容忽視。

數據(data)一詞出現于13世紀,源自拉丁語,有寄予的含義。數據的概念是在量的基礎上建立起來的,量成爲數據的基本單位。[5]數據不僅代表“真正的事實”,經由統計工作、系統化收集的成片數據,除代表事實,還蘊藏著事物的發展規律。這種規律支配著整個社會的發展,一旦掌握,就可把握社會的脈搏甚至預測未來。[6]“作爲社會管理和公共服務的提供部門,收集數據、使用數據,是自古以來各國政府普遍采用的做法。”[7]

所謂數據治理,是指運用數據科學的技術手段,采集、清洗、整理、利用數據,用數據說話、用數據決策的問題分析及解決機制。數據治理具有如下特征:第一,數據治理以量化分析減少不確定性和降低風險,彌補個體經驗、直覺及智慧的不足。隨著世界的數據化,“我們不再將世界看作是一連串或是自然或是社會現象的事件,我們會意識到本質上世界是由信息構成的,量化一切成爲可能。”[8]第二,數據治理主張相關比因果更重要,通過量化不同事物之間的數理關系,以相關關系捕捉現在和預測未來。第三,數據治理以數據科學爲基礎,以統計軟件和數學模型爲分析工具。第四,數據治理認爲政府處于數據化的環境中,政府的治理活動應以數據爲依據,數據化決策,即采集及整理數據——量化分析——相關性測算——預測或決策。第五,數據治理尊重事實、推崇理性、強調數據創新,倡導一種數據治國的數據文化。

當前,針對治安防控的創新問題,研討較爲活躍、視角頗爲豐富。有的從地域出發,關注中心城市、老城區、城鄉結合部、邊境城市、農村等地的防控創新;有的從防控主體出發,關注公安機關、社區、民間組織、志願者的工作機制創新;有的從防控手段出發,關注人防、技防、物防等手段的改進;有的從系統論出發,研討治安防控各模塊之間的體系創新。實際上,上述研討基于社會控制、社會失範、系統論、社會沖突、社會結構、科際整合等理論學說進行了充分的邏輯推演、理論思辨、經驗歸納及比較分析;但僅憑這些理論及方法還遠遠不夠,各類防控創新舉措最終能否成功還離不開數據治理。

首先,各類防控創新均需根植于犯罪數據與社會事實,用數據說話、用數據創新。針對不同地域、防控主體、防控手段及防控體系的創新舉措,均離不開對特定空間中的特定因素及犯罪大數據的精確測量。

其次,各類防控創新離不開數據科學中量化方法的運用。如針對城鄉結合部的治安防控問題,需根據曆史數據、運用數學模型評估出城鄉結合部空間中哪些因素存在較強的犯罪吸引力。BBC紀錄片《地平線:大數據時代》講述了數據治理及數學方法、數據分析技術改進犯罪防控的實例,即數學家幫助洛杉矶警察局建立犯罪時空預測模型,以數學模型設計犯罪預測軟件,以預測軟件規劃警察每天的巡邏路線,從而大大降低犯罪率且被美國多個警察機構予以采用。

最後,防控創新舉措是否成功離不開數據的檢驗與評估。聲名顯赫的破窗理論、情景預防及防衛空間學說、犯罪制圖方案均通過了各種實驗性項目的嚴格檢測,在實踐中取得了顯著效果。各類治安防控創新舉措如未經現實檢驗,則仍處于理論設想和方案計劃階段。

正如孟建柱同志2015年1月在中央政法工作會議上強調政法機關要“善于抓住關鍵的具體”[9];作爲關鍵性基礎環節,數據治理就是創新社會治安防控體系的“關鍵的具體”。此外,雖然數據治理描繪出非常美好的未來,但要想在治安防控中實現數據治理難度可想而知,系統反思開展數據治理的現實困境構成了創新治安防控的起點。

二、數據治理在治安防控中的現實困境

“伴隨新一輪信息技術革命浪潮的出現,信息技術在靜悄悄的革命中重塑了國家治理的生態,大數據時代的中國國家治理面臨一系列全新的機遇和挑戰,國家治理能力建設的路徑優化成爲迫在眉睫的時代命題。”[10]數據治理已成爲國家治理各個領域均要面對的機遇和挑戰。依靠數據的犯罪治理源自犯罪統計,但又汲取了犯罪社會學、犯罪地理學、犯罪心理學、犯罪經濟學等犯罪學分支學科中的量化分析、犯罪制圖、心理評估、數學建模等科學方法。對于治安防控來說,數據治理並非新問題,但在理論上卻相當薄弱,在實踐中亦困難重重。具體來說,數據治理在治安防控中的困境如下:

第一,在觀念上,治安防控中的數據文化尚未落地生根。

在多年的綜治工作中,政法委、公安、監獄、法院等防控機構的案卷、檔案、報表、文件中積累了大量的犯罪和治安數據。隨著辦公信息化進程的加速,在公安機關等機構的局域網中,形成了所在轄區的全樣本、長時段、標准化、實時性、交互式的刑事案件、治安案件、人口戶籍、城市管理等數據。因此,在治安防控中並不缺數據,但缺乏重視數據的意識和觀念。正如胡適在《差不多先生傳》中指出國人具有“凡事差不多”的習慣,“回望曆史,中國是個數據文化匮乏的國家;就現狀而言,有些數據的公信力弱、質量低,數據定義的一致性差也是不爭的事實。過去深入群衆、實地考察的工作方法雖仍然有效,但對決策而言,系統采集的數據、科學分析的結果更重要。”[11]防控部門對習慣和經驗過于依賴、犯罪數據深層分析有限、對犯罪風險評估不夠精確、各項防控決策的量化支持不足、重視犯罪原因忽視犯罪影響條件、重視犯罪預防忽視犯罪預測等現狀,均反映出數據文化尚未落地生根。

第二,在機制上,缺乏標准化的犯罪數據分析及應用模式。

當前,犯罪數據獲取不是問題,問題在于如何分析和應用。在分析環節上,以往對犯罪數據的分析多限于宏觀層面的描述性統計,犯罪與周邊環境、人口、空間特征、經濟社會因素的相關性分析匮乏,基于相關性分析的數學建模及犯罪預測鮮見;針對微觀地理單位及較長曆史周期的犯罪時空風險分析有限;基于地理信息系統的犯罪數據可視化分析仍處于探索階段;關于犯罪原因的分析很多情況下還處于經驗描述層面。在應用環節上,由于常態化的犯罪風險評估匮乏,犯罪數據的針對性、實用性、可操作性較爲有限,尤其是基于犯罪數據的犯罪預測落後。實際上,基于統計建模、具有數往知來功效的犯罪預測對防控資源的調配和防控布局優化具有重大價值。在操作環節上,各地各級防控部門的犯罪數據分析及應用在目標界定、分析策略、數據標准、數據庫建設、分析工具選擇、分析報告設計、報表自動化、數據分析師培訓等領域尚無統一、規範且經過實踐檢驗的標准模式。

第三,在結構上,“數據孤島”問題凸顯,各部門的數據缺乏共享與整合。

2015年5月,全國多家媒體報道了河南信陽市發生的一起兒童走失案,父母在一個派出所報案後,兒童被同屬一個分局的另一個派出所接走後送當地福利院,而後走失兒童病逝于福利院。[12]該案反映出各個公安機關之間在數據聯網共享與信息管理方面存在一定問題。盡管公安機關等機構掌握所在轄區內的犯罪及治安數據,但各級各地公安機關之間、公安機關與其他防控機構之間的數據缺乏有效兼容與整合。這種現象又稱爲“數據孤島”或“信息孤島”。“信息孤島在我國當前政府部門的信息化系統之間是一種普遍現象,這從國際上公認衡量各國信息化發展水平的全球電子政務發展指數上也能體現。近十年,我國該指數排名先升後降,從2003年第74位升至2005年第57位,2012年跌至第78位。”[13]准確地說,“數據孤島”不是技術性問題,而是體制性問題。該問題導致治安防控體系難以形成全國一盤棋,阻礙著上下互通、左右互動、情報共享、實時更新的數據治理的實現。

第四,在開放性上,犯罪數據對社會開放的水平和程度有限。

開放犯罪數據不僅是爲了保障公民知情權,更重要的是通過數據公開實現用數據制衡政府公權力運用。以往我國犯罪數據公開僅限于《中國法律年鑒》、《中國統計年鑒》對全國公安機關每年刑事案件立案總數和主要幾類案件立案數進行公布,以及“兩高”報告、個別省份公安年鑒的總體數據公布。隨著包括刑事判決書在內的裁判文書網上公開,全樣本的刑事案件信息(未成年人犯罪等案件除外)已實現全國公開;但基于此的刑事司法統計未獲同步公布。畢竟,每份判決書本身不能管中窺豹,只有基于全部判決書的刑事司法統計才能准確反映犯罪態勢。由于刑事判決書並未被進一步數據化整理,基于判決書的數據抽取僅能靠人工篩選,即通過人工閱讀每份判決書,將Web文本中如罪名、犯罪時間、犯罪地點、刑期等信息進行抽取並轉成Excel或SPSS格式表格;而依靠機器的智能數據抽取與清洗尚無法真正落實。同時,二審判決書並未與一審判決書形成有效鏈接,這給人工刑事司法統計帶來數據源重複的障礙。此外,治安案件未能納入公開範圍,鑒于犯罪黑數的漏鬥效應,比犯罪數據更爲龐大的治安案件數據更有參考價值。犯罪數據開放性的上述局限致使獨立第三方的專業犯罪風險評估難以出現,普通民衆難以根據犯罪數據有針對性的開展被害預防。

三、源自小數據治理傳統的防控創新

针对数据治理遭遇的问题,当前流行的应对思路是从大数据的运用上寻找突破口和改进路径,甚至某些治理对策研究已到了言必称大数据的地步。实际上,“1998 年《科学》杂志刊登论文《大数据的处理程序》才第一次使用大数据(big data)一词;2008年《自然》杂志刊登“big data”专刊,使“大数据”在学术界得到认可和广泛使用。”[14]在中国,信息产业界公认的“大数据元年”是2013年[15];欧美等国的大数据发展计划是近五年内陆续出现的。理论界建议政府借大数据东风,利用后发优势实现“弯道超车”固然正确;但切不可忽视人类长久以来利用小数据所积淀的治理传统,忽视小数据与大数据之间的内在关联。

從數據可用性上看,大數據的價值主要體現在傳統的小數據和結構化數據上。當前人類的數據約75%是非結構化數據,大記錄的表現形式就是非結構化數據,而大記錄、非結構化數據要體現出價值,當前主要的處理方法還是把它們轉化爲有嚴整結構的數據,即傳統的小數據。[16]源自記錄的非結構化大數據只有轉換爲能夠測量的結構化小數據才有數據治理意義。對于治安防控來說,多數情況下使用的犯罪信息仍系小數據,數據量尚達不到“太字節”(240)這一大數據量級。

从治理传统上看,东西方国家依靠复杂的文官治理系统拥有丰富的小数据治国经验。在我国历史上有商鞅提出“强国知十三数”,《孙子兵法》中“算则胜、不算则不胜,多算胜、少算则不胜”等传统。循数治理在欧美国家更是大放异彩,20世纪八九十年代,源自美国纽约的“Comp Stat”警务模式构成了将数据分析引入治安防控的标志性创举。“从20世纪九十年代起,全美有1/3的警察机构陆续复制了这种基于犯罪地图和数据的警务模式。”[17]随着地理信息系统(GIS)的大发展和桌面GIS的普及,“Comp Stat”模式的数据可视化分析水平获得跨越性提升,基于犯罪制图的地点警务成为美国21世纪的主流防控模式。“Comp Stat”模式及地点警务主要运用的仍是911报警信息、犯罪及越轨行为时空信息、警力配置信息等小数据。

在邁入大數據時代的當口,數據治理不僅要向前看,沐浴大數據的陽光;還要向後看,重視小數據與大數據的聯系,從小數據治理傳統中汲取智慧、挖掘資源。在某種程度上,只有向後看,重視小數據傳統,才能更好地向前看,真正把握大數據帶來的曆史機遇。具體來說,下述小數據治理傳統對防控創新甚爲重要:

第一,基于相關性的犯罪風險評估。

因過于專注因果關系,在傳統的“現象—原因—對策”犯罪學研究模式中,注重犯罪與各因素相關性的犯罪風險理論幾乎無立足之地。如何科學評估不同區域、不同犯罪類型、不同罪犯群體、不同時空層級的犯罪風險,離不開始于小數據時代的相關性分析。“在日常生活中,我們習慣性地用因果關系來考慮事情,所以會認爲因果關系淺顯易尋,但事實卻並非如此。因果關系被完全證實的可能性幾乎沒有。不像因果關系,證明相關關系的實驗耗資少,費時也少。與之相比,分析相關關系,我們既有數學方法,也有統計學方法。”[18]在此意義上,“相關比因果更重要”[19]。實際上,只要能將特定因素予以數據化,就可運用統計分析方法和數學模型測算犯罪數量與特定因素的相關關系。這種相關性分析揭示出哪些因素的犯罪吸引力更大、哪些因素的增減與犯罪的增減關系緊密,因而構成研判犯罪風險的主要思路。

第二,基于數理邏輯和科學實驗的犯罪量化分析。

自小數據時代,量化分析就備受重視。對于各類防控舉措受何種因素影響、是否有效、在多大程度上有效等問題,只有量化分析才能找到答案。如針對地點警務的有效性問題,美國學者威斯伯德(2010年斯德哥爾摩犯罪學獎獲得者)研究團隊聯合警察部門設計實驗組(實驗區)和對照組(不實施地點警務的毗鄰對照區)開展實驗性研究,將地點警務實施效果在實驗組和對照組中對比分析,從而發現犯罪溢出效應和犯罪轉移效應兩種犯罪分布規律。[20]數理邏輯和科學實驗構成了數據治理的基礎性量化方案,以往常見的描述性統計不過是量化分析的“皮毛”。基于個人經驗的防控方案或創新理念,必須被數據實證所檢驗,而不是僅在價值或主觀上“認爲應該是對的”,數理邏輯和科學實驗完全能超越基于個人經曆的智慧。這種量化分析對創新社會治安防控體系,尤其是各地開展防控創新實驗具有特別的啓示價值。

第三,基于地理信息系統的犯罪數據可視化分析。

“數據可視化技術是利用計算機圖形學和圖像處理技術,將數據轉換成圖形或圖像在屏幕上顯示出來,並進行交互處理的理論、方法和技術。”[21]在治安防控領域,數據可視化的典範就是犯罪制圖。正所謂“一圖勝千言”,利用地理信息系統對違法犯罪時空信息及相關警務問題進行空間分析的犯罪制圖在歐美國家開展的如火如荼;隨著我國“金盾工程”二期的建設,警用地理信息系統平台(PGIS)投入使用。

這種寓數于圖的犯罪時空數據分析方式不僅能直觀展示特定犯罪的空間分布狀況,探測犯罪熱點,诠釋犯罪與空間環境諸因素的相關性,前瞻犯罪在未來的空間分布趨勢,還能爲防控資源的優化配置(如調整警察巡邏的頻度和密度、防衛空間策略如何設計等)提供針對性方案。

第四,基于犯罪數據的防控決策。

數據治理最終要爲決策服務,前述量化分析、相關性分析及可視化分析構成數據決策的基礎。耶魯大學法學院丹尼爾?埃斯蒂教授指出,“數據驅動的決策方法,政府將更有效率、更加開放、更加負責,引導政府前進的將是‘基于實證的事實’。”[22]對治安防控決策來說,經驗和智慧不能代替科學,直覺和習慣不能取代事實;各種犯罪專項治理和日常治理的科學開展更離不開犯罪數據的精准支持。如基于犯罪制圖探測犯罪熱點,針對熱點布置高清攝像頭和警務室,針對熱點路段安排警察定時巡邏等。如在特大型犯罪團夥的偵破中,將已知信息輸入社會網絡分析軟件,破解團夥中衆多成員的真實關系,尋找集團首腦和關鍵性主犯。

四、大數據對防控創新的推動

“大數據是指那些大小已經超出了傳統意義上的尺度,一般的軟件工具難以捕捉、存儲、管理和分析的數據。”[23]大數據包括自然環境數據、商務過程數據、人的行爲數據、物理實體的數據,還可分爲結構化、半結構化、非結構化數據。從數據産生上看,傳統的小數據源于測量,現代的大數據源于記錄;不同于小數據的結構化數據,大數據更多的是非結構化數據。摩爾定律奠定了大數據的物理基礎,社交媒體使每個人都變成潛在的數據生成器,數據挖掘技術增強了人類使用數據的能力,大數據時代就是大計算的時代,大數據時代標志著計算型社會的興起。[24]“大數據的出現爲危機或風險信息的全面掌握提供了充分的可能。通過收集、處理海量的數據信息,能提升危機決策者的認知與判斷能力,並以過去根本不可能的方式做出決策。”[25]大數據對治安防控創新形成了強大的推動力,爲數據治理遭受的困境提供解決思路。

第一,大數據浪潮催生計算型社會的興起,爲數據文化在治安防控中生根發芽提供契機,防控創新的文化基礎逐漸形成。

大數據的出現使各種社會問題變得可以被計算,數據治國、循數管理、數據決策的呼聲日益高漲且深入人心。如果說之前數據文化對治安防控的影響還是涓涓細流滋潤人心的話,那麽大數據浪潮下的數據文化俨然成爲震耳欲聾的時代強音。以往憑借經驗、直覺、傳統知識進行防控決策的做法愈發受到質疑,憑借數據治理改進治安防控、實施平安建設開始受重視。數據治理逐漸成爲決策者、執行者在進行治安防控管理中無法忽視的“前理解”。

第二,大數據技術爲犯罪數據庫的准備和共享提供支持,防控創新的數據基礎日臻完善。

運用大數據技術分析犯罪問題首先要加強數據庫建設,沒有數據庫就無從開展數據分析。數據庫建設不僅要在各部門局域網中實現既有數據的結構化整理及數據集建設,更要打通“數據孤島”實現各部門犯罪防控基礎數據的對接和共享,外接各類行政管理數據庫,並在互聯網及物聯網層面有效延伸和覆蓋(即與超級數據對接),從而實現全方位、實時性、系統化、多角度、互動式的數據抓取。

第三,大數據技術爲犯罪數據分析提供了工業化控制模式,治安防控決策支持系統的技術基礎逐漸成熟。

犯罪數據分析是數據治理的關鍵環節,也是當前治安防控信息化建設中的瓶頸所在。對此,大數據技術提供了兩種不同層次的工業化技術路線。其一,將犯罪大數據與防控者的先驗知識相結合,人工建模分析數據。如以空間滯後模型分析犯罪空間分布規律,以時間序列模型分析犯罪時間規律等。此種模式的優點是數據分析的目的性和針對性強,分析思路可檢驗、分析過程可複制;缺點是因數學模型的選擇不同,可能導致分析結果不一致。其二,設計人工智能系統,用大量數據對計算機智能系統進行喂養和訓練,使計算機獲得從數據中自動提取知識的能力,從而實現機器學習。“機器學習主要研究如何使用計算機模擬和實現人類獲取知識過程,創新、重構已有的知識,提升自身處理問題的能力。機器學習的最終目的是從數據中獲取知識,實現人工智能。”[26]此種模式代表了未來智能型社會的發展方向,通過不斷調試的參數及不斷優化的設計方案,計算機智能分析犯罪數據將極大提升犯罪分析的計算能力、擴展犯罪分析的應用範圍。當前,美國很多警察局使用的警務自動簡報生成系統就是機器學習在治安防控中的初級應用。實際上,上述兩種技術路線均是通過標准化的數學模型挖掘犯罪與其他因素之間的相關關系,揭示隱藏于紛繁蕪雜表象下的犯罪規律,爲防控決策提供隱性知識和預測方案。上述技術路線與推崇智能制造的“工業4.0”有異曲同工之處,即基于海量犯罪數據,輸入擬解決的問題,依靠標准化的智能制造程序,獲得相關結論。因此,在本質上,大數據分析是一種工業化的犯罪分析及決策支持模式。

第四,大數據的興起並不意味著“理論的終結”,大數據技術要求不斷提升治安防控的理論基礎。

《連線》雜志主編克裏斯?安德森指出:數據爆炸使得科學的研究方法都落伍了。大量的數據從某種程度上意味著“理論的終結”,用一系列的因果關系來驗證各種猜想的傳統研究範式已不實用,如今它已被無需理論指導的相關性研究所取代。[27]這種觀點反映了當前對數據過于迷信的心態。實際上,大數據只能告知與治安防控有關的信息和提供參考答案,但如何解釋及正確使用信息離不開犯罪分析師。相反,隨著犯罪大數據的刺激和沖擊,如何梳理、解讀、分析、反思大數據對治安防控的影響,如何將數據治理理論、數據挖掘技術和數學建模方法引入犯罪學,如何量化犯罪現象以揭示犯罪規律等問題,均要求治安防控理論推陳出新。

總之,在小數據傳統與大數據技術的滋養下,以數據治理創新社會治安防控體系適逢其會。預測未來最好的辦法就是創造未來,當前迫切期待通過數據治理的實驗性項目做出更多的探索。

(作者系同濟大學法學院副教授)

(來源:“法學學術前沿”微信公衆號)

(責任編輯:admin)

(掃一掃,更多精彩內容!)