順豐集團劉新凱:數字化升級帶來的數據安全挑戰與機遇
數字化成為了各行各業的熱詞和轉型方向。
而隨著各行各業的數字化程度不斷加深,進入產業互聯網時代的它們,面臨的安全威脅,更加隱蔽,更加復雜,也更具破壞性,安全能力的缺失將為企業帶來難以承受的損失。尋求產業轉型升級的企業要如何應對產業互聯網下的安全挑戰,實現高質量發展,是亟待解決的問題。
騰訊公司云與智慧產業總裁湯道生就指出,產業互聯網時代,安全出現了兩大新特性。一方面,產業互聯網時代安全威脅的突發性更強、破壞性更大。尤其涉及國計民生的產業領域,一旦遭遇網絡攻擊,可能造成極大的社會影響和經濟損失。另一方面,安全價值升維,安全不僅能幫助企業“降本”,還能顯著“增效”,已成為數字時代企業核心競爭力之一。
這種深刻影響,體現在各行各業,物流行業也不例外。數據安全如何保護?數據又如何治理?細微的改變帶來了哪些進步?數字化的戰役如何打?在7月30日開幕的第五屆互聯網安全領袖峰會(CSS 2019)上,順豐集團信息安全與內控處負責人劉新凱給出了順豐的答案
以下為其演講全文,詳細介紹了順豐在推進數字化方面的所作所為,內容詳實,值得學習:
各位與會的朋友大家下午好!我是來自順豐集團信息安全與內控處的負責人劉新凱。在談到整個產業升級以及數字化的過程中,我相信很多企業也會遇到相應的挑戰,也在尋求不同的相關的解決方案,我希望剩下的25分鐘時間里面能夠以順豐為例,把我們發現的挑戰以及在具體落地和應用的方法跟大家作一些分享,希望能夠帶來一些啟迪和幫助。
一、順豐數字化發展的歷程
我們把順豐以及順豐數字化發展的整個歷程發展分成了三個階段:
第一階段,2007年以前
最早開始使用不管是OA也好,還是整個運作過程中數據的上線,最早在快遞企業實現了路由數據監控和后臺的更新。
第二階段,2008年—2015年之間
這是非常大的變革年,這幾年的時間,不管是整個2009年順豐科技的成立,還是在人、財、物各種系統批量上線的過程,實現了企業方方面面的數字化。
第三階段,從2016年到現在
在數字化的基礎上更多的是運用大數據、人工智能,是將整個的運作以及產品更偏向人工智能的過程,提高用戶的感知、內部運作的效率,也降低了成本。
這些年發展下來,整個科技的人員從0發展到現在超過5000人,可以說整個順豐在整個科技化的過程中是跑得非常快的。
二、數字化的挑戰
在這么快的過程中,安全有沒有遇到什么樣的挑戰?其實我相信像每個企業在思考的問題是一樣的,都會遇到非常多的問題。
首先在整個數字化升級的過程中,單純從數據安全的角度,看一看會遇到哪些通用性的風險。
第一,數據的集中
最早做科技的時候可能有不同的系統,甚至從紙質界開始變成系統、變成OA,包括后來的ERP,其實數據在集中化,有了大數據概念以后,以前分散的數據越來越集中了,集中帶來的問題是什么?相當于我們的數據被批量泄密或者被批量攻擊的可能變得更大。
第二,互聯互通。
以前都是單機版的或者線下的操作,很多的時候是要物理接觸才能夠對系統或者數據產生影響。而現在互聯互通的時代,其實整個安全的防護已經是面對要全球的攻擊,你不知道是你的競爭對手還是惡意的團隊,還是什么樣的情況。你的風險無時不在。
第三,大數據的應用。
大數據的應用在每個企業都是現在的必選項,不管是客戶的畫像、商圈的選擇還是未來產品的制定,大數據就是整個未來發展決策的重要一環。但是你在大數據分析的過程中,跟安全是不是有些沖突?哪些數據可以分析?哪些數據、哪些人可以用?展現或者是分析的力度到底是什么樣的?大數據和安全之間如何選擇一個有效合理的平衡點?
第四,數據安全的管理。
可能最初的時候大家做一個兩個、十個八個系統,可以很清楚地說清楚我的數據在哪里,應用誰來管。當你的系統發展成100個、200個,甚至我們的規模已經超過500個系統之后,沒有人真的能說清楚各個應用系統之間數據是什么關系,我的數據如何流轉,應該如何保護。當面對這么大的變化的時候,怎么樣才能夠進行有效的落地,我相信很多這類的問題,各個公司都會遇到。
順豐有特點的地方兩個:首先,順豐員工差不多40萬人,分布在全球50多個國家和地區,尤其是大陸的人員是最多的。同時,因為行業本身的問題,從大家有印象開始,實際上你自己的信息、寄方的信息在運作的過程中必然被整個員工接觸到,它不像別的行業數據是保密的,可能只有幾個人能接觸到。當你接觸到快遞的時候,你會發現客戶隱私和整個的運作是息息相關的。面對這種挑戰如何解決?
剛才也提到了大數據上的風險,當你想解決這些數據安全帶來的問題的時候,你會發現,針對結構化的數據如何去保護?業界能夠發現的方案或者是能夠使用的方案,一是比較匱乏,二是成本可能會很高。當面臨這些問題的時候,如何選擇?
三、順豐的方案
我們在眾多的安全目標里面,今天就選擇了一個跟大家做一個分享,這是我們很重要的一個目標,就是要實現客戶的隱私數據,尤其是電話號碼,全體員工在整個生產運作環節中是不可見的。
大家可能覺得這個事情很小,但是你想想我們有500套系統超過40萬員工,又有行業本身的特點,這件事情如何去做?這件事情想要治本一定要回到最基礎的部分:一是業務,第二就是數據本身。
我們羅列出來的這個流程實際上是一個快遞公司非常基本的過程,前面有下單、收件,中間有收派和售后,還有三線的運營過程,我們按照業務流程,以及業務如何改造,以及系統端如何改造,介紹一下順豐在落地過程中做的事情。
1.紙質面單
如右圖,很多朋友非常熟悉,幾年前這種四聯單,郵政或者快遞行業通常使用的模式,大家所有的信息都是記在這張單上,寄方信息、你的信息、保價信息、個人簽名都在上面。
我們在做最早的數字化的時候是在做什么?按照標準的流程是手寫下單,進行相關的掃描,有一個非常重要的環節就是要有一個人工錄單的環節,把所有快遞單的數據及時錄到系統中,相當于白天取完件,馬上有業務員把它做批量的掃描,掃描件會給到后面的輸單人員,進行數據的傳輸。
那個年代開始,其實順豐已經很關注客戶的隱私,怎么保證一張運單不會被任何一個人拿到中間完整的信息,從而做一些欺騙或者是詐騙的相關的動作。這張圖上寫了很多編號,這張圖在掃描之后,當時就在上面可以拆成十塊,每一張掃描圖自動會被拆成十個部分,十個部分給不同的供應商負責數據的錄入,相當于沒有任何一家可以看到完整的面單。這是順豐在紙質面單的時候的手段。
我們跟騰訊最早的合作,有300多家供應商在負責輸單,幾千人在負責輸單。我們跟騰訊當年合作的第一件事情,就是所有手寫的漢字自動化輸入、自動化識別,結合OCR的技術,以及順豐在地圖、地址上的能力,基本上可以做到手寫的地址以及信息識別率達到99%以上,來解決這種人在中間參與可能接觸到數據帶來的風險。
2.電子面單
順豐是第一家推出二維碼掃碼寄件的公司,在這之后電子面單就成了大家現在看到的快遞包裹上的主流。左圖的面單是2017年發布的順豐“豐密面單”,做這個事情的目的非常簡單,就是在一張能打出來的面單上,對收方、寄方通過信號脫敏處理,包括小哥在日常處理過程中,包括客戶在處理剩余面單紙的時候不會出現電話號碼的泄密。
發布之后的一年,2018年8月8號就出現了右邊的這塊業務,如果大家拿出手機在微信里面選順豐速運的話,會發現其中有一項叫“隱址件”。我們發現很多朋友其實是不希望有人給你寄東西的時候知道你的家庭住址。通過“隱址件”在寄件的時候不需要填收件人地址,這個由朋友自己填,打出來的面單也不會有相關的地址,相當于收寄雙方的業務過程都不會接觸到相互的聯系方式和地址,保證大家傳遞過程中個人數據的安全。
3.一線人員
順豐的業務大概每天有1500萬件,這1500萬件里面大多數都是通過小哥和客戶的溝通來進行下單和處理的,小哥就成為了跟大家日常接觸的最頻繁或者最緊密的伙伴。我們想做的第一件事情或者落地的第一件事情,就是如何保證小哥跟客戶的交流無法接觸到電話號碼。
可能跟有些業務不一樣,有些業務是高價值低頻率,選擇一些比較簡單的虛擬號碼很容易實現電話號碼的隱藏。但是對于高頻且每一票快遞的利潤相對比較低的業務的時候,如何能保證,能選擇通用的虛擬號碼嗎?如果是這樣,順豐光虛擬號碼的成本要兩個多億,接近三個億,這還不算電話費。怎么出現新的方案解決這個問題?我們選擇的是整個操作系統的改造+虛擬號碼兩種方式二合一的方式。
左圖是快遞員在呼出的時候,左下角會有一個相關的按鈕,通過這個按鈕呼出的時候是顯示第二張圖的界面,相當于小哥看到的電話號碼中間是有信號加密的,在所有通訊錄當中存儲的通訊記錄中間也是打了“*”,整個過程并不知道客戶的電話號碼。同時還有很重要的功能就是每一個業務都是有時效的,像弓總的滴滴,(業務)結束之后這個電話號碼就聯系不了。順豐會根據業務周期調整整個通訊錄能夠撥通的時長進行相關的動態清理。短信也是類似的。右圖是客戶可以看到的數據,相當于客戶依舊可以看到小哥的電話號碼,當你有任何問題的時候依舊可以通過這個電話號碼聯系到快遞員。這是在一線發端或者快遞員這一端能夠解決的模式。
4.二線人員
在談完大量的快遞員之后,我們還有很多二線的人員,類似于倉管和中轉場,大家可能不熟悉,但是說起客服大家就不陌生,當他們撥出電話號碼或者有客戶打進電話的時候是通過CRM或者相關的系統進行自動的關聯,而所有的展示界面中間是不需要知道客戶電話號碼的,而當他撥出去的時候,尤其使用IP電話的時候會發現客戶看到的是,類似于像右邊的95338-85這樣的電話號碼,95338是順豐的官方客服電話,這樣的號碼有比較高的辨識度,二是能夠實現所有二線人員在跟前端客戶溝通的時候電話號碼是相關保密的。
5.三線人員
其實在介紹完這個之后還有一個很重要的點,就是所有的三線數據分析人員,這一部分怎么解決?其實他們并不需要電話號碼,電話號碼對于很多數據分析人員最大的作用是什么?實際上是所有信息的關聯或者是唯一的ID標簽,它是要靠這個來進行整個客戶之間的關系以及客戶畫像這樣的一些相關的動作,就意味著我們并不需要真的給他展現一個相關的電話號碼。
所以我們現在選擇了一個在順豐落地很好的模式,就是所有的敏感字段按字段級進行加密,相當于客戶的訂單剛剛出現的時候,信息剛剛進順豐在最外端的系統的時候,有關他的電話號碼、地址以及相關的敏感數據就已經加密了,從這套系統開始,每一個向下流轉的過程,所有的電話號碼都保持加密的狀態,即使進入大數據的平臺,即使進入了數據分析人員的范疇,你會發現他依舊接觸不到明文的數據。相當于整個數據就不會有明文見到數據分析人員的時候,它是靠著整個密文的唯一ID來進行相關數據分析的。綜合前面這一部分講的話,其實還是跟整體前端業務有關,如何能讓我們的一線、二線以及三線做數據分析的人員,在整體的過程當中沒有辦法或者是根本不需要接觸客戶的敏感數據。
四、數據資產的治理
當解決完這些問題之后,其實還有很多老大難的問題,這塊會比較偏系統。
當有500個系統以上的時候,你的數據到底在哪里?你關心的系統、你的數據庫到底在哪里?它們是從哪里來的?如何流轉?最后去了哪里?當你知道這些信息以后如何保護?這些可能就成了每一個安全從業者或者是負責人真正內心里面最重要的問題。我們有時候這么比喻這件事情,有點像管家,當你管了所有的系統和數據的時候總要有一本賬,這些數據到底在哪里?賬目上是不是清楚的?如何從一個庫里面去了另外一個?它們如何劃轉。
就像倉庫一樣,我們知不知道它的庫存什么樣?知不知道如何劃撥,這些都不知道怎么管好家底?怎么選擇安全有效的安全措施保證數據是安全的?這是大家在做了很多外圍安全之后應該好好想想的問題,到底知不知道自己在保護什么,它們面臨什么樣的狀態?
我們也尋找相關的解決方案,從差不多去年開始,我們做了一套解決方案來解決相關的問題。第一個是解決數據資產在哪里的問題,不管是數據資產掃描、敏感數據引擎,還是網絡流量探針的方式,發現在整個數據中心不同網段和不同區域之間的資產變化,來確定整個資產的變化,同時當有了這個基礎的東西之后才能進行管理。
有了這個東西可能還遠遠不夠,我們真正關心的不是全量資產是什么樣的,而是中間真正敏感的數據和敏感的字段到底是如何的,所以在這個基礎之上,當知道了資產的整體分布情況之后,我們還要發現所有的敏感數據是如何分布的,我們在這里面有一個隱私管理的平臺,可以通過規則或者是人工智能的方式進行敏感數據的識別,從而進行數據的分類和分級,最后進行相關的可視化。可能講起來會比較抽象,用兩張給大家分享一下具體的展現方式是什么樣的。
左圖是有關數據資產,當你分析之后,到底應該是什么樣,怎么能夠盤點好自己的家底到底是什么樣的。右圖是現在在做的,不同數據庫的表到底有多少字段?哪些字段是敏感的?它們之間是什么樣的關系?你會發現這樣一層一層拉下去之后會有非常完整的對于資產以及敏感數據分布的概念。其實這個我們也是有很多慘痛經驗的,當我們分析自己的敏感數據的時候差不多也花了接近20個人,差不多干了一周才搞明白自己有什么,都在哪里。
當有了這一套東西之后,你可以隨時隨地了解自己的家底是什么、你關心的數據到底在哪里。這個也只是剛剛開始,為什么?其實這是一個靜態的數據,不管是資產還是數據分布,其實我們可以查很多東西了解這個數據,但是還有一件事情是動態變化的,就是它們是如何流轉的,接口是如何變化的,你的業務是隨時隨地變化的,安全怎么能夠知道業務是如何變化的,而中間的數據是如何流轉的。
我們做了這個之后又做了很重要的功能,就整個數據追溯的管理,相當于我們怎么能夠通過敏感的字段、敏感的應用來進行相關的數據發掘,后面有一張動圖可以跟大家簡單地做一下分享。這張圖有一些播放的問題,但是可以看到這里面有幾層,首先在中間部分就是不同的應用,下面是不同的DB,在中間有很多灰色是通互相數據傳遞的管道,這個管道是如何進行運作的?管道中間的接口是如何變化的?包含敏感數據是怎么通過A的應用一直傳到應用最后一個,中間流轉的過程是什么樣的?其實是需要一套動態的監控能力來保證這套數據傳輸的過程中對于安全人員是可視或者是可控的。
做完前兩個動作之后做的下一個動作就是有關于數據的流轉過程的實時發現和監控的內容,來保證在業務變化的過程中,發現接口以及敏感數據是如何傳遞的。
在做完這幾個之后,還有一個很重要的點,其實大家也都會做,就是有關數據脫敏。右圖是開發測試、數據、分析、培訓,甚至其他的場景,數據脫敏都是其中非常重要的關系,不管替代也好,屏蔽也好,做唯一的數據的替換也好,還是隨機數據也高,對于日常應用,尤其是大家所在的IT和科技部門在使用的過程中如何保證數據的安全,就提供了一個最后兜底的解決方案,至少不會有敏感的數據進入到開發測試環境、上線的環境,甚至備份的系統里面去,來保證整個數據能夠有效地進行全流程的安全防護。
五、總結
所有的需求是來自于不同的業務場景,剛才我們談到了順豐的不同業務的點,其實這些點是我們選擇方案和制定方案過程中最為重要的部分,同時我們梳理了整個的安全管理的策略,以及在底層進行安全支撐的內容,比如剛才的資產管理、數據管理、追溯管理等功能來支撐中間的部分,就是數據生命周期的管理。其實這里面也是按照整個生命周期的過程分成了幾個部分,比如采集、傳輸、存儲、訪問、使用以及最后的交換共享,通過生命周期的不同步驟,選擇自己企業或者組織的管理能力來保證這張圖能夠有一個有效的落地。
同時,強調一個最重要的點,當做完所有的建設以后,還有一個數據安全的運營和監控的能力。因為所有的安全都是動態變化的,沒有人真的能夠保證自己的安全一定不會出問題,而出問題或者出這樣的攻擊或者風險可能會成為一種常態,這種東西必然出現的時候就要有一個合理的安全運營和監控的能力,包括現在的安全成熟度評估、個人隱私的安全評估以及在這個上面相關的SRC或者SOC的建設,就成為了這件事情能夠日常運營,并且進行有效防范的很重要的點,來保證整個數據安全的落地。
總結剛才說過的話就是,選擇自己企業現在面臨具體的時機和情況,看自己的業務到底風險點在哪里,根據自己的業務,不管是從業務流程的改造、模式的變化,還是在底層數據安全的分析、建設、保護,來實現一個更全面的企業的數據安全的保護,來實現安全能夠助力經營或者保護整個企業未來發展護航的作用。
我們每次都在談現在、眼前,其實未來也已經在我們的腳下,跟今天的主題是一樣的,產業升級,安全也在升維,我希望整個安全的專家以及從業者能夠更多地交流、更多地溝通,把各自的經驗進行相關的分享,共同建設一個更加安全、更加美好的安全的未來。
新時代鞋服物流與供應鏈面臨的變革和挑戰03月07日 20:38
點贊:這個雙11,物流大佬一起做了這件事11月22日 21:43
物流管理機構及政策分布概覽12月04日 14:10
盤點:2017中國零售業十大事件12月12日 13:57
2017年中國零售電商十大熱點事件點評12月28日 09:58