數(shù)據(jù)分析是常見的挖掘數(shù)據(jù)價值的手段,數(shù)據(jù)分析場景根據(jù)使用數(shù)據(jù)的方式一般可分為離線數(shù)據(jù)分析和在線數(shù)據(jù)分析兩種類型。離線數(shù)據(jù)分析需要將生產(chǎn)數(shù)據(jù)導出并共享至第三方環(huán)境,在線數(shù)據(jù)分析需要直接連接生產(chǎn)環(huán)境的數(shù)據(jù)。如果不對分析數(shù)據(jù)中使用的敏感數(shù)據(jù)加以管控,無論哪種數(shù)據(jù)分析類型都容易造成敏感數(shù)據(jù)泄漏。例如在離線數(shù)據(jù)分析中,如果包含大量真實的敏感數(shù)據(jù),能夠接觸到這些數(shù)據(jù)的人員,就可以通過拷貝、復制、導出等手段將敏感信息泄露;同樣在線數(shù)據(jù)分析場景中,數(shù)據(jù)分析過程直接訪問生產(chǎn)數(shù)據(jù)進行分析統(tǒng)計,分析人員可以隨意查詢重要未經(jīng)處理的敏感數(shù)據(jù),也可以通過復制、導出、拍照等手段將敏感信息泄露。
離線數(shù)據(jù)分析場景下,采用靜態(tài)數(shù)據(jù)脫敏技術(shù)實現(xiàn)數(shù)據(jù)掩碼,對離開生產(chǎn)環(huán)境的敏感數(shù)據(jù)進行脫敏處理。這種情況下,為了保障分析數(shù)據(jù)可用,需要將特定數(shù)據(jù)保留其格式和特性。例如一些數(shù)據(jù)分析場景中需要分析用戶的地域特性,在只需要知道用戶的所在省份情況下,這種情況在脫敏中只需要保留用戶地址信息中的省份信息,同時為了避免用戶地址信息泄露,可以對省份后面的具體地址信息進行遮蔽或者替換處理。
在線數(shù)據(jù)分析場景下,可以采用動態(tài)脫敏技術(shù),對實時返回的生產(chǎn)數(shù)據(jù)中的敏感信息進行掩碼處理。這種情況下,即要保證分析數(shù)據(jù)可用,又不能對生產(chǎn)數(shù)據(jù)造成影響。安華金和動態(tài)數(shù)據(jù)脫敏技術(shù)基于“語句改寫”技術(shù)路線,能夠?qū)崿F(xiàn)高性能、高擴展性的動態(tài)數(shù)據(jù)屏蔽和脫敏。其技術(shù)原理是在數(shù)據(jù)庫通訊協(xié)議層面,通過SQL代理技術(shù),實現(xiàn)完全透明的、實時的敏感數(shù)據(jù)掩碼;在不需要對生產(chǎn)數(shù)據(jù)庫中的數(shù)據(jù)進行任何改變的情況下,依據(jù)不同的分析模塊和其他定義規(guī)則,動態(tài)的對生產(chǎn)數(shù)據(jù)庫返回的數(shù)據(jù)進行專門的屏蔽、加密、隱藏和審計,確保數(shù)據(jù)分析訪問生產(chǎn)環(huán)境的敏感數(shù)據(jù)安全。