人工智能、大數(shù)據(jù)、云計算、物聯(lián)網(wǎng)、移動互聯(lián)等為代表的新一輪信息技術,帶動信息技術快速向前發(fā)展,創(chuàng)新型應該用不斷出現(xiàn)和普及,各類組織機構(gòu)都在被信息技術帶動著向前發(fā)展,驅(qū)動組織機構(gòu)不斷提升信息化程度。來自業(yè)務端的系統(tǒng)開發(fā)需求大量劇增,這對于開發(fā)測試所需的數(shù)據(jù)質(zhì)量提出更嚴格的要求,但另一方面,生產(chǎn)數(shù)據(jù)用于開發(fā)測試將加劇敏感數(shù)據(jù)泄露的安全風險。國家及行業(yè)監(jiān)管機構(gòu)對于數(shù)據(jù)安全提出明確要求:用于開發(fā)測試的生產(chǎn)數(shù)據(jù)必須經(jīng)過脫敏處理。這就帶來了一系列的問題:
1、開發(fā)測試環(huán)境中是否使用生產(chǎn)數(shù)據(jù)?
2、其中的敏感數(shù)據(jù)是否有人在使用?誰在用?
3、這些敏感數(shù)據(jù)脫敏了嗎?
4、面對行業(yè)監(jiān)管,如何證明生產(chǎn)數(shù)據(jù)使用的合規(guī)性?
5、敏感數(shù)據(jù)的管理有效嗎?是否可以持續(xù)開展?
6、敏感數(shù)據(jù)管理與開發(fā)測試工作是否有沖突?如何解決?
通過靜態(tài)數(shù)據(jù)梳理技術自動發(fā)現(xiàn)開發(fā)測試環(huán)境中的敏感數(shù)據(jù)并實現(xiàn)清單化管理,包括:數(shù)據(jù)庫分布在哪些IP網(wǎng)段、數(shù)據(jù)庫類型、實例信息、表結(jié)構(gòu)信息、源數(shù)據(jù)信息等。
通過動態(tài)梳理技術,對數(shù)據(jù)庫訪問流量進行解析,獲取數(shù)據(jù)庫訪問源、訪問對象、訪問行為及返回值,從而獲知是否有開發(fā)測試賬戶使用了敏感數(shù)據(jù),哪些用戶或系統(tǒng)在使用哪些敏感數(shù)據(jù),是怎樣的使用的。
將數(shù)據(jù)脫敏流程分解為敏感數(shù)據(jù)發(fā)現(xiàn)、敏感數(shù)據(jù)梳理、脫敏方案制定、脫敏任務執(zhí)行四大步驟,結(jié)合完善的敏感數(shù)據(jù)字典管理、數(shù)據(jù)發(fā)現(xiàn)算法管理、脫敏算法管理模塊,實現(xiàn)全面的敏感數(shù)據(jù)管理。
脫敏數(shù)據(jù)的高度仿真和關聯(lián)關系保留,才能保證開發(fā)出的系統(tǒng)與現(xiàn)有系統(tǒng)的兼容性。所以需要保證脫敏后的數(shù)據(jù)能夠準確反應原始數(shù)據(jù)的業(yè)務屬性和數(shù)據(jù)分布特征,脫敏后的數(shù)據(jù)滿足業(yè)務系統(tǒng)的數(shù)據(jù)關系特征,保留原有的數(shù)據(jù)關系,例如身份證號在多個表中出現(xiàn),需要保證脫敏后也是一樣的,時間等序列關系的數(shù)據(jù),需保證脫敏后仍然能夠保持原有的時間序列。