近日,字節(jié)跳動安全團隊對外宣布開源敏感數(shù)據(jù)保護方案GoDLP,該方案能夠應(yīng)用多種隱私合規(guī)標準,對原始數(shù)據(jù)進行分級打標、判斷敏感級別和實施相應(yīng)的脫敏處理。
據(jù)悉,GoDLP 提供了一系列針對敏感數(shù)據(jù)的識別和處置方案, 其中包括敏感數(shù)據(jù)識別算法,數(shù)據(jù)脫敏處理方式,業(yè)務(wù)自定義的配置選項和海量數(shù)據(jù)處理能力。
作為字節(jié)跳動在數(shù)據(jù)脫敏保護方向成功的實踐案例,字節(jié)安全團隊決定用開源的方式向大家分享其研究成果,與行業(yè)一同成長。字節(jié)跳動安全團隊相關(guān)負責人表示,GoDLP會長期維護更新,歡迎行業(yè)人士一起溝通交流。
字節(jié)跳動開源的GoDLP是怎么樣?
GoDLP 能夠廣泛支持結(jié)構(gòu)化(JSON數(shù)據(jù)、KV數(shù)據(jù)、golang map)和非結(jié)構(gòu)化數(shù)據(jù)(多語言字符串)。
● 可實現(xiàn)敏感數(shù)據(jù)自動發(fā)現(xiàn)
GoDLP內(nèi)置多種敏感數(shù)據(jù)識別規(guī)則,可覆蓋市面80%以上識別規(guī)則,最大程度識別敏感數(shù)據(jù)
● 靈活的敏感數(shù)據(jù)脫敏處理
GoDLP支持多種脫敏算法,用戶可自行根據(jù)需求進行脫敏處理
● 業(yè)務(wù)自定義配置選項
除默認的敏感信息識別和處理規(guī)則外,業(yè)務(wù)可根據(jù)實際情況,配置自定義的YAML規(guī)則,GoDLP能夠根據(jù)傳入的配置選項,完成相應(yīng)的數(shù)據(jù)處理任務(wù)。
GoDLP的性能表現(xiàn)
下方數(shù)據(jù)是在開啟全部敏感數(shù)據(jù)類型情況下的結(jié)果
● 針對1K的文件,用時需4.1毫秒,占用128.6k的內(nèi)存
● 1M的文件,用時為4.1s,內(nèi)存占用118.6MB
(測試環(huán)境:8核虛擬機,Linux,amd64,Intel(R)Xeon(R)Platinum8260CPU@2.40GHz;代碼版本:v2.0.0)
GoDLP在字節(jié)的實踐
GoDLP已在字節(jié)跳動進行了豐富的實踐,已接入的業(yè)務(wù)線涵蓋抖音、電商、飛書、火山引擎、云安全、財經(jīng)、教育、游戲等諸多業(yè)務(wù)線。目前,字節(jié)跳動安全團隊已放出GitHub上開源地址(https://github.com/bytedance/godlp)。