(19)中华人民共和国国家知识产权局
(12)发明专利说明书 | ||
(10)申请公布号 CN 109726585 A (43)申请公布日 2019.05.07 | ||
(21)申请号 CN201811532422.8
(22)申请日 2018.12.14
(71)申请人 银江股份有限公司
地址 310023 浙江省杭州市益乐路223号1幢1层
(72)发明人 张名民 李建元 于海龙 秦俊峰 张江鑫 王超
(74)专利代理机构 杭州之江专利事务所(普通合伙)
代理人 张慧英
(51)Int.CI
权利要求说明书 说明书 幅图 |
(54)发明名称
(57)摘要
本发明涉及一种面向身份证号码的集成数据脱敏系统及方法,主要包括:(1)收集待脱敏身份证号码;(2)采用脱敏方法对待脱敏身份证号码进行脱敏处理,获得一级脱敏身份证号码。另外,还可根据实际需要进一步地进行脱敏操作获取二级脱敏身份证号码。本发明的脱敏结果都很好的保留了地域信息、年龄信息、性别信息等,具有很好的分析价值;本发明采用一种多策略的混合脱敏、扩展脱敏等方式来满足不同场景的脱敏需求,可以在亿万级别的数据量下,保证脱敏结果的一致性,同时满足不同需求的身份证脱敏场景。 | |
法律状态
法律状态公告日 | 法律状态信息 | 法律状态 |
2021-12-03 | 专利权人的姓名或者名称、地址的变更 | 专利权人的姓名或者名称、地址的变更 |
2020-08-04 | 授权 | 授权 |
2019-05-31 | 实质审查的生效 | 实质审查的生效 |
2019-05-07 | 公开 | 公开 |
权 利 要 求 说 明 书
1.一种面向身份证号码的集成数据脱敏方法,其特征在于包括如下步骤:
(1)收集待脱敏身份证号码;
(2)采用脱敏方法I对待脱敏身份证号码进行脱敏处理;所述的脱敏方法I为将待脱敏身份证号码进行分割,取得行政区域代码、出生日期代码以及顺序码,根据行政区域代码设置参数;将行政区域代码与参数相乘、取余后查行政区域代码表,获得脱敏后的行政区域代码;将出生日期代码与参数相乘、取余后将原出生日期根据结果左右摇摆,得到脱敏后的出生日期代码;顺序码不作处理,最后一位校验码根据脱敏后的行政区域代码、脱敏后的出生日期代码、顺序码自动生成,获得一级脱敏身份证号码。
2.一种面向身份证号码的集成数据脱敏方法,其特征在于包括如下步骤:
(1)收集待脱敏身份证号码;
(2)采用脱敏方法II对待脱敏身份证号码进行脱敏处理,具体如下:
(a)将待脱敏身份证号码进行分割,取得行政区域代码、出生日期代码以及顺序码,根据行政区域代码设置参数;将行政区域代码与参数相乘、取余后查行政区域代码表,获得脱敏后的行政区域代码;将出生日期代码与参数相乘、取余后将原出生日期根据结果左右摇摆,得到
脱敏后的出生日期代码;顺序码不作处理,最后一位校验码根据脱敏后的行政区域代码、脱敏后的出生日期代码、顺序码自动生成,获得一级脱敏身份证号码;
(b)取一级脱敏身份证号码和待脱敏身份证号码,号码运算取余后查混淆码对照表获得混淆码,进行二级脱敏,获得最终脱敏后的身份证号码,其中,所述的号码运算采用以下一种或多种方式:
相加;相乘;加设定值;
其中,所述的二级脱敏采用以下任意一种或多种方式:
将混淆码替换一级脱敏身份证号码;
将混淆码添加到一级脱敏身份证号码;
将待脱敏身份证号码的部分号码替换一级脱敏身份证号码;
将待脱敏身份证号码的部分号码添加到一级脱敏身份证号码。
3.根据权利要求2所述的一种面向身份证号码的集成数据脱敏方法,其特征在于:所述步骤(b)具体如下:
(b.1)取待脱敏的身份证号码的前17位之和S<Sub>1~17</Sub>,根据如下算法获得余数Remainder,再根据Remainder查混淆码对照表I获取混淆码;
Remainder=S<Sub>1~17</Sub>mod36
其中,混淆码对照表I具体为:余数为0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35对应的混淆码分别为Z、A、Q、X、S、W、C、D、E、V、F、R、B、G、T、N、H、Y、M、J、U、0、1、2、3、4、5、6、7、8、9、I、O、P、K、L;
(b.2)将一级脱敏身份证号码的第15位置换为所获得的混淆码,将一级脱敏身份证号码的第16位置换为待脱敏身份证号码的第18位校验码,获得最终脱敏后的身份证号码。
4.根据权利要求2所述的一种面向身份证号码的集成数据脱敏方法,其特征在于:所述步骤(b)具体还可如下:
(b.1)取待脱敏身份证号码的第1-6位之和S<Sub>1~6</Sub>、第7-14位之和S<Sub>7~14</Sub>;根据如下算法获得余数Remainder1、Remainder2,根据Remainder1、Remainder2查混淆码对照表I获取混淆码:
Remainder1=S<Sub>1~6</Sub>mod36
Remainder2=S<Sub>7~14</Sub>mod36
其中,混淆码对照表I具体为:余数为0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35对应的混淆码分别为Z、A、Q、X、S、W、C、D、E、V、F、R、B、G、T、N、H、Y、M、J、U、0、1、2、3、4、5、6、7、8、9、I、O、P、K、L;
(b.2)将一级脱敏身份证号码的后面追加所获得的2位混淆码,再在混淆码面追加一位待脱敏身份证号码的校验码,获得最终脱敏后的身份证号码。
5.根据权利要求2所述的一种面向身份证号码的集成数据脱敏方法,其特征在于:所述步骤(b)具体还可如下:
(b.1)取待脱敏的身份证号码的第1-6位之和S<Sub>1~6</Sub>、第7-14位之和S<Sub>7~14</Sub>,计算时若遇到某一位为0时则加10;根据如下算法计算获得余数Remainder1、Remainder2,再根据Remainder1、Remainder2查混淆码对照表I获取混淆码:
Remainder1=S<Sub>1~6</Sub>mod36
发布评论