发布日期:2026-06-11 浏览次数:2
"这个Excel表格里有138个客户的手机号码,发到群里让大家核对一下——记得先脱敏再发。"
如果你在工作中处理过包含个人信息的表格,你大概率听到过类似的叮嘱。但"脱敏"具体怎么做?手工一个一个改,138个号码改到第50个就眼花缭乱了。在网上找一个脱敏工具,但把客户数据上传到第三方网站,本身就是一个安全风险。想用Excel公式自己处理,但REPLACE、MID、SUBSTITUTE这些函数到底怎么组合才能把"13812345678"变成"138****5678"?
手机号码是个人信息保护中最敏感的数据之一。《个人信息保护法》明确规定,处理个人信息时应采取"去标识化"措施,降低敏感度。在职场中,如果你需要将包含手机号的数据表发送给同事、客户或第三方时,必须对手机号进行脱敏处理——即"部分隐藏"而非完全删除。既保留必要的信息识别能力(如通过后4位确认是谁的号码),又防止完整号码被泄露。
本文将从WPS表格的实际操作出发,系统讲解手机号码脱敏的多种函数方案、批量处理技巧、自动化模板设计,以及企业数据脱敏管理的合规实践。
数据脱敏(Data Masking),是指在保留数据格式和部分可辨识特征的前提下,对敏感信息进行"变形"处理,使其在非授权环境中无法还原为原始信息。
对于手机号码来说,最常见的脱敏方式是"中间隐藏":保留前3位(运营商号段)和后4位(用户识别),中间4位替换为星号"*"。13812345678 → 138****5678
为什么要保留前3位和后4位?
《中华人民共和国个人信息保护法》第六条规定:处理个人信息应当具有明确、合理的目的,并应当与处理目的直接相关,采取对个人权益影响最小的方式。
在实操层面,这意味着:
| 级别 | 处理方式 | 示例 | 适用场景 |
|---|---|---|---|
| 完全隐藏 | 全部替换为* | *********** | 测试数据、演示数据 |
| 部分隐藏 | 保留前后若干位 | 138****5678 | 内部核对、统计分析 |
| 完全保留 | 不做任何处理 | 13812345678 | 业务操作必需(如发短信) |
多数场景下,"部分隐藏"是最实用、最平衡的选择。
REPLACE函数是将字符串中指定位置的字符替换为新字符,非常适合"中间隐藏"手机号:
语法:
手机号脱敏公式:
解释: 从A1单元格的手机号第4位开始,替换4个字符为"****"。
13812345678 → 138****5678
这是一个典型的手机号脱敏结果:前3位保留、中间4位隐藏、后4位保留。REPLACE的优点是简单直接,一行公式解决问题,不需要复杂的字符串拼接。
但需要注意: 这个公式要求手机号必须为11位且统一格式。如果手机号中包含分隔符(如"138-1234-5678"),则需要先用SUBSTITUTE函数去除分隔符后再脱敏。
如果你需要更灵活地控制脱敏后的格式,可以使用MID函数提取字符串的指定部分,然后用CONCATENATE或"&"符号拼接:
公式:
MID(A1, 1, 3):提取前3位。& "****":拼接隐藏符号。MID(A1, 8, 4):提取第8到第11位(后4位)。优点: 可以在拼接过程中加入更多的格式控制(如添加空格、括号等)。
扩展: 如果需要在脱敏后的手机号中添加格式美化:
如果你更习惯使用LEFT和RIGHT函数来分别提取前几位和后几位:
LEFT(A1,3)提取左边3位,RIGHT(A1,4)提取右边4位。结果同样是138****5678。
三种方法中,REPLACE最简洁,MID+CONCATENATE最灵活,LEFT+RIGHT最直观。选择哪一种取决于你的个人习惯。
有些企业内部要求手机号码只保留前3位和最后2位:
结果:138******78
保留了更多隐藏位,安全级别更高,但后2位的识别能力较弱(需要更多其他信息才能确认识别)。
有些场景下需要保留前4位(含运营商号段)来识别来源:
结果:1381***5678
前4位保留、中间3位隐藏、后4位保留。
如果需要更复杂的分段隐藏(如"前3位→隐藏4位→后4位"),使用MID拼接法更容易控制:
座机号的长度不统一(如"0755-12345678"或"010-12345678"),无法用固定11位的公式处理。
思路: 先确定分隔符"-"的位置,隐藏分隔符后的中间几位,保留最后4位。
可以使用FIND函数找到"-"的位置,再结合MID和REPLACE进行处理:
但这个公式需要根据座机号的具体格式进行微调。最简单的方法:将座机号单独处理,不与手机号混用同一个公式。
当你写好一行脱敏公式后,需要将公式应用到整列:
=REPLACE(A2, 4, 4, "****")。注意: 如果手机号列中有空行或非手机号的文字,填充的公式也会应用到这些单元格上。建议只选择有数据的区域进行填充。
如果确认脱敏后的数据不再需要恢复为原始号码(如用于导出给第三方的统计报表),可以直接在原列上操作:
这样操作后,A列中存储的是脱敏后的文本("138****5678"),不再包含原始号码。
如果只是"临时看一下"脱敏后的效果,可以尝试使用查找替换:
????(4个问号,代表4个任意字符)。****。局限性: 查找替换的"?"只能匹配"单个字符",但手机号中的所有字符是连续的,无法精确定位到"从第4位开始的4位",因此会匹配前4位、中间4位、后4位中任意连续的4位——结果不可控。
结论: 查找替换更适合"掩码"式的整体隐藏,不适合精确的"前3位+后4位"的脱敏。推荐使用函数法。
在开始脱敏之前,先回答这个问题:脱敏后的数据还需要还原吗?
REPLACE函数替换后存储为文本(如"138****5678"),一旦粘贴为数值后,无法还原为原始号码。因此:
如果既需要脱敏后的版本用于分发,也需要保留脱敏前的完整版本用于业务操作,建议:
重要提醒: 在分发Sheet2文件时,请务必删除Sheet1或将Sheet2另存为副本("文件"→"另存为"→选择新的文件,并在新文件中只保留脱敏后的数据Sheet)。
在脱敏处理完成后,可以对工作表和单元格进行保护,防止其他用户修改或查看原始数据:
如果脱敏后需要保留原始数据列但不想让其他人看到:
如果整个表格包含大量敏感信息(如客户名单+手机号+地址),建议对工作簿文件本身进行加密:
WPS表格支持"信息权限管理"(IRM),可以对表格设置"只读""禁止打印""禁止复制"等权限。在企业环境下,结合企业版WPS,可以实现更精细的权限控制——指定哪些人可以查看完整数据、哪些人只能查看脱敏后的数据。
实际数据中,手机号可能出现"138 1234 5678""138-1234-5678""138.1234.5678"等格式。如果直接使用公式,REPLACE函数的起始位置定位会出错,因为空格和分隔符也被计入了字符位置。
解决方案: 先使用SUBSTITUTE函数去除空格和分隔符,再脱敏:
这个公式先去除了空格和"-",再进行脱敏处理。
如果WPS表格中的手机号显示为科学计数法(如1.38123E+10),或者公式无法正确处理手机号,说明手机号被存储为了"数值"格式而非"文本"格式。
解决方案:
=TEXT(A1, "00000000000")。将手机号转换为11位文本,再进行脱敏。REPLACE函数返回的是文本结果,但在某些单元格格式设置下可能显示为数值或科学计数法。
解决方案: 在公式外套一个TEXT函数,或设置单元格格式为"文本":
脱敏后的数据在导出为CSV或其他列格式时,应注意保留文本格式,避免导出后手机号显示为科学计数法或丢失前导零。建议在导出前将脱敏列全部"粘贴为数值",然后另存为Excel格式(.xlsx),而非CSV格式。
企业内部应对以下场景明确要求数据脱敏:
企业应建立统一的数据脱敏规范,包括:
对于需要定期处理大量数据的团队,可以将脱敏流程模板化:
工具层面的脱敏只是基础,真正有效的是团队整体的隐私保护意识:
WPS表格中一个简单的REPLACE公式,背后所承载的是对个人信息保护的重视和责任。=REPLACE(A1, 4, 4, "****") 不只是一个字符串处理函数——它是你作为数据管理者在"便利"和"安全"之间找到的平衡点:保留必要的识别能力,同时避免完整信息的泄露。
数据脱敏不是一道"选择题",而是《个人信息保护法》实施后的"必答题"。学会在WPS表格中快速、准确地对手机号码进行脱敏处理,不仅是一项技术技能,更是每一位数据处理者应有的基本素养。
掌握本文的方法后,下次有人对你说"把这张表脱敏再发",你可以在30秒内完成操作——而不是花30分钟去网上找脱敏工具,或者花一上午手工逐个修改。
没有相关标签