AI 心理系统里最常被提到的数据安全动作,是脱敏。很多机构会理解成去掉姓名、手机号和身份证号。
心理数据的风险比普通表格更复杂。开放题原文、班级、部门、岗位、请假信息、家庭事件和时间线,都可能让人被识别出来。
标识信息要先清理
姓名、手机号、学号、工号、身份证号、邮箱、微信号和详细地址属于直接标识信息。导出和分析前,这些字段应先移除或替换。
但只清理直接标识还不够。心理项目里常有年级、班级、部门、岗位、宿舍、项目组和咨询时间,这些字段组合在一起,也可能指向某个人。
脱敏前要先明确使用目的。用于群体趋势分析,就不需要保留个体身份;用于个体服务,材料不能随意脱离专业人员管理。
开放题原文要谨慎处理
开放题是心理数据中最容易暴露个人的信息。学生可能写家庭事件,员工可能写主管冲突,来访者可能写个人经历。
即使删掉姓名,原文里的细节仍可能让熟人识别。机构做汇总分析时,可以改用主题归类、脱敏摘录或人工改写后的摘要。
橙星云这类心理测评系统如果使用 AI 整理开放题,应保留原文和摘要的区别。对外汇报只看主题和趋势,原文留在受控权限内。
小样本群体要合并展示
小样本是脱敏中的常见盲区。一个班级、部门、宿舍或项目组人数很少,即使只显示百分比,也可能被猜出是谁。
对小样本,可以采用合并展示、隐藏展示或延迟展示。比如人数低于某个阈值时,只显示上一级汇总,不展示具体组别。
风险线索、开放题主题和特殊事件更要注意小样本。越敏感的数据,越不能依赖简单匿名。
导出文件也要脱敏
脱敏不能只在系统页面做。报告导出、Excel 表格、会议材料、专家评估包和培训案例都要按照同一规则处理。
导出文件要标注用途、范围和保管人。文件复制后很难完全追踪,所以导出前就要控制字段和内容。
如果材料需要外部专家查看,尽量使用脱敏汇总或抽样材料。需要查看个体材料时,要有明确授权和访问期限。
脱敏后还要复核可识别性
脱敏完成后,应人工检查样本。看是否能通过班级、岗位、时间、事件和文字细节推回个人。
这一步很重要。很多数据表看起来没有姓名,但熟悉组织的人仍能根据上下文识别。
AI摘要也要检查识别风险
AI 生成的摘要有时会保留关键细节。比如家庭结构、岗位冲突、住院经历、转学时间、特殊事件,这些内容即使改写过,也可能让人被识别。
机构在使用 AI 摘要做汇报或培训材料前,应再做一次人工复核。摘要不等于天然脱敏,改写也不等于安全。
对于高敏感内容,可以只保留主题标签和处理建议,把原文和具体细节留在受控档案中。
AI 心理数据脱敏要同时处理直接标识、开放题原文、小样本和导出文件。脱敏的目标,是让数据能支持管理和研究,同时不扩大个人暴露。
