名单导入前先去重，后面会省掉很多解释成本

心理测评项目里，名单去重越早做越值钱。等结果出来再清洗，往往已经不只是数据问题了。

很多团队做批量施测时，先把名单导进系统再说，觉得重复数据后面总能清。这个习惯在普通问卷里问题还不算特别大，到了心理测评场景，代价会高很多。因为名单一旦带着重复对象进入批次，后面不只会多出几条记录，还会把完成率、复测链路、报告归属和回访顺序一起搅乱。

更麻烦的是，很多重复不是导入那一刻就能一眼看出来。姓名略有差别、工号旧新并存、手机号更新、班级或部门信息变动，这些都可能让同一个对象以两个身份进入系统。等结果已经生成，再回头合并，就不是清理表格那么简单了。

先把重复挡在导入前，系统后面才有稳定对象可追

真正稳的做法，通常是在导入前就做对象匹配和规则校验：哪些字段是唯一键，哪些字段只能作为辅助判断，重复对象发现后是合并、覆盖还是人工确认。这一步看起来花时间，实际上是在给后面的历史记录、复测结果和心理档案打基础。

像对象 ID 为什么比姓名更值得先设计，说的就是这个道理。没有稳定对象识别，去重就只能一直在表层打补丁。名单导入前先去重，真正省下来的不是清洗动作，而是后面每一次解释“为什么同一个人有两份结果”的成本。

尤其当名单来自多个来源时，这一步更不能省。招生表、学籍表、人事表、历史项目名单如果直接混导，系统最好能先给出冲突清单和比对依据，让操作者在导入前就把最明显的问题处理掉，而不是等报告已经跑出来再回头补救。

如果系统还能把合并前后的来源关系一起存下来，后面有人追问“这条记录原来从哪来”，管理员也能说得清。去重做得越早，后面越不容易在历史链路上反复返工。

对采购心理测评系统的人来说，这也是很实用的验收点：系统能不能在导入前识别重复对象、给出冲突提示，并保留合并记录。项目一大，越早做去重，后面的数据越能站得住。