大家是怎么解决手机号、身份证号这类数据的加密存储

针对手机号、身份证号等敏感数据的加密存储，需结合法规要求（如《个人信息保护法》《GDPR》）和技术方案，确保数据“可用不可见”。以下是系统化的解决思路和实践方法：

一、加密核心原则

最小化存储：仅存储必要的敏感数据，避免冗余（如身份证号仅在实名认证时存储，且完成后可考虑哈希处理）。
分层防护：传输加密（HTTPS）+ 存储加密（字段级/数据库级）+ 访问控制（权限管理）。
可逆性与不可逆性结合：

可逆加密（需解密场景，如实名认证）：用于需要恢复原始数据的业务（如客服验证）。
不可逆哈希（无需恢复场景，如登录校验）：用于密码、设备指纹等仅需验证的数据。

二、具体加密方案

1. 字段级加密（细粒度防护）

针对单个敏感字段（如手机号、身份证号）在写入数据库前加密，读取时解密，是最常用的方案。

加密算法选择：

对称加密（AES-256、DES）：速度快，适合高频读写，需配合密钥管理系统（KMS）存储密钥。

# Python示例：AES加密手机号
from cryptography.hazmat.primitives.ciphers import Cipher, algorithms, modes
from cryptography.hazmat.backends import default_backend
import base64

key = b'0123456789abcdef0123456789abcdef'  # 256位密钥，通过KMS获取
iv = b'0123456789abcdef'  # 128位IV，每次加密随机生成更佳

cipher = Cipher(algorithms.AES(key), modes.CBC(iv), backend=default_backend())
encryptor = cipher.encryptor()
plaintext = b'13812345678'
ciphertext = encryptor.update(plaintext) + encryptor.finalize()
encrypted_data = base64.b64encode(ciphertext).decode()  # 存储到数据库

非对称加密（RSA）：用于加密对称密钥（避免密钥明文传输），不直接加密长数据（效率低）。
令牌化（Tokenization）：用无意义的令牌（如UUID）替代敏感数据，令牌与原始数据的映射存储在独立的安全库中，适合支付、金融场景（如PCI-DSS合规）。
注意事项：
初始化向量（IV）：每次加密使用随机IV，避免相同明文生成相同密文（防止模式攻击）。
填充方式：使用PKCS7等标准填充，确保数据块长度符合算法要求。

2. 数据库级加密（整体防护）

对数据库或表进行整体加密，适合对安全性要求极高但无需细粒度控制的场景。

透明数据加密（TDE）：
MySQL/TiDB：支持TDE，加密存储引擎层数据文件（如InnoDB的表空间）。
PostgreSQL：通过pgtcrypto扩展实现列级加密，或使用Citus插件支持分布式加密。
优势：对应用透明，无需修改业务代码；缺点：无法针对单个字段加密，密钥管理依赖数据库自身。
全磁盘加密：云服务商（如AWS EBS、阿里云磁盘）提供的底层存储加密，防止物理层面数据泄露，但不影响数据库层访问。

3. 哈希处理（不可逆场景）

适用于无需恢复原始数据的场景（如用户注册时的手机号唯一性校验），需结合盐值（Salt）增强安全性。

# Python示例：SHA-256哈希+盐值处理身份证号
import hashlib
import os

salt = os.urandom(16)  # 随机盐值，长度16字节以上
plaintext = b'110101199001011234'
hash_value = hashlib.pbkdf2_hmac('sha256', plaintext, salt, 100000)
stored_hash = salt.hex() + hash_value.hex()  # 存储盐值+哈希值

注意：哈希不可逆，无法解密还原，需提前确认业务是否允许（如找回密码时是否需要原始手机号）。

三、密钥管理体系

密钥生成与存储：

禁止硬编码密钥到代码或配置文件中，使用 密钥管理服务（KMS）：
- 云厂商：AWS KMS、阿里云KMS、腾讯云CMK（支持密钥轮换、操作审计）。
- 开源方案：HashiCorp Vault（支持多环境密钥隔离，API驱动）。

密钥生命周期：

定期轮换密钥（如3个月一次），旧密钥加密的数据需批量解密后用新密钥重新加密。
密钥访问需审批，记录操作日志（谁在何时何地使用了哪个密钥）。

四、访问控制与合规

权限最小化：

数据库账户仅赋予必要的读写权限（如应用服务器账户只能访问特定表的加密字段）。
业务层通过RBAC（角色权限控制）限制敏感数据访问（如仅管理员可解密身份证号）。

审计与日志：

记录敏感数据的访问行为（如谁查询了身份证号，操作时间、IP地址）。
符合等保三级、ISO 27001等合规要求，定期进行渗透测试和数据安全审计。

脱敏处理：

开发/测试环境使用脱敏数据（如将手机号显示为138****5678），避免敏感数据泄露。
使用工具：SQL脱敏工具（如Sqitch）、代码层面脱敏函数（返回数据时隐藏部分字符）。

五、性能优化与实践建议

避免加密字段直接查询：

若需根据加密字段查询（如通过手机号搜索用户），可：
- 对加密后的数据建立索引（需确保加密方式支持固定长度，如AES-CBC）。
- 使用“部分加密”（如仅加密身份证号中间8位，保留前6位用于区域查询，但需评估合规风险）。

缓存解密后数据：

对高频访问的敏感数据（如用户中心的手机号），在应用层缓存解密结果（设置短有效期），减少重复解密损耗。

优先应用层加密：

数据库层加密可能影响性能，建议在应用层（如Java的JCE、Python的cryptography库）完成加解密，数据库仅存储密文。

六、典型场景方案对比

| 场景 | 推荐方案 | 技术要点 | 合规性 |

|------------------------|-------------------------------------|---------------------------------------------|-------------------------|

总结

敏感数据加密存储的核心是 “分层防护、按需选择、合规优先”：

业务层面：明确哪些数据需要加密、是否可逆、访问频率等需求。
技术层面：字段级加密（AES等）解决细粒度问题，KMS管理密钥安全，哈希/令牌化处理不可逆场景。
管理层面：建立密钥生命周期管理、权限审计、脱敏机制，确保合规性。

通过上述方案，可在数据安全性、可用性、性能之间找到平衡，同时满足法律法规要求。