Хранили все вместе, но использовали маскирование для общего пользования. Только круг лиц, специально определенный имел доступ. Был отдельный проект по зачистки этих данных и полному обезличиванию. Не знаю насколько правильно, но юристов вроде устроил
2025-06-27 08:33:17
Привет! Физически не тащим PII в хранилище, хотя в теории в сырой слой (куда доступ ограничен ETL сервисными аккаунтами и дата-инженерами) можно.
PII лежат в СУБД-источниках, для отдельных задач, где требуется заджойнить PII с данными хранилища - используем Trino.
В хранилище PII поля, если грузятся, то маскированные/хэшированные (второй вариант обычно лучше, т.к. сохраняет уникальность отдельных PII значений).
2025-06-27 08:54:48
Если без уточнений по отраслевым требованиям, то можно хранить всё вместе, главное соблюсти все требования по трансграничной передаче. Если с уточнениями - то надо изучать конкретные регуляции.
2025-06-27 09:20:14