安全性较低,因为 Power BI 中也必须保护个人数据
Posted: Mon Feb 10, 2025 4:58 am
缺点
成本更高,因为 Power BI 需要更大的容量(Premium)
由于必须在多个地方实现功能,因此 效率降低
更容易出错,因为 Power BI 导入需要安排和监控
GDPR 解决方案的实施
当我们处理个人数据(PII = 个人身份信息)时,我们必须在数据平台采取措施,确保只有具有正确权限的员工才能读取这些个人数据:人力资源员工可以在报告中看到完整的邮政编码,但营销员工只能看到前四位数字。 Inergy 基于 Snowflake 数据平台 墨西哥电报数据 开发的 GDPR 解决方案提供了执行此操作的功能,即使在大型数据集上也是如此。
在 Power BI 中使用导入存储模式时,数据必须存储在带有和不带有 PII 的 Power BI 数据集中,并且 Power BI 会保护谁可以查看哪些数据。这会导致双重存储、更高的消耗以及多个地点的管理和维护。
直接查询作为替代方案
另一种选择是“DirectQuery”模式。数据不会导入 Power BI,但查询会直接从 Power BI 转发到 Snowflake。在本研究的背景下,这种存储模式的一个重要优势是,Snowflake 中实施的 GDPR 解决方案被 Power BI 利用。
因为用户在使用报告时已经登录,所以他们的用户名会传递给 Snowflake,Snowflake 可以确定是否应该以匿名形式返回数据。这是一个优雅、高效的管理和存储解决方案。
成本更高,因为 Power BI 需要更大的容量(Premium)
由于必须在多个地方实现功能,因此 效率降低
更容易出错,因为 Power BI 导入需要安排和监控
GDPR 解决方案的实施
当我们处理个人数据(PII = 个人身份信息)时,我们必须在数据平台采取措施,确保只有具有正确权限的员工才能读取这些个人数据:人力资源员工可以在报告中看到完整的邮政编码,但营销员工只能看到前四位数字。 Inergy 基于 Snowflake 数据平台 墨西哥电报数据 开发的 GDPR 解决方案提供了执行此操作的功能,即使在大型数据集上也是如此。
在 Power BI 中使用导入存储模式时,数据必须存储在带有和不带有 PII 的 Power BI 数据集中,并且 Power BI 会保护谁可以查看哪些数据。这会导致双重存储、更高的消耗以及多个地点的管理和维护。
直接查询作为替代方案
另一种选择是“DirectQuery”模式。数据不会导入 Power BI,但查询会直接从 Power BI 转发到 Snowflake。在本研究的背景下,这种存储模式的一个重要优势是,Snowflake 中实施的 GDPR 解决方案被 Power BI 利用。
因为用户在使用报告时已经登录,所以他们的用户名会传递给 Snowflake,Snowflake 可以确定是否应该以匿名形式返回数据。这是一个优雅、高效的管理和存储解决方案。