您的文件实际上去哪里了?

当您使用基于云的 PDF 工具时,您的文件会往返。它从您的设备上传到远程服务器,进行处理,然后下载回来。在此期间,您的文档存在于您无法控制的基础设施上。

主要云 PDF 服务每月在其服务器上处理超过 1 亿个文件。 每次上传都会在第三方基础设施上创建文件的副本,即使只是暂时的。

基于浏览器的工具完全跳过该行程。您的文件加载到浏览器的内存中,由设备上运行的 JavaScript 和 WebAssembly 进行处理,然后从本地内存下载结果。没有网络请求携带您的文档数据。除您的计算机外,任何地方都不存在任何副本。

云 PDF 工具的真正隐私风险是什么?

风险不仅仅是“有人可能会看到您的文件”。以下是实际发生的情况:

  • 服务器端文件保留 - 大多数服务声称会在 1-24 小时内删除文件。有些保留的时间更长。您无法验证删除。
  • 员工访问 - 服务器管理员和支持人员可以在技术上访问上传的文件。内部访问控制差异很大。
  • 数据泄露暴露 - 如果服务被黑客攻击,您的文档就会泄露。 2023 年,全球发生超过 2,800 起数据泄露事件,暴露了 82 亿条记录。
  • AI 培训 - 某些服务使用上传的文档来训练机器学习模型。他们的服务条款可能允许这样做。
  • 第三方子处理者 - 云工具通常依赖于 AWS、Google Cloud 或 Azure。您的文件可能会通过多个公司的基础设施。
  • 元数据记录 - 即使文件被删除,文件名、大小、IP 地址和处理类型的日志也会无限期地保留。

GDPR 和 HIPAA:法律是什么说

将客户端文档上传到云PDF工具会在GDPR下创建数据处理事件。这会触发特定的法律要求:

  • A 必须与工具提供商签订数据处理协议 (DPA)
  • 传输必须出现在您的处理活动记录中
  • 跨境传输(欧盟数据到美国服务器)需要标准合同条款
  • 用户有权知道其数据在何处处理

根据HIPAA(美国医疗保健),在没有商业伙伴协议的情况下上传患者文件属于违规行为。 HIPAA 每次事件的罚款从 100 美元到 50,000 美元不等,每年最高罚款可达 150 万美元。

基于浏览器的工具完全消除了这些问题。没有数据离开设备,因此没有数据传输需要调节。

隐私功能比较

隐私功能PDFviz (基于浏览器)云PDF工具
文件离开您设备No
已创建服务器端副本No是(临时)
需要帐号经常yes
记录的IP地址文件
离线工作是(后页负载)No
GDPR数据传输已触发
第三方子处理者1-5家公司
违规暴露风险当前

客户端处理实际上如何工作?

PDFviz 在浏览器中加载两种技术:用于界面和文件处理的 JavaScript,以及用于压缩和加密等繁重 PDF 操作的 WebAssembly (WASM)。 WASM 在浏览器沙箱内以接近本机的速度运行编译后的代码。

当您选择文件时,浏览器会使用文件 API 将其读入本地内存。处理代码对内存中的数据进行操作。结果通过 Blob URL 从本地内存下载。任何时候都没有网络请求携带您的文档。关闭选项卡,垃圾收集器将擦除内存。

敏感文档合规性检查表

  1. 该工具是否将您的文件上传到服务器?如果是,请检查他们的 DPA 和保留策略。
  2. 服务器位于哪里?跨境转账有额外的法律要求。
  3. 该工具需要帐户吗?帐户关联处理会创建活动跟踪。
  4. 您可以离线使用该工具吗?离线功能确认了真正的本地处理。
  5. 提供商是否使用子处理器?每一项都会增加违规风险。
  6. 处理后会发生什么? “24 小时内删除”与“从未上传”不同。

对于敏感 PDF - 合同、医疗表格、纳税申报表、HR 文档 - 基于浏览器的工具是最安全的选择。 压缩merge加密,或在不离开设备的情况下进行转换。