最后,进行信息提取。相关信息(例如名称、日期、金额或其他特定信息)以结构化格式进行识别和存储 - 如下图所示:
图2:信息提取示例
如何利用文档理解?
文档理解可以通过 UiPath 等工具集成到机器人流程自动化 (RPA) 中。因此,以严格基于规则的方式运行的软件机器人得到了扩展,包括智能决策选项。软件机器人本身会生成用于做出决策的数据库,例如,软件机器人可用于处理客户电子邮件(见图 3)。客户发送一封电子邮件,其中包含 PDF 格式的健康保险申请扫描件。机器人处理电子邮件并将 PDF 文件保存在指定文件夹中。如果没有文档理解,此时就必须有人介入来读取文件、理解文件并将相关数据传输到适当的软件。由于对文档的理解,机器人现在可 寻求商机的电子邮件列表 以承担这项任务。它将扫描的 PDF 文档数字化,将其分类为申请表并提取文本。然后从文本中提取并保存客户数据,例如姓名、保险开始时间和保险类型。提交申请后,现在可以派一名员工来检查该申请。下面,可以告诉员工该申请是否合理以及哪里存在歧义。
图 3:软件机器人处理客户电子邮件
什么会改变文档理解?
当今的许多业务流程仍然严重基于文档。这些文件通常只能以模拟形式提供,并且必须费力地手工输入并输入到现有系统中。人类并不是为这些活动而设计的:我们常常既不喜欢这些活动,也不会长时间集中、无差错地从事这些活动。通过文档理解,基于文档的流程将在未来实现“端到端”自动化,因此仅在特殊情况下才需要人工干预。
对于员工来说,这意味着未来他们将能够利用工作时间进行创造性、沟通性或复杂的任务,而不是进行愚蠢的艰苦工作。对于机器人过程自动化来说,这意味着机器人正在从基于规则的行为演变为智能决策。文档理解与 RPA 相结合将扩大可自动化流程的范围。这有助于实现 RPA 自动化大批量重复流程的目标。总体而言,文档理解将在管理信息过载和帮助公司做出明智决策方面发挥关键作用。这是朝着更智能的信息处理迈出的令人兴奋的一步,将永久改变公司的工作方式。我们可以通过使用软件来越来越多地支持我们自己的健康。从膝盖锻炼(例如同伴髌骨)到戒烟(例如不吸烟英雄)到抑郁症治疗(例如伊洛娜疗法)——市场上已经有许多网络应用程序和应用程序。如果制造商打算将软件用于治疗或诊断目的,那么它在法律上就是医疗产品。因此,制造商必须遵守所有适用的法律以及各种标准的所有要求。
与许多 Web 应用程序和应用程序一样,大量数据通常作为内容提供、记录和评估。由于高可用性和易于扩展性,许多医疗设备制造商依赖外部提供商来存储和处理这些数据。除了超大规模提供商(包括拥有 AWS 的亚马逊、拥有 Azure 的微软和拥有云平台的谷歌)之外,市场上还可以找到拥有医疗云的 Telekom 等欧洲提供商。