混合 IT 环境
根据最近的一份云状态报告,多云和混合云在云模型的选择中占据主导地位,平均每个企业使用 2.6 个公共云和 2.7 个私有云。
将公有云和私有云与本地 IT 集成以创建统一、灵活和分布式计算环境具有多种优势。它允许公司有选择地投资于最能满足技术和战略重点的最佳云和本地功能。它使他们能够微调工作负载分配,以确保每个工作负载都有最佳的计算资源。
混合模式有望提供更大的灵活性和敏捷性,以快速适应不断变化的业务条件。对于数据敏感的行业和应用(例如基因组学研究),混合云可能是利用云采用优势同时遵守数据驻留和主权法规的最佳框架。
混合模型还可能带来一些数据管理挑战,尤其是对于基因组学和生物信息学等大数据实践而言。例如,在分布式混合环境中存储和共享数据的简单任务可能会对数据可用性和冗余、应用程序性能、数据安全性和云计算成本产生不利影响。
然而,混合云和多云环境已经演变成分布式云模型,从定义上讲,该模型强调了物理位置在混合云交付服务中的相关性。例如,分布式模型现在 玻利维亚手机数据 使具有严格数据驻留要求和敏感工作负载的企业能够通过一组一致的 API 访问公共云服务来扩展其内部部署功能。
随着混合云对于大多数企业来说已成为必然,无缝互操作性的需求变得前所未有的迫切。
然而,混合云架构往往会随着时间的推移变得更加复杂,从而降低可见性和互操作性。确保最佳互操作性和可见性的挑战是从孤立的混合云管理方法转变为能够实现整体治理的集成模型。
由于缺乏可互操作的集成框架进行分析,不同平台生成的大量异构组学、临床和生物医学数据集已经面临着多重挑战。
以精准组学为例,该研究领域的特点是大数据复杂、异构、多维,且主要呈分散状态且不可互操作。简化精准组学数据集成和互操作性的广泛方法是应用 FAIR 指导原则,以便向数据添加元数据,然后将每个数据元素链接到通用词汇表或本体。
然而,数百种本体的出现为使所有这些本体可互操作带来了新的挑战。
鉴于当前生物信息学分析框架的碎片化性质以及组学数据的分散性、不互操作性,挑战在于确保基于云的组学不会加剧现有的可移植性和互操作性挑战并增加另一层复杂性。