没有评论
文章由NewsMDirector于 8 个月前更新
您可能不止一次听说过这句话,并且您对此感到好奇。什么是数据湖?尽管如果您的组织在商业智能方面还不成熟,那么您很可能还没有经历过这种状态导致的问题。因此,您不必了解数据湖的概念。
正如您可以想象的那样,公司面临的最大挑战之一是数据增长。在我们所处的数字时代,信息无处不在。并且它以光速倍增。
所有的数据都非常有价值。换句话说:你不应该让他们过去。卡塔尔公司电子邮件列表 这就是组织和管理的某个点发挥作用的地方,以了解如何组织所有这些知识。
目录索引
您想知道什么是数据湖吗?
数据湖和数据仓库有什么区别?
1.- 数据湖保存所有数据
2.- 数据湖支持所有类型的数据
3.- 数据湖支持所有类型的用户
4.- 数据湖轻松适应变化
5.- 数据湖提供更快的洞察力
如何在数据湖选项之间进行选择以进行数据处理?
您想知道什么是数据湖吗?
什么是数据湖
您可能已经将这个概念与大数据联系起来。数据湖是存储公司所有数据的存储库。不管有没有结构化,这些都是原始的,没有任何组织,留待以后分析。
[横幅英雄]
事实上,公司可以随时转储数据并恢复数据。只有在那一刻,我们才开始组织它们并设计一个结构,使后续的分析变得更加容易。
另一方面,大数据将在第二步中发挥作用。因为它指的是存储所有数据量的结构。如您所知,一旦分析了信息,就可以执行许多操作:
设计公共政策。
制定营销策略。
预测人群中疾病的演变。
怎么办呢?进入情境。如果您有中心患者的医疗记录,将更容易检测疾病的传染模式或爆发的时间。
想知道这将如何影响营销?很简单,例如,如果一家服装店检测到消费者的偏好,它就会知道他们最喜欢的产品是什么或何时购买量较低。从那里可以更容易地确定推出促销活动的关键时刻。
数据湖和数据仓库有什么区别?
数据湖和数据仓库之间的区别
对数据湖和数据仓库进行比较是了解数据存储系统如何发展的最佳方法之一。正如您在 DataFloq 信息图中看到的 , 每个系统都有其优点和缺点。
1.- 数据湖保存所有数据
在数据仓库的开发过程中,需要花费大量时间来分析源、了解业务流程和分析数据。结果是一个高度结构化的数据模型,可供报告。
这个过程的很大一部分还包括决策程序。包含哪些数据,不包含哪些数据。一般来说,如果数据不是用来回答特定问题或者在某些报告中不是必需的,则可以将其排除。这样,简化了模型并节省了空间。
然而,数据湖保留所有数据。不仅是那些在那个特定时刻至关重要的信息,而且还包括所有在某个时刻可能需要的存储信息。这提供了几个好处,特别是在分析部分方面。
这种方法是可行的,因为数据湖的硬件通常与普通数据存储所使用的硬件有很大不同。便利性、可用的服务器和更便宜的存储意味着将数据湖扩展到 TB 和 PB 是相当经济的。