Pentaho 首席技术官 James Dixon 提出“数据湖”一词已有十年。该术语 数据湖和数据仓库之间的桥梁作 及其底层技术比以往任何时候都更加蓬勃发展。
虽然数据仓库 (DWH) 系统已经存在并得到认可,但数据行业已经接 数据湖和数据仓库之间的桥梁作 受了更新的存储库,即数据湖,尤其是在大数据的增长、向云存储的转变以及人工智能(人工智能)技术。
有人可能会说数据湖的优势包括
更快的访问:用户可以轻松访问数据湖,从而实现实时分析。
适应性:数据湖可以存储小规模或海量数据(甚至是 PB 级)。
灵活性:数据湖能够处理各 WhatsApp 数据 种数据类型和数据源。
成本效益:与本地数据湖相比,云数据湖更实惠。
数据湖的吸引力和新功能对传统数据仓库 (DWH) 系统构成了巨大威胁。DWH 的主要缺点包括成本高昂、内部结构僵化、无法适应不断变化的数据环境,而且 DWH 在设计和构建复杂数据存储方面可能非常耗时。
尽管如此,DWH 解决方案仍具有竞争力,它还提供经济 且 希里什·巴特 执行长兼创办人 信息 高效的云存储选项,并使界面和功能更清晰、更简单。此外,DWH 的需求仍然很高,其优势包括:
效率
DWH 数据是结构化的,可以在几毫秒内检索。
趋势分析:由于 DWH 是为查询和分析而设计的,因此它包 够促 印度手机号码 进内部 含历史数据,允许用户随时间推移回答一组预定义的问题。
治理:由于许多 DWH 系统遵循基于内部数据标准和政策的方法(例如 Kimball 或 Inmon),这有助于数据用户就规则、标准和解释达成一致。