HPE推出用于分析的GreenLake数据湖库架构

发布时间:2021-10-10 21:22 来源:TechTarget中国 阅读:0 作者:TechTarget中国 栏目: 数据库 欢迎投稿:712375056

HPE周二表示,他们正在为其 GreenLake 平台添加新的统一数据湖库功能,预计新的数据服务将于2022年初全面推出。

HPE GreenLake是一个混合云平台,使用户能够在本地和云端运行应用程序和服务。在HPE推出的其他新服务中,值得注意的是Ezmeral Data Fabric Object Store,它提供一种基于 Kubernetes 的存储技术,可以在混合环境中运行。

HPE 还推出Ezmeral Unified Analytics,这是基于一组开源技术构建的云数据湖库平台,可为用户提供数据架构以运行数据分析和商业智能工作负载。

该数据架构的基础是几种开源技术,包括 Apache Spark 查询引擎和 Delta Lake 数据湖库。

Delta Lake 最初由Databricks创建,现在是由Linux 基金会运行的开源项目。借助Ezmeral Unified Analytics,HPE瞄准了现在由Databricks 主导的数据湖库市场。

Eckerson Group公司分析师 Kevin Petrie 表示:“在云计算的喧嚣中,我们很容易忘记这样的事实,即在可预见的未来,由于数据引力和所有权要求等因素,大量数据仍将保留在本地。因此,这里的挑战不仅在于弄清楚如何优化云端的数据工作负载,还需要确定如何在混合环境中优化它们,包括边缘、数据中心、云和多云基础设施等。”

Petrie指出,HPE的新服务旨在通过容器化应用程序管理和跨越混合环境的数据湖库来优化BI和数据科学工作负载。

HPE通过GreenLake转向数据湖库模型

在发布新GreenLake服务的网络直播活动中,HPE公司首席执行官Antonio Neri 强调了该供应商平台的混合性质。

Neri称:“我们在全球范围内统一你的数据,并将其提供给所有分析团队使用,这些团队的数据位于企业数据仓库、本地、云数据湖或其他云平台(例如Snowflake)的边缘。”

Neri表示,借助新的 Kubernetes 原生对象存储,HPE 提供与 Amazon S3 兼容的API。他补充说,HPE的新 GreenLake 服务的目标是使用户能够将来自文件、对象事件流和数据库的不同类型的数据整合到同一个数据结构中。

Neri 表示,主要的好处是企业将能够在一个平台上管理不同的数据源,从而加快获得洞察的时间。

开源基础

在媒体见面会中,HPE Ezmeral Software的全球首席技术官Matt Maccaux表示,与 S3 兼容的数据层是企业的重要选择。

Maccaux 称:“如果你考虑需要能够在某处启动计算作业,你可能还会考虑启动临时存储。我们知道这些应用程序通常是针对S3 API而编写,因此我们开发了对象存储,它可以通过与计算服务相同的运行时进行部署,然后将连接延伸回整个架构。”

Maccaux表示,通过使用开源的Delta Lake Lakehouse技术,HPE 正试图提供一种方法,以使企业不会被锁定在单一供应商。

Maccaux 说:“我们认为,从传统的专有堆栈转移到公共云中的另一个堆栈是没有意义的。”

免责声明:本站发布的内容(图片、视频和文字)以原创、来自本网站内容采集于网络互联网转载等其它媒体和分享为主,内容观点不代表本网站立场,如侵犯了原作者的版权,请告知一经查实,将立刻删除涉嫌侵权内容,联系我们QQ:712375056,同时欢迎投稿传递力量。