数据访问和分析供应商Starburst公司的使命是,通过利用开源Presto SQL查询技术,帮助在基于Hadoop部署中存储数据的企业快速访问和查询数据。
该公司在周三表示,他们已经对Starburst Enterprise Presto平台进行了更新,该平台是基于开源Presto分布式SQL项目–最初由Facebook开发。
基于Presto的技术市场正在不断发展,这个市场还有其他供应商,其中最知名的是Ahana公司—该公司于6月30日发布其Presto服务。在Presto背后有两个不同的活跃开源开发分支:PrestoSQL和PrestoDB。根据Starburst的说法,他们的计划是在不久的将来,将这两个社区整合在Linux基金会的Presto基金会下。Starburst是基于PrestoSQL项目,而Ahana来自PrestoDB。
Presto本身正受到希望继续使用Hadoop大数据部署以及数据湖的企业的青睐。S&P Global Market Intelligence公司研究总监Matt Aslett表示,虽然很多企业正在将其长期关注点从本地Hadoop部署转移到基于对象存储的基于云的数据湖,但仍有大量现有的大数据处理部署。
Aslett说:“Presto可用于加速分布式数据处理项目—同时基于Hadoop和对象存储,无论它们驻留在本地还是在云端。因此,这提供了一个一致的计算层,可以支持对现有投资的持续使用,并提供迁移路径以增加新云平台的使用。”
Starburst公司联合创始人Matt Fuller表示,Presto使用户能够从各种数据源(包括Hadoop和云端)以及关系和非关系数据库系统中查询数据。Fuller指出,通过Starburst,在Hadoop上进行投资的企业仍然可以继续使用其数据–通过基于Presto的查询方法。
Fuller说:“对于这个版本,我们的产品实际变得更好,以及与Hadoop更高级的集成。”
在这次Starburst更新中,与Hadoop的特定增强集成包括支持Cloudera CDP 7.1–Hadoop数据平台。此外,Starburst增加了对MapR Hadoop平台的支持,该平台于2019年8月被惠与收购。
Presto的关键用例之一是云数据湖,例如Amazon S3,它与Amazon分布式文件系统(HDFS)兼容。Starburst具有连接器模型,可用于不同数据源,包括AWS、Azure和谷歌上的数据湖。
Fuller说:“Presto是从云数据湖查询的非常好的工具。对于迁移中的企业来说,这真的非常好,因为他们现在可以通过Hadoop使用相同的工具,而在过渡到数据湖后不必使用其他工具。”
对于企业而言,使用多个云越来越常见,这是Presto发挥作用的另一个领域。Fuller指出,Presto可以在任何云上运行,并且Starburst看到Presto也可以用来帮助实现多云数据湖查询。
用于保护Hadoop安全的关键开源技术之一是针对数据安全的Apache Ranger框架。
尽管Ranger最初是针对Hadoop的框架,但Fuller指出,近年来,它已更广泛地部署在Hadoop生态系统之外,以保护数据。
Fuller说:“你可以将Apache Ranger视为存储数据湖和其他数据源的所有安全策略的全局位置。”
Starburst已经与Ranger进行了一些集成,并且正在通过附加功能对其进行增强。新功能之一是支持称为SQL授权的功能。通过SQL授权支持,用户可以授予和撤消对Starburst Presto中特定表的访问权限,然后该配置将反映在Apache Ranger中。
Fuller指出,Starburst将继续致力于通过Presto改善对不同类型数据源的访问,并使整个平台更易于使用。
他说:“你可以期望看到更多的连接性和更多性能用于联合访问数据。”
免责声明:本站发布的内容(图片、视频和文字)以原创、来自互联网转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:ts@56dr.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。
Copyright © 2009-2021 56dr.com. All Rights Reserved. 特网科技 版权所有 珠海市特网科技有限公司 粤ICP备16109289号
域名注册服务机构:阿里云计算有限公司(万网) 域名服务机构:烟台帝思普网络科技有限公司(DNSPod) CDN服务:阿里云计算有限公司 中国互联网举报中心 增值电信业务经营许可证B2