Aerospike Connect改进与NoSQL数据库的集成

发布时间:2021-07-07 12:36 来源:TechTarget中国 阅读:0 作者:TechTarget中国 栏目: 数据库 欢迎投稿:712375056

NoSQL数据供应商Aerospike发布了一系列增强功能,以实现更好的数据集成,并加快针对机器学习工作负载的数据分析。

此次Aerospike Connect更新于9月15日发布,其中包括与Apache Spark、Apache Kafka、Java Message Service和Apache Pulsar的增强集成。

该连接器使用户可以更轻松地从Aerospike数据库中获取不同的数据源。该公司于2019年3月发布Aerospike Connect初始版本,其中包含第一个版本的Spark和Kafka连接器。更新的连接器还受益于Aerospike 5.1数据库更新–该更新已于7月正式上市。

S&P Global公司分析师James Curtis表示,借助Aerospike Connect,该供应商可使用户低摩擦进入现有环境。

Curtis说:“Aerospike是更大趋势的一部分,即NoSQL供应商成为分析的推动者,而在过去,大多数NoSQL数据库主要集中于操作/事务工作负载。该公司的Spark连接器(包括其更新)是该战略的重要组成部分。”

Aerospike Connect受益于跨数据中心复制

Aerospike 5.0数据库于2019年5月首次亮相,并在7月发布5.1版。

该增强型连接器利用这个最新Aerospike数据库版本中的更新功能,并帮助改善所有连接器的实时更新和性能。

Aerospike Database 5系列的主要新增功能之一是支持跨数据中心复制(XDR)。除了XDR,Aerospike Database 5系列还引入全球分布式事务。新功能都有助于使用户能够跨多个站点和云端运行Aerospike,并为不同应用(包括财务支付)提供高性能。

Spark改进将有助于AI模型

此次Aerospike Connect更新中的Spark连接器已得到改进,可帮助加速AI模型生成的性能。

Aerospike公司首席产品官兼联合创始人Srini Srinivasan说,当开发人员运行用于生成AI模型的算法时,他们倾向于尝试提供正在内存中分析的所有数据,以便快速生成模型。

在使用新的Spark连接器之前,用户倾向于将数据从Aerospike实时数据库复制到另一个数据库(例如HBase),然后在此之上运行Spark进程。该方案的问题在于用户需要复制数据,这需要时间和计算资源。

Srinivasan说,而通过这个新的连接器,他的公司已经建立了基于数据帧的访问—从Spark到Aerospike数据库。现在,这个新的连接器使Spark的并行执行与Aerospike的并行执行保持一致。最终结果是,由于没有将数据复制到辅助系统,因此用户可以更快地生成AI模型并具有更多实时数据。

Apache Pulsar加入Aerospike Connect,下一个是Presto

虽然Aerospike以前有针对Kafka和Spark的连接器,但Pulsar连接器是全新的。Pulsar是一种事件流技术,通常被视为Apache Kafka的替代方法。

Srinivasan说:“在Pulsar领域有很多活动,我们收到用户的很多要求。我们认为,根据我们在市场上看到的投资情况,Pulsar连接器将被大规模使用。”

除Pulsar外,Aerospike现在还在开发Presto连接器,目前处于测试阶段。Presto是一种日益流行的开源SQL查询引擎,通常被视为Spark的竞争对手。

免责声明:本站发布的内容(图片、视频和文字)以原创、来自本网站内容采集于网络互联网转载等其它媒体和分享为主,内容观点不代表本网站立场,如侵犯了原作者的版权,请告知一经查实,将立刻删除涉嫌侵权内容,联系我们QQ:712375056,同时欢迎投稿传递力量。