为了提供低延迟和高吞吐量的保证,大多数大键值存储将数据保存在许多服务器的内存中。尽管查询之间存在自然的并行性,但是由于密钥的流行分布中存在严重的倾斜,导致负载不平衡限制了性能。为了避免违反尾延迟服务级别的目标,系统倾向于将服务器利用率保持在较低的水平,并将数据组织在微碎片中,这为负载平衡提供了迁移和复制单元。这些技术减少了歪斜,但增加了监视、数据复制和一致性维护开销。
在这项工作中,我们介绍了Rackout,这是一种内存池技术,它利用新兴的机架式系统的单边远程读取原语来减轻负载不平衡,同时尊重服务级别目标。在rackout中,数据以机架级粒度聚合,机架中的所有参与服务器共同服务机架的所有微碎片。我们开发了一个排队模型来评估Rackout对数据中心规模的影响。此外,我们还实现了一个Rackout概念验证密钥值存储,在两个基于RDMA和扩展NUMA的实验平台上对其进行评估,并使用这些结果来验证模型。我们设计了两种不同的Rackout单元内的负载平衡方法,一种是基于随机选择节点的Rackout_静态方法,另一种是基于自适应负载平衡机制的Rackout自适应方法。我们的结果表明,与扩展部署相比,rackout-static将RDMA的吞吐量增加了6倍,扩展numa的吞吐量增加了8.6倍,同时考虑到了紧尾延迟服务级别目标。rackout-adaptive将工作负载的吞吐量提高了30%,其中20%的写入量超过rackout-static。
地 址:广州市番禺区大学城中山大学资讯管理学院B栋B305
邮政编码:510000
联 系 人:李启元老师
电 话:+86-20-39336519
电子邮箱:hpcoffice@gdhpcs.org
网 址:http://sdcs.sysu.edu.cn/gdhpcs/