摘要
近几年来的GPU允许从快速外围设备(如NVMe SSD)进行点对点直接内存访问(P2P),以将CPU从它们之间的数据路径中排除,从而提高效率。不幸的是,使用p2p访问文件极具挑战性,因为低级别非标准接口的细微之处,绕过了OS文件I/O层,将可能会损害系统性能。开发人员必须熟悉低级接口,才能手动处理数据一致性和未对齐访问的细微差别。
我们提出了SPIN,它将p2p集成到标准OS文件I/O堆栈中,在适当的时候动态地激活p2p,对用户透明。它将P2P与页面缓存访问相结合,重新启用顺序读取的预读功能,同时保持标准POSIX FS一致性、跨GPU和SSD的可移植性以及与虚拟块设备(如软件RAID)的兼容性。
我们使用标准文件I/O基准、应用程序跟踪和端到端实验来评估NVIDIA和AMD GPU上的SPIN的效率。spin在广泛的工作负载范围内实现了显著的性能加速,超过了P2P吞吐量高达一个数量级。它还通过动态适应其依赖于输入的文件访问模式,将航空图像渲染应用程序的性能提高了2.6倍,使GPU加速日志服务器的吞吐量提高了3.3倍,并使高度优化的GPU加速图像的执行速度提高了29%。这其中只有30行代码被更改。
文献地址:https://dl.acm.org/citation.cfm?id=3309987
地 址:广州市番禺区大学城中山大学资讯管理学院B栋B305
邮政编码:510000
联 系 人:李启元老师
电 话:+86-20-39336519
电子邮箱:hpcoffice@gdhpcs.org
网 址:http://sdcs.sysu.edu.cn/gdhpcs/