摘要:
国防科技大学团队自主研发设计了MT-3000高性能多区异构处理器,并将其作为重要算力部署于我国新一代天河超级计算机系统中。为拓展MT-3000在人工智能领域的应用前景,亟需攻克PyTorch等主流深度学习框架仅与国外少数厂商的硬件深度绑定这一技术壁垒。聚焦于PyTorch中常用算子与MT-3000异构处理器适配方法的研究。针对MT-3000处理器中,部分PyTorch算子难以利用DSP加速核实现加速的问题。设计并实现了PyTorch虚拟算子。通过常用算子的对比实验表明,提出的方法准确可靠,且基本没有性能损失。