MLSys 标签

2026

02-23

[arXiv'25] MTGRBoost: Boosting Large-scale Generative Recommendation Models in Meituan 论文阅读

02-22

[ICDE'22] PICASSO: Unleashing the Potential of GPU-centric Training for Wide-and-deep Recommender Systems 论文阅读

02-08

[NeurIPS'12] Large Scale Distributed Deep Networks (DistBelief) 阅读笔记

02-07

[MAPL@PLDI'19] Triton: An Intermediate Language and Compiler for Tiled Neural Network Computations 阅读笔记

02-01

[OSDI'18] TVM: An Automated End-to-End Optimizing Compiler for Deep Learning 阅读笔记

2025

09-01

[arXiv'16] TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems 阅读笔记

08-31

[KDD'15] Petuum: A New Platform for Distributed Machine Learning 论文阅读

04-06

[OSDI'20] A Unified Architecture for Accelerating Distributed DNN Training in Heterogeneous GPU/CPU Clusters (BytePS) 论文阅读

04-05

[arXiv'19] Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism 论文阅读

04-04

A Generic Communication Scheduler for Distributed DNN Training Acceleration 论文阅读

0%