在AI领域,跨界人才拥有独到的见解和独特的研究技巧。例如,微软亚洲研究院(上海)的高级研发经理杨玉庆,他拥有软硬件两方面的研究经历,为AI研究贡献了新颖的观察角度。
跨界入行历程
2017年,杨玉庆加盟了微软(亚洲)互联网工程院。在此之前,他主要从事底层系统架构的设计工作。加入工程院后,他的工作重心转向了系统软件的设计。这一转变促使他开始从开发者及用户的角度去思考问题,并在实践中逐步形成了自己独特的思维和研究理念。从底层到上层,不同的视角为他提供了多角度的研究视野。
底层视角优势
深入底层,他能够清楚地认识到模型在计算设备中的运行方式。杨玉庆深知,底层结构对模型的运行有着显著的作用。因此,他能够对模型进行有目的的改进。这就像工匠对工具的原理有了深入了解,才能更有效地完成作品一样,杨玉庆通过从底层角度出发,提高了模型在硬件中的运行效率。
上层视角洞察
杨玉庆凭借高层视角,洞察了系统优化的核心环节及未来走向。在设计系统软件时,他能够全面掌控每一个优化环节对整个系统的影响。以模型训练至部署为例,这种视角能发现那些常被忽视却对整体性能至关重要的环节,并据此预先制定解决方案。
整体系统研究
杨玉庆提出,在设计支持深度学习或AI模型的系统时,不能将问题孤立考虑。以模型从训练到被用户多次使用为例,各个层级的调用都会对效率和性能产生影响。微软亚洲研究院的四个项目,先分别研究各个环节,然后再将这些环节串联起来,形成一个完整的解决方案,这种做法充分展现了系统化研究的理念。
解决实际问题
在AI模型训练过程中,集群训练是一种普遍采用的方法。杨玉庆及其团队为了最大化GPU或硬件集群的性能,不仅运用了NNI的大模型压缩技术,还创新性地研发了利用模型稀疏性的新方法,以此提升部署效率。此外,nn-Meter模型能够预测模型与硬件的适配度,有效解决了模型在各类边缘设备上推理时出现的延迟问题。
研究领域成果
经过三年多的努力建设,微软亚洲研究院(上海)的研究领域已经趋于稳定。杨玉庆所在的系统组专注于为计算密集型任务研发高效技术。他们通过优化模型、编译器和系统平台级工具,有效提升了大规模AI模型处理和实时视频流处理等方面的效率,从而为研究者和开发者带来了更高的生产效率。
当前AI技术飞速进步,杨玉庆的研究方法和观点为业界提供了不少灵感。关于AI研究,跨软硬件领域的知识背景还有哪些潜在优势值得探索?欢迎在评论区交流你的观点,同时记得点赞并转发这篇文章!