阿里云智能事业群-神龙异构智能研发专家/高级专家-杭州/上海/北京
阿里巴巴集团
北京
3天前

岗位描述

神龙计算平台的异构与智能计算组 担负着整个阿里云的异构加速器云化产品的基础研发责任 在IaaS和IaaS+层面为阿里云的异构计算的布局奠定坚实的产品和技术基础 满足在大计算业务场景(包括人工智能 机器学习 高性能计算等)下对超强算力和业务性能优化的需求 围绕软硬一体和云上大规模计算布局打造核心竞争力 全面支持公共云 专有云 混合云 边缘云等所有的云形态 形成依托昊天(GPU)平台 舜天(FPGA FaaS)平台和面向AI 大数据场景性能优化的擎天(AIACC)平台的三位一体的产品和技术研发体系

岗位职责

1. 负责落地阿里云异构GPU智能计算在云上服务的输出

2. 负责基于阿里云异构智能计算的擎天AI云加速和大数据云加速平台建设

3. 基于异构智能计算平台 针对深度学习 机器学习 大数据处理 或者音视频处理 渲染 远程CAD设计等场景在云上提供解决方案 并进行性能或者算法调优

4. 负责异构智能与阿里云其他云产品对接 并能持续优化和维护

5. 与GPU厂商合作 负责定义 开发和落地符合阿里云安全隔离 性能和通用化要求的GPU虚拟化技术

岗位要求

1. 六年以上Linux C / C++ / Python / Java / Scala编程经验 对程序架构和数据结构有深入理解

2. 熟练掌握主流AI计算框架(TensorFlow / MxNet / PyTorch / Caffe等)性能优化 熟练掌握深度学习模型 机器学习模型优化的优先

3. 熟悉掌握Hadoop / Spark / Flink / HBase / Hive性能优化 熟练掌握大数据处理 流式计算的优先

4. 精通针对Nvidia GPU / Intel Xeon的计算性能优化 熟练掌握针对深度学习 机器学习 大数据性能优化的优先

5. 精通TCP / IP 网络编程 熟悉RDMA等高性能网络技术 有网络性能调优经验者优先 对分布式计算领域有丰富的理论和实践经验的优先

6. 熟练掌握Linux Windows内核驱动开发和调试经验的优先

7. 熟练掌握业界比较流行的显卡虚拟化技术 对Nvidia / AMD / Intel等GPU技术有较深理解的优先

8. 熟悉或了解Xen, KVM等虚拟化技术的优先

9. 有利用GPU进行特定领域的加速 深度学习 机器学习 音视频处理 渲染 远程CAD设计等场景的优先

10. 具有很强的上进心和结果导向 具有很强的解决问题 团队协作能力的优先

11. 具有很强的分析问题和快速解决问题的能力 善于学习新技术的优先

報告此工作
checkmark

Thank you for reporting this job!

Your feedback will help us improve the quality of our services.

申请
邮箱地址
通过点击 "继续", 我 同意neuvoo处理我的信息数据, 并给我发送电子邮件提醒 详见neuvoo 隐私政策 。我可以在任何时候取消订阅。
继续
申请表