计算机、虚拟机、容器、集群、云系统的整体运行管理;
负责系统架构设计,方案评审,性能调优;
系统管理核心工具开发,包括但不限于监控、告警、测试、故障自动诊断等模块;
参与核心模块编码测试,帮助团队解决关键问题;
按照研发流程、规范,独立进行编码,并撰写研发技术文档。
计算机科学与技术专业,本科及以上学历;
熟悉Linux/Unix操作系统管理和使用;
熟练掌握shell、perl、python等脚本编程;
熟悉GCC、Intel、PGI等编译器者,了解MPI、OpenMP、CUDA、OpenACC、OpenCL等并行编程语言;
有较强的分析能力, 较强的逻辑思维能力, 对技术和数据都有很好的敏感度;
沟通能力强,语言表达清晰,逻辑性强,有良好的团队合作精神;
对编写程序有极高兴趣,有较强的学习能力和自主解决问题的能力;
有良好的英文阅读能力,能看懂英文材料,具备英文写作能力更佳;
熟悉构建计算机集群系统的主要技术方法优先;
有高性能计算中心工作经验者优先。