1、构建领先的全球化多云异构AI推理集群,支持超大规模全球化多云异构算力的智能接入和管理系统的研发;
2、支持B端全球化多种商业模式的持续探索和落地,比如专有云部署、模型授权等工作;
3、基于全球化业务和多云异构算力的流量优先级调度和算力智能分配系统的建设和优化,确保在多国家、多租户、多场景下实现极致优化算力使用效率并提升业务收益。1、本科及以上学历,计算机、软件工程、人工智能等相关专业优先;
2、计算机和编程基础扎实,熟练掌握Java或Python,有服务端系统的开发经验;
3、有较强的工作责任心和自驱力,较好的学习能力和沟通能力,良好的工作文档习惯;
4、熟悉大模型推理或训练框架(如vLLM、SGLang、PyTorch等)、云原生编排调度者优先。