職位描述
職責描述:1. 主導AI業務場景下Kubernetes調度系統的戰略規劃與架構設計,支撐生成式AI、多模態模型訓練、智能體協同等核心業務需求。 2. 構建面向AI工作負載的調度范式,解決模型開發、部署、持續迭代全生命周期的資源動態編排問題。 3. 深入理解AI業務特征,設計資源調度策略與業務指標的聯動機制。 4. 構建跨集群/跨云的智能調度中臺,支持混合云、邊緣計算等新興AI業務場景。 5 主導AI調度能力的產品化封裝,為AI平臺、AI智能體等上層業務提供標準化資源治理能力。任職要求: 1. 統招本科以上學歷,人工智能、計算機及相關專業,技術基礎扎實,5年以上云原生架構經驗,至少2年專注AI/ML場景的基礎設施建設。 2. 主導過AI業務關鍵路徑的調度系統設計,如支持千卡規模訓練任務調度、實時推理資源保障等。 3. 深入理解AI業務全流程(數據準備、訓練調優、推理部署),具備將業務需求轉化為基礎設施設計的能力。 4. 精通Kubernetes調度領域核心方法論,對資源隔離、優先級搶占、彈性伸縮等機制有體系化認知。 5. 具備架構級抽象能力,能設計兼顧通用性與AI場景特性的調度解決方案。 優先: 1. 熟悉AI技術演進趨勢(如MoE架構、Agent群體智能),能預判其對基礎設施的新要求。 2. 具備技術產品化思維,能通過調度能力輸出提升AI業務迭代速度與資源使用效率。
企業介紹
曙光信息產業股份有限公司(以下簡稱“中科曙光”)作為我國核心信息基礎設施企業,為中國及全球用戶提供創新、高效、可靠的IT產品、解決方案及服務。 公司于2014年在上海證券交易所上市(股票代碼:603019)。經歷20余年發展,中科曙光在高端計算、存儲、安全、數據中心等領域擁有深厚的技術積淀和市場份額,并充分發揮高端計算優勢,布局智能計算、云計算、大數據等領域的技術研發,打造計算產業生態,為科研探索創新、行業信息化建設、產業轉型升級、數字經濟發展提供了堅實可信的支撐。 中科曙光在全國各省、自治區和直轄市均設立了分支機構,擁有國際的3大智能制造生產基地、5大研發中心,在全國50多個城市部署了城市云計算中心。 作為以技術創新為基因的科技企業,中科曙光未來將持續專注于核心技術研發,并與用戶、合作伙伴攜手共建應用生態、推動產業進步,以科技創新助力“數字中國”建設,驅動經濟高質量發展。