工作地點:東城區 | |
招聘人數:1 人 | |
工作地點:東城區 | |
招聘人數:1 人 | |
崗位職責:1、負責芯片異構計算大模型相關算子、框架的開發與優化;2、負責分析定位系統性能瓶頸,針對特定AI芯片做高性能計算加速和優化;3、針對特定GPU架構,開展調優工作,確保產品在性能和功耗上的優勢;4、負責優化大模型推理效率和性能提升;崗位要求:1、碩士以上學歷,計算機、自動化、通信等相關專業;2、熟悉系統性能調優的方法,熟練掌握CUDA語言,具備GPU算子開發能力;3、熟悉GPU、NPU等算子底層細節、具備大模型算子優化經驗(矩陣計算庫、Attention算子、訪存瓶頸算子、融合算子)等;4、有常用大模型推理框架的設計與實現經驗,例如:vllm、SGLang、TensorRT-llm等;
學歷要求:碩士 | 工作經驗:無經驗 |
年齡要求:不限 | 性別要求:不限 |
語言要求:普通話 |
公司性質:其它 | 公司規模:500-999人 |
所屬行業:人工智能/大模型 |
中國電信人工智能研究院(TeleAI)由人工智能科學家、中國電信集團CTO及首席科學家李學龍教授牽頭組建,面向國家戰略需求和人工智能發展趨勢,結合中國電信在算力、數據、應用場景及5G/6G通信等多方面的優勢,圍繞大模型、具身智能、AIGC、AI平臺設施等方向開展基礎研究、技術攻關和應用落地。