職位描述
該職位信息待核驗(yàn),請仔細(xì)了解后再進(jìn)行投遞!
工作內(nèi)容
1.在公司AI系統(tǒng)解決方案制定、售前支持和項(xiàng)目落地中起到關(guān)鍵技術(shù)帶頭作用;
2.AI系統(tǒng)架構(gòu)設(shè)計(jì):主導(dǎo)智算集群(GPU/TPU/NPU異構(gòu)計(jì)算)的系統(tǒng)架構(gòu)規(guī)劃,設(shè)計(jì)高吞吐、低延遲的計(jì)算與存儲方案,支持大規(guī)模模型訓(xùn)練與推理場景。
3.性能深度優(yōu)化:從硬件(芯片互聯(lián)、內(nèi)存帶寬)、框架(PyTorch/TensorFlow)、算法(模型并行策略)全棧協(xié)同優(yōu)化,提升算力利用率(MFU)與能效比。
4.異構(gòu)計(jì)算生態(tài)整合:對接芯片廠商(如NVIDIA、華為昇騰等),完成驅(qū)動、固件、計(jì)算庫(CUDA/MindSpore)的適配與調(diào)優(yōu),解決跨平臺兼容性問題。
5.技術(shù)前瞻與落地:跟蹤AI芯片(如存算一體、光計(jì)算)、液冷技術(shù)等前沿方向,推動創(chuàng)新技術(shù)在智算中心的工程化落地。
任職資格
1.學(xué)歷與專業(yè):計(jì)算機(jī)科學(xué)、電子工程、應(yīng)用數(shù)學(xué)等相關(guān)專業(yè)碩士及以上學(xué)歷,博士優(yōu)先。
2.核心能力
精通異構(gòu)計(jì)算架構(gòu)(GPU/TPU/FPGA),熟悉NVLink、RoCE、InfiniBand等高速互聯(lián)技術(shù)。
深入理解深度學(xué)習(xí)訓(xùn)練/推理流程,具備PyTorch/TensorFlow框架底層優(yōu)化經(jīng)驗(yàn)(如算子融合、顯存優(yōu)化)。
掌握C /Python,熟悉Linux內(nèi)核機(jī)制,能通過perf、Nsight等工具分析系統(tǒng)瓶頸。
了解分布式訓(xùn)練框架(DeepSpeed、Megatron-LM)。
3.軟技能:
具備技術(shù)領(lǐng)導(dǎo)力,能統(tǒng)籌硬件、算法、運(yùn)維團(tuán)隊(duì)協(xié)同,輸出高質(zhì)量技術(shù)方案與專利。
加分項(xiàng)
具備高性能計(jì)算(HPC)或AI系統(tǒng)研發(fā)經(jīng)驗(yàn),有智算中心、云廠商AI平臺建設(shè)經(jīng)驗(yàn)者優(yōu)先。
有AI芯片(如NVIDIA H100/H200、華為昇騰910B、沐曦、寒武紀(jì)、天數(shù)智芯、的適配與優(yōu)化能力)底層驅(qū)動或固件開發(fā)經(jīng)驗(yàn)。
熟悉液冷系統(tǒng)設(shè)計(jì)、綠色數(shù)據(jù)中心能效優(yōu)化方案。
有千億參數(shù)模型訓(xùn)練優(yōu)化經(jīng)驗(yàn)者優(yōu)先。
截止日期:2027年04月08日
招聘人數(shù):1人
工作地點(diǎn)
地址:深圳南山區(qū)科發(fā)路3北門中國長城計(jì)算機(jī)集團(tuán)公司內(nèi)
??
點(diǎn)擊查看地圖
詳細(xì)位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財(cái)物(如體檢費(fèi)、置裝費(fèi)、押金、服裝費(fèi)、培訓(xùn)費(fèi)、身份證、畢業(yè)證等),均涉嫌違法,請求職者務(wù)必提高警惕。
職位發(fā)布者
劉曉丹HR
中國長城科技集團(tuán)股份有限公司
-
計(jì)算機(jī)硬件·網(wǎng)絡(luò)設(shè)備
-
1000人以上
-
公司性質(zhì)未知
-
長沙市經(jīng)濟(jì)技術(shù)開發(fā)區(qū)東三路5號

應(yīng)屆畢業(yè)生
博士
2026-04-20 12:54:47
481人關(guān)注
注:聯(lián)系我時,請說是在四川人才網(wǎng)上看到的。
