職位描述:
1、設(shè)計(jì)和實(shí)現(xiàn)推理引擎SDK,提升推理性能、易用性和產(chǎn)品穩(wěn)定性。
2、開發(fā)推理引擎的AI編譯。包括圖融合、各類圖優(yōu)化、算子優(yōu)化以及自動(dòng)化調(diào)優(yōu)等;
3、開發(fā)推理引擎的運(yùn)行時(shí)系統(tǒng)。包括內(nèi)存管理以及資源管理等等;
4、熟悉類CUDA/ROCm Runtime和Driver API及其底層實(shí)現(xiàn),理解常用機(jī)制如異步launch,事件event,進(jìn)程隔離/調(diào)度;
5、參與大模型的推理優(yōu)化。基于推理引擎,研發(fā)和應(yīng)用大模型推理優(yōu)化的技術(shù)。
職位要求
1、計(jì)算機(jī)相關(guān)學(xué)科碩士及以上學(xué)歷;
2、熟悉 C++、Python 等編程語言,3年以上C++的開發(fā)經(jīng)驗(yàn);//有開發(fā)經(jīng)驗(yàn)即可,組內(nèi)已經(jīng)有兩個(gè)資深工程師;
3、熟悉深度學(xué)習(xí)框架,如Tensorflow,Pytorch,至少熟悉一種推理引擎;
4、具有使用TVM / MLIR / IREE 進(jìn)行AI模型編譯和優(yōu)化的經(jīng)驗(yàn) 加分項(xiàng);
5、有很好的團(tuán)隊(duì)協(xié)作能力與溝通能力,對(duì)技術(shù)和代碼品質(zhì)有追求。