其他技術(shù)職位
面議工作描述:
負責(zé)大規(guī)模自動駕駛計算下GPU中間層與運行時架構(gòu)設(shè)計與優(yōu)化,深入?yún)⑴c驅(qū)動層、CUDA/OpenCL運行時、調(diào)度器及內(nèi)存管理模塊的研發(fā)
精通CUDA和OpenCL編程,能獨立完成高性能核函數(shù)(kernel)設(shè)計與優(yōu)化,包括但不限于內(nèi)存訪問模式優(yōu)化、線程并行調(diào)度和寄存器/共享內(nèi)存調(diào)優(yōu),優(yōu)化passes,提升GPU計算效率與吞吐
在通用GPU(GPGPU)場景下開展性能剖析(profiling)、瓶頸定位與優(yōu)化,熟練使用NsightCompute、Nsys、VulkanProfiler等性能分析工具完成GPGPU性能分析
設(shè)計并實現(xiàn)GPU排程策略,優(yōu)化多流/多內(nèi)核/異構(gòu)算子調(diào)度;支持混合計算(CUDACore、TensorCore、DLA等)協(xié)同執(zhí)行
構(gòu)建端到端性能驗證與回歸測試體系,包含性能基準(zhǔn)、自動剖析報告、回歸對比和A/B測試機制
任職要求:
計算機、電子工程、微電子或相關(guān)專業(yè)碩士及以上,3年以上GPU加速、編譯器或驅(qū)動研發(fā)經(jīng)驗
精通CUDA(有長時間開發(fā)經(jīng)驗),熟悉Warp調(diào)度機制、內(nèi)存層次架構(gòu)(global/share/local/constantmemory)等原理;熟練使用OpenCL或SYCL為加分項
掌握GPGPU性能優(yōu)化技術(shù):線程塊/網(wǎng)格調(diào)度、memorycoalescing、寄存器壓榨、內(nèi)存對齊與數(shù)據(jù)布局設(shè)計、延遲隱藏、流水線調(diào)度、算子Fusion等
熟悉GPU調(diào)度機制及異步執(zhí)行模型,具有多流、多優(yōu)先級隊列、事件同步、計算圖經(jīng)驗
熟悉GPU性能剖析工具(NsightCompute、Nsys、CUPTI、VulkanProfiler等),能獨立定位并解決性能瓶頸
加分點:
有RTX/Ampere/Orin/Xavier等NVIDIA下一代GPU或SoC平臺的實踐經(jīng)驗;熟悉TensorCore、DLAPTX/SASS分析能力;
具備深度學(xué)習(xí)框架(TensorRT、TVM、MLIR)異構(gòu)后端研發(fā)背景;
熟悉多維度算子Fusion、圖算子調(diào)度框架設(shè)計,或具備自定義算子編寫與打包部署能力。

北京海淀區(qū)中航科技大廈
相關(guān)推薦查看更多 >
北京房山區(qū)家具安裝
300-400元/天后廚學(xué)徒,煮粉師
面議公家福利店招聘發(fā)型師
8000-10000元/月急招水暖安裝維修工
面議海淀區(qū)
相同職位推薦
企業(yè)招聘