算法工程師-CV方向
1.5-3萬(wàn)元/月該職位于3日內(nèi)新發(fā)布
算法工程師
1.5-3萬(wàn)元/月AI算法工程師(多模態(tài)方向)
關(guān)于我們
本公司是香港牛道集團(tuán)的深圳分部,是一家著眼于未來(lái)的初創(chuàng)公司。我們正全力打造一款基于AI的情緒陪伴智能硬件產(chǎn)品,旨在通過(guò)尖端的多模態(tài)技術(shù)(融合視覺(jué)、語(yǔ)音、觸覺(jué)等)實(shí)時(shí)感知用戶情緒,并生成高度擬人化的反饋與交互。我們的愿景是,通過(guò)AI技術(shù)賦予產(chǎn)品“類(lèi)人化”的情感表達(dá)與交互能力,使其成為用戶獨(dú)一無(wú)二的情感伴侶,共同開(kāi)啟AI陪伴的新紀(jì)元。
職位概述
我們正在尋找一位兼具圖像識(shí)別與智能語(yǔ)音交互全鏈路技術(shù)能力的資深A(yù)I算法總監(jiān)。您將作為公司的核心技術(shù)領(lǐng)袖,全面負(fù)責(zé)和主導(dǎo)產(chǎn)品多模態(tài)AI戰(zhàn)略的制定與落地,帶領(lǐng)并組建AI算法團(tuán)隊(duì),攻克從視覺(jué)感知到語(yǔ)音對(duì)話的各項(xiàng)技術(shù)挑戰(zhàn),驅(qū)動(dòng)一款開(kāi)創(chuàng)性AI產(chǎn)品的誕生與迭代。
崗位職責(zé)
1.技術(shù)戰(zhàn)略與架構(gòu)設(shè)計(jì):
主導(dǎo)公司AI技術(shù)的長(zhǎng)遠(yuǎn)發(fā)展藍(lán)圖與路線規(guī)劃,尤其是在多模態(tài)情感計(jì)算領(lǐng)域。
設(shè)計(jì)并構(gòu)建AI陪伴產(chǎn)品的核心算法架構(gòu),確保圖像與語(yǔ)音兩大技術(shù)方向的深度融合與協(xié)同。
全面負(fù)責(zé)從語(yǔ)音喚醒、語(yǔ)音識(shí)別(ASR)、大語(yǔ)言模型(LLM)接入與融合,到語(yǔ)音合成(TTS)的全鏈路技術(shù)方案設(shè)計(jì)與實(shí)現(xiàn)。
2.核心算法研發(fā)與領(lǐng)導(dǎo):
領(lǐng)導(dǎo)團(tuán)隊(duì)進(jìn)行核心算法的研發(fā)、優(yōu)化與部署,覆蓋圖像與語(yǔ)音兩大模塊:
視覺(jué)感知:指導(dǎo)高精度、輕量化的實(shí)時(shí)表情識(shí)別、手勢(shì)識(shí)別(15種)、及食物/水果種類(lèi)識(shí)別(約50種)模型的開(kāi)發(fā)與優(yōu)化。
語(yǔ)音交互:領(lǐng)導(dǎo)團(tuán)隊(duì)解決網(wǎng)絡(luò)延遲、模型推理耗時(shí)等問(wèn)題,實(shí)現(xiàn)接近真人對(duì)話的低延遲、可打斷的流暢溝通體驗(yàn)。
3.算法部署與性能優(yōu)化:
指導(dǎo)算法模型在嵌入式設(shè)備(如瑞芯微RK系列芯片)上的高效部署。
領(lǐng)導(dǎo)團(tuán)隊(duì)進(jìn)行模型的輕量化設(shè)計(jì),包括不限于模型壓縮、量化、剪枝及蒸餾,并構(gòu)建高性能推理引擎(如TensorRT,ONNXRuntime),以滿足端側(cè)的低延遲與高能效需求。
4.多模態(tài)融合與前沿探索:
探索并實(shí)踐語(yǔ)音、文本、表情、動(dòng)作等多模態(tài)信息的融合策略,讓產(chǎn)品的交互更具表現(xiàn)力和情感感知力。
持續(xù)關(guān)注并研究AIAgent、具身智能等前沿技術(shù),并將其應(yīng)用于產(chǎn)品迭代中。
6.跨部門(mén)協(xié)作與產(chǎn)品落地:
與硬件、嵌入式開(kāi)發(fā)、產(chǎn)品及市場(chǎng)團(tuán)隊(duì)緊密合作,確保技術(shù)方案與產(chǎn)品需求和商業(yè)目標(biāo)的精準(zhǔn)對(duì)齊。
強(qiáng)力推動(dòng)技術(shù)方案的最終產(chǎn)品化落地,并構(gòu)建數(shù)據(jù)閉環(huán),通過(guò)數(shù)據(jù)收集與標(biāo)注持續(xù)迭代模型性能。
任職要求
1.計(jì)算機(jī)科學(xué)、人工智能、模式識(shí)別、電子信息等相關(guān)專(zhuān)業(yè)碩士及以上學(xué)歷(能力特別突出者可放寬至本科)。
2.五年以上AI相關(guān)領(lǐng)域研發(fā)經(jīng)驗(yàn),其中至少三年以上擔(dān)任技術(shù)領(lǐng)導(dǎo)或研發(fā)團(tuán)隊(duì)管理角色。
3.在圖像識(shí)別和智能語(yǔ)音交互兩大領(lǐng)域均具備深厚的技術(shù)功底和成功的項(xiàng)目落地經(jīng)驗(yàn)。
4.視覺(jué)技術(shù)能力:
精通人臉檢測(cè)、表情識(shí)別、目標(biāo)檢測(cè)等計(jì)算機(jī)視覺(jué)核心技術(shù),熟悉CNN、ResNet、VisionTransformer等模型。
具備豐富的模型輕量化實(shí)戰(zhàn)經(jīng)驗(yàn)(剪枝、蒸餾、量化),并熟悉TensorRT/OpenVINO/RKNN等至少一種部署工具。
5.語(yǔ)音技術(shù)能力:
擁有偽流式全鏈路語(yǔ)音交互項(xiàng)目的實(shí)戰(zhàn)經(jīng)驗(yàn),深刻理解并實(shí)現(xiàn)過(guò)VAD、ASR、LLM、TTS的整合鏈路。
熟悉主流ASR或TTS模型(如CTC,Transducer,VITS),以及麥克風(fēng)陣列處理和遠(yuǎn)場(chǎng)語(yǔ)音增強(qiáng)方案。
熟悉主流LLM(如Llama,GPT系列,GLM等)的API接入及微調(diào)技術(shù)(如LoRA,QLoRA等)。
6.精通Python,熟悉C++/C,并熟練掌握PyTorch/TensorFlow等至少一種主流深度學(xué)習(xí)框架及OpenCV等開(kāi)發(fā)包。
7.擁有智能硬件/IoT設(shè)備AI算法的量產(chǎn)落地案例。
加分項(xiàng):
1.主導(dǎo)或核心參與過(guò)情感計(jì)算、人機(jī)交互、AI玩偶、智能音箱、機(jī)器人等相關(guān)產(chǎn)品的研發(fā),且產(chǎn)品有成功量產(chǎn)經(jīng)驗(yàn)。
2.熟悉多模態(tài)模型(如LLaVA)并有相關(guān)項(xiàng)目實(shí)踐經(jīng)驗(yàn)者優(yōu)先。
3.熟悉ROS、機(jī)器人運(yùn)動(dòng)控制或嵌入式開(kāi)發(fā)者優(yōu)先。
4.在CVPR、ICCV、ACL、ICASSP等頂級(jí)會(huì)議或期刊發(fā)表過(guò)論文者優(yōu)先。
我們能為您提供:
作為早期核心成員,您將有機(jī)會(huì)從零到一地定義一款開(kāi)創(chuàng)性的AI產(chǎn)品。
提供極具市場(chǎng)競(jìng)爭(zhēng)力的薪酬待遇(14薪)加技術(shù)分紅,具體細(xì)節(jié)面議。
提供充足的研發(fā)資源、靈活的工作機(jī)制以及住宿。
工作地點(diǎn):深圳蓮塘
我們熱切期待對(duì)打造有溫度、有智慧的AI伙伴充滿激情,并具備上述卓越專(zhuān)業(yè)能力的您加入,與我們一同開(kāi)啟人機(jī)交互的全新篇章!

深圳羅湖區(qū)羅湖區(qū)高新技術(shù)產(chǎn)業(yè)第一園區(qū)附近
