算法工程師-CV方向

1.5-3萬(wàn)元/月

該職位于3日內(nèi)新發(fā)布

感興趣

撥打電話

職位詳情：

算法工程師

1.5-3萬(wàn)元/月

5-10年

AI算法工程師（多模態(tài)方向）

關(guān)于我們

本公司是香港牛道集團(tuán)的深圳分部，是一家著眼于未來(lái)的初創(chuàng)公司。我們正全力打造一款基于AI的情緒陪伴智能硬件產(chǎn)品，旨在通過(guò)尖端的多模態(tài)技術(shù)（融合視覺(jué)、語(yǔ)音、觸覺(jué)等）實(shí)時(shí)感知用戶情緒，并生成高度擬人化的反饋與交互。我們的愿景是，通過(guò)AI技術(shù)賦予產(chǎn)品“類(lèi)人化”的情感表達(dá)與交互能力，使其成為用戶獨(dú)一無(wú)二的情感伴侶，共同開(kāi)啟AI陪伴的新紀(jì)元。

職位概述

我們正在尋找一位兼具圖像識(shí)別與智能語(yǔ)音交互全鏈路技術(shù)能力的資深A(yù)I算法總監(jiān)。您將作為公司的核心技術(shù)領(lǐng)袖，全面負(fù)責(zé)和主導(dǎo)產(chǎn)品多模態(tài)AI戰(zhàn)略的制定與落地，帶領(lǐng)并組建AI算法團(tuán)隊(duì)，攻克從視覺(jué)感知到語(yǔ)音對(duì)話的各項(xiàng)技術(shù)挑戰(zhàn)，驅(qū)動(dòng)一款開(kāi)創(chuàng)性AI產(chǎn)品的誕生與迭代。

崗位職責(zé)

1.技術(shù)戰(zhàn)略與架構(gòu)設(shè)計(jì)：

主導(dǎo)公司AI技術(shù)的長(zhǎng)遠(yuǎn)發(fā)展藍(lán)圖與路線規(guī)劃，尤其是在多模態(tài)情感計(jì)算領(lǐng)域。

設(shè)計(jì)并構(gòu)建AI陪伴產(chǎn)品的核心算法架構(gòu)，確保圖像與語(yǔ)音兩大技術(shù)方向的深度融合與協(xié)同。

全面負(fù)責(zé)從語(yǔ)音喚醒、語(yǔ)音識(shí)別（ASR）、大語(yǔ)言模型（LLM）接入與融合，到語(yǔ)音合成（TTS）的全鏈路技術(shù)方案設(shè)計(jì)與實(shí)現(xiàn)。

2.核心算法研發(fā)與領(lǐng)導(dǎo)：

領(lǐng)導(dǎo)團(tuán)隊(duì)進(jìn)行核心算法的研發(fā)、優(yōu)化與部署，覆蓋圖像與語(yǔ)音兩大模塊：

視覺(jué)感知：指導(dǎo)高精度、輕量化的實(shí)時(shí)表情識(shí)別、手勢(shì)識(shí)別（15種）、及食物/水果種類(lèi)識(shí)別（約50種）模型的開(kāi)發(fā)與優(yōu)化。

語(yǔ)音交互：領(lǐng)導(dǎo)團(tuán)隊(duì)解決網(wǎng)絡(luò)延遲、模型推理耗時(shí)等問(wèn)題，實(shí)現(xiàn)接近真人對(duì)話的低延遲、可打斷的流暢溝通體驗(yàn)。

3.算法部署與性能優(yōu)化：

指導(dǎo)算法模型在嵌入式設(shè)備（如瑞芯微RK系列芯片）上的高效部署。

領(lǐng)導(dǎo)團(tuán)隊(duì)進(jìn)行模型的輕量化設(shè)計(jì)，包括不限于模型壓縮、量化、剪枝及蒸餾，并構(gòu)建高性能推理引擎（如TensorRT,ONNXRuntime），以滿足端側(cè)的低延遲與高能效需求。

4.多模態(tài)融合與前沿探索：

探索并實(shí)踐語(yǔ)音、文本、表情、動(dòng)作等多模態(tài)信息的融合策略，讓產(chǎn)品的交互更具表現(xiàn)力和情感感知力。

持續(xù)關(guān)注并研究AIAgent、具身智能等前沿技術(shù)，并將其應(yīng)用于產(chǎn)品迭代中。

6.跨部門(mén)協(xié)作與產(chǎn)品落地：

與硬件、嵌入式開(kāi)發(fā)、產(chǎn)品及市場(chǎng)團(tuán)隊(duì)緊密合作，確保技術(shù)方案與產(chǎn)品需求和商業(yè)目標(biāo)的精準(zhǔn)對(duì)齊。

強(qiáng)力推動(dòng)技術(shù)方案的最終產(chǎn)品化落地，并構(gòu)建數(shù)據(jù)閉環(huán)，通過(guò)數(shù)據(jù)收集與標(biāo)注持續(xù)迭代模型性能。

任職要求

1.計(jì)算機(jī)科學(xué)、人工智能、模式識(shí)別、電子信息等相關(guān)專(zhuān)業(yè)碩士及以上學(xué)歷（能力特別突出者可放寬至本科）。

2.五年以上AI相關(guān)領(lǐng)域研發(fā)經(jīng)驗(yàn)，其中至少三年以上擔(dān)任技術(shù)領(lǐng)導(dǎo)或研發(fā)團(tuán)隊(duì)管理角色。

3.在圖像識(shí)別和智能語(yǔ)音交互兩大領(lǐng)域均具備深厚的技術(shù)功底和成功的項(xiàng)目落地經(jīng)驗(yàn)。

4.視覺(jué)技術(shù)能力：

精通人臉檢測(cè)、表情識(shí)別、目標(biāo)檢測(cè)等計(jì)算機(jī)視覺(jué)核心技術(shù)，熟悉CNN、ResNet、VisionTransformer等模型。

具備豐富的模型輕量化實(shí)戰(zhàn)經(jīng)驗(yàn)（剪枝、蒸餾、量化），并熟悉TensorRT/OpenVINO/RKNN等至少一種部署工具。

5.語(yǔ)音技術(shù)能力：

擁有偽流式全鏈路語(yǔ)音交互項(xiàng)目的實(shí)戰(zhàn)經(jīng)驗(yàn)，深刻理解并實(shí)現(xiàn)過(guò)VAD、ASR、LLM、TTS的整合鏈路。

熟悉主流ASR或TTS模型（如CTC,Transducer,VITS），以及麥克風(fēng)陣列處理和遠(yuǎn)場(chǎng)語(yǔ)音增強(qiáng)方案。

熟悉主流LLM（如Llama,GPT系列,GLM等）的API接入及微調(diào)技術(shù)（如LoRA,QLoRA等）。

6.精通Python，熟悉C++/C，并熟練掌握PyTorch/TensorFlow等至少一種主流深度學(xué)習(xí)框架及OpenCV等開(kāi)發(fā)包。

7.擁有智能硬件/IoT設(shè)備AI算法的量產(chǎn)落地案例。

加分項(xiàng)：

1.主導(dǎo)或核心參與過(guò)情感計(jì)算、人機(jī)交互、AI玩偶、智能音箱、機(jī)器人等相關(guān)產(chǎn)品的研發(fā)，且產(chǎn)品有成功量產(chǎn)經(jīng)驗(yàn)。

2.熟悉多模態(tài)模型（如LLaVA）并有相關(guān)項(xiàng)目實(shí)踐經(jīng)驗(yàn)者優(yōu)先。

3.熟悉ROS、機(jī)器人運(yùn)動(dòng)控制或嵌入式開(kāi)發(fā)者優(yōu)先。

4.在CVPR、ICCV、ACL、ICASSP等頂級(jí)會(huì)議或期刊發(fā)表過(guò)論文者優(yōu)先。

我們能為您提供：

作為早期核心成員，您將有機(jī)會(huì)從零到一地定義一款開(kāi)創(chuàng)性的AI產(chǎn)品。

提供極具市場(chǎng)競(jìng)爭(zhēng)力的薪酬待遇（14薪）加技術(shù)分紅，具體細(xì)節(jié)面議。

提供充足的研發(fā)資源、靈活的工作機(jī)制以及住宿。

工作地點(diǎn)：深圳蓮塘

我們熱切期待對(duì)打造有溫度、有智慧的AI伙伴充滿激情，并具備上述卓越專(zhuān)業(yè)能力的您加入，與我們一同開(kāi)啟人機(jī)交互的全新篇章！

張女士實(shí)名企業(yè)IP：廣東深圳

深圳羅湖區(qū)羅湖區(qū)高新技術(shù)產(chǎn)業(yè)第一園區(qū)附近

工作地址：

深圳羅湖區(qū)羅湖區(qū)高新技術(shù)產(chǎn)業(yè)第一園區(qū)附近

點(diǎn)擊查看地圖

深圳市牛道科技有限公司

查看企業(yè)信息

法定代表人：俞文升

成立日期：2013-08-07

查看更多信息

亚洲天堂精品日韩一区-麻豆国产精品一二三区-日韩深夜福利在线观看-国产传媒视频在线免费观看

深圳市牛道科技有限公司

算法工程師-CV方向