職位描述:
崗位職責(zé) 1. 參與AI模型服務(wù)平臺的核心設(shè)計(jì)與開發(fā),如模型推理服務(wù)平臺核心能力搭建及各類管理功能; 2. 參與平臺管理后臺及相關(guān)配置界面開發(fā),實(shí)現(xiàn)模型部署服務(wù)監(jiān)控資源調(diào)度等功能的可視化管理,提升操作便捷性; 3. 持續(xù)跟進(jìn)AI Infra及大模型應(yīng)用相關(guān)開源項(xiàng)目,評估技術(shù)可行性,快速集成適配平臺的輕量化技術(shù)方案; 4. 基于Docker/K3s環(huán)境,編寫自動化腳本,完成裸金屬服務(wù)器的環(huán)境檢測系統(tǒng)初始化及模型運(yùn)行環(huán)境的標(biāo)準(zhǔn)化配置。 崗位要求 1. 熟悉Python或Go編程語言,具備2年以上服務(wù)端開發(fā)經(jīng)驗(yàn),能獨(dú)立完成后端模塊開發(fā)API設(shè)計(jì)與調(diào)試,具備良好的系統(tǒng)設(shè)計(jì)與邏輯抽象能力; 2. 熟悉Docker容器化技術(shù),了解K3s/Kubernetes基礎(chǔ)使用,具備容器化環(huán)境下的開發(fā)部署與問題調(diào)試經(jīng)驗(yàn); 3. 了解大模型推理服務(wù)或AI應(yīng)用的基本原理,有相關(guān)項(xiàng)目實(shí)踐經(jīng)驗(yàn)者優(yōu)先;具備良好的工程習(xí)慣,能獨(dú)立推進(jìn)功能開發(fā),并完成相關(guān)技術(shù)文檔編寫; 4. 具備較強(qiáng)的問題排查能力,能快速定位并解決開發(fā)部署過程中的環(huán)境代碼相關(guān)問題。 加分項(xiàng) 1. 深入使用或研究過vLLMllama.cppFastChat等模型服務(wù)項(xiàng)目;具備GPU服務(wù)器運(yùn)維CUDA環(huán)境配置或AI推理/訓(xùn)練環(huán)境調(diào)優(yōu)經(jīng)驗(yàn); 2. 參與過平臺型系統(tǒng)調(diào)度系統(tǒng)或資源管理類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),有相關(guān)架構(gòu)設(shè)計(jì)或核心模塊開發(fā)經(jīng)驗(yàn); 3. 使用過RAGAgent或工作流相關(guān)框架(如DifyLangChain等),有大模型應(yīng)用開發(fā)經(jīng)驗(yàn)者優(yōu)先; 4. 具備全棧開發(fā)能力,熟悉React/Vue等前端框架及現(xiàn)代前端工程化,能獨(dú)立完成簡單前端頁面開發(fā); 5. 熟悉Linux系統(tǒng)運(yùn)維,,掌握Linux自定義鏡像封裝(適配GPU及模型運(yùn)行場景)。 舉報(bào)
崗位職責(zé) 1. 參與AI模型服務(wù)平臺的核心設(shè)計(jì)與開發(fā),如模型推理服務(wù)平臺核心能力搭建及各類管理功能; 2. 參與平臺管理后臺及相關(guān)配置界面開發(fā),實(shí)現(xiàn)模型部署服務(wù)監(jiān)控資源調(diào)度等功能的可視化管理,提升操作便捷性; 3. 持續(xù)跟進(jìn)AI Infra及大模型應(yīng)用相關(guān)開源項(xiàng)目,評估技術(shù)可行性,快速集成適配平臺的輕量化技術(shù)方案; 4. 基于Docker/K3s環(huán)境,編寫自動化腳本,完成裸金屬服務(wù)器的環(huán)境檢測系統(tǒng)初始化及模型運(yùn)行環(huán)境的標(biāo)準(zhǔn)化配置。 崗位要求 1. 熟悉Python或Go編程語言,具備2年以上服務(wù)端開發(fā)經(jīng)驗(yàn),能獨(dú)立完成后端模塊開發(fā)API設(shè)計(jì)與調(diào)試,具備良好的系統(tǒng)設(shè)計(jì)與邏輯抽象能力; 2. 熟悉Docker容器化技術(shù),了解K3s/Kubernetes基礎(chǔ)使用,具備容器化環(huán)境下的開發(fā)部署與問題調(diào)試經(jīng)驗(yàn); 3. 了解大模型推理服務(wù)或AI應(yīng)用的基本原理,有相關(guān)項(xiàng)目實(shí)踐經(jīng)驗(yàn)者優(yōu)先;具備良好的工程習(xí)慣,能獨(dú)立推進(jìn)功能開發(fā),并完成相關(guān)技術(shù)文檔編寫; 4. 具備較強(qiáng)的問題排查能力,能快速定位并解決開發(fā)部署過程中的環(huán)境代碼相關(guān)問題。 加分項(xiàng) 1. 深入使用或研究過vLLMllama.cppFastChat等模型服務(wù)項(xiàng)目;具備GPU服務(wù)器運(yùn)維CUDA環(huán)境配置或AI推理/訓(xùn)練環(huán)境調(diào)優(yōu)經(jīng)驗(yàn); 2. 參與過平臺型系統(tǒng)調(diào)度系統(tǒng)或資源管理類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),有相關(guān)架構(gòu)設(shè)計(jì)或核心模塊開發(fā)經(jīng)驗(yàn); 3. 使用過RAGAgent或工作流相關(guān)框架(如DifyLangChain等),有大模型應(yīng)用開發(fā)經(jīng)驗(yàn)者優(yōu)先; 4. 具備全棧開發(fā)能力,熟悉React/Vue等前端框架及現(xiàn)代前端工程化,能獨(dú)立完成簡單前端頁面開發(fā); 5. 熟悉Linux系統(tǒng)運(yùn)維,,掌握Linux自定義鏡像封裝(適配GPU及模型運(yùn)行場景)。 舉報(bào)
- 你可能感興趣的職位
- 最近瀏覽記錄
-
1.2萬以上/月
-
5-6千/月
-
0.4-1萬/月
-
5.5-6.5千/月
-
4-8千/月
-
4-8千/月
-
5.5-6千/月
-
5.5-6.5千/月
- 公司規(guī)模:100-499人
- 公司性質(zhì):0
- 所屬行業(yè):電力、電氣、自動化、熱力、鍋爐、照明、電池、電源、電纜、光電等
聯(lián)系方式
- 聯(lián)系人:黃丹琪
- 手機(jī):會員登錄后才可查看
- 郵箱:會員登錄后才可查看
- 郵政編碼:
工作地址
- 地址:深圳市南山區(qū)粵海街道盈峰中心16樓
