職位描述
崗位職責:1、聚焦強化學習(RL)、模仿學習(IL)、離線強化學習(Offline RL)等方向,構建基于多模態感知的決策系統,開發從仿真環境到物理世界的高效遷移學習框架(sim2real),推動機器人復雜操作技能的自主學習與持續進化。2、對前沿技術工程化落地,構建算法-仿真-硬件閉環驗證體系,攻克傳感器噪聲補償、動態環境感知、機械臂運動學約束等現實場景挑戰。3、研發機器人操作算法,探索基于Transformer、Diffusion Model、圖神經網絡(GNN)等架構的端到端控制范式,開發跨模態表征學習系統(視覺/力覺/觸覺/語音),實現復雜任務的長周期規劃與柔性操作。4、持續優化工作流程,提升機器人仿真效率和質量。任職要求:1、研究生及以上學歷,計算機、自動化以及人工智能等相關專業。2、精通Python,熟悉PyTorch,Jax等深度學習框架。3、具有扎實的模仿學習和強化學習領域的與機器人操作的相關的研究經歷,熟悉強化學習的相關框架,如Stable Baselines,rsl-sl等,有sim2real項目或者相關論文者優先。4、熟悉常見的機器人仿真軟件,如lsaac-sim、Mujoco等。熟悉3d渲染引擎優先,如Blender,Omniverse和Unreal.。5、熟悉3D場景理解(NeRF/Gaussian Splatting)、動態物體操作(非剛性物體抓取)、接觸力學建模等6、部署能力:熟悉ROS2、LCM通信協議,有TensorRT/OpenVINO部署經驗者優先7、有ACT,Diffusion Policy、VLA等端到端算法以及多模態機器人操作算法研究背景者優先。
企業介紹
天娛數科(股票代碼:002354.SZ),錨定AI 開拓者定位,致力于為企業數字化轉型和智能化升級全面賦能。公司把“數據要素x”與“人工智能+”結合起來,依托在各類業務場景中積累的海量數據要素資源優勢和人工智能算法技術優勢,自研多個企業級大模型,構筑了AI 營銷 SaaS、移動應用分發 PaaS、空間智能MaaS 三大業務平臺,持續推動零售、工業、金融、文娛等多個行業的數轉智改,形成服務百行千業萬家企業客戶的業務生態。