<rt id="eqeyq"><delect id="eqeyq"></delect></rt><rt id="eqeyq"><tr id="eqeyq"></tr></rt>
  • <rt id="eqeyq"></rt><abbr id="eqeyq"></abbr>
    <button id="eqeyq"><input id="eqeyq"></input></button>
    <bdo id="eqeyq"></bdo>
    <table id="eqeyq"></table>
    好獵頭網(wǎng)-中高級(jí)人才獵頭網(wǎng)站!服務(wù)熱線:400-1801-668 好獵頭   |   登錄 注冊(cè)
    首頁(yè) > 人才求職

    大模型部署工程師

    刷新時(shí)間:40秒前

    深圳市邁特芯科技有限公司

    20-45萬(wàn)

    深圳市 | 碩士 | 無(wú)經(jīng)驗(yàn)

    基本信息
    工作地點(diǎn):深圳市
    招聘人數(shù):1 人
    職位描述

    崗位職責(zé)1、搭建端到端部署流水線,集成模型壓縮、編譯優(yōu)化、服務(wù)編排等流程,支持一鍵式部署。2、設(shè)計(jì)并實(shí)現(xiàn)大模型(如GPT、LLaMA、PaLM等)的分布式推理架構(gòu),支持GPU/TPU集群的高效協(xié)同。3、優(yōu)化模型服務(wù)的并發(fā)處理能力,實(shí)現(xiàn)萬(wàn)級(jí)QPS(每秒查詢數(shù))的高吞吐場(chǎng)景。4、開(kāi)發(fā)自適應(yīng)負(fù)載均衡系統(tǒng),根據(jù)實(shí)時(shí)流量動(dòng)態(tài)分配計(jì)算資源,避免服務(wù)雪崩。5、開(kāi)發(fā)自動(dòng)擴(kuò)縮容策略,基于流量預(yù)測(cè)和實(shí)時(shí)監(jiān)控快速響應(yīng)峰值壓力。6、研究稀疏化推理、MoE模型部署、異構(gòu)計(jì)算加速(GPU+NPU)等方向,推動(dòng)技術(shù)邊界。任職要求1、計(jì)算機(jī)/電子工程/數(shù)學(xué)相關(guān)專業(yè)碩士及以上,2年以上AI基礎(chǔ)設(shè)施或分布式系統(tǒng)開(kāi)發(fā)經(jīng)驗(yàn)。2、精通PyTorch/TensorFlow框架,熟悉大模型結(jié)構(gòu)(Transformer、Attention機(jī)制)及推理優(yōu)化技術(shù)。3、掌握分布式系統(tǒng)設(shè)計(jì)(Kubernetes、Ray Cluster、NCCL),具備大規(guī)模集群(100+節(jié)點(diǎn))的部署調(diào)優(yōu)經(jīng)驗(yàn)。4、有十萬(wàn)級(jí)QPS在線服務(wù)開(kāi)發(fā)經(jīng)驗(yàn),熟悉高并發(fā)場(chǎng)景下的性能瓶頸與解決方案(如異步IO、無(wú)鎖隊(duì)列)。5、深入理解網(wǎng)絡(luò)協(xié)議棧優(yōu)化(gRPC/HTTP2/QUIC)、連接池管理、長(zhǎng)尾延遲治理。6、強(qiáng)烈的技術(shù)熱情,能快速?gòu)?fù)現(xiàn)論文方案并工程化落地。

    崗位要求:
    學(xué)歷要求:碩士 工作經(jīng)驗(yàn):無(wú)經(jīng)驗(yàn)
    年齡要求:不限 性別要求:不限
    語(yǔ)言要求:普通話
    企業(yè)信息
    公司性質(zhì):其它 公司規(guī)模:20-99人
    所屬行業(yè):人工智能/大模型
    企業(yè)介紹

    一、公司概述:深圳市邁特芯科技有限公司成立于2023年底,由南方科技大學(xué)余浩教授領(lǐng)銜的深圳市孔雀團(tuán)隊(duì)孵化,專注于具身智能芯片研發(fā)與端側(cè)大模型部署。公司以“低功耗、高能效”為核心競(jìng)爭(zhēng)力,致力于為AI手機(jī)、穿戴設(shè)備、機(jī)器人及智能硬件提供國(guó)際領(lǐng)先的算力解決方案,推動(dòng)人工智能在端側(cè)場(chǎng)景的規(guī)模化落地。二、核心技術(shù):LPU芯片架構(gòu):采用22-40nm制程與3D-DRAM混合鍵合技術(shù),實(shí)現(xiàn)5W超低功耗下>200tps的推理性能,帶寬利用率達(dá)80%,兼容DeepSeek、GLM、Llama等主流大模型。端側(cè)優(yōu)化技術(shù):融合立方脈動(dòng)架構(gòu)、張量壓縮算法、感算一體設(shè)計(jì),顯著提升端側(cè)設(shè)備的實(shí)時(shí)決策與多模態(tài)數(shù)據(jù)處理能力。三、產(chǎn)品矩陣:7B MetaChip:旗艦級(jí)端側(cè)推理芯片(算力4.92 TOPS,性能>200Token/s),應(yīng)用于手機(jī)、平板、PC等核心終端。1B MetaChip:高集成泛端側(cè)芯片(功耗<200RMB),適配AI耳機(jī)、桌面機(jī)器人等輕量化場(chǎng)景。14B MetaChip:高性能SoC芯片,專為具身智能機(jī)器人、無(wú)人機(jī)設(shè)計(jì),支持10B+大模型實(shí)時(shí)部署。四、市場(chǎng)與客戶千億級(jí)賽道:覆蓋端側(cè)大模型芯片1000億存量市場(chǎng)及具身智能硬件100億增量市場(chǎng),技術(shù)對(duì)標(biāo)英偉達(dá)、高通。頭部合作:與華為、榮耀、大疆、優(yōu)必選等企業(yè)深度合作,產(chǎn)品應(yīng)用于:AGI-PC/手機(jī):為華為預(yù)研項(xiàng)目提供端側(cè)大模型算力支持,人力降本效率提升>20倍。具身智能硬件:賦能大疆無(wú)人機(jī)視覺(jué)決策、優(yōu)必選人形機(jī)器人多模態(tài)交互,實(shí)現(xiàn)本地化低延遲推理。五、核心團(tuán)隊(duì)創(chuàng)始人余浩教授:國(guó)家萬(wàn)人計(jì)劃科技創(chuàng)新領(lǐng)軍人才、IEEE國(guó)際宣講人,20年+芯片設(shè)計(jì)經(jīng)驗(yàn),主導(dǎo)多項(xiàng)國(guó)家級(jí)科研項(xiàng)目。頂尖團(tuán)隊(duì):成員來(lái)自華為、ARM、英偉達(dá)等頭部企業(yè),涵蓋芯片架構(gòu)、AI算法、硬件量產(chǎn)全鏈路專家,累計(jì)發(fā)表頂會(huì)論文100+篇,獲吳文俊人工智能獎(jiǎng)等權(quán)威榮譽(yù)。產(chǎn)學(xué)研協(xié)同:依托南方科技大學(xué)實(shí)驗(yàn)室資源,與ARM中國(guó)、中興共建聯(lián)合實(shí)驗(yàn)室,加速技術(shù)商業(yè)化落地。六、愿景與使命邁特芯以“讓智能觸手可及”為使命,通過(guò)革新端側(cè)算力技術(shù),推動(dòng)AGI普惠化發(fā)展,成為全球具身智能芯片領(lǐng)域的標(biāo)桿企業(yè)。

    企業(yè)信息

    深圳市邁特芯科技有限公司

    人工智能/大模型

    20-99人

    其它

    深圳市南山區(qū)西麗街道西麗社區(qū)打石二路萬(wàn)科云城六期一棟云中城B704

    推薦企業(yè)
    二維碼
    微信掃一掃
    用手機(jī)分享職位信息
    深圳市最新發(fā)布職位
    主站蜘蛛池模板: 类乌齐县| 南丰县| 霞浦县| 岳阳县| 邓州市| 方正县| 大荔县| 仁怀市| 山阳县| 盐山县| 安顺市| 如东县| 米林县| 盐山县| 上虞市| 澄江县| 连州市| 兰西县| 利辛县| 四会市| 鲁山县| 四子王旗| 休宁县| 武川县| 米易县| 新野县| 祁连县| 涟水县| 兰州市| 神池县| 华安县| 乐业县| 竹溪县| 栾城县| 定安县| 项城市| 巴南区| 建湖县| 安多县| 吉首市| 长垣县|