<rt id="eqeyq"><delect id="eqeyq"></delect></rt><rt id="eqeyq"><tr id="eqeyq"></tr></rt>
  • <rt id="eqeyq"></rt><abbr id="eqeyq"></abbr>
    <button id="eqeyq"><input id="eqeyq"></input></button>
    <bdo id="eqeyq"></bdo>
    <table id="eqeyq"></table>
    好獵頭網(wǎng)-中高級(jí)人才獵頭網(wǎng)站!服務(wù)熱線:400-1801-668 好獵頭   |   登錄 注冊(cè)

    爬蟲(chóng)架構(gòu)師崗位職責(zé)、要求

    添加時(shí)間:2019-06-27 10:59:29
    瀏覽次數(shù): 0
    爬蟲(chóng)架構(gòu)師職位要求
    1.全日制本科及以上,5年以上python/java開(kāi)發(fā)經(jīng)驗(yàn),3年以上數(shù)據(jù)抓取工作經(jīng)驗(yàn);
    2.精通使用分布式基本知識(shí),設(shè)計(jì)與開(kāi)發(fā)爬蟲(chóng)系統(tǒng)架構(gòu);
    3.精通使用爬蟲(chóng)相關(guān)技術(shù),如:python, scrapy, selenium, xpath, 正則表達(dá)式 但不限于以上技術(shù)等,有app研發(fā)背景或app爬蟲(chóng)開(kāi)發(fā)經(jīng)驗(yàn)佳,有逆向經(jīng)驗(yàn)尤佳;
    4.精通高并發(fā)、高性能的分布式系統(tǒng)的設(shè)計(jì)及應(yīng)用,熟悉常用數(shù)據(jù)存儲(chǔ),各種數(shù)據(jù)處理技術(shù)優(yōu)先; 
    5.能夠解決封賬號(hào)、封IP采集等問(wèn)題,解決網(wǎng)頁(yè)抓取、信息抽取等問(wèn)題,構(gòu)建完善的網(wǎng)絡(luò)信息收集平臺(tái);
    6.熟悉Linux常用命令,獨(dú)立完成日常部署更新等;
    7.具備較強(qiáng)的團(tuán)隊(duì)協(xié)作精神,工作責(zé)任心強(qiáng),良好的溝通、理解、執(zhí)行能力。

    爬蟲(chóng)架構(gòu)師崗位職責(zé)
    1.參與消費(fèi)大數(shù)據(jù)的建設(shè),專注于垂直領(lǐng)域數(shù)據(jù)爬取,進(jìn)行多平臺(tái)信息的抓取和分析; 
    2.對(duì)爬蟲(chóng)系統(tǒng)的架構(gòu)設(shè)計(jì)與開(kāi)發(fā); 
    3.深刻理解爬蟲(chóng)系統(tǒng)架構(gòu),能對(duì)系統(tǒng)架構(gòu)提出自己的見(jiàn)解和優(yōu)化方案;
    4.實(shí)現(xiàn)數(shù)據(jù)提取、清洗、結(jié)構(gòu)化、入庫(kù)、統(tǒng)計(jì)分析等需求; 
    5.建立爬蟲(chóng)監(jiān)測(cè)體系,及時(shí)分析及解決爬蟲(chóng)在運(yùn)行過(guò)程中出現(xiàn)的缺陷;
    6.研究?jī)?yōu)化算法,提升爬蟲(chóng)系統(tǒng)的穩(wěn)定性、可擴(kuò)展性; 
    7.設(shè)計(jì)爬蟲(chóng)策略和防屏蔽規(guī)則,提升網(wǎng)頁(yè)抓取的效率和質(zhì)量; 
    8.能獨(dú)立解決實(shí)際開(kāi)發(fā)過(guò)程碰到的各類問(wèn)題。
    主站蜘蛛池模板: 河东区| 沧源| 句容市| 澎湖县| 逊克县| 全南县| 呈贡县| 城口县| 汤阴县| 安溪县| 潞西市| 桂阳县| 手机| 惠州市| 北安市| 林州市| 桂林市| 开江县| 西平县| 华容县| 鄂温| 樟树市| 兴化市| 治多县| 兴安县| 乌兰察布市| 青铜峡市| 兖州市| 金堂县| 孟村| 大兴区| 鄂托克前旗| 犍为县| 阿合奇县| 莱西市| 拜城县| 旬邑县| 章丘市| 沈丘县| 井陉县| 连州市|