職位描述
崗位職責1. 負責設計、開發并優化高效穩定的網絡爬蟲框架,進行大規模數據采集與處理工作。2. 深入研究各類網站的結構與反爬機制,制定并實現有效的數據抓取策略(包括但不限于 User Agent 模擬、動態渲染頁面處理、瀏覽器自動化、流量管理與規避反爬技術等)。3. 基于 Python / Node.js / Go 等編程語言,構建并維護高效、可擴展的爬蟲服務,確保數據抓取的高穩定性與高并發性能。4. 運用 AI 工具驅動日常研發效率提升,探索前沿爬蟲技術方案,及時分享并快速落地。5. 與后端、數據分析、產品團隊緊密協作,快速響應需求變化,保障數據獲取的時效性與準確性。任職要求1. 海內外院校2024/2025屆畢業生(本科/研究生),第一學歷為QS100、985、兩電一郵或以上,專業方向涵蓋計算機、軟件工程、人工智能、數據科學等。2. 熟練掌握常用的后端開發語言(Python/Node.js/Go 等)。3. 對網絡爬蟲、網頁抓取有濃厚興趣與深入研究,熟悉 HTTP 協議、瀏覽器原理、反爬技術(如 User-Agent 模擬、Session 管理、動態頁面抓取、代理池管理、驗證碼識別等);4. 熟悉常用爬蟲框架和工具(如 Scrapy、Puppeteer、Playwright、Selenium 等),了解數據存儲與消息隊列技術(如 MongoDB、Redis、Kafka 等)5. 具備強烈的 AI 工具使用習慣,日常高頻使用 ChatGPT、GitHub Copilot、Cursor 或其他 AI 輔助工具來提升研發效率。6. 能夠將想法快速轉化成實驗與原型并進行數據驗證,具備靈活多變、持續迭代的研發心態。
企業介紹
深圳天云如川科技有限公司位于深圳市南山區西麗大學城。公司成立于2020年,并于次年完成A輪融資。使命與愿景在AI技術發展的背景下,我們的使命是:致力于Context Management Capability(上下文管理能力)的研發與應用。隨著大模型技術的發展,人類與AI工具及智能代理之間的交互需要有效的Context獲取、理解與管理支持。基于這一理念,我們正在開發Context-as-a-Service(CaaS)平臺,努力為智能時代創造價值。團隊背景公司核心團隊成員具有帝國理工學院與格拉斯哥大學的學術背景,擁有技術研發經驗和創業經歷。團隊成員此前曾參與創立多家企業并有成功案例,積累了豐富的市場經驗。工作方式我們在日常工作中積極應用AI技術,探索創新的工作模式。我們正在建設適應技術發展的組織形態:團隊成員接受AI工作方法培訓,同時也參與優化個人工作流程,共同探索人機協作的可能性。加入我們加入天云如川,您將有機會參與技術創新,學習AI工作方法,提升專業能力。我們期待與您一起探索AI時代的工作方式,共同發展。