職位描述
崗位職責:1、負責可面向多領域場景(低質文檔,OS屏幕等)OCR通用引擎及產品平臺架構研發,實現高精度,高可信,高性能的各類圖像文字識別服務2、利用各類機器學習前沿技術不斷優化模型、建立OCR場景模型訓練的通用高效流程,融合NLP和知識圖譜技術實現OCR效果的精度提升和結構化文本抽取3、具體工作內容涵蓋需求探討、標注數據體系建設、系統方案架構設計、模型建模調優方法研究、saas服務流程設計并能對OCR團隊進行有效技術指導。任職要求:1. 具有計算機科學、圖像處理、模式識別、機器學習、人工智能、數學等相關專相關專業本科以上學歷,掌握扎實的機器學習、計算機視覺、OCR的理論基礎;2. 3年以上CV通用模型設計和實現經驗,熟悉圖像處理、圖像分割、目標檢測,多語言文字識別等相關的算法,精通不同場景字符檢測的自動化分類和算法方案的選擇與實現,并在通用OCR引擎方面有扎實的研發經驗,實現過一款市場主流產品級別通用OCR引擎;3.熟悉深度學習技術,精通一種以上深度學習開源框架,如TensorFlow、PyTorch、MXnet、Keras、paddlepaddle等,能靈活地運用框架解決模型構建、訓練、優化的問題;4.扎實的工程實現能力,Python等Coding能力較強,C++熟練;5.學習能力強,能夠跟蹤業內最新論文和成果。
企業介紹
1、團隊:核心成員組成阿里,華為,百度
2、產品:輿情監測方向
3、上海總部,武漢研發中心,北京分公司下半年
4、上海辦公地點:上海市靜安區彭江路大寧易園