崗位職責:
1、負責網頁信息抽取技術的研究和開發(fā);
2、負責爬蟲各個系統(tǒng)核心代碼開發(fā);
3、提高數據抓取的效率和質量,解決數據的重復,垃圾數據識別,清洗;
4、提高系統(tǒng)的可運維,可測性,易用性。
任職要求:
1、3年以上python或java開發(fā)經驗;
2、熟悉MYSQL,MSSQL,具備sql調優(yōu)經驗;
3、了解爬蟲的設計及實現流程;
4、了解HTML基礎知識;
5、具備團隊協作精神;
6、了解文本分類,統(tǒng)計分析,自然語言處理,機器學習算法,熟悉前端技術和分布式計算,有分布式存儲經驗者優(yōu)先。
聯系我時,請說是在臨沂招聘網上看到的,謝謝!