投递简历联系龙八娱乐员工登录入口

高薪职位

High position
微信公众平台:搜索CareeyWay 或扫描下面的二维码

Python数据挖掘

职位编号:319  最后更新:2016/5/9 18:29:39  浏览次数:107次

职位信息

  • 招聘公司:知名商业数据服务公司

职位描述:

1、 互联网网站,网页,链接的特征挖掘,对指定的多个网站的网页进行网页抓取、数据的提取、清洗、入库;

2、 开发垂直站点定向抓取程序,持续优化系统已有模块性能;

3、 对搜索、匹配、同步等后台守护程序进行性能优化等;

4、 负责系统日常运营资源调度优化及运营指标分析调优,并能实时监控爬虫的进度和警报反馈;

5、 负责特殊网页采集任务的分析及采集方案设计。

任职要求:

1、 有较多的Web站点爬取开发经验,至少熟悉Python

2、 熟悉网页抓取原理及技术,熟悉基于Cookie的网站登录原理,熟悉基于正则表达式、XpathCss等网页信息抽取技术;

3、 熟悉多线程,熟悉使用至少一种关系型数据库MySQLOracle等,熟悉NoSQlhbaseMongo

4、 良好的编程风格,对整洁代码有追求;

5、 良好的沟通能力和团队合作精神。

快速申请职位

推荐给朋友

恭喜你!简历提交成功!

您的简历已经收录在科诺维的人才数据库中,龙八娱乐将为您推荐适合您的职位!请保持联系方式畅通!

恭喜你!职位推荐成功!

职位信息已发送到您朋友的电子邮箱,请告知查收!

网站地图

友情链接: 众智云慧成都管理咨询 
成都市高新区天府大道1480号(孵化园)德商国际A座406室 Tel:+86 28 85317585                        蜀ICP备11017771号-1
©2011-2018 龙八娱乐 版权所有 网站建设:呼啸网络