数据爬虫工程师 15K---20K
板块:爬虫、开发
岗位职责:
1. 负责业务需求的数据采集与爬取、解析处理、入库及备份等数据工作;
2. 研究Web、APP反爬策略,攻克技术难点,激活成功教程反爬机制,优化爬虫路由调度策略,同时负责反爬策略的设计及优化;
3. 负责爬虫核心算法的策略优化研究,提升爬虫抓取效率和质量,提升网页抓取的效率和质量;
4. 设计爬虫策略和防屏蔽规则,解决封账号、封IP、验证码、JS加密等难点攻克;
5. 对抓取后的网页数据进行清洗、预处理,包括去除重复内容、填充缺失值、处理异常值等;
6. 建立与维护本地数据库,
任职条件:
1. 2年及以上的网络爬虫开发经验,有web端和app端数据抓取能力,熟悉两端的数据抓取方法,计算机相关专业背景;
2. 熟悉分布式网络爬虫开发;熟悉HTTP协议, xpath,css选择器等;
3. 熟悉网页抓取原理及技术,熟悉正则表达式,从结构化的和非结构化的数据中获取信息;熟悉javascript, 网站加密逆向;能处理各种javascript加密激活成功教程;
4. 有Scrapy redis spider分布式抓取系统的开发、架构经验,至少熟悉并使用过一种主流爬虫架构,熟练编写scrapy中间件;
5. 具有丰富的反反爬经验,包括图形验证码、滑块验证码、代理IP、JS加密、so签名等;
6. 熟悉mysql、redis、kafka等数据库缓存中间件;
7. 优秀的学习能力与工作规划能力;
8. 良好工作习惯与团队合作精神,能够在跨学科环境中有效沟通。
数据爬虫工程师 15K---20K
板块:爬虫、开发
岗位职责:
1. 负责业务需求的数据采集与爬取、解析处理、入库及备份等数据工作;
2. 研究Web、APP反爬策略,攻克技术难点,激活成功教程反爬机制,优化爬虫路由调度策略,同时负责反爬策略的设计及优化;
3. 负责爬虫核心算法的策略优化研究,提升爬虫抓取效率和质量,提升网页抓取的效率和质量;
4. 设计爬虫策略和防屏蔽规则,解决封账号、封IP、验证码、JS加密等难点攻克;
5. 对抓取后的网页数据进行清洗、预处理,包括去除重复内容、填充缺失值、处理异常值等;
6. 建立与维护本地数据库,
任职条件:
1. 2年及以上的网络爬虫开发经验,有web端和app端数据抓取能力,熟悉两端的数据抓取方法,计算机相关专业背景;
2. 熟悉分布式网络爬虫开发;熟悉HTTP协议, xpath,css选择器等;
3. 熟悉网页抓取原理及技术,熟悉正则表达式,从结构化的和非结构化的数据中获取信息;熟悉javascript, 网站加密逆向;能处理各种javascript加密激活成功教程;
4. 有Scrapy redis spider分布式抓取系统的开发、架构经验,至少熟悉并使用过一种主流爬虫架构,熟练编写scrapy中间件;
5. 具有丰富的反反爬经验,包括图形验证码、滑块验证码、代理IP、JS加密、so签名等;
6. 熟悉mysql、redis、kafka等数据库缓存中间件;
7. 优秀的学习能力与工作规划能力;
8. 良好工作习惯与团队合作精神,能够在跨学科环境中有效沟通。
到此这篇爬虫跟java哪个好(爬虫和java哪个好)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!
版权声明:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符,请将相关资料发送至xkadmin@xkablog.com进行投诉反馈,一经查实,立即处理!
转载请注明出处,原文链接:https://www.xkablog.com/jjc/27554.html