职位详情

找工作 心仪offer,入职涨薪 咨询顾问

深圳市 3-5 年 本科 全职
2025-02-24

职位发布人

24895171

昨日活跃

启程智远集团HRD

立即沟通

职位要求

职位描述:
1、负责设计和开发分布式网络爬虫系统,进行数据抓取和分析;
2、设计爬虫策略和防屏蔽规则,提升网页抓取的效率和质量;
3、参与分布式爬虫和数据采集系统的架构设计和开发,快速响应业务变动;
4、负责网络数据抓取规划、定期爬取指定网站的数据;
5、参与数据层建设,专注于垂直领域数据爬取,进行多平台信息的抓取和分析;
6、实现数据提取、清洗、结构化、入库、统计分析等需求;
7、研究优化算法,提升爬虫系统的稳定性、可扩展性。
任职要求:
1、本科及以上学历,5年以上爬虫抓取采集相关工作经验,爬虫基础扎实;
2、熟练Python和常用的开源库,熟练使用Django/Flask等至少一种主流的web开发框架;
3、熟练Mysql,MongoDB, Redis,Es,队列等数据库的使用和优化;
4、对进程、线程、协程、异步、非阻塞有一定了解和使用;
5、熟练掌握爬虫主流框架Scrapy、Selenium、gocolly,webmagic等(深入了解其中一种);
6、熟悉应用IP代理池、Headers认证和Cookie等;
7、熟悉分布式爬虫,JS防护、混淆、逆向分析等技能,熟悉各种浏览器检测/反检测手段;
8、熟悉Python/Java/Go/C++其中一种语言,具备扎实的编码能力;
9、责任心强、工作积极、良好的服务意识、较强的工作适应能力,自我驱动;
10、加分项:逆向、分布式、数据分析、数据挖掘;有训练过自己的模型;github或者码云有相关开源项目;有海量代理池搭建经验;有采集政府网址经验优先考虑;

深圳启程智远网络科技有限..

网络产品开发

民营企业 100 - 499人

带薪年假 岗位晋升 管理规范 扁平管理 技能培训

相似职位

投递简历 立即沟通
×
温馨提示
经研究,先留言,再投递,企业回复率更高哦
提示 ×

您好,请登录一览职业app或微信小程序查看最新回复进度。可在手机打开m.job1001.com前往页面底部下载app或者前往手机应用市场搜索

×
该职位打招呼次数达到上限,请第二天后再尝试
第一时间接收面试通知
手机先聊,聊好再面,面试不白跑