职位描述
岗位职责:
1. 遵循robots协议,采集互联网公开的各类信息,满足公司业务需求;
2. 负责爬虫系统及体系的建设,优化数据调度、抓取、解析、存储等全流程;
3. 帮助团队攻克各种爬虫技术难关、提升海量数据系统的抓取效果与性能;任职要求:
1. 本科及以上学历,2年及以上爬虫抓取采集相关工作经验;
2. 熟悉主流爬取技术及爬虫框架工具,如Selenium/Puppeteer/Scrapy/Playwright等;
3. 熟练掌握python,具备扎实的编码能力;
4. 熟悉常见反爬封禁策略,并具备相关的实战经验;
职能类别:爬虫工程师
关键字:编码seleniumscrapy爬取数据系统爬虫框架数据调度爬虫系统puppeteerrobots