职位描述
工作职责:
1.编写抓取互联网内容的爬虫。
2.数据抽取核心算法的编写与优化,提升爬虫抓取效率和质量。
3.抓取策略算法的更新维护,以及确保数据抽取准确、高效。
任职资格:
1.理工科专业,本科以上学历。
2.熟悉多线程、多进程、网络通信编程相关知识;
3.有java平台下网络爬虫开发经验,熟悉scrapy,WebMagic爬虫框架,selenium动化测试及phantomJS;
4.熟悉JavaScrip、HTML、XML、CSS技术,熟悉网页抓取原理及技术,熟悉正则表达式,从结构化的和非结构化的数据中获取信息;
5.具有团队合作精神,有责任感,对工作认真负责,有较强的协调和沟通能力。