7年工作经验。熟练使用scrapy、aiohttp、asyncio、flask、requests等库,掌握mysql、MongoDB、redis等数据库在爬虫中的运用,linux下爬虫开发部署。处理js逆向、图片验证码、文字样式加密,ip封禁,账号登录等反爬虫问题。熟练使用pyth on多进程+协程高并发。涉及dl,可手写分类问题源码。
个人介绍
项目经验
需要实时更新上述两个网站最新披露的数据,两个网站存在很多可用信息,爬取量大,时效性要求较高 2.技术手段以及实现思路 a.考虑数据量大,主要为结构化数据,使用mysql数据库,pymysql便于操作,代理池proxypool提供代理数据避免ip封禁b.针对两个网站的项目,建立两个scrapyproject,两个项目实现思路一样。考虑以后会新增其他数据需求,start_requests里面使用主域名。针对不同数据需求分析页面,在生成的新请求里面调用不同的parse函数 c.设置异常处理情况,遇到异常时,记录异常信息保存到本地便于后期分析,setting里面注释钓默认的中间件 d.以上架构综合考虑了反爬虫机制,易于修改代码后增加后期数据需求,容错机制等
接单发单客服
添加客服微信,接单发单快人一步!
相关程序员推荐
leon 5年经验
本人擅长Python、Golang等后端Wev开发;擅长多种数据库操作;擅长小程序、网络、算法相关的项目开发;并且有一群靠谱且技术过硬的小伙伴;本人崇尚合作精神,是一个遵守规则的人。
袁宇 0年经验
接本科水平订单;
可使用C/C++、Python编程,OpenCV图像处理,QT开发上位机,STM32单片机开发;
可使用SolidWorks进行建模,CAD绘制图纸,Protues/Multisim电路仿真;
参加多项工科类竞赛,均为教育部认可A类竞赛;
码农 5年经验
五年后端开发经验,一年前端开发经验,精通php开发语言,精通uniapp,vue2,做过许多类型的项目,分销商城类,erp类,展示类,同城陪玩,企业管理,家教,充电桩,合同签约,借贷,租房,医疗器材等
王于辰 全栈开发工程师 3年经验
擅长写vue springboot 项目以及微信小程序 uniapp