ID:22732
杨平   数据库工程师  
公司信息:=
工作经验: 12年
薪资价格:200/天
所在区域: 武汉
浏览次数:93次
登录次数:51次
最近登录:2024-07-10
认证情况:
掌握技能: 其他  
立即预约
立即收藏
沟通需求
程序员接单发单

微信扫码,联系客服沟通需求

个人介绍
	能够熟练使用HTML+CSS/JavaScript等前端开发工具;
	熟悉Linux的常规操作,能使用Linux系统进行相关项目的开发和编写shell脚本;
	熟悉python语言,能够使用numpy,pandas,等数据分析模块,能结合scrapy框架和bs4模块,flask模块,实现对网页上数据的抓取和提取工作,制作爬虫;
	了解pytorch,transform等深度学习框架
	掌握Hbase存储原理和读写机制,掌握常用的数据存储工具,Mysql,Redis,mongodb;
	熟悉Hadoop结构和其工作原理,掌握HDFS存储机制,编写MapReduce程序,掌握Yarn资源分配策略;
	掌握Hive的架构,熟练使用sql语句,对数据进行ETL操作,数仓建模,数据分析,以及hive的相关调优;
	能运用Sqoop进行数据的采集和传输;
项目经验
项目名称: 基于爬虫和大数据的结合
	开发周期: 3个月(2023-2-2023-3)
	项目描述:
爬虫将数据导入到mysql数据库中,通过sqoop将MySQL中的数据导入到Hadoop的hdfs中,Hadoop集群运用hive进行sql数据库查询,使用hdfs将数据存储在节点,并实现提取出用户留存率,日创建用户和日活跃用户,用户地址,各个年龄段的用户。通过一系列的数据筛选,提取,转换来调查用户需求,来描绘用户画像。
 项目架构: Mysql + Sqoop + Hadoop +python爬虫
 技术实现:
1.	使用爬虫将爬到的数据传入mysql里面。
2.	使用Sqoop将MySql的业务数据导入HDFS,将原本就保存在本地的了日志文件导入到HDFS
3.	使用Sqoop将MySql的业务数据导入HDFS,将原本就保存在本地的了日志文件导入到HDFS
3.使用SparkCore/SparkSql对数据进行清洗,最后将数据存到Hdfs,映射的到hive表;
3. 创建ODS、MI、DWD、WT、DIM、TMP层;
5. 将数据进行图表展示,发送给运营、产品、测试、管理层。
发布需求
点击发布需求,客服审核通过后会展示订单,程序员会在任务下报名,招聘专员也会在1小时内与您联系,帮助您精准找到符合要求的程序员!
接单发单客服
程序员接单客服微信
添加客服微信,接单发单快人一步!
相关程序员推荐
leon 5年经验
本人擅长Python、Golang等后端Wev开发;擅长多种数据库操作;擅长小程序、网络、算法相关的项目开发;并且有一群靠谱且技术过硬的小伙伴;本人崇尚合作精神,是一个遵守规则的人。
杭州紫冰科技有限公司 AI、前后端开发 4年经验
我们是一支来自阿里、美团由软件高级工程师、算法工程师组成的高端软件研发团队。团队小而精,自2022年成立以来,为客户提供十几个软件解决方案。设计领域为门户网站、CRM系统、智能化系统、AI大模型、计算机视觉领域。已经有大量的项目开发经验。
袁宇 0年经验
接本科水平订单; 可使用C/C++、Python编程,OpenCV图像处理,QT开发上位机,STM32单片机开发; 可使用SolidWorks进行建模,CAD绘制图纸,Protues/Multisim电路仿真; 参加多项工科类竞赛,均为教育部认可A类竞赛;
少风 视觉工程师 4年经验
应用类视觉需求可联系我
立即预约
意见反馈