ID:22535
谭静 数据分析师 6年经验
2025-05-12
个人介绍:web前端 html css js jQuery web后端 python django mysql数据库 redis数据库 数据分析 数据爬取 反爬虫技术 伪造头... 数据清洗 pandas 正则表达式 数据可视化 echarts
项目经验:项目一《禁毒数据分析》 1、爬取人民检察院案件信息公开网 a、在爬取过程中遇到了反爬虫 b、通过伪造头、无头浏览器、以及控制爬取频率等反反爬虫机制成功爬取吸毒人员数据 c、数据为每个吸毒人员的起诉书内容 d、存入mysql数据库 2、数据清洗 a、python对mysql数据库调用读出每一篇起诉书内容 b、用python的pandas和正则表达式提取出吸毒人员的姓名(名被隐藏)、身份证号(只有开头6位和结尾4位)、年龄、职业、性别、学历、是否贩毒、吸毒地点、吸毒抓获时间、吸食毒品种类、毒品单价、毒品重量、通讯方式(是否使用手机)、是否复吸(是否有吸毒史)、常驻地址等信息 c、去重后存入mysql 3、数据分析 a、pandas数据groupby数据分组以及count统计 b、matplotlib绘制柱状图、散点图、饼图 c、通过数据分析得到以下结论 吸毒人员的男女占比,以及在每个城市的男女占比 吸毒人员的学历情况分布,大部分是初中学历(具体数据不便公布) 吸毒人员职业情况的分布,大部分是无职业无经济来源,因此有很大部分是以贩养吸(具体数据不便公布) 吸毒地点的分布情况,以及不同地区的吸毒地点分布情况,常出现在个人的租赁单间以及旅行社 不同地区的吸毒抓获时间以及吸毒人数的趋势分布,能看出不同地区对吸毒人员布控的程度,以及治理的情况 不同地区的毒品单价分布 不同地区的复吸率的统计 4、数据可视化 a、搭建web页面,调用可视化工具echarts搭建出精美的数据可视化页面
技      能: 其他  
¥1200 / 8小时
立即预约
ID:22484
陈桂花 NLP、全栈开发 13年经验
2025-05-11
个人介绍:熟悉语音识别整体流程,包括传统HMM-GMM语音识别和端到端语音识别,熟悉LSTM、CNN等网络模型框架及 attention注意力机制,能使用tensorflow及pytorch搭建模型; 熟悉主流编程语言,如java/python/C++; 了解Docker应用容器引擎,能进行多主机集群管理; 熟练使用linux操作系统,有阅读linux内核页面调度源码经历; 熟悉开源云操作系统openstack,包括OpenStack的概览、操作界面管理、认证管理、镜像管理、计算管理、存储管理、网络管理、编排管理、故障处理。
项目经验:文本纠错 负责对语音识别的输出文本进行优化校正。主要内容包括预处理数据,生成True和False训练标签;使用BiLSTM-CRF进行 网络搭建,从命名实体识别的思路出发进行检错分析,找出错文本中错误文字的索引;根据错误索引,使用混淆集和语言模 型进行文字校正。项目中主要使用java和python语言。主要解决难点在于检错以及混淆集的选取,最终的纠错策略应用在 语音识别上能有效提高文本准确率。 语音识别 负责研发医疗领域语音识别系统。主要职责在于语料分析、语音识别模型训练、模型部署。①语料分析采用的方法是数据的 余弦相似度,在词覆盖率上进行分析,期望在少量的训练集中取到最佳的识别效果;②语音识别模型部分,提取音频数据的 fbank特征,使用tensorflow搭建CNN+CTC的端到端网络模型进行语音模型的训练;③在服务器上部署语音识别模型, 优化客户端和服务器之间的访问请求,达到实时返回识别文本的效果。
技      能: 其他  
¥1100 / 8小时
立即预约
ID:22778
韩刚 算法工程师 15年经验
2025-05-11
个人介绍:1、5年的深度学习算法经验,具有Python、qt、sql、mysql、labview、c++、linux等编程经验和项目经验; 2、熟悉pytorch、tensorflow、darknet等主流深度学习框架,在项目中使用过Nvidia deepstream框架、yolov3/v4/v5/v7目标识别算法、deepsort跟踪算法、docker容器管理等,具有Nvidia Jeston Orin深度学习边缘板卡、RTX3090、RTX2060 GPU加速使用经验,熟悉CycleGAN、Facenet、Segmentation等其他算法。 3、熟悉前沿机器学习算法,包括聚类、异常检测、随机森林等,项目上使用过DBSCAN聚类算法、xgboost模型、lightgbm模型等。熟练使用python数据分析方法。
项目经验:人员行为智能识别系统 项目难点:6个摄像头同时识别多个行为,如何做好硬件选择与速度保证。数据通讯压力较大。 解决方案:1)采用nvidia deepstream框架处理6个摄像头并行跑模型的问题,通过前期经验与测试,采用2块3090GPU完成所有功能,速度保证基本实时。2)采用多个docker容器服务运行的方式设计整体架构,模型在deepstream容器内运行并将将结果写入redis docker容器,后台查询代码从redis获取数据并设定一定逻辑得到报警信息,写入Mysql docker容器,前端展示代码运行于虚拟机并从mysql和deepstream推流的rtsp获取数据。整体架构的容错率和效率都较高。
技      能: 其他  
¥1200 / 8小时
立即预约
立即预约
意见反馈