ID:20930
马婷婷 高级软件工程师 15年经验
2025-05-12
个人介绍:作为拥有15年后端Java开发经验的资深程序员,我精通Java在多个框架和环境下的应用,包括但不限于Spring, Hibernate,和微服务架构。对于其他技术栈也比较熟悉,比如GO,Python,docker,K8S等。这段时间里,我参与了从小型企业应用到大型分布式系统的设计和实施,深刻理解软件开发生命周期,并能够熟练应用设计模式以提高代码的可维护性和扩展性。 近年来,我对LLM(大型语言模型)的兴趣使我开始深入研究其在应用开发中的潜力,特别是如何将其集成到现有系统中以提升智能化水平,比如通过自然语言处理来改善用户交互体验。我成功将LLM技术应用于多个项目中,通过自然语言处理提升了系统的互动质量和信息处理能力。 我相信,我的经验和持续探索新技术的热情,使我能够为您带来宝贵的技术资产和创新解决方案。
项目经验:决策管理系统: 1. 数据收集和存储:从各种来源收集数据,包括数据库、API、文件等,并将这些数据存储在适当的数据结构中,以便后续的分析和处理。 2. 数据分析和挖掘:对存储的数据进行分析和挖掘,发现数据之间的关联和趋势,为用户提供有用的信息和洞察。 3. 决策模型的建立和优化:建立决策模型,根据不同的决策场景和需求来优化模型,以提供更好的决策支持。 4. 决策结果的可视化和报告:将决策结果以图表、报表等形式直观地展现出来,让用户能够快速了解决策的过程和结果。报表可以根据用户的自然语言输入自动生成。这个部分涉及到LLM的应用,大语言模型负责将自然语言转换为SQL语句,再结合Apache Superset生成可视化报表。
技      能: Python  
¥1500 / 8小时
立即预约
ID:22727
程梅 大数据开发工程师 12年经验
2025-05-12
个人介绍:1、熟悉数仓建模,做过大型项目的数仓开发经验。 2、精通sql,做过很多复杂的sql指标运算,包括MR、spark作业调优。 3、熟悉bi工具,可以做报表展示。 4、熟悉spark,可以用spark计算指标。 5、熟悉python,掌握常用的python方法,负责过数据治理功能的开发,包括但不限于(数据产出监控,数据质量监控,hdfs和yarn运行资源的监控,自动化开发工具等) 6、掌握数据治理理论,包括元数据管理和数据管理,数据地图,数据血缘开发等。
项目经验:一、网盘核心数仓表全链路迭代 项目背景:出于公司降本指标,核心指标稳定性问题频发,故迭代升级历史核心任务链路(包括:sql 链路调优,spark 性能参数调优,表功能迭代)。 主要职责: 1、调研需要迭代的指标数量,分析各个计算链路存在问题,并设计优化方案。 2、优化上游调用表链路,拉取更合理的分区,以及 sql 调整减少 shuffle ,调整 spark 参数提高性能,并通过 sapark web 观察 stage 的实际产出效能,调整 executor 、core partition 数量,以及内存的大小等参数来提高效能,并尽量精确节约计算资源降低成本。 3、测试优化后的链路是否通路,并校验数据的准确性,并对比优化前后的成本和效能。 项目业绩: 1、提高了任务链路例行成功率,做到除系统故障外几乎0失败。 2、 降低了计算资源成本35%,提高了计算效率20%。 二、网盘部门计算资源治理系统开发 背景:部门确少全局的资源和任务监管系统,很多队列存在资源浪费和作业不规范的情况,故 ,开发网盘队列资源和作业相关的监管系统,实现全局治理计算资源。 项目职责: 个人开发 1、通过对 队列资源信息的抓取,实现队列稳定性相关的监控。 2、通过一些策略对队列任务进行管控,保证队列资源的稳定性和规范性 3、 提取队列上的作业的核心信息入库并通过可视化展示查询。(包括各个时间作业运行时间,是否触发报警,各个作业运行在哪个队列,消耗多少内存以及 core ,并统计资源占用 top榜,各个时间段的队列资源占比,以及各个时间各队列作业数量统计等相关维度展示) 项目业绩: 大盘上实现了网盘队列和作业的稳定性和规范性。 通过该监控系统,节约大盘计算资源成本 20%。 可以全盘监控和统计网盘运行作业的信息,对后续网盘业务链路迭代提供了数据基础。 三、网盘埋点数据用户pv uv 留存的全链路开发和可视化 1、协同 PM 确认数据口径和需求指标。 2、 从数据库和埋点数据进行采集 etl 处理入 ods层。 3、对数据纬度进行加工聚合,行转列降维成 dws 层宽表,方便 ads 指标取数。 4、 对各个埋点类型的用户(包括 tool、card 、资源位、小飞机、电商、push 等多渠道)进行分类统计 展现 pv,uv 点击 pv,uv 和留存,留存率,ads 层指标。 5、将指标数据通过开发 shell 倒库脚本导入到数据库。 6、 通过 bi 可视化展示收益指标
技      能: 其他  
¥1400 / 8小时
立即预约
ID:22535
谭静 数据分析师 6年经验
2025-05-12
个人介绍:web前端 html css js jQuery web后端 python django mysql数据库 redis数据库 数据分析 数据爬取 反爬虫技术 伪造头... 数据清洗 pandas 正则表达式 数据可视化 echarts
项目经验:项目一《禁毒数据分析》 1、爬取人民检察院案件信息公开网 a、在爬取过程中遇到了反爬虫 b、通过伪造头、无头浏览器、以及控制爬取频率等反反爬虫机制成功爬取吸毒人员数据 c、数据为每个吸毒人员的起诉书内容 d、存入mysql数据库 2、数据清洗 a、python对mysql数据库调用读出每一篇起诉书内容 b、用python的pandas和正则表达式提取出吸毒人员的姓名(名被隐藏)、身份证号(只有开头6位和结尾4位)、年龄、职业、性别、学历、是否贩毒、吸毒地点、吸毒抓获时间、吸食毒品种类、毒品单价、毒品重量、通讯方式(是否使用手机)、是否复吸(是否有吸毒史)、常驻地址等信息 c、去重后存入mysql 3、数据分析 a、pandas数据groupby数据分组以及count统计 b、matplotlib绘制柱状图、散点图、饼图 c、通过数据分析得到以下结论 吸毒人员的男女占比,以及在每个城市的男女占比 吸毒人员的学历情况分布,大部分是初中学历(具体数据不便公布) 吸毒人员职业情况的分布,大部分是无职业无经济来源,因此有很大部分是以贩养吸(具体数据不便公布) 吸毒地点的分布情况,以及不同地区的吸毒地点分布情况,常出现在个人的租赁单间以及旅行社 不同地区的吸毒抓获时间以及吸毒人数的趋势分布,能看出不同地区对吸毒人员布控的程度,以及治理的情况 不同地区的毒品单价分布 不同地区的复吸率的统计 4、数据可视化 a、搭建web页面,调用可视化工具echarts搭建出精美的数据可视化页面
技      能: 其他  
¥1200 / 8小时
立即预约
ID:22484
陈桂花 NLP、全栈开发 13年经验
2025-05-11
个人介绍:熟悉语音识别整体流程,包括传统HMM-GMM语音识别和端到端语音识别,熟悉LSTM、CNN等网络模型框架及 attention注意力机制,能使用tensorflow及pytorch搭建模型; 熟悉主流编程语言,如java/python/C++; 了解Docker应用容器引擎,能进行多主机集群管理; 熟练使用linux操作系统,有阅读linux内核页面调度源码经历; 熟悉开源云操作系统openstack,包括OpenStack的概览、操作界面管理、认证管理、镜像管理、计算管理、存储管理、网络管理、编排管理、故障处理。
项目经验:文本纠错 负责对语音识别的输出文本进行优化校正。主要内容包括预处理数据,生成True和False训练标签;使用BiLSTM-CRF进行 网络搭建,从命名实体识别的思路出发进行检错分析,找出错文本中错误文字的索引;根据错误索引,使用混淆集和语言模 型进行文字校正。项目中主要使用java和python语言。主要解决难点在于检错以及混淆集的选取,最终的纠错策略应用在 语音识别上能有效提高文本准确率。 语音识别 负责研发医疗领域语音识别系统。主要职责在于语料分析、语音识别模型训练、模型部署。①语料分析采用的方法是数据的 余弦相似度,在词覆盖率上进行分析,期望在少量的训练集中取到最佳的识别效果;②语音识别模型部分,提取音频数据的 fbank特征,使用tensorflow搭建CNN+CTC的端到端网络模型进行语音模型的训练;③在服务器上部署语音识别模型, 优化客户端和服务器之间的访问请求,达到实时返回识别文本的效果。
技      能: 其他  
¥1100 / 8小时
立即预约
ID:21578
刘楠 c#开发工程师 1年经验
2025-05-11
个人介绍:数据库:MSSQL,Oracle,Mysql 能熟练运用T-SQL,函数,储存过程,视图,任务,触发器等,会数据库的基本调优如添加索引,分表分库等 语言:c#,c 主要使用c#进行客户端开发,如WinForm,WPF,上位机,等 技能:Socket,OCR,Feret,Webapi,RS232,RS485,单片机(51系列),PLC(西门子) ,多线程,Vue等 经验:致力于MES系统开发5年,熟悉人料机法环各个管理控制环节及车间生产业务流程。 平台:金蝶云星空,能熟练使用BOS开发,表单插件/列表插件/操作服务插件等各种插件开发。
项目经验:1.富态宏精密工业有限公司MES系统 项目目的:实时呈现公司生产进度,目标达成状况,产品品质状况及人、料、机利用状况,及数据分析 项目技术:WebApi、多线程、异步进程、Socket、RS232、PLC等 职责:主要负责以下几个模块开发:人力管理:采集生产员工出勤,上线,脱岗,下线,任岗时长,技能水平等,使人力资源更优化;设备管理:实时显示设备嫁动率及各种设备良好,损坏,待保养等状态的数量,为优化嫁动率,调整设备调度,设备租赁,生产锁排等做数据支持;数据采集-环境监控:员工ESD检测及记录,温湿度检测及记录,预警,控制温控设备的停启,防止批量物料不良,光照强度,噪音,有害气体监测,保障员工健康安全;任务派工等模块等。 2.龙奔丰吉商贸有限责任公司ERP系统 项目目的:实现进存销管理,财务管理,人力资源管理,客户服务管理的信息一体化,降低管理成本,提升管理效能。 项目技术:WebApi、ECharts、OCR、FERET 职责:主要负责以下几个模块开发:出入库、盘点管理模块实现商品实时显示库存,追溯门店间、跨组织调拨,出入库,周期盘点等情形;销售管理:销量上报及利润预测,促销活动匹配赠品、优惠券,订单出货处理等;积分管理:会员在注册,购物,生日等多种情况下使用的积分赠送规则,及积分赠送兑换履历,会员消费排名及消费喜好分析。
技      能: .NET  
¥400 / 8小时
立即预约
立即预约
意见反馈