ID:22588
路平 数据分析师 4年经验
2025-04-08
个人介绍: 熟练应用 Python 及其相关库(如 Pandas、Numpy、Matplotlib 等)。  熟悉数据分析全流程,熟练掌握各种数据分析常见工具。  熟练 Excel 函数应用(如:vlookup、sumif、countif 等)、Mysql 数据库语句、PowerBI 等工具进行数据分析及 可视化操作。  具备一定的数据挖掘能力,能够使用 SKlearn 等常见科学计算库进行分类、回归、聚类、降维、词向量分析等创 建数据模型,完成对数据的分析及预测。
项目经验:信用卡交易欺诈风险预测 项目背景:为了预测持卡人是否会发生信用卡被盗刷,通过利用信用卡的历史交易数据,进行机器学习,构建信用卡 反欺诈预测模型,提前发现客户信用卡被盗刷的事件。 工具:Python(Pandas、Numpy、Matplotlib、逻辑回归、随机森林、XGboost 模型、Bagging 算法)。 主要职责:  数据提取与清洗:获取用户信息数据,对数据基本情况、统计值等进行查看。  特征工程:(1)对这两列特征进行标准化处理;(2)查看特征值与因变量标签之间的关系以及对数据进行共线 性筛查;(3)对数据分类标签查看被盗刷与未被盗刷比例失衡情况,被盗刷占所有交易的 0.172%,因此采用 随机过采样方法平衡数据集。  模型和调优:选取逻辑回归、随机森林、XGboost 和 Bagging 算法进行交叉验证训练,对比模型效果,并使 用网络搜索找到相应的最优超参数。  模型迭代和评估:(1)将各模型对应的最优超参数带入对应模型中,并计算出准确率、精确率、召回率、 F1_score 和 AUC 曲线面积;(2)选出 AUC 面积值最大的两个模型(逻辑回归和 XGboost)再进行 VotingClassifier 集成学习。 项目成果:  该集成学习模型最终预测准确率、精确率、召回率都达到 90%以上,基于此模型对信用卡交易数据进行预 测能找出更多的信用卡被盗刷的持卡人,有助于平台对危险用户进行识别和处理,降低风险。
技      能: 其他  
¥1500 / 8小时
立即预约
ID:22511
宋冬梅 数据开发工程师 11年经验
2025-04-08
个人介绍:1. 对接运营/产品的需求,快速理解需求,利用SQL进行数据开发,产出报表。 2. 熟练掌握大数据技术的应用,DataX,spark,hive,flink,kafka等。 3. 掌握数据仓库建模和分层,能搭建高质量数据模型。 4. Python处理数据,包含json,excel等。 5. 有一定的SpringBoot开发能力,有UDF函数开发经验。
项目经验:项目描述: (携程大住宿数据分析平台) 数据源为携程海内外各渠道母子酒店的订单信息,对数据进行清洗入仓 之后, 追踪酒店间夜数计算业务指标,并进行可视化报表展示。 项目职责:  数据研发: 计算携程酒店业务指标, 开发极速查询 BI 报表。  基于 Spark(Java)实现随机抽取算法计算指标,并设计 DQC 任务监控数据浮动, 保证数据质量。  基于 Spark Streaming + Redis 生成实时动态黑名单, 并从 Redis 中获取黑名单过滤数据。  将数据写入 StarRocks,根据需求设计 StarRocks 模型,并创建物化视图,索引优化来加快查询。  建立抽象数据模型,并设置人酒权限, 开发 ArtNova BI 报表。  任务优化: 优化批处理和报表任务,保证集群稳定。  对 Spark 进行内存调优(JVM) , 优化占用集群资源多和执行速度慢的 Spark 任务。  对 StarRocks 和 Hive 数据集进行分布式 SQL 调优,加快报表查询速度。 涉及技术: Spark, StarRocks, Hive, Presto, Datax, Redis 项目描述: 为了区分不同的本体关系在计算相似度时的特征,进行相关性分析。为了对海量文本进行自动分 类,结合大数据引擎设计了相似度并行算法,提高计算效率并具有很强扩展性。 项目职责:  相似度算法 (DIF): 基于相关性分析不同语义链接, 设计特征相似度计算方法, 结果准确度达到 94% 。  文本并行算法: 基于 MapReduce 引擎, 设计文本相似度并行算法。  结合 DIF 预先计算本体所有特征间的相似度。  将点对点相似度转化成特征对文本相似度,然后聚合得到文本间相似度,结果计算效率提升 70 倍。 涉及技术: Hive, Hadoop, Sklearn, Spss
技      能: 其他  
¥800 / 8小时
立即预约
ID:22203
杜桂芝 C++软件工程师 2年经验
2025-04-08
个人介绍:熟练使用C/C++语言与常用数据结构和算法 ; 熟练使用xml,并能够用duilib开源库快速进行设计界面; 熟练使用MFC、QT进行软件开发,熟悉ATL、DLL、COM、ActiveX编程;精通String/List/Vector/Map等基本容器的使用; 熟悉WINCE平台开发,对串口通讯,RS232, 485 通迅机制和工作原理有一定了解; 熟悉MQ消息队列的使用,持久化内存数据库Redis的应用,对http、Tcp等通讯方式也有较为深入的理解。 熟练使用SOCKET,具备多线程和线程同步的开发能力 ; 熟悉使用SQL Server/mySql/SQLite 数据库的增删改查操作,对内循环、游标、触发器、存储过程有一定的理解; 了解多线程通讯和同步对象:临界区、事件、互斥量和信号量等;
项目经验:项目一: 路由优化大师 硬件环境:win7/win8/win10系统,酷睿I3+4G内存+500G硬盘 开发环境:VS2010, Socket, XML, Lua, duilib 项目职责: 通过路由器固件匹配,编写统一接口,主要完成的功能有路由体检,屏广告,防蹭网已经路由高级设置等。 项目描述: 路由大师致力于打造一款路由管理产品,让广大用户在安全上网的同时可以很轻松的对自家路由器进行管理。 项目二: WCS分拣控制系统客户端 硬件环境:Intel® Core™ i3-3240双核CPU 同等或以上配置+4G内存+500GB+1440x900分辨率 开发环境:VS2010/QT5.8 + MySQL+Http+MQ, 项目职责: 负责WCS客户端各模块的开发,优化软件占用资源,保证设备的正常分拣。 项目描述: 该控制系统是一款针对于交叉带分分拣系统的管理软件,主要包括线体状态的实时显示、小车状态的实时显示、格口状态的显示、导入台状态的显示,以及各种报警功能的显示。通过软件界面将目前分拣机的各种状态实时、直观进行展示,方便现场操作人员及时了解分拣机运行状况,对突发事项进行及时处理。具有丰富的SCADA显示功能,操作简单,数据日志清晰等特点。
技      能: C++  
¥300 / 8小时
立即预约
立即预约
意见反馈