- 
工作职责: 1、负责复杂数据源的数据清洗、分析、监控搭建与质量维护; 2、负责多个数据源复杂关联逻辑打通及维护; 3、负责使用集团大模型服务的资源和平台,搭建各项数据挖掘任务; 4、参与模型私域变量库搭建,变量计算SQL或Python代码扩写; 5、参与模型通用工具包的代码开发及封装; 6、参与模型开发实验与实验报告撰写; 7、参与数据挖掘方案总结和文档撰写。 任职要求: 1、研究生优先,统计/数学/计算机专业优先; 2、熟练掌握各种统计模型和机器学习方法,如各类回归模型、分类模型等;理解LR、XGB等常用算法的基本原理;有模型调优经验优先; 3、熟练掌握Python和SQL; 4、有不错的结构化思维和逻辑分析能力,好奇心重,责任心强,善于沟通; 5、有不错的英文阅读理解能力。
- 
职位职责: ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:CQC(中国内容质量与数据服务平台)归属于抖音集团,负责今日头条、抖音、西瓜等产品内容和抖音集团商业内容的安全质量与体验,支持各产品的运营和增长,以及为产品线提供AI算法算力的基础支持服务。 1、负责支持AI大模型语音产品效果提升,包括提供PE调优、Agent搭建、模型精调数据构造与交付等; 2、负责优化智能外呼、销售助手、智能培训等大模型产品效果,通过模型评测、PE调优等方式推动产品效果提升; 3、负责推进Agent搭建以ToB行业方案在业务侧的落地,保证效果及业务目标达成; 4、负责持续监控和跟进大模型产品上线后效果及ToB客户反馈,并针对性进行调优。 职位要求: 1、2026届本科及以上学历在读,计算机相关专业; 2、了解语音原子化能力,有实习大模型智能外呼、大模型销售助手等AI语音产品优先; 3、具有处理和分析数据的能力,并熟悉大模型、数据挖掘等相关领域的基本方法; 4、思维活跃、学习能力强、有探索精神、耐心细致、渴望挑战真实业务场景中的大模型产品能力。
- 
职位职责: 日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:国际化内容安全平台团队致力于为字节跳动国际化产品的用户维护安全可信赖环境,通过开发、迭代机器学习模型和信息系统以更早、更快发掘风险、监控风险、响应紧急事件,以人工智能技术支持业务发展,力求更高效、更敏捷、更全能地维护站内生态安全。 1、投身于国际化业务场景下的预训练大模型技术研究与应用创新,专注于提升预训练效率,通过对海量数据的精准筛选与处理策略研究,优化数据选择机制,以及训练策略,完整基座语言模型的优化; 2、依托国际化场景对多语言的需求,深度优化多语言训练技术,包括数据策略和模型策略,提升在各语种知识迁移和对齐,实现强大的多语种基座模型能力; 3、深入探索后训练(Post training)技术,包括继续预训练(CPT),微调对齐(SFT,RFT)等不同的方面,精心钻研微调对齐技术和推理能力优化,确保大模型在国际化业务不同任务与领域应用中的精准适配与高效表现; 4、全力攻克模型效率优化难题,从模型架构设计、算法优化, 包括但不限于知识蒸馏、模型量化压缩,样本采样等方法等多维度入手,打造高效能、低能耗的预训练大模型,使其在实际业务应用中展现卓越的处理速度与资源利用率,助力构建智能、高效且具有广泛适应性的内容处理与分析系统; 5、建立有国际化短视频场景特色的预训练模型评估体系和数据体系,为模型的长期迭代提供有力支撑; 6、探索前沿AI技术,包含但不限于AIGC、LLM、多模态内容理解(视频/图像/音频/文本)等,以构建下一代安全模型。 职位要求: 1、本科及以上学历在读,计算机、软件工程、电子等相关专业优先; 2、丰富的ML/CV/NLP/推荐经验,包括但不限于: 1)机器学习/数据挖掘/CV/NLP/多模态等相关竞赛或行业经验; 2)机器学习/数据挖掘/人工智能/大模型相关领域的会议论文(KDD/WWW/NIPS/ICML/CVPR/ACL/AAAI等); 3)对预训练技术有深入研究者(不限于预训练,Post train,SFT/RFT,数据处理,评估等方面)可能获得优先的机会; 3、扎实的编程功底,熟悉Python/C++等编程语言; 4、优秀的分析问题和解决问题的能力,并热衷于解决具有挑战性的问题; 5、对技术充满热情,良好的沟通能力和团队合作精神; 6、每周可实习4天以上,可实习4个月以上。
- 
工作内容 1.协助团队数据平台闭环搭建。 2.进行机器学习模型/预测分析技术的开发,包括数据中的可重复模式和发现新特征。 3.协助团队数据平台训练闭环。 职位要求 1.计算机相关专业硕士及以上学历。 2.具备坚实python代码能力。 3.熟悉了解基本的机器学习/深度学习的数据相关算法并有扎实的数学统计基础者优先。 4.能长期实习者优先。
- 
工作内容: 1. 负责开发特定渠道的数据监测系统:通过数据挖掘技术,识别并触达优质的潜在创业者 2. 通过对创投生态的观察进行下探分析,沉淀出反映未来技术发展趋势的核心数据指标体系,及时监控、解读并反馈数据指标的异动 岗位要求: 1. 掌握常见爬虫库和框架,如urlib、requests、Scrapy、Selenium等,熟悉基于正则表达式、Xpath、CSS选择器等网页信息抽取技术 2. 有很强的逻辑思考能力,有非常强的执行力 3. 在校学生且有充裕的时间投入到项目中 4. 可以远程,每周至少投入4天,每天至少6小时 我们希望你: 1. 有过网络爬虫的开发经验 2. 有独立项目开发经验优先 3. 对创业,前沿科技,或者一级市场投资,抱有高度的职业热情 加分项: 1. 有过搜索引擎、feed流、NLP模型的开发经验优先 2. 有创业或独立项目经历 3. 有一级市场投资经历 4. Gap year 且保留学籍 你将收获: 1. 建立对于中国创投生态的观察框架,尤其是动态的数感 2. 学习初创公司「“0到1” 的方法论」,尤其是学习创业公司融资、做产品、市场销售、股权分配等课程 3. 旁听一线创业大咖的闭门分享、奇绩创坛投资的校友企业投后参与的创业营课程、杰出被投企业的内部分享等(往届分享嘉宾:张一鸣、雷军、刘强东、陈睿、丁磊、李想) 4. 结识一帮来自全球各地、不同背景、有梦想有激情的年轻小伙伴
- 
上班时间早晨九点到下午六点中午休息一个半小时周末双休
- 
工作职责 1.计算机、数学、统计、运筹等专业优先; 2.2~3年互联网/金融行业数据工作经验,有互联网数据运营相关知识优先; 3.熟悉SQL开发,熟悉hadoop平台/Python、R等开发语言/tabular等分析工具优先; 4.可独立执行数据分析、数据建模、数据挖掘工作; 5.工作认真踏实,富有责任心和进取心,有良好的数据敏锐度,愿意承受较大的工作压力。 任职要求 1.负责用户经营分析,通过数据分析和挖掘探索客群经营的规律,对用户线上经营提出策略支持; 2.数字化创新应用探索,运用最新的工具和方法探索数据应用场景; 3.丰富C端客户、B端供应商画像,为数据分析、建模打下基础; 4.根据深分业务特点,建立深分个性化标签; 5.利用数据分析处理和展示工具,生成自动化报表提升数据展示的效率及准确性。
- 
工作内容: 1.针对具体的业务问题,规划、设计基于数据挖掘的解决方案; 2.参与文本挖掘项目,包括数据准备,数据建模及后期的模型评估等工作; 3.对现有模型进行维护或更新; 4.阅读前沿论文,在项目中应用。 任职资格: 1.985院校研究生; 2.熟悉自然语言处理和基本的机器学习方法论,如word2vec, LSTMs, CNN, Seq2seq, crf; 3.熟练使用Python语言,有较强的编程能力; 4.有阅读英文学术论文能力; 5.了解深度学习工具,使用过Tensorflow或PyTorch;
- 
工作地点杭州之江实验室新园区 工作内容: 1. 基于多模态大数据进行深度挖掘和优化,能够从业务和产品的角度出发,利用数据发现产品、系统或是业务的瓶颈,并提出优化的方案。 2. 能够利用数据挖掘,机器学习等技术分析和解决实际问题,例如实现模块自动化,或者优化现有算法的精度。 3. 定期进行产品的全面诊断分析,发现业务问题,为上层决策提供参考。 4. 紧跟机器学习及深度学习前沿技术,并应用于业务扩展中,实现业务价值。 任职要求: 1. 计算机,电子信息,统计,应用数学等相关专业背景,硕士及以上学历。 2. 从事过机器学习、数据挖掘、NLP等算法相关的项目经验,熟悉常见的概率统计、数据挖掘、机器学习等算法。 3. 熟练使用C++、JAVA、scala、Python、R、SAS等编程语言中的至少一种,具备一定的模型开发能力,熟练使用SQL、shell。 4. 良好的逻辑思维能力,善于发现和分析问题。 5. 具备较好的算法理论基础,喜欢研究前沿技术,有相关经验和顶会文章发表的优先。
- 
实习薪资:300元/天 岗位职责: 1. 协助跨境电商数据的数据挖掘工作; 2. 根据实际需求和问题,应用统计建模、数据挖掘、机器学习等方法建立数学模型解决实际问题,设计、评估、落地数据挖掘方案; 3. 协助梳理、整合能解决业务问题的可复用数据挖掘方案,沉淀形成数据中台的挖掘工具,持续提升挖掘效率。 任职要求: 1、数学、统计学、金融工程、计算机科学等相关专业,高年级本科生或研究生; 2、对数据敏感,具有良好的数据导向思维; 3、 对主流的数据挖掘技术具较好的理解,了解主流算法和工具方法; 4、参与过实际应用项目优先(如回归分析、时间序列建模等); 5、熟悉Python、Java、C++等至少一门编程语言,具有良好的编程能力和快速学习能力。
- 
岗位描述:负责问答系统的设计和开发;图像识别,验证码识别; 能力要求:计算机及相关专业,研究方向图像或语音相关;熟练掌握Java,Python语言,有Linux系统下开发经验优先;了解机器学习、数据挖掘、深度学习的经验者优先;对业务问题肯钻研,有想法,责任心强,良好的团队合作精神,较强的沟通能力。实习期长的想转正的优先。 优先:有相关图像识别或语音识别相关经验有自然语言处理、分词相关经验
- 
岗位职责: 1.负责数据源测试,包括样本选择、测试推进、效果评估、测试报告撰写等工作; 2.负责对接客户测试需求,提供数据支持,跟进客户的测试反馈,并给出产品优化建议; 3.负责其他专项分析,优化和完善数据分析流程,将数据分析结果转化成优化方案。 任职要求: 1.1年数据分析相关工作经验,拥有统计学、数学、计算机等相关专业的本科及以上学历; 2.能熟练运用Python/R进行数据分析; 3.具备优秀的分析和解决问题能力,良好的沟通能力和抗压能力,并且具有自我驱动力。
- 
职位描述 应用数学,计算数学,统计学专业优先,工作年限:不限;技能要求: Python,PANDAS库,NUMPY,Sklearn,数学基础,统计学;工作内容:统计分析及数据分析技术在工业生产场景的应用 1.工程应用的理解能力:对于数据分析的应用场景,能快速理解和归纳,将先验业务知识转为数据分析工具 2.编程基础:熟练运用python,熟练使用numpy及pandas库 3.数学基础:有较好的统计学基础,对描述性统计、假设检验、贝叶斯、极大似然法、回归、主成分分析有一定理解 4.基于理解的工程基础:会选、用、调常用的机器学习算法,对sklearn等主流算法工具库有一定了解 5.专业要求:应用数学、计算数学,统计学、运筹学,自动化建模等相关专业。
- 
大数据工程师(数据挖掘、数仓、大数据分析等方向)[上海·浦东新区] 2022-09-0812k-24k·13薪 经验在校/应届 / 本科软件服务|咨询,IT技术服务|咨询 / 不需要融资 / 500-2000人岗位职责: 1. 负责一体化智慧校园hadoop数据采集架构搭建及数据采集; 2. 负责ETL第三方数据对接平台开发、大数据关联分析、预测算法编写。 任职要求: 1. 本科及以上学历,计算机、软件工程、应用数学、电子通信等相关专业; 2. 熟练搭建hadoop+spark,Flink生态下离线或在线数仓,熟练操作sqoop、hive、Flume+kafka、zookeeper、Hbase、Flink、zabbix组件; 3. 熟练应用Spark RDD 、Spark Mlib或Sklearn库中机器学习模型训练,熟练使用linux系统脚本、docker技术自动化部署生产环境,熟悉各组件运维管理。 工作地点:浙江嘉兴、广州
- 
工作职责 1、基于各种数据分析方法及机器学习算法,从全局视野主动挖掘和探索业务经营趋势,发掘潜在问题点和优化点 2、对特定数据分析和挖掘的专题等进行日常跟踪 3、对资本市场和客户经营过程中的一些重要指标、信息进行跟踪 4、其他辅助工作 任职要求 1、硕士及以上学历,金融学、金融统计、金融数学、金融工程、数量经济及相关专业; 2、具有较强的信息搜集能力、逻辑思维能力、文字表达能力和沟通能力; 3、具备扎实的理论水平、较强的数据分析能力,能够熟练运用matlab、R或Python等一种或多种编程软件,熟悉关系型数据库使用; 4、熟悉金融数据(私募、公募、股票、债券、期货、期权)、有数据挖掘、数据分析、统计建模等数据科学相关经验优先考虑; 5、工作细致认真,积极主动,责任心强,有较强的抗压能力。
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 



 
 
 
 
 
