-
职位职责: 团队介绍:平台治理算法团队2020年9月成立,主要职责是通过优化算法,和电商业务团队配合,对字节电商产品进行全方位的质量/生态的治理,既包括低质/风险/违规问题的打击,也包括画风优化、优质内容扶持、电商生态建设等。 平台治理算法团队使命:经营带货有保障,所见所得皆好物; 愿景:打造安全合规的平台秩序,建立用户信赖的健康生态。 1、负责电商场景下的文本内容相关的(如商品文案、画面文本、口播描述等)风险识别模型; 2、负责商品/短视频/直播的评论、举报等舆情内容的风险挖掘算法,完善平台治理效果; 3、构建业内领先的内容识别方法,针对存在对抗行为的文本内容,构建跨域多维度的识别策略; 4、探索NLP相关前沿技术,并应用落地到电商业务场景中; 职位要求: 1、扎实的NLP算法基础,对文本分类、相似匹配、对话问答、机器翻译、序列标注、知识图谱、意图理解、词义消歧等领域有较深入理解和实践经验; 2、熟悉常用的机器学习和深度学习算法,了解基本的网络模型结构(DNN/LSTM/CNN等)和文本表征方法(LDA/Word2Vec/ELMo/GPT/BERT等),对深度学习训练和推理模型调优有实操经验; 3、实践动手能力强,熟练使用至少一种主流深度学习框架(TensorFlow/PyTorch/Caffe/MXNet),对分布式训练、蒸馏加速等实现方式有所了解; 4、优秀的分析问题和解决问题的能力,对领域迁移、小样本构建、文本挖掘、无监督/半监督等问题有一定的处理方法和优化经验; 5、掌握基本的大数据相关组件(Hadoop/Spark/Hive/Flink),具有大批量文本数据处理清洗经验; 6、熟悉Linux开发环境,精通C++/go/python至少一种编程语言,有扎实的算法和数据结构功底; 7、良好的团队合作意识和沟通能力,有相关业务场景实践经验者优先; 8、在计算机科学高水平会议(ACL, EMNLP, NIPS, AAAI等)发表过论文或者有竞赛经验者优先。
-
岗位职责: 1、负责对公司数据进行深入研究和探索,利用数据挖掘等大数据技术解决业务需求,支撑业务决策; 2、负责公司大型数据挖掘项目的需求分析、方案制定、项目实施及迭代优化等; 3、负责对数据挖掘领域新技术的探索与引进,并结合业务场景解决具体业务问题。 任职资格: 1、硕士及以上学历,数学、统计、计算机等相关专业,5年以上数据挖掘工作经验,有互联网、制造业背景优先; 2、熟悉数据挖掘方法,如线性回归、决策树、集成学习、深度学习、推荐系统、文本挖掘等,能够熟练使用分类、回归、聚类、关联等方法解决业务问题,具有供应链或用户相关大型数据挖掘项目经验优先; 3、丰富的数据分析、挖掘、清洗和建模的经验,具有较强的数据整合、数据分析/挖掘和解决业务问题的能力; 4、具备良好的沟通和自我驱动力,对业务有良好的数据化思维能力、抗压能力强。
-
岗位职责 1、负责参与知识图谱构建,研发自动化/半自动化构建流程与关键方法; 2、负责参与知识图谱的实体链接、关系抽取、知识融合、知识推理等相关工作; 3、负责参与知识图谱在搜索、智能问答、信息推荐等应用场景中的落地; 4、追踪知识图谱相关前沿算法、技术,结合客户应用场景,探索前沿技术并应用于实际业务。 岗位要求 1、三年以上相关工作经验。掌握图谱相关技术组件,如:Neo4j、Jena 、GraphFrame等; 2、至少在以下领域有过研究或工程经验:文本挖掘、中文NLP、信息检索等。有知识图谱相关实际有效产出项目经验者优先考虑; 3、具有较强基础算法和编程能力,熟悉Java编程。
-
职责描述: 1.运用自然语言处理NLP、深度学习技术挖掘各类风控、质检等非结构化信息,实现海量数据的自动学习与理解,进行创新研究,将AI技术大规模应用于金融风控领域; 2.应用先进的机器学习、统计建模、数据挖掘、文本挖掘等方法建立数据模型,并负责实施技术落地,解决实际业务问题; 3.工作范围为风控时序数据挖掘、命名实体识别、情感分析、舆情分析、智能质检、智能对话等; 3. 有顶会论文、算法竞赛(如 Kaggle、天池等)获奖者优先。 任职要求: 1. 硕士及以上学历,包括但不限于计算机,电子信息,自动化,数学,统计等专业; 2. 熟悉Python(必须)、C++(可选)等编程语言,熟悉基本数据结构,有较强的工程实现能力; 3. 熟练运用Pytorch/TensorFlow至少一项,对NLP主流模型有丰富的训练和调参经验; 4. 对NLP技术充满热情,具有较好的独立思考和推断能力,较好的沟通表达能力。 加分项: 1. 有丰富的NLP领域的理论基础和实践经验; 2. 多项NLP模型的研发设计与实现,最好风控相关
-
1、利用机器学习、文本挖掘等技术挖掘海量用户数据开展用户特征分析与洞察,建立用户分群模型,挖掘用户不同生命周期需求与偏好 2、开展用户价值评估、行为需求、兴趣偏好等研究,构建和优化用户画像标签,并进行检验评价,提升画像标签在业务落地的效果; 3、输出画像产品功能和服务组件需求,与IT团队沟通协作,保障画像服务全生命周期的规范化运维及其质量; 4、跟进业界数据业务创新发展动态,匹配行业应用业务诉求,进行大数据业务创新设计,并推动创新需求的落地。 岗位要求 1、计算机、数学、统计、机器学习、信息科学、运筹学等相关专业硕士以上学历(优先); 2、三年以上大数据处理、分析、挖掘和建模经验,熟悉分类、回归、聚类、图算法、文本分析、深度学习等3种以上算法及原理,具备用户分群实践经验尤佳 3、精通SQL、Python、C、C++、Java、scala等中至少2种编程语言; 4、有较强的数据敏感度,具备海量数据处理经验,能从海量数据提炼核心结果; 5、有较强的沟通能力、逻辑思维能力、归纳总结能力和文档编写能力,具备团队合作精神; 6、有互联网,金融,零售或电商行业从业经历者优先,有咨询行业背景优先。
-
1. 构建物流中中文地址库助力物流行业,解决拼多多包裹物流转过程中的地址处理问题,推动物流智能化进程 2. 运自然语言处理理技术识别用户收货地址详情中地名要素【四级行政区划、道路、门牌号、POI、楼栋号、房间号等】,从海量收货地址中挖掘同义地名和同义地址 3. 探索自然语言处理理技术在物流智能化的应用 任职要求: 1. 本科以上学历,有自然语言处理相关工作经验 2. 具备扎实的机器学习、自然语言处理基础,有完整的机器学习项目经验 3. 熟悉中文分词、命名实体识别、信息抽取、文本挖掘背后的各类算法,阅读过开源算法代码 4. 良好的沟通能力、优秀的分析问题解决问题的能力 5. 熟练使用TensorFlow,scikit-learn等主流机器学习框架 6. 编程功底扎实,熟练使⽤用 Python,Java
-
需求描述: 1基于小微企业客户的基本信息、税务数据、征信数据、审批数据、还款数据等,运用LR、XGboost、LightGBM等常用算法,优化小企业评分模型的效果,提升模型排序能力和风险识别能力。 任职要求: 1、本科及以上学历,计算机、数学、统计、金融等相关专业,熟悉银行业务知识,掌握数据挖掘、数据治理、数据架构、数据产品相关的理论及方法 2、拥有5年以上从事数据挖掘、数据治理、数据架构、数据产品相关工作的经验,参与过大型项目开展。如拥有3年以上在银行、保险、互联网金融等行业的数据挖掘、数据治理、数据架构、数据产品项目经验者,可适度放宽年限要求。 3、熟悉Teradata、HADOOP等平台,熟练运用主流分析工具(例如SAS、Python、Spark等),有海量数据处理经验,具备编制复杂sql脚本的能力。 4、掌握公文处理软件,会用excel宏处理,擅长PPT编制。 5、熟悉TensorFlow、Keras、Caffe等主流深度学习框架,或有知识图谱、图像处理、自然语言处理、文本挖掘、社交网络分析等方面组合建模工作经验者优先。 6、具有敏锐的洞察力,深入理解业务场景,可提出建设性和创新性的分析方法和解决方案。 7、乐于面对挑战,勇于钻研探索,擅长沟通交流和归纳总结,在策划、编辑、宣传方面有相关经验,具备一定的文字组织能力。 8、热爱数据工作,优秀的合作精神,良好的职业操守(安全意识、法律合规、商业机密等)。 工作内容: 协助行内人员进行行内基础数据探查、数据分析等工作,包括小企业信用评分卡迭代优化模型、开发报告和需求文档撰写等需求。
-
岗位职责: 1、负责规则引擎、统计模型等风控平台体系的开发与维护; 2、参与分析、挖掘用户的行为特征,抵御涉政涉黄等内容风险; 3、理解产品作弊生态、规划产品反作弊发展方向,并转化为可执行的项目进行建设与落地; 4、负责风控运营工具的落地,协助业务提升风控运营的效率。 岗位要求: 1、JAVA基础扎实,熟悉io、多线程、集合等基础框架,熟悉分布式、缓存、消息等机制; 2、3年以上使用java进行开发的经验,熟练使用spring 、MVC等框架,熟悉Linux下的常用命令,熟悉MySQL; 3、熟悉常用设计模式,有大型分布式、高并发、高负载、高可用性系统设计开发经验; 4、熟悉风控安全相关业务,熟悉与黑产对抗过程; 5、具备自然语言处理、文本挖掘、数据挖掘、机器学习等算法能力优先; 6、具有良好的抽象设计能力,思路清晰,善于思考,能独立分析和解决问题,责任心强,具备良好的团队合作精神和承受压力的能力; 7、具有良好的项目规划和决策能力,善于捕捉业务需求、架构设计中存在的问题,并给出有效的解决措施和方法。
-
工作职责: 1、 调研行业内使用的遗传病突变注释和致病性判断流程,使用大样品数据测试流程,比较优劣得出结论,整合新的数据库和流程,开发符合行业标准的遗传病突变致病性判断流程; 2、 利用各类常用生物信息软件和统计学方法完成各种生物信息,生物统计以及数据分析; 3、 协助完成遗传病数据库的清洗、内容挖掘和结构整理; 4、 协助调研突变注释流程相关的数据库、预测软件等资源,优化流程; 5、 能够完成上级指派和分析流程中各种日常信息分析工作。 任职资格: 1、 硕士及以上学历,计算机、数学和生物信息相关专业优先,有文本挖掘、自然语言处理工作经验者优先,有药物基因组数据库建设经验者优先。 2、 3-5年以上生物信息研发、分析工作经验,掌握Linux,Perl,R和常见基因组学分析等工作技能,熟悉常用生物信息分析软件; 3、 具有良好的沟通和协调能力,抗压能力强,有责任心和上进心,具备学习能力; 4、 较好的英文能力。
-
研究员(AIGC方向) 工作职责: 1、跟踪和探索AIGC方向研究前沿,实现关键技术突破,构建业界领先的技术竞争力和学术影响力 2、负责多模态媒体内容的理解、编辑、生成相关新技术的应用落地和探索 3、支持数字人、3D空间等产品和应用场景的关键算法实现和优化 职位要求: 1、计算机相关专业 博士毕业,具备一定的模式识别和多模态内容处理的经验。 2、具备扎实的数理统计基础和良好的科研素养,有复杂算法的设计、实现、分析和调优能力 3、在内容生成方向有较为深入的研究和探索,富于热情,自驱力强,勇于进行创新实践和技术突破 4、熟练掌握机器学习相关理论,有丰富的实践经验,精通GAN、预训练模型等内容生成相关技术 5、熟悉3D建模/重建,渲染及生成相关技术,有3D生成和视频生成类经验者尤佳 6、熟练掌握C/C++、Python或Java编程语言,有较强的动手能力和工程实践经验。 7. 有较强的责任心和良好的执行力,具备优秀的沟通协调能力及团队合作精神。 研究员(人机交互方向) 工作职责: 1、探索前沿人机交互技术,实现关键技术突破,构建业界领先的技术竞争力和学术影响力 2、负责相关产品的人机交互方案设计和技术提供,通过多模态全通道融合的方式改善人机交互体验,提升产品竞争力 职位要求: 1、HCI/CS/QA相关专业博士毕业,熟悉人机交互领域的基本理论和设计方法。 2. 具备扎实的数理统计基础和良好的科研素养,有复杂算法的设计、实现、分析和调优能力 3. 熟练掌握机器学习相关理论,有丰富的实践经验,具备人机交互领域相关项目经验和科研经历者优先(CHI,UIST,IUI) 4. 良好的创新思维和技术预见及洞察能力,对领域方向有很好地理解和把握,勇于实现突破和创新 5. 熟练掌握C/C++/Python/Java中任一编程语言,有较强的动手能力和工程实践经验 6. 富于热情,积极主动,自驱力强,有较强的责任心和良好的执行力,具备优秀的沟通协调能力及团队合作精神。 研究员(认知推理方向) 工作职责: 1、跟踪和探索认知智能方向研究前沿,实现关键技术突破,构建业界领先的技术竞争力和学术影响力 2、负责认知科学、自动推理、智能规划相关技术的研究探索和应用落地实践 职位要求: 1、计算机相关专业 博士毕业。 2、具备扎实的数理统计基础和良好的科研素养,有复杂算法的设计、实现、分析和调优能力 3、有良好的数学和形式化的思考能力,精通离散数学、认知科学或博弈论及相关理论和应用 4、熟练掌握机器学习相关理论,有丰富的实践经验,具备知识表示和推理方向相关科研经历者优先(KR) 5、熟练掌握C/C++、Python或Java编程语言,有较强的动手能力和工程实践经验。 6、富于热情,自驱力强,勇于进行创新实践和技术突破 7. 有较强的责任心和良好的执行力,具备优秀的沟通协调能力及团队合作精神。 研究员(NLP/多模态方向) 岗位职责: 1. 负责实现和调优自然语言处理以及文本挖掘的相关算法; 2. 跟踪自然语言处理相关前沿算法的研究进展和应用; 职位要求: 1. 熟练掌握自然语言处理领域的基础理论和方法,具有相关研究或项目经验者优先 2. 具备扎实的数理统计、数据结构和算法基础功底,具备复杂算法的分析和调优能力 3. 熟练掌握Java和python编程语言,具备一定的工程化能力 4. 熟悉机器学习及数据挖掘相关领域的算法 5. 良好的逻辑思维能力,优秀的分析问题和解决问题的能力 6. 有较强的执行力和责任心,具备优秀的学习能力、沟通协调能力及团队合作精神。
-
职责: 1. 负责最右推荐产品的研发,用推荐产品/技术来提升用户体验和活跃度; 2.应用机器学习、自然语言处理等技术,基于海量用户日志和内容,建立用户画像,构建内容质量及内容标签体系; 3.以数据挖掘和数据分析为基础,发现新的产品改进点,驱动产品改进,探索新的产品形态; 4. 跟踪业界最新的机器学习算法和研究趋势,并将其应用于实际的生产环境。 要求: 1.熟练掌握Python、php、go等其中的一种或几种编程语言,熟练使用数据结构和常用算法,有较强的算法设计和实现能力; 2.熟悉自然语言处理、机器学习、模式识别等常用算法,并进行过相关的实践; 3.较强的技术攻关能力,能够跟进领域内最新技术研究成果,并结合应用场景快速实验和调优; 4.4年以上推荐、ranking、NLP、文本挖掘等方向的实际工程和项目经验; 5.具备良好的团队合作精神和沟通意识。
-
1. 完成国家重点项目中的算法调研和开发工作; 2. 负责文本挖掘、知识图谱、用户模型等相关算法的调研和开发; 3. 优化搜索推荐系统算法; 4. 基于大数据的知识抽取、挖掘、融合和可视化等算法研究; 5. 算法和功能模块代码开发、后端算法 API 开发、测试、技术文档编写。 【岗位要求】 1. 硕士及以上学历,计算机、统计、通信等相关专业; 2. 有扎实的编程能力,掌握至少一门后端编程语言(Python/Go/Java等); 3. 对操作系统、数据结构和算法有较为深刻的理解; 4. 具有以下算法项目经验者优先:数据挖掘、知识图谱、搜索、推荐、NLP; 5. 有编程竞赛获奖经历者优先,例如 ACM、中国大学生程序设计大赛、蓝桥杯、CCF 相关竞赛或 CCF 等级考试相关算、PAT 等级考试。
-
职位描述: 职责: 1. 负责最右推荐产品的研发,用推荐产品/技术来提升用户体验和活跃度; 2.应用机器学习、自然语言处理等技术,基于海量用户日志和内容,建立用户画像,构建内容质量及内容标签体系; 3.以数据挖掘和数据分析为基础,发现新的产品改进点,驱动产品改进,探索新的产品形态; 4. 跟踪业界最新的机器学习算法和研究趋势,并将其应用于实际的生产环境。 要求: 1.熟练掌握Python、php、go等其中的一种或几种编程语言,熟练使用数据结构和常用算法,有较强的算法设计和实现能力; 2.熟悉自然语言处理、机器学习、模式识别等常用算法,并进行过相关的实践; 3.较强的技术攻关能力,能够跟进领域内最新技术研究成果,并结合应用场景快速实验和调优; 4.有1-3年推荐、ranking、NLP、文本挖掘等方向的实际工程和项目经验; 5.具备良好的团队合作精神和沟通意识。
-
岗位职责: 1、负责公司智能销售云平台内AI产品及应用场景规划、业务流程设计、功能设计、产品优化等工作; 2、负责AI产品及解决方案,结合公司已有的企业数据和客户具体应用场景,输出可落地的NLP、AI项目解决方案; 3、分析行业竞品、深刻了解用户的需求,针对用户需求输出高质量的产品原型和文档,不断地改良、调整产品的表现形式; 4、与设计、研发、运营等部门保持良好的沟通,协同工作,保证产品设计的理念被良好的贯彻执行,推动产品需求落地。 任职资格: 1、有5年以上的实际互联网产品设计经验,精通各类产品设计的工具和流程; 2、热爱互联网,洞察力强,关注大数据、智能营销、智能客服类产品,熟悉互联网AI相关产品的产品形态和产品功能; 3、对数据敏感,数据分析能力强,思路敏捷,逻辑思维,具有较好的解决问题能力; 4、优秀的项目管理能力、抗压能力以及跨职能、跨部门的组织协调能力和沟通能力,为结果负责; 5、熟悉NLP、知识图谱、文本挖掘算法学术和工程的研究进展优先。
-
岗位职责: 1.负责业务数据、知识的自然语言处理,结合自然语言处理技术、语义分析方法和知识图谱技术,从产品、项目等维度,实现相关模型的建立; 2.负责自然语言处理领域的前沿模型或算法的探索和研究,利用NLP、文本挖掘、机器学习、深度学习等方法解决如命名实体识别、分词、语义分析、指代消解、匹配等实际问题; 3.负责对领域数据、知识等进行采集、处理、加工、分析及应用; 4.支撑业务通过库表、Webservice、爬虫等技术,建立领域数据、知识的采集和应用工具。 任职要求: 1.计算机类相关专业,本科以上学历,至少3年以上自然语言处理,机器学习,或大数据分析建模等相关工作经验; 2.有较强的算法基础和编码能力;熟练使用Python、java等开发语言,熟悉常见的数据结构和算法;对常见的语言模型和自然语言处理任务有较深的理解; 3.在NLP领域语义建模和推理、知识图谱等方向有经验者优先 4.具备较强的学习新技术能力,熟悉深度学习、人工智能、机器学习等技术在大数据领域的应用; 5.有法律行业数据及知识管理经验者优先。 6.负责协助解决现场系统出现的故障,以及系统管理运维工作。