-
负责视频处理算法以及编码解码在公有云,私有云以及服务器上的并行化开发和部署。 2. 具体工作内容包含但不限于以下内容: 1)把单线程的算法模型改为多线程软件,提高实时性并且充分利用CPU资源, 2)使用OpenGL/OpenCL/汇编等方法充分利用服务器的计算能力, 3)利用公司现有服务器通过Docker,Openstack等方式部署视频处理软件, 4)利用API或者SDK在公有云上开发和部署视频运用。 任职要求 1. 在并行计算相关领域有丰富的工作经验: 1)多线程编程 2)多进程编程 3)OpenGL, OpenCL,Intel汇编
-
工作职责: 1.负责搜狐视频广告引擎系统的架构设计和系统研发工作,支撑天级数亿的广告请求; 2.负责搜狐视频广告交易平台的架构设计和开发维护工作; 3.持续优化现有系统,提高系统稳定性和性能,更好的支持广告投放业务; 任职要求: 1.**本科及以上学历,5年以上广告系统开发经验,对计算广告行业有兴趣,有团队管理经验优先; 2.熟悉C/C++,至少5年以上C/C++开发经验,熟悉openresty者更佳; 3.具备良好的分析解决问题能力,能独立承担工作任务及把控任务进度; 4.熟悉网络编程,多线程编程技术,有大规模系统的设计和开发经验。 5.有广告架构,搜索架构的相关开发经验优先。具有并行计算开发经验的优先考虑,参与大规模开源项目优先; 6.有良好的学习能力和团队协作精神,在技术方向有钻研精神,善于分享。工作积极有责任,认同企业文化,愿意拼搏努力。
-
工作职责: 1. 参与公司高性能计算平台的搭建、开发和优化。 2. 参与公司HPC建设的相关技术研究、设计和实现,例如并行计算、低延迟网络、并行文件系统等。 3. 研究和开发深度学习相关的通信、计算等技术,致力于GPU或其他异构硬件的高性能系统开发。 4. 开发公司高频策略所需的高性能回测系统。 职位要求: 1. 计算机、电子、通信专业,硕士及以上学历。 2. 精通C++语言,具有3年及以上的linux环境下C/C++多线程和多进程开发经验, 熟练掌握Linux环境下C++网络编程技术。具有linux环境下丰富的代码调试经验。 3. 熟练掌握计算机系统相关原理和结构,了解常见处理器(X86、ARM等)、缓存、传输总线、存储介质的基础知识。 4. 具有OpenMP、MPI、RDMA等高性能计算相关技术的开发经验,通过对Linux内核的优化,开发出基于CPU的高性能、低延迟抖动系统。 5. 具有多年的cuda并行计算开发经验,能够基于相关GPU框架(Tensorflow、Pytorch)进行性能或通信上的优化,以提升相关系统在海量金融数据(TB级)下的高速传输和计算。 6. 具有优秀的团队沟通和协作能力、责任心强,善于学习,有较强的自我驱动,具有独立分析并解决问题的能力。
-
岗位职责: 1.负责腾讯音乐集团相关产品推荐算法的设计实现与优化; 2.负责完善现有推荐系统的基础算法及并行计算框架; 3.负责音乐平台业务的基于用户/音乐特性的数据挖掘及推荐策略设计实现; 4.负责能够根据业务数据变化不断设计并调整算法策略来提升算法质量,并最终提升用户体验。 岗位要求: 1.硕士及以上学历; 2.计算机,统计,信息,数学等相关专业毕业优先; 3.扎实可靠的编程能力,精通C/C++/GO至少一门编程语言; 4.熟悉业内推荐算法及数据挖掘领域的技术热点和进展,对互联网在线音乐的推荐系统架构设计有深入了解; 5.了解Hadoop/Spark生态相关技术优先; 6.具备规模分布式数据存储与计算开发经验者优先; 7.沟通能力佳,表达能力出众者,音乐爱好者优先。
-
【校招】大语言模型工程师 职位描述: 1. 参与大规模预训练模型的研发工作,探索超大规模模型的极致系统优化; 2. 研究高效的模型调优策略、高质数据建设方法,包括数据建设、指令微调、偏好对齐、模型优化等; 3. 设计、实现、优化分布式系统和并行计算框架,提升训练和推理效率,支持大模型平台化及创新应用落地; 4. 探索大模型在前沿技术和趋势中的应用,包括生成创作、逻辑推理等,并在金融领域下的更多使用场景中进行深入研究和探索。 职位要求: 1. 硕士及以上学历,人工智能、计算机、自动化、数学相关专业优先; 2. 扎实的机器学习基础,熟悉NLP、RL领域技术,在ACL/EMNLP/NAACL/NeurIPS/ICML/ICLR等顶会发表论文者优先; 3. 熟练掌握Python及Pytorch/Tensorflow/PaddlePaddle等框架,C/C++熟练者优先; 4. 优秀的代码能力和算法功底,ACM/ICPC、NOI/IOI、Kaggle等竞赛获奖者优先; 5. 熟悉预训练模型算法原理,有大规模模型(>7B参数)训练调优或分布式系统开发经验; 6. 具备出色的问题分析和解决能力,能独立探索技术解决方案。 加分项: 1. 在大模型领域或RL领域,主导过大影响力的项目或论文者; 2. 有较强的学术背景,在会议上发表过相关论文者; 3. 有丰富的实践经验,能够快速将研究成果应用于实际场景中。
-
【校招】大语言模型工程师 职位描述: 1. 参与大规模预训练模型的研发工作,探索超大规模模型的极致系统优化; 2. 研究高效的模型调优策略、高质数据建设方法,包括数据建设、指令微调、偏好对齐、模型优化等; 3. 设计、实现、优化分布式系统和并行计算框架,提升训练和推理效率,支持大模型平台化及创新应用落地; 4. 探索大模型在前沿技术和趋势中的应用,包括生成创作、逻辑推理等,并在金融领域下的更多使用场景中进行深入研究和探索。 职位要求: 1. 硕士及以上学历,人工智能、计算机、自动化、数学相关专业优先; 2. 扎实的机器学习基础,熟悉NLP、RL领域技术,在ACL/EMNLP/NAACL/NeurIPS/ICML/ICLR等顶会发表论文者优先; 3. 熟练掌握Python及Pytorch/Tensorflow/PaddlePaddle等框架,C/C++熟练者优先; 4. 优秀的代码能力和算法功底,ACM/ICPC、NOI/IOI、Kaggle等竞赛获奖者优先; 5. 熟悉预训练模型算法原理,有大规模模型(>7B参数)训练调优或分布式系统开发经验; 6. 具备出色的问题分析和解决能力,能独立探索技术解决方案。 加分项: 1. 在大模型领域或RL领域,主导过大影响力的项目或论文者; 2. 有较强的学术背景,在会议上发表过相关论文者; 3. 有丰富的实践经验,能够快速将研究成果应用于实际场景中。
-
职位职责: 1、负责端侧模型推理框架开发,包括模型压缩、优化技术,在端侧的接入、适配、算子开发工作,使之符合业务要求,提高性能收益; 2、负责探索和落地 AI 模型工程部署前沿技术,包括但不限于稀疏计算、编译优化。 职位要求: 1、具备扎实的计算机科学功底和编程能力,了解常见并行计算算法,具有良好的编程习惯; 2、熟悉transformers、stable diffusion等主流模型原理; 3、良好的团队协作能力; 4、创新性强,有良好的动手实现能力,对技术有热情; 5、加分项:了解模型剪枝、量化等优化方法原理,具备相关模型优化经验。
-
职位职责: ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、负责字节跳动AML机器学习训练框架的研究与开发,服务于全公司各个产品; 2、参与机器学习训练框架底层组件的抽象,设计,优化与落地; 3、与全公司算法部门深度合作,为重点项目进行算法与系统的联合优化。 职位要求: 1、2026届本科及以上学历在读,计算机、软件工程等相关专业优先; 2、熟练掌握Linux环境下的C/C++与Python语言; 3、接触过至少一种机器学习框架(Tensorflow/PyTorch/MxNet或其他自研框架); 4、有以下至少一项的背景知识与经验:GPU编程,编译器,高性能网络,分布式存储,集群调度; 5、具有独立解决问题的能力,良好的团队合作精神; 6、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力;有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档。 加分项: 1、深入研究过至少一种机器学习框架(Tensorflow/PyTorch/MxNet或其他自研框架)的底层架构和机制; 2、熟悉至少一种经典深度学习模型及其应用场景,如ResNet50,BERT,或者了解GAN,强化学习,图神经网络,AutoML等; 3、有研究生或博士阶段的计算机系统方向(包含分布式系统,并行计算,编程语言与编译器,网络,存储等)研究背景; 4、有软硬件联合设计的经验; 5、能使用数学工具分析深度学习训练中的优化算法。
-
岗位职责:(部分匹配即可) 1、针对大模型推理、训练等场景,优化和扩展vLLM、SGLang等框架的核心模块,提升计算效率与资源利用率; 2、能够使用Profiler手段,分析训练瓶颈,使用分布式策略调优、算子优化等手段来提升训练性能; 3、提升分布式推理下模型并行(ModelParalleism)、数据并行(Data Paralelism)等场景下的性能; 4、支撑异构AI芯片上的调度框架设计与优化,提升系统的实时性、吞吐率、算力利用率等指标; 5、针对不同端侧设备的硬件特性(CPU、GPU、NPU 等)进行镜像和训推框架适配,针对特定硬件架构和推理引擎进行性能优化; 6、深入分析GPU硬件架构特性(如Tensor Core、显存带宽、通信机制等),设计并实现高性能算子与算法; 7、探索前沿技术方向(如混合专家模型MoE、强化学习算法等),推动AI工程化落地的效率提升。 岗位要求:(部分满足即可) 1、熟练GPU的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化等; 2、熟悉TensorRT-LLM、LMDeploy、vLLM、SGLang等大模型推理框架,有实际性能调优经验(如KV Cache优化、动态批处理、Attention算子定制等); 3、扎实的高性能计算基础,熟悉并行计算、内存优化、通信优化等技术; 4、至少熟练使用C++/Python/Golang中一种,具备良好的算法设计与代码实现能力; 5、熟悉Pytorch,Deepspeed等主流分布式框架的使用和原理,熟练掌握TensorFlow、PyTorch等深度学习框架; 6、了解深度学习算法基本原理,熟悉深度学习训练框架及其模型文件的解析; 7、了解通信架构原理、有分布式优化和通信优化经历者优先; 8、了解深度学习模型的量化压缩、推理加速等优化技术; 9、了解通信架构原理、有分布式优化和通信优化经历者优先。
-
岗位职责 1.负责腾讯地图轨迹数据挖掘系统架构的设计、开发和维护; 2.负责设计和开发高效的轨迹、特征存储方案,支持离线、实时的挖掘应用; 3.负责开发和部署用于道路数据挖掘的算法,机器学习模型,支持轨迹数据分析和挖掘应用; 4.负责系统的性能、稳定性、扩展性、成本的保障和提升。 岗位要求 1.计算机、理工类相关领域的本科及以上学历,工作经验3年以上; 2.有海量数据处理和并行计算开发经验,熟悉Hadoop、Spark、Flink等大数据处理框架,熟悉常用的数据存储,熟悉Kafka、RabbitMQ等消息队列系统,了解实时数据流处理技术; 3.具备分布式系统设计和开发经验,了解微服务架构,了解高并发、高可用系统的设计方法; 4.扎实的计算机科学基础知识,包括数据结构、算法、数据库系统、操作系统等,熟练掌握Java或者C++语言,熟悉常用设计模式; 5.有较强的学习能力及创新能力,有地图道路数据、海量轨迹处理相关背景优先。
-
团队介绍: 我们是一家成立近十年的科技企业,主营K12线上教培,业务领导经验丰富好沟通。 岗位职责: 1、负责推荐算法的分析、研究和落地; 2、负责学习机推荐算法、精准教学项目纸质作业图像识别,OCR识别,智能批改作业; 3、承接算法数据的模型基础训练与开发,负责训练数据清洗以及训练,同时承担模型训练工作; 4、负责算法训练数据的数据分析,包含标定流程的效率与质量分析、各类标签数据规模的分析、模型使用效果的分析:标定工具问题,进行归纳总结,同时积极推进改进清洗方案落地执行,提升数据清洗效率,优化标注成本; 5、负责算法的需求调研与需求实施规划,与算法、工具开发人员沟通,协调资源落实需求方案,跟进与把控后期的上线部署、测试等流程进度。 任职资格: 1、计算机、数学、物理或图像处理等相关专业,具有5年以上工作经验的本科,211及以上院校优先; 2、熟练使用 C/C++,熟悉面向对象编程,拥有良好的编程习惯,熟悉开发环境的搭建; 3、熟悉Windows、Linux开发环境; 4、有 Matlab、Python 等编程语言经验者优先;有并行计算经验者特别是 cuda 使用经验者优先; 5、熟悉图像处理算法,了解 opencv、halcon 等常用视觉库的使用、halcon有实际项目开发经验; 6、拥有较强的数理基础,对算法有较深的理解,有独立开发或改进算法的能力; 7、有机器学习/深度学习经验者优先;有基于图像检测识别算法开发经验者优先; 8、了解各种典型CNN网络的适用场景以及使用方法,了解TensorFlow、PyTorch等主流深度学习框架中的一种或多种, 或熟悉数字图像处理、图形学相关算法; 9、熟悉深度学习模型原理(如YOLO系列),需要有相关实践经验; 10、具备良好的团队合作精神和沟通能力,责任感强,工作认真仔细; 11、善于沟通,具有较强的数据敏感性,开阔的思维和视野,具有良好的逻辑分析能力和学习能力,善于分析和总结问题:擅于通过数据分析发现问题。 面试流程: 初试(可线上)-笔试(15到25分钟)-复试(线下)
-
1、工作职责 算法开发:设计、实现和优化高效的向量计算算法,提升数据处理和分析的性能。 系统架构:参与系统架构设计,确保向量计算模块的高效集成和运行。 性能优化:分析和优化现有系统的性能瓶颈,提出改进方案并实施。 技术研究:跟踪最新的向量计算和高性能计算技术,评估其在公司项目中的应用潜力。 团队协作:与数据科学家、软件工程师和产品经理紧密合作,推动项目的顺利进行。 文档编写:撰写技术文档和研究报告,确保知识的有效传递和共享。 2、任职要求 教育背景:计算机科学、数学、物理或相关专业的本科及以上学历。 工作经验:至少5年相关工作经验,有向量计算和高性能计算项目经验者优先。 编程技能:精通C/C++、Python等编程语言,熟悉并行计算和多线程编程。 数学基础:具备扎实的线性代数、概率统计和数值分析基础。 工具和框架:熟悉常用的向量计算库(如BLAS、LAPACK)和高性能计算框架(如MPI、CUDA)。 问题解决:具备优秀的问题分析和解决能力,能够独立完成复杂技术问题的研究和攻关。 沟通能力:良好的团队合作和沟通能力,能够清晰地表达技术方案和研究成果。 创新精神:对新技术和新方法保持敏感,具备持续学习和创新的能力。
-
岗位职责: 1、 医学图像配准算法开发; 2、 负责对现有文献、专利等资料所揭示算法的调研、实现、评估、改进和提升; 3、 根据产品需求定义或科研合作内容研发新的图形图像处理算法; 4、 负责撰写算法相关技术描述文档,并基于研究成果撰写发明专利。 任职要求: 1、 具有图像处理、计算机视觉等方面的理论知识和研究背景,能熟练阅读相关英文论文和专利; 2、 良好的C/C++/CUDA/OpenGL程序开发能力和算法实现功底、 熟悉OpenCV、Python、Matlab等语言; 3、 具有并行计算开发/算法优化经验、图像分割、图像配准算法研发经验者优先; 4、 在深度学习领域如CNN有实际项目经验,在深度学习等领域有研究; 5、 硕士研究生及以上学历。
-
AI大模型训练 优化工程师 温馨提示: 1 处于上升期蓬勃发展的部门,转正指标会相对多很多。退一万步来说,您能在这个平台学得到真东西,无论后续如何都可以操作 2 昇腾计算,在AI算力产业处于龙头地位,可以把握一下机会。 (外企德科OD) 岗位职责: 1.在昇腾软硬件平台上,负责大规模模型的迁移和调优,持续提升模型性能和效率; 2.设计、实现和优化创新的分布式训练技术,适配多方分布式仓库,推动公司在模型训练领域的技术领先地位; 3.参与AscendSpeed开发,并积极参与开源社区的维护和用户互动,为开源项目提供基础设施支持。 任职要求: 1.熟练掌握PyTorch/Tensorflow/Caffe等深度学习框架中的至少一种,具备扎实的基础知识; 2.熟悉Megatron-LM,DeepSpeed等第三方分布式框架者优先考虑; 3.熟练运用Transformer、Attention等NLP模型结构,并具备相关领域的深入了解和实践经验; 4.了解并行计算、网络通信、系统优化和集群硬件架构等相关知识; 5.具备出色的编程能力,精通Python,并熟悉C++、数据结构和算法设计,熟练使用Git、Linux/Unix系统和Shell编程。 我们提供: 1.拥有领先大模型研发和实践经验的团队,为您提供广泛的学习和成长机会; 2.激励薪资和完善的福利待遇。 3.广阔的职业发展空间,有机会参与头部科技企业合作项目。 如果您对人工智能技术充满热情,热衷于追求卓越,渴望在AI领域深耕,我们真诚邀请您加入我们的团队,共同探索人工智能的边界,为社会创造更大的价值。
-
岗位职责 我们面向鸿蒙生态1+8+N,负责数据科学研究,生态演进策略研究,业务价值多指标度量等任务。我们的目标是深入理解营销以及业务的运行机制,数据驱动,支撑产品团队高效科学的决策,支撑算法&策略持续优化创新,助力业务快速且可持续的增长。 1、根据业务需求完成较为深入的专项数据分析与洞察,准确定位业务问题中实际的原因; 2、将复杂问题进行拆解、定义,基于数据挖掘、统计建模等手段提出有效的策略或解决方案; 3、基于对用户人群、媒体、平台与生态系统的深入理解,通过定义科学的指标体系和探索性数据分析,准确反映业务现状,快速发现各个业务与技术方向的潜在改进机会; 4、与协同的各团队紧密配合,设计、实施科学合理的AB实验或观察性研究,指导科学的决策与迭代闭环,推动数据分析结论的落地与持续优化。 岗位要求 业务技能要求: 1 优秀的商业分析报告撰写能力,有及时发现和分析其中隐含问题的敏锐性; 2 至少掌握一种数据分析工具; 3 至少熟悉一种数据库,熟练运用SQL,有丰富的数据分析、挖掘、清洗和建模经验; 4 熟练使用JAVA/C++/Python/PHP 构建中等规模的数据分析系统, 有丰富的脚本处理数据经验。 专业知识要求: 熟悉数据分析方法和工具,有数据分析领域工作经验者优先 1、 计算机、自动化、数学、统计学、管理科学与工程、数据科学与大数据技术、信息安全等专业优先; 2、 有统计分析、机器学习、数据挖掘等领域的理论知识基础和实践经验,包括概率统计、数据挖掘、机器学习算法; 3、 热爱编程,基础扎实,熟悉掌握不限于Python/JAVA等编程语言中的一种或数种,有良好的编程习惯; 4、 熟悉Oracle、DB2、SQL Server、mySQL等至少一种数据库;对数据结构、算法有一定了解; 5、 掌握分布式并行计算框架,包括Hadoop、Hive、Spark、流式计算、实时计算等大数据相关技术; 6、 具备独立工作能力和解决问题的能力、善于沟通,乐于合作,热衷新技术,善于总结分享,喜欢动手实践