-
负责视频处理算法以及编码解码在公有云,私有云以及服务器上的并行化开发和部署。 2. 具体工作内容包含但不限于以下内容: 1)把单线程的算法模型改为多线程软件,提高实时性并且充分利用CPU资源, 2)使用OpenGL/OpenCL/汇编等方法充分利用服务器的计算能力, 3)利用公司现有服务器通过Docker,Openstack等方式部署视频处理软件, 4)利用API或者SDK在公有云上开发和部署视频运用。 任职要求 1. 在并行计算相关领域有丰富的工作经验: 1)多线程编程 2)多进程编程 3)OpenGL, OpenCL,Intel汇编
-
岗位职责: 1.负责腾讯音乐集团相关产品推荐算法的设计实现与优化; 2.负责完善现有推荐系统的基础算法及并行计算框架; 3.负责音乐平台业务的基于用户/音乐特性的数据挖掘及推荐策略设计实现; 4.负责能够根据业务数据变化不断设计并调整算法策略来提升算法质量,并最终提升用户体验。 岗位要求: 1.硕士及以上学历; 2.计算机,统计,信息,数学等相关专业毕业优先; 3.扎实可靠的编程能力,精通C/C++/GO至少一门编程语言; 4.熟悉业内推荐算法及数据挖掘领域的技术热点和进展,对互联网在线音乐的推荐系统架构设计有深入了解; 5.了解Hadoop/Spark生态相关技术优先; 6.具备规模分布式数据存储与计算开发经验者优先; 7.沟通能力佳,表达能力出众者,音乐爱好者优先。
-
职位职责: 1、负责端侧模型推理框架开发,包括模型压缩、优化技术,在端侧的接入、适配、算子开发工作,使之符合业务要求,提高性能收益; 2、负责探索和落地 AI 模型工程部署前沿技术,包括但不限于稀疏计算、编译优化。 职位要求: 1、具备扎实的计算机科学功底和编程能力,了解常见并行计算算法,具有良好的编程习惯; 2、熟悉transformers、stable diffusion等主流模型原理; 3、良好的团队协作能力; 4、创新性强,有良好的动手实现能力,对技术有热情; 5、加分项:了解模型剪枝、量化等优化方法原理,具备相关模型优化经验。
-
职位职责: 1、负责商业化实时数据流(百万级QPS)及实时数仓系统的开发与迭代; 2、负责商业化内部数据应用产品的开发与迭代,如BI、埋点平台、实验平台等; 3、负责巨量引擎各平台数据产品的数据链路及查询服务开发与迭代,为客户提供有价值高质量的数据能力。 职位要求: 1、具备良好的沟通能力和自我学习能力,具备较强的责任心和主人翁意识,积极推动问题解决和项目进展; 2、具备扎实的Java语言基础,具有良好的编码和文档习惯,对代码美感的追求孜孜不倦; 3、熟悉并行计算或者分布式计算原理,熟悉高并发、高稳定性、可线性扩展、海量数据的系统特点和技术方案; 4、对性能调优,算法效率和分布式计算的资源管理策略有较深的理解; 5、熟悉ZooKeeper/Kafka/Paimon/Hudi等平台者优先。
-
工作职责: 1.负责视频广告引擎系统的架构设计、核心模块研发与性能调优,支撑每日数亿级流量下的高并发广告请求,保障系统的极致性能与高可用性 2.根据视频广告业务发展的需求,主导重点业务和技术方向的项目:深入业务,通过策略优化驱动收入增长;攻克系统瓶颈,在底层性能优化等核心技术难题上有突破; 3.持续优化现有系统,包括品牌广告引擎和程序化交易平台系统,提高系统稳定性和性能,更好的支持广告业务的发展 4.持续完善广告后端服务的周边基础服务,包括但不限于高性能推理服务、自动化排查工具与全链路监控体系,提升团队整体研发效率与系统稳定性 任职要求: 1.**本科及以上学历,5年以上C/C++方向的大规模高并发系统开发背景,有广告/搜索/推荐系统开发经验优先,熟悉openresty者优先。 2.精通网络编程、多线程及并发技术,对系统性能调优有浓厚兴趣和丰富经验,能解决复杂的底层技术挑战。对数据敏感,可以通过技术手段提升核心业务指标。 3.具备优秀的技术架构能力、问题分析与解决能力,能独立负责复杂模块并从推动完成其高质量交付。 4.有大型分布式系统设计经验,参与过大型开源项目,具有并行计算开发经验的优先考虑 5.有良好的学习能力和团队协作精神,在技术方向有钻研精神,善于分享。工作积极有责任,认同企业文化,愿意拼搏努力。
-
Job Title: Technical Officer(SAERF) Department: Sustainable Atmospheric Environment Research Facility(SAERF), HKUST(GZ) Job Posting Details Formally established in June 2022, the Hong Kong University of Science and Technology (Guangzhou)(HKUST(GZ)) is a cooperatively-run university between the Chinese mainland and the Hong Kong Special Administrative Region. HKUST(GZ) has obtained approval from the Ministry of Education (MoE) and become the first legally-independent educational institution co-established by the Mainland and Hong Kong since the announcement and implementation of the “Outline Development Plan for the Guangdong-Hong Kong-Macao Greater Bay Area” and the “Overall Plan for Deepening Globally Oriented Comprehensive Co-operation amongst Guangdong, Hong Kong and Macao in Nansha of Guangzhou”. With a spirit of pioneering innovation, HKUST(GZ) charts new territories in cross-disciplinary education and explores new frontiers in pedagogies, aiming to serve as a role model of the mainland-Hong Kong integrated educational development and become a world-famous high-level university, endeavoring to nurture future-oriented, high-level and innovative talents. In response to the increasingly complex challenges faced by the rapidly changing world, HKUST(GZ) adopts a brand-new and cross-disciplinary academic structure featuring “Hub” and “Thrust” to substitute the conventional one characterized by “school” and “department”, facilitating cross-disciplinary integration while vigorously developing emerging and frontier disciplines. This is a groundbreaking move in the higher education community across the globe. 专业要求: 计算机科学与技术、软件工程、计算机工程或相关理工科专业。 工作职责 1. 设计、部署和管理高性能计算 (HPC) 集群,支持大气模拟、气候建模和大规模环境分析等计算密集型建模任务。 2. 构建并维护强大的环境数据库,整合传感器数据、管理元数据、确保数据质量,并为研究人员提供无缝的数据访问和分析支持。 3. 负责系统管理工作,包括服务器安装配置、操作系统管理维护、安全监控及软件更新升级,确保计算环境稳定安全运行。 4. 配置和维护本地及远程网络与数据基础设施,保障传感器、存储系统、HPC资源与终端用户之间的高效数据流传输。 5. 评估并实施新兴技术(如云计算、容器化方案-Docker、可扩展存储),持续增强机构的技术能力和效率。 6. 为研究人员提供技术支持与合作,包括问题调试、系统优化以及HPC工具和数据工作流程的培训指导。 7. 协助设备采购的技术规划和预算编制,负责供应商评估选择及物流协调管理事宜。 8. 领导并指导初级工程师,负责日常系统维护及用户支持工作。 9. 积极参与机构战略发展,推动数据驱动的环境研究发展,提升数据集的可访问性与互操作性,保障设施技术生态的长期可持续性。 10. 完成领导交办的其他任务。 任职要求 1. 计算机科学、软件工程、大气科学、环境工程或相关理工科专业硕士及以上学位。 2. 熟悉气象与环境数据全生命周期管理流程,掌握气候模型验证及卫星遥感数据分析方法论。 3. 具备大规模计算集群的架构设计及性能调优能力,精通主流并行计算框架与分布式任务调度系统。 4. 具有公有云服务部署实施经历(至少一种主流云平台)。 5. 5主导过复杂系统从需求分析到生产落地的完整交付周期,能独立设计测试验证方案并组织技术培训。 6. 熟练应用关系型数据库及时空数据库解决方案,了解实时数据流处理技术框架的实现原理。 7. 拥有跨学科协作经验,可有效转化科研需求为技术方案。 8. 能适应中英双语工作环境, 具有良好的中英文书写和口语能力优先。
-
岗位职责: 1、负责GPU资源调度与优化,提升计算效率; 2、参与深度学习框架与模型的并行优化; 3、分析性能瓶颈,提出并实施有效的优化方案; 4、跟踪GPU技术发展,引入新技术以提升产品性能。 任职要求: 1、深入理解GPU架构,具备扎实的编程能力; 2、熟悉CUDA、OpenCL等并行计算编程模型; 3、熟悉SGlang、vLLM框架,了解Unsloth、Llama-Factory、MS-SWIFT; 4、具备深度学习或高性能计算领域相关经验。
-
工作内容: • 研发稳定高效的 LLM 推理系统,支持低延迟和高吞吐 • 设计和优化分离式推理框架,实现低延迟、高吞吐 • 开发和优化分布式 KV 缓存(KV Cache)框架 • 进行 CUDA 内核优化,提高计算效率和 GPU 资源利用率 岗位要求: • 熟悉大语言模型(如 LLaMA、Qwen)推理流程 • 了解主流模型推理加速技术(模型量化、算子融合、P/D 分离、Prefix Caching、Speculative Decoding、KV Cache 压缩与调度) • 掌握 vLLM、TensorRT-LLM 等主流推理加速框架,能分析并优化其加速技术 • 熟悉 Hugging Face Transformers 及常见深度学习库 • 具备 GPU 高性能计算优化能力,熟悉 CUDA 并行计算、访存优化、低比特计算 • 深入理解计算机体系结构,具有基于 CUDA 的 GPU 性能优化经验 • 熟悉深度学习算法、神经网络架构及算子计算 加分项: • 了解至少一种深度学习训练框架(如 PyTorch、TensorFlow)及其模型文件解析方式 • 具备软硬件联合设计经验 • 有 P/D 分离系统、分布式 KV Cache 系统优化经验 • 熟悉底层性能优化(Cutlass、NCCL 等)
-
进行土木工程类数字孪生软件开发,至少具有以下开发经验之一: 1、具有GPU并行计算、数据库编程经验 2、参与过Web平台开发,能够与团队全生命周期协作,能够基于Vue3+Element-Plus+Echarts实现高可维护性UI组件,能够搭建与维护后端服务,使用Flask框架开发高效并保障接口稳定性,探索并实现三维可视化功能,结合Three.js进行3D场景构建与性能优化。
-
岗位职责 1、负责点云数据处理算法的研发,包括点云滤噪、分割、特征提取等预处理; 2、负责基于点云的矢量提取算法,实现的高精度的矢量轮廓提取与拓扑重建; 3、负责基于点云的DEM生成、三角网构建及等高线绘制算法,优化地形建模效率; 4、撰写技术文档,参与专利与论文撰写,跟进行业前沿技术动态。 岗位要求 1、硕士及以上学历,计算机/测绘/数学/自动化相关专业,3年以上图形学算法开发经验; 2、精通点云处理库(PCL、Open3D等)、三维重建算法(泊松重建、Marching Cubes等)、常见的优化算法(Ceres等); 3、熟悉计算机图形学基础理论(网格生成、曲面拟合、空间索引结构); 4、掌握C++/Python,具有CUDA或OpenCL并行计算优化经验者优先; 5、有LiDAR点云项目经验者优先。 6、有高水平论文发表经验者优先。
-
岗位职责: 1、架构设计:主导高性能计算框架开发,优化核心算法库(图像处理)及并行编程模块(CUDA/MPI等),确保系统高扩展性与跨平台兼容性; 2、硬件适配:推进CPU/GPU等硬件选型与算力评估,完成计算集群、网络存储等组件的部署与调优; 3、数据处理:设计分布式数据存储与并行计算方案,针对TB/PB级数据集实现高效存取与流式处理; 4、性能监控:执行系统性能瓶颈分析,制定动态优化策略并落地迭代; 5、技术沉淀:编制架构设计文档、调优手册等技术资产。 任职要求: 1、拥有模型训练、AI人工智能相关项目经验优先; 2、熟悉AI相关产品与技术体系(至少应用过OCR、NLP、视觉、数据智能、语音对话系统其中2种以上); 3、具有扎实的机器学习、深度学习相关知识,有机器学习相关算法实现和优化等丰富的工作经验; 4、熟练使用业界场景AI框架TensorFlow、PyTorch等,进行过实际产品的训练、调参与部署; 5、精通Linux操作系统、了解Docker、K8S架构和技术原理,有容器云平台架构设计和开发经验优先。
-
岗位职责: 1、架构设计:主导高性能计算框架开发,优化核心算法库(图像处理)及并行编程模块(CUDA/MPI等),确保系统高扩展性与跨平台兼容性; 2、硬件适配:推进CPU/GPU等硬件选型与算力评估,完成计算集群、网络存储等组件的部署与调优; 3、数据处理:设计分布式数据存储与并行计算方案,针对TB/PB级数据集实现高效存取与流式处理; 4、性能监控:执行系统性能瓶颈分析,制定动态优化策略并落地迭代; 5、技术沉淀:编制架构设计文档、调优手册等技术资产。 招聘要求: 1、拥有模型训练、AI人工智能相关项目经验优先; 2、熟悉AI相关产品与技术体系(至少应用过OCR、NLP、视觉、数据智能、语音对话系统其中2种以上); 3、具有扎实的机器学习、深度学习相关知识,有机器学习相关算法实现和优化等丰富的工作经验; 4、熟练使用业界场景AI框架TensorFlow、PyTorch等,进行过实际产品的训练、调参与部署; 5、精通Linux操作系统、了解Docker、K8S架构和技术原理,有容器云平台架构设计和开发经验优先。
-
岗位职责: 我们正在寻找一名资深大模型工程师,负责设计、开发、优化和部署大规模语言模型及相关应用。您将参与从模型预训练、微调、推理优化到实际落地的全流程工作,推动前沿技术在业务场景中的创新应用。 核心职责 1. 大模型开发与优化 - 参与大规模语言模型(如GPT、LLaMA、BERT等)的预训练、指令微调(Instruction Tuning)、对齐优化(Alignment)等全流程开发。 - 设计高效的分布式训练方案,优化模型训练效率与资源利用率。 - 探索模型压缩、量化、蒸馏等技术,提升模型推理性能与部署效率。 2. 算法研究与落地 - 结合业务场景(如对话系统、内容生成、知识问答等)设计定制化模型方案。 - 探索多模态大模型(文本、图像、视频)的技术融合与创新应用。 - 持续跟踪学术界与工业界前沿技术(如MoE、RAG、Agent框架),推动技术迭代。 3. 工程化与部署 - 构建高可用、低延迟的大模型推理服务,优化GPU资源管理与服务稳定性。 - 开发配套工具链,如数据清洗、评估指标、Prompt工程自动化等。 - 与Infra团队协作,优化训练/推理框架(如vLLM、DeepSpeed、Triton)。 4. 跨团队协作 - 与产品、数据、业务团队紧密合作,理解需求并输出技术解决方案。 - 推动大模型能力在真实场景中的落地,制定效果评估与迭代策略。 任职要求: - 硬性要求 - 计算机科学、数学、统计学或相关领域硕士及以上学历,3年以上AI研发经验。 - 精通Python,熟悉PyTorch/TensorFlow/JAX等框架,具备CUDA/并行计算经验者优先。 - 深入理解Transformer架构、注意力机制、大模型训练技术(如3D并行、ZeRO)。 - 熟悉LangChain、LlamaIndex等大模型应用开发框架,具备端到端落地经验。 - 对NLP基础任务(如文本生成、信息抽取)有扎实的算法与工程经验。 - 加分项 - 发表过ICLR、NeurIPS等顶会论文,或参与过开源大模型项目(如Llama、Falcon)。 - 熟悉大模型生态工具链(Hugging Face、wandb、向量数据库)。 - 有高并发服务开发经验,熟悉Kubernete/Docker等云原生技术。 - 具备多模态模型(如CLIP、Stable Diffusion)或AI Agent开发经验。 - 软性要求 - 强烈的技术热情,能快速学习并攻克技术难点。 - 优秀的逻辑思维与跨团队沟通能力,能将复杂技术转化为业务价值。
-
岗位职责:(部分匹配即可) 1、针对大模型推理、训练等场景,优化和扩展vLLM、SGLang等框架的核心模块,提升计算效率与资源利用率; 2、能够使用Profiler手段,分析训练瓶颈,使用分布式策略调优、算子优化等手段来提升训练性能; 3、提升分布式推理下模型并行(ModelParalleism)、数据并行(Data Paralelism)等场景下的性能; 4、支撑异构AI芯片上的调度框架设计与优化,提升系统的实时性、吞吐率、算力利用率等指标; 5、针对不同端侧设备的硬件特性(CPU、GPU、NPU 等)进行镜像和训推框架适配,针对特定硬件架构和推理引擎进行性能优化; 6、深入分析GPU硬件架构特性(如Tensor Core、显存带宽、通信机制等),设计并实现高性能算子与算法; 7、探索前沿技术方向(如混合专家模型MoE、强化学习算法等),推动AI工程化落地的效率提升。 岗位要求:(部分满足即可) 1、熟练GPU的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化等; 2、熟悉TensorRT-LLM、LMDeploy、vLLM、SGLang等大模型推理框架,有实际性能调优经验(如KV Cache优化、动态批处理、Attention算子定制等); 3、扎实的高性能计算基础,熟悉并行计算、内存优化、通信优化等技术; 4、至少熟练使用C++/Python/Golang中一种,具备良好的算法设计与代码实现能力; 5、熟悉Pytorch,Deepspeed等主流分布式框架的使用和原理,熟练掌握TensorFlow、PyTorch等深度学习框架; 6、了解深度学习算法基本原理,熟悉深度学习训练框架及其模型文件的解析; 7、了解通信架构原理、有分布式优化和通信优化经历者优先; 8、了解深度学习模型的量化压缩、推理加速等优化技术; 9、了解通信架构原理、有分布式优化和通信优化经历者优先。
-
团队介绍: 我们是一家成立近十年的科技企业,主营K12线上教培,业务领导经验丰富好沟通。 岗位职责: 1、负责推荐算法的分析、研究和落地; 2、负责学习机推荐算法、精准教学项目纸质作业图像识别,OCR识别,智能批改作业; 3、承接算法数据的模型基础训练与开发,负责训练数据清洗以及训练,同时承担模型训练工作; 4、负责算法训练数据的数据分析,包含标定流程的效率与质量分析、各类标签数据规模的分析、模型使用效果的分析:标定工具问题,进行归纳总结,同时积极推进改进清洗方案落地执行,提升数据清洗效率,优化标注成本; 5、负责算法的需求调研与需求实施规划,与算法、工具开发人员沟通,协调资源落实需求方案,跟进与把控后期的上线部署、测试等流程进度。 任职资格: 1、计算机、数学、物理或图像处理等相关专业,具有5年以上工作经验的本科,211及以上院校优先; 2、熟练使用 C/C++,熟悉面向对象编程,拥有良好的编程习惯,熟悉开发环境的搭建; 3、熟悉Windows、Linux开发环境; 4、有 Matlab、Python 等编程语言经验者优先;有并行计算经验者特别是 cuda 使用经验者优先; 5、熟悉图像处理算法,了解 opencv、halcon 等常用视觉库的使用、halcon有实际项目开发经验; 6、拥有较强的数理基础,对算法有较深的理解,有独立开发或改进算法的能力; 7、有机器学习/深度学习经验者优先;有基于图像检测识别算法开发经验者优先; 8、了解各种典型CNN网络的适用场景以及使用方法,了解TensorFlow、PyTorch等主流深度学习框架中的一种或多种, 或熟悉数字图像处理、图形学相关算法; 9、熟悉深度学习模型原理(如YOLO系列),需要有相关实践经验; 10、具备良好的团队合作精神和沟通能力,责任感强,工作认真仔细; 11、善于沟通,具有较强的数据敏感性,开阔的思维和视野,具有良好的逻辑分析能力和学习能力,善于分析和总结问题:擅于通过数据分析发现问题。 面试流程: 初试(可线上)-笔试(15到25分钟)-复试(线下)


