-
岗位职责: 1、负责行车场景周视感知算法设计和开发工作,包括高速/城区等场景中的障碍物、车道线等感知任务的模型及后处理算法开发工作 2、负责泊车场景环视感知算法设计和开发工作,包括室内、室外等场景中的车位、障碍物等感知任务的模型及后处理算法开发工作 3、负责自动驾驶领域大模型等前沿技术研发工作 任职要求: 1、计算机、汽车工业、机器人、电子或相关专业; 2、熟悉当前主流的深度学习算法,包括但不限于BEV感知、无监督训练、大模型、目标检测、图像分割、多任务学习、多传感融合等领域; 3、熟悉常用的深度学习框架,如PyTorch、TensorFlow、MxNet等,要求至少对其中一种框架较为熟练; 4、至少精通Python或C++编程,熟悉常用的视觉算法库如numpy/opencv等,了解常用的传统图像处理算法。 5、具备针对车载端侧平台检测/分割等算法设计经验和落地能力,有针对自动驾驶场景落地障碍物、车道线、红绿灯、freespace等算法经验者优先。 6、具有正确的价值观、内在驱动力;具有较强的学习能力、沟通能力和团队协作能力;能主动解决问题;能够承受较强的工作压力。
-
职位职责: 1、负责计算机视觉相关算法研发,将最新的CV技术落地到抖音直播丰富的业务场景,提升直播内容表现和互动能力; 2、支持大模型算法训练/推理相关的视觉/多模态相关CV算法处理,保证大模型算法更优的落地效果。 职位要求: 1、本科及以上学历,计算机/数学相关专业; 2、在NIPS、ICML、CVPR、ICCV 、ECCV 、TPAMI等国际会议/期刊有论文发表者优先; 3、在多媒体和计算机视觉某个领域有较深入的研究,包括但不限于识别、分割、生成式AI、3D视觉等,在图像生成和多模态等领域有深入研究及相关产品落地者优先; 4、熟练使用C++/Python,在Kaggle,COCO,ImageNet,ActivityNet,ICPC,NOI/IOI等比赛获奖者优先; 5、熟悉模型压缩加速最新研究和技术进展优先,如模型量化、剪枝、知识蒸馏等,及TRT Inference框架; 6、动手能力强,有技术追求,善于表达沟通和协同合作。
-
工作职责: 1、负责视觉算法、设计与开发,包括目标检测、图像分割、图像生成、视频理解等领域,满足实际业务场景需求; 2、基于 Pytorch 等深度学习框架,进行网络结构优化与算法性能调优,提升模型精度、速度和稳定性; 3、参与算法从研究原型到工程化部署的全流程,实现算法在不同硬件平台(如 瑞芯微3588、地平线、nvidia等边缘设备)上的高效运行。 任职资格: 1、计算机科学与技术、电子信息、数学、自动化等相关专业本科及以上学历。 2、精通深度学习理论,熟悉常见的视觉神经网络模型(如 CNN、Transformer、YOLO 系列、Mask R-CNN 等)的原理与应用; 3、对 ONNX 网络格式及网络 IR 有深入理解,能够熟练处理模型的转换与优化; 4、熟悉 NCNN、ONNXRuntime 等推理引擎的工作原理,具备使用这些引擎进行模型部署与性能优化的能力; 5、具备良好的代码编写能力,熟练掌握 Python、C++ 等编程语言,熟悉 Linux 开发环境及ros2环境。 其他要求 具备较强的问题分析与解决能力,能够独立应对算法研发与部署过程中的技术挑战; 具有良好的团队协作精神和沟通能力,能够在跨部门合作中高效推进项目; 对技术有强烈的好奇心与学习热情,能够快速掌握新知识和新技能,适应技术的快速发展。
-
一、岗位职责 (此岗位为我司劳务派遣岗位,由我司直接管理,对劳派岗位介意的慎投) 1.负责计算机视觉算法的设计与开发,涵盖图像识别、目标检测、图像分割、视频分析等核心领域,确保算法性能的高效与稳定。 2.深度参与数据处理流程,包括数据标注、清洗、增强等环节,构建高质量的数据集,为算法训练提供坚实基础。 3.运用深度学习框架(如TensorFlow、PyTorch等),进行模型的搭建、训练与优化,持续提升模型的准确性、泛化能力和实时性。 4.协同硬件工程师、软件工程师,完成算法在实际产品或项目中的部署与集成,保障算法与系统的无缝对接。 二、专业技术要求 1、本科及以上学历,计算机科学、数学、电子信息、模式识别、人工智能等相关专业优先。 2、 理解卷积神经网络(CNN)、循环神经网络(RNN)、Transformer等深度学习模型原理,熟悉ResNet、YOLO、Faster R-CNN、Mask R-CNN、U-Net等经典视觉算法中的一种。 3、 熟练使用Python进行算法原型开发,掌握C++用于算法工程化部署,能独立完成从模型设计到落地的全流程开发者优先。 4、 精通至少一种深度学习框架(PyTorch优先,或TensorFlow/Keras),熟悉模型训练、迁移学习、量化压缩、剪枝等工程化优化技术者优先。 5、 有以下场景经验者优先:工业质检、自动驾驶、医学影像分析、视频行为分析等实际业务落地项目。 6、具备良好的团队协作精神、沟通能力和问题解决能力,对技术有强烈的热情和探索精神者优先
-
职位职责: ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 1、负责图像与视频的内容理解与生成相关算法模型研发与优化,跟进计算机视觉领域的前沿技术研究; 2、负责图像与视频生成模型基座的训练和优化,提升生成效果能力的高美观度和可控度; 3、负责图像与视频的内容理解算法的训练和优化与在抖音各场景的应用研发与落地。 职位要求: 1、2026届本科及以上学历在读,计算机、软件工程等相关专业优先; 2、具备优秀的编码能力,扎实的数据结构和算法功底; 3、优秀的分析问题和解决问题的能力,有良好的沟通表达能力和团队精神; 4、熟悉Diffusion、ControlNet、GAN等生成方案原理,有相关模型研发经验者优先; 5、在图像内容理解和生成领域有经验,有相关方向会议论文者优先; 6、每周可实习4天以上,实习时间3个月以上。
-
岗位职责: 视觉算法研究(检测、识别、分割、跟踪、分类、回归、模型优化、架构搜索等)。 任职要求: 1、 硕士及以上学历,图像处理、机器学习、模式识别、人工智能等方向的相关专业; 2、有扎实的数学功底、深厚算法理论基础和较强的编程能力,能快速理解并重现论文中的算法; 3、图像基础扎实,熟练使用c++、python,opencv等开发语言和工具; 4、熟悉深度学习框架(pytorch/mxnet/tensorflow/caffe/caffe2);熟悉深度学习训练流程,对训练样本设计有深入理解;如熟悉RNN/LSTM/GAN更佳; 5、有良好的团队协作能力,能够独立思考,善于创新,针对问题提出有效解决方案; 6、每周能保证3-5天实习,能持续至少3月以上优先。
-
岗位职责: 1、负责机械臂视觉算法的设计与实现; 2、参与视觉算法在实际应用场景中的调试与优化; 3、与团队成员协作,解决项目中遇到的技术难题。 岗位要求: 1、本科及以上学历,计算机科学、自动化、电子信息 等相关专业; 2、具备1-3年相关工作经验,有机械臂视觉算法开发 经验者优先; 3、熟练使用OpenCV和PCL进行图像处理和点云数据 处理; 4、具备良好的编程能力,熟悉C++或其他相关编程 语言; 5、具有较强的问题分析和解决能力,能够独立开展 工作。
-
工作职责 1、研发生成式AI模型(如Diffusion Model/GAN等),推动AI生成内容(AIGC)在手机影像中的创新应用,涵盖图像生成、增强、风格化等领域; 2、优化AIGC算法在移动端的实时性与能效,支持文字到图像、图像到图像等多模态生成任务; 3、探索AIGC与手机影像技术的深度结合,解决暗光增强、超分辨率、人像生成、影调风格、可控编辑等场景的算法难题; 4、跟踪业界、学术界前沿技术趋势,输出高价值专利与算法原型,支撑公司AI影像技术领先性。 任职要求 1、学历和专业要求:本科及以上学历,计算机科学、人工智能、数学、物理等相关专业; 2、工作经验要求:有2年以上图像处理、计算机视觉算法开发经验,熟悉主流生成框架(如Stable Diffusion、DALL-E等),了解模型压缩与移动端推理优化技术(如ONNX、TensorRT); 3、技能要求:精通Python,熟悉PyTorch/TensorFlow,具备C++工程化能力及多线程优化经验;对用户需求敏感,能通过算法创新提升影像创作自由度与趣味性; 4、个人能力要求:具备较强的逻辑思维能力、学习能力及跨团队协作能力,能快速理解产品需求,输出系统性解决方案。
-
计算机视觉算法工程师 岗位职责 1、负责图像检索算法研发工作; 2、负责图像分类、检测和分割的算法研发工作; 3、负责机器视觉图像预处理,图像检测和特征处理等核心算法研发工作; 4、根据相关任务的落地场景,进行相关的算法优化工作; 岗位要求 1. 计算机、智能、数学或相关专业本科以上学历,硕士优先; 2. 责任心强,有良好的团队沟通能力和逻辑思维能力,要善于分析和解决问题; 3. 熟练掌握至少一种编程语言Python、C/C++等,代码功底要扎实,良好的编码风格; 4. 熟练常见CV库并使用一种或几种深度学习框架(如PyTorch、Tensorflow等); 5. 熟悉常见的图像检索/分类/识别/检测/分割算法,跟进学术界&业界最新研究状态,并有对应的实践经验; 6. 熟悉计算机视觉传统算法,如特征点提取/目标跟踪,有3D重建/SLAM等对应的实践经验可加分; 7. 在大规模场景下有上述相关任务经验的可加分。 上班时间:09:00-18:30(弹性工作制,午休1.5h,周末双休) 员工福利:下午茶、团建、旅行等。
-
计算机视觉算法应届生和实习生招
[上海·浦东新区] 2024-08-1222k-44k 经验不限 / 硕士人工智能服务,网络通信,IT技术服务|咨询 / 不需要融资 / 2000人以上国内知名科技公司大模型团队实习生和应届生招聘 我们正在寻找25-29届实习生,25届应届生,加入我们的团队,共同推进盘古基础视觉大模型的前沿研究和应用。欢迎对技术充满热情的你投递简历! 主要职责: 1. 参与盘古视觉大模型的前沿研究和应用,包括: 开集和闭集分割,检测 多模态对齐 多模态对话(MLLM) Diffusion图像和视频生成 3d重建和生成 2. 推动研究成果在工业、遥感、智慧城市等领域的项目落地。 职位要求: 计算机、电子信息、软件相关专业,本科及以上学历 熟练掌握Python,pytorch等深度学习常用工具 具备较强的自我学习能力,实习10个月以上 熟悉Transformer、mamba,CNN等常见架构 了解视觉理解,多模态对齐、对话、diffusion,3d GS等前沿技术 发表过高水平论文者优先 投递方式:请将简历发送至邮箱 ************************** 我们期待你的加入,共同探索技术的无限可能! -
我们正在寻找25届应届生和25-29届实习生,加入我们的团队,共同推进盘古基础视觉大模型的前沿研究和应用。欢迎对技术充满热情的你投递简历! 主要职责: 1. 参与盘古视觉大模型的前沿研究和应用,包括: 开集和闭集分割,检测 多模态对齐 多模态对话(MLLM) Diffusion图像和视频生成 3d重建和生成 2. 推动研究成果在工业、遥感、智慧城市等领域的项目落地。 职位要求: 计算机、电子信息、软件相关专业,本科及以上学历 熟练掌握Python,pytorch等深度学习常用工具 具备较强的自我学习能力,实习10个月以上 熟悉Transformer、mamba,CNN等常见架构 了解视觉理解,多模态对齐、对话、diffusion,3d GS等前沿技术 发表过高水平论文者优先
-
一、岗位职责 1, 参与公司图像相关的算法设计与开发,包含图像分类,图像搜素,目标检测与分割等技术; 2,参与OCR相关的文字检测与识别工作; 3,参与人脸识别相关的人脸检测、人脸关键点检测、人脸识别等工作; 二、任职要求 1, 计算机、数学或统计等相关专业硕士及以上学历。 2, 熟悉一种常见的深度学习框架,熟悉常见的机器学习、深度学习算法; 3, 熟练使用python,tensorflow,pytorch等编程语言和深度学习框架 4, 有大规模图像搜索、图像/视频分类和识别、人脸识别、OCR文字检测与识别等相关工作经历。 5, 能够设计和实现相关计算机视觉算法,并在实际系统应用中进行优化和改进;
-
职位描述 1、跟进计算机视觉及多模态等前沿技术方向,能够实现前沿算法,保持算法在工业界和学术界的领先; 2、探索计算机视觉及多模态算法在内容理解和内容生成等领域的应用,参与和推动技术落地到快手各产品线,如搜索、推荐、电商、商业化等; 3、打造算法技术在工业界和学术界的影响力,参与相关专利、顶会论文的发表。 任职要求 1、实习至少4-6个月、具备快速学习新技术、跟踪最新文献能力,优秀的自我驱动及沟通表达能力; 2、在多模态理解与生成算法方面有经验者优先,在**学术会议上发表论文者优先; 3、有扎实的工程能力,能够快速复现前沿论文和实现算法; 4、主观能动性强,具备优秀的逻辑思维能力,对解决有挑战的事情充满热情。
-
岗位职责 1. 负责人脸识别、行人重识别、多目标检测与分割、视频内容理解、三维重建等模型的研发工作 2. 独立承担计算机视觉产品中的一个或多个独立模块的算法设计与落地部署 3. 跟进、复现、优化相关领域的前沿算法,参与构建公司计算机视觉核心技术架构,沉淀创新性研究成果 任职条件 1. 独立完成过(或者主要负责人)一个图像处理项目,熟练使用python或者c++语言 2. 熟练运用机器学习算法解决工程中的问题 3. 熟练使用tensorflow或者pytorch框架 4. 熟悉多目标检测及追踪算法,并能根据现场数据做出合理的算法修正 5. 能够使用onnx、ncnn、tensorrt等至少一种模型转换及部署工具 6. 计算机相关专业硕士及以上学历 7. 2年以上计算机视觉研发经验 8. 对行人重识别、目标分割算法、三维重建等算法中的一种或者多种有比较深入的研究,了解目前图像领域的新技术,在网络模型优化、损失函数优化、三维重建等方面有完整研发经验者优先
-
岗位职责 1. 负责人脸识别、目标检测与跟踪、模型部署等相关算法研发工作 2. 跟进、复现、优化相关领域的前沿算法,并在对应产品中完成落地 任职条件 1. 计算机相关专业硕士及以上学历 2. 一年以上计算机视觉研发经验 3. 了解数字图像处理的基础知识 4. 掌握传统机器学习模型原理(决策树、贝叶斯分类器、svm、集成学习) 5. 熟悉tensorflow或者pytorch的基础使用方法 6. 熟悉常见的检测模型,并能根据需求进行一些模型改造及训练 7. 了解opencv的调用,并能根据opencv编写基础的图像处理工程 8. 在目标检测,人脸识别和模型轻量化方面有商业级算法研发经验者优先


