• 社交媒体 / 上市公司 / 2000人以上
    工作职责: 1. 多模态大模型:探索跨模态的信息对齐方法,探索多模态大模型的继续预训练、指令微调等技术,探索多模态的数据质量评估和清洗方法。 2. 多模态大模型应用:解决多模态大模型工程化过程中的难题,推动多模态大模型在微博场景落地。 任职要求: 1. 自然语言处理、计算机视觉、机器学习、数据挖掘、人工智能等相关专业,本科及以上学历,研究生优先。 2. 在计算机视觉或多模态理解与生成方面有扎实的知识基础,熟悉主流的多模态大模型或图片、视频生成模型,如LLaVA、Qwen-VL、SD、FLUX、OpenSora等。 3. 在多模态理解或多模态生成等应用方向具备1年左右,或在计算机视觉领域具备2年以上相关工作经验,两者满足其一即可。 4.熟悉Pytorch、Transformers 等常用工具的使用,具备扎实的编程基础。 5. 赛事获奖或开源项目贡献者优先。
  • 社交媒体 / 上市公司 / 2000人以上
    工作职责: 1. 多模态大模型:探索跨模态的信息对齐方法,探索多模态大模型的继续预训练、指令微调等技术,探索多模态的数据质量评估和清洗方法。 2. 多模态大模型应用:解决多模态大模型工程化过程中的难题,推动多模态大模型在微博场景落地。 任职要求: 1. 自然语言处理、计算机视觉、机器学习、数据挖掘、人工智能等相关专业,本科及以上学历,研究生优先。 2. 在计算机视觉或多模态理解与生成方面有扎实的知识基础,熟悉主流的多模态大模型或图片、视频生成模型,如LLaVA、Qwen-VL、SD、FLUX、OpenSora等。 3. 在多模态理解或多模态生成等应用方向具备1年左右,或在计算机视觉领域具备2年以上相关工作经验,两者满足其一即可。 4.熟悉Pytorch、Transformers 等常用工具的使用,具备扎实的编程基础。 5. 赛事获奖或开源项目贡献者优先。
  • 金融 / 上市公司 / 2000人以上
    工作职责 1、 主要负责应用多模态(文本、视频、语音处理)建模、深度学习等技术,为医疗健康产品研发具有科学性、可行性、先进性的算法解决方案,提高AI在心理、慢病等数字疗法领域的诊断和治疗能力,满足医疗健康多场景使用; 2、 负责调研、探索、应用深度学习等技术的最新的研究和技术进展,优化算法建模实验,提高算法模型性能; 3、 参与医疗AI产品的研发,与产品团队、开发团队合作完成创新技术向应用成果的转化; 4、 参与外部研究机构的学术或科研项目,发表论文和申请发明专利。 任职要求 1、计算机、统计学、数学、自动化、生物医学工程等相关专业硕士或以上学历; 2、有2年以上多模态、自然语言处理、深度学习等算法工作经验; 3、具有较好的算法设计与编程开发经验,熟练掌握Python或R编程,熟悉SQL语言; 4、具有良好的沟通能力与多学科团队协作能力; 5、在人工智能领域**期刊、会议上发表过学术论文者优先; 6、在医疗人工智能领域有相关研究经验者优先。
  • 50k-70k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、结合对直播场景的深入理解,进行直播多模态大模型的建设,面向主播开播的全流程,通过直播间内容理解、智能辅播、主播成长陪伴、智能复盘、智能创作等能力的建设和落地,打造面向直播全流程、自迭代的智能直播专家落地; 2、深入分析研发全生命周期的痛点问题,实现代码智能生成、技术方案智能设计、智能运维提效等全生命周期的提效助手,构建智能研发大模型; 3、密切跟进LLM领域最新研究成果,积极参与新业务的探索研究,结合对业务场景的充分理解,寻找最佳解决方案。 职位要求: 1、本科及以上学历,人工智能、计算机、模式识别等相关专业; 2、有NLP、CV、数据处理相关复杂系统的落地经验,具备较强的前沿创新能力; 3、具有优秀的编程基础,熟练使用Python/C++等至少一种编程语言,熟练使用TensorFlow/PyTorch等至少一种深度学习框架; 4、熟练掌握常见开源模型调优训练、推理加速框架,熟悉LLaMA、ChatGLM等开源大模型原理与实现; 5、优秀的分析和解决问题的能力,对解决具有挑战性的问题充满激情,良好的沟通和团队合作能力。 加分项: 1、具备业界大模型的训练、调优和交付经验,在多模态大模型、代码大模型上有实战经验者更优; 2、具备业界的大模型应用产品落地经验,在其中发挥关键的架构设计、模型优化作用; 3、具有长视频理解、图文交互等大模型应用落地经验,在其中发挥关键的架构设计、模型优化作用; 4、具有研发提效相关的大模型应用落地经验,在其中发挥关键的架构设计、模型优化作用。
  • 30k-60k 经验3-5年 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、算法方向:负责设计和开发多模态AI模型,包括但不限于音视频处理、图片理解、文档理解、表格理解等核心技术; 2、业务场景:将多模态算法应用于会议纪要生成、企业问答、智能文档创作等协同办公场景,提升办公智能化水平; 3、性能优化:优化多模态模型在实际应用中的性能和用户体验,包括延迟、准确性和资源利用效率; 4、产品协作:与产品团队紧密合作,深入理解用户需求,提供创新的AI解决思路; 5、技术建设:持续关注业界最新的技术趋势和研究成果,分享行业最佳实践,推动团队技术能力提升。 职位要求: 1、本科及以上学历,多模态/跨模态理解方向有较多深入研究以及实际落地案例,对于开源多模态模型有深入理解; 2、扎实的机器学习理论基础和算法实现能力,精通PyTorch等深度学习框架; 3、紧跟AI领域的最新发展动态,通过参加学术会议、阅读前沿论文、在线学习课程等方式不断提升自己的专业知识和技能; 4、良好的项目管理能力和团队协作精神; 5、在**会议/期刊发表过论文或有开源项目贡献者优先。
  • 软件开发,物联网 / 不需要融资 / 50-150人
    ★★欢迎对人工智能领域感兴趣的应聘者加入,内部提供类ChatGPT/AI人工智能小助理等多款工具,协助团队提升工作效率并发掘新的业务增长点★★ 【我们需要这样的你】 1)心态积极阔达、坦诚自信、乐观进取;(当看到半杯水的时候会觉得自己拥有了半杯水,而不是只有这半杯水,更多关注杯子的外侧,通过了解未知的未知保持空杯心态) 2)善于思考与创新,愿意持续学习新知识,内驱力强,喜欢“跳出已有框架”思考问题,不为自己设限 【项目背景简述】 职业合伙人是一种创新的商业模式,代表专注于特定领域的一人公司负责人,无需组建管理团队。在团队的支持下,职业合伙人通过AI赋能,形成“人+ AI + 外包”的公司形态。主要专注于推动业务增长和生态商业发展,以及AI、AGI的使用。根据客户群体的不同,职业合伙人分为B端和C端,您将在B端或C端发挥重要作用。 【项目内容比重】 ★专业技能工作(市场分析、数据分析):30% ★管理工作(统筹规划、组织协调):30% ★事务性工作(会务参与、业务沟通):40% 【项目服务内容】 1.业务发展: -专注于公司的业务发展,制定并执行业务增长策略 -识别和抓住市场机会及潜在客户 -建立和维护与客户的良好关系 2.AI技术应用: -利用AI和AGI技术提升业务效率及创新能力 -持续学习***并探寻应用场景 3.客户管理: -维护和深化与客户的合作关系,保障客户满意度 4.外包协调: -筛选合适的外包合作伙伴并进行有效管理,确保项目按时高质量完成 -协调内部资源与外部合作伙伴之间的合作 5. 生态系统建设: -积极参与生态系统建设,与其他团队成员协作,共同推动业务发展 -踊跃参与行业活动,拓展业界人脉 -在生态系统中发挥影响力,推动商业模式创新 【合作要求条件】 ★通用要求: 1.有留学背景,具备流利的英语听说读写能力,能够与国际客户和团队无障碍沟通,有商业、商科或IT相关学位(硕士及以上学位优先) 2.对美国文化有一定了解,能够迅速适应并融入国际化的业务环境 3.拥有强烈的工作热情与驱动力,自我激励且愿意投入时间和精力于公司的长期发展目标中4.具备出色的时间管理与项目管理能力,能有效规划、执行并监控项目进度,确保达成预定目标 5.能够在快节奏、多变化的工作环境中灵活应对挑战,始终保持高度自我驱动力与适应能力,直面各种不确定性 6.具备强大的数据分析能力和问题解决技巧,能独立进行数据挖掘和分析,并提出可行的改进建议,以支持决策过程 ★专业技能要求: 1.熟悉云计算领域相关技术 2.熟悉大资料领域相关技术 3.熟悉人工智能领域相关技术 4.熟悉科技公司的商业化运作 【合作服务时间】 视服务内容需要协商安排 【合作服务费用】 ★12000-24000元/期 【项目收益】 ★股权激励:根据职位和表现授予股权/期权,让您参与公司的长期成长与价值创造 【合作方式】 ★通过遴选考核体验等环节,双方达成意向后,以项目承揽方式合作,服务待遇以承揽人员的相关协议条例为准 【发展方向】 项目合作伙伴 【项目服务模式】 ★线上服务:自由办公,场地不限 ★项目线下服务地点: 1、中山市西区街道金港路48号美林假日翰林苑4期164-167卡 2、中山市东区街道兴政路1号中环广场1幢5楼 3、中山市火炬开发区伟盛路12号幸福旭日家园1栋6卡 4、中山市港口镇港口银库路8号裕港豪庭二期52卡 5、中山市石岐区江怡街2号富力商务大厦2栋21层 6、中山市沙溪镇星宝路佳兆业大都汇四期12栋182卡 ★最终需要视乎部门实际选择线上/线下合作服务模式 【面试流程】 简历筛选---技术面试---现场体验(非刚需)---人事面试---合作意向建立沟通---合作手续办理 【项目说明】 本项目由【中山华定科技有限公司】发起合作
  • 移动互联网 / 上市公司 / 2000人以上
    岗位职责 1.我们正在构建原生支持视觉、音频与文本的大规模多模态模型体系,以推动人工智能系统实现对物理世界的全面感知与理解。你将加入语音与音频方向的核心研究团队,围绕以下关键研究任务开展工作:; 2.研发具备通用能力的端到端语音大模型,包括多语言语音识别、语音翻译、语音合成,副语言信息理解,音频理解 等; 3.推进 语音表征学习 与 语音编码/解码 架构研究,构建适用于多任务、多模态的统一声学表征; 4.探索音频和语音在多模态大模型中的表征对齐与融合机制,与图像、文本联合建模; 5.构建并维护高质量的语音多模态数据集、自动标注与数据合成技术。 岗位要求 1.计算机、电子工程、人工智能、语言学或相关领域博士,或硕士加多年相关工作经验; 2.深入理解语音音频信号处理、声学建模、语言模型和大模型架构; 3.熟练掌握 语音识别,语音合成,语音翻译等 一项多多项系统开发流程,具有多语言、多任务或端到端系统经验者优先; 4.对以下方向具备深入研究或实践经验者优先:; 5.语音表征预训练(如 HuBERT, Wav2Vec, Whisper 等); 6.多模态对齐与跨模态建模(音视频和文本); 7.有推动大模型在音频理解任务上达到 SOTA 性能的经验优先; 8.熟练掌握 PyTorch、TensorFlow等深度学习框架,有大规模训练与分布式系统经验者优先; 9.熟练 Transformer 类模型及其在语音、多模态领域的训练和推理。
  • 5k-9k 经验在校/应届 / 硕士
    硬件 / 不需要融资 / 2000人以上
    岗位职责 1. 开发与部署深度学习、图像视频文本理解、多模态融合、大规模特征检索、等方向先进算法,达到业界领先的性能指标; 2、负责多模态的微调训练,提升模型在复杂环境中的泛化能力。 3、建立多模态大模型性能评测体系,设计覆盖准确性、实时性、鲁棒性等维度的评测指标与基准数据集。 4、推进多模态大模型轻量化、端侧部署及推理加速技术,优化多模态大模型在平台上的运行效率。 岗位要求 1、硕士及以上学历,计算机科学、机器人学、人工智能、自动化等相关专业 2. 深入理解Qwen-VL/InternVL/GPT-4o等 MLLM模型,具备大模型预训练/微调等经验,以及数据构造和评测经验。 4、模型开发经验,对vit、lora等有相关模型或能力的开发/训练经验 5、工程能力:熟练使用Python/pytorch,具有多模态模型部署(ONNX/TensorRT等)经验者优先。 6、在CVPR/ICCV/ECCV/NeurIPS/ICRA/IROS等会议或TPAMI/IJCV等期刊发表论文者优先。
  • 8k-12k 经验1-3年 / 本科
    企业服务,软件开发 / 上市公司 / 2000人以上
    工作内容: 1、图像的识别理解:用户拍照的图片上传到某AI软件(如豆包、deepseek、通义等),再发送要求的指令,模型会根据指令生成关于图片的描述输出,比如品牌、型号、功能等信息文字提取。 2、图像编辑:上传一张图片,输入指令,比如换一个背景;图像的生成,比如上传一个自己的头像,要求换成动漫风格的图片;问答类型,上传图片,输入指令这是什么品牌;描述类型,比如拍一个电脑上传,判断图片里面品牌、需求类型、图片类型,看模型反馈结果质量如何 ,有没有准确性问题,或视觉问题。 3、文生图需求(单独需求):需要先理解图片,要有描述/编辑指令的能力,由模型生成图片。给AI指令,比如生成一只小狗在草地上玩耍,主要是我们的指令怎么写(输入指令相对比较难,所以要求文科),对于生成图的质量判断好坏。 要求: 1、学历:本科高优,文科专业优先,如果能力很好,也可以接受大专。(有人工手写和改写的内容,需要有文本语义判断能力,所以要求文科较好)。 2、能力素质:理解能力好、学习能力好、逻辑清晰【必需】 3、能力加分项:英文读写、代码编辑、高数/物理解题等能力【优先,比较欠缺的能力,如果有类似能力会优先面试】 4、有SFT/RM标注经验,可放宽至搜索等业务的结果质量标注(图片/文字/视频都可)【必需】 5、有文字编辑或处理经历,可适当放宽【必需】
  • 11k-22k 经验不限 / 硕士
    数据服务|咨询 / 不需要融资 / 500-2000人
    1、面向AIGC多模态数据内容安全检测需求,进行图片、视频、音频等多模态数据的内容安全检测算法设计与实现; 2、面向AIGC多模态数据特征关联、融合、建模进行技术攻关,开展跨模态对齐检测模型设计与系统实现; 3、开展相关项目论证、申报和执行,负责工程实现; 4、具有计算机、网络安全、人工智能等相关专业硕士及以上学位; 5、具有数据安全、数据治理和AIGC等领域的研究基础,熟练使用机器学习框架,具有开发实践经验; 6、工作踏实认真、有高度的责任心、勇于开拓、具有较强的工程实现能力和团队合作精神。
  • 40k-70k·16薪 经验1-3年 / 本科
    电商 / 上市公司 / 2000人以上
    【P5-P8均有HC,根据面试表现和经验而定】 职位描述 1. 负责开发和优化新一代多模态AI搜索系统,包括但不限于多模态模型训练、跨模态生成与检索、多模态Agent等。 2. 负责搜索系统算法设计与实施,负责搜索系统中的多模态query理解、召回、相关性排序等关键模块的算法设计与优化。 3. 跟踪多模态大模型方向前沿问题的研究,将业界SOTA模型在业务场景进行产品化落地。 职位要求 1. 计算机科学、人工智能、数学或统计学等相关专业硕士及以上学历,有多模态大模型相关研究或实际项目经验者优先。 2. 熟悉搜索引擎的基本原理和算法,包括query理解、召回、相关性排序、个性化推荐等,有多模态搜索和图搜经验者优先。 3. 深入理解GPT-4o/Qwen-VL/InternVL等 MLLM模型,具备大模型post-training训练经验,以及数据构造和评测经验。 4. 加分项:在ICLR、CVPR、ICCV、ACL、NeurIPS等顶会上发表过论文;具有大型搜索产品核心算法优化的实际工作经验者优先。 如果你对多模态大模型和搜索系统有浓厚兴趣,并期望在前沿技术领域有所作为,欢迎加入我们,共同探索新一代AI搜索引擎的算法架构,提升搜索结果的精准性和用户体验。
  • 35k-65k·16薪 经验3-5年 / 本科
    工具 / 上市公司 / 2000人以上
    本科及以上学历,计算机相关专业。有大型项目开发经验。
  • 短视频 / 上市公司 / 2000人以上
    职位描述 1、对海量多媒体素材(如图片、视频、文本、音乐等)进行深入语义理解,在此基础上进行素材打散、内容匹配和智能创作,形成多样化高质量的内容,服务于智能广告生成、视频智能混剪、特效制作等方向,支持商业化、海外等多个重要业务线; 2、对生成的海量内容,设计基于多模态内容和用户反馈的质量评价体系; 3、基于线上用户的行为反馈,分析用户的兴趣点和生成内容优缺点,不断进行生成策略调优。 任职要求 1、对基于图像、视频、语音、文本等模态内容的各类算法算法有一定的理解,包括不限于图像/视频理解、检测、分割、OCR、人脸、ASR、文本生成等; 2、工程能力强,熟练掌握python/c++语言,有成功的项目经验; 3、熟悉常见的机器学习和深度学习算法,熟练使用至少一种深度学习框架,如Pytorch、TensorFlow、MXNet等; 4. 、对学术前沿有浓厚兴趣,时刻跟进技术前沿,并善于利用各类技术解决复杂的实际问题,有良好的沟通表达能力; 5、对搜索、GAN、图形学渲染、特效等方向有深入了解者优先。
  • 30k-60k 经验3-5年 / 硕士
    智能硬件 / 不需要融资 / 2000人以上
    base:深圳或者南京 职位描述 1.负责基于业内先进的大模型进行针对特定业务场景的训练、微调,并推动其在实际应用中的落地; 2.负责文本、图像、视频等多模态数据处理&治理,数据质量检测和内容风控,构建高质量的垂域数据样本; 3.负责多模态数字内容生成的算法研发,包括但不限于图像、视频和3D生成,旨在提升生成质量的稳定性、可控性等; 4.负责AIGC+图像的算法研究,文生图AIGC算法研究和广告业务落地,建设&优化文生图算法Pipeline; 5.通过Prompt强化、前后置插件优化、fine-tune等方式解决文生图模型在广告场景的生成质量、可控性问题。 任职要求 1.本科及以上学历,硕士学历者优先,计算机、人工智能、数学、电子信息与工程等相关专业; 2.熟悉多模态生成领域的最新技术,如ChatGPT、DALLE、StableDiffusion等前沿技术; 3.掌握计算机视觉和图像处理的基本算法,熟悉常用的深度学习算法,如LSTM、CNN、RNN、Transformer等,并有相关框架(如TensorFlow、PyTorch)的使用经验; 4.具有多模态大模型的研究和开发经验,熟悉常见ΑI生成模型框架,包括 GAN、 VAE、VQGAN、Diffusion等,熟悉ControlNet, LoRA,Text Inversion等生成模型插件模型; 5.有多模态图像/3D/视频生成实践经验者优先,具有AIGC相关产品落地经验者优先; 6.具备强的学习能力和自驱力、清晰的逻辑思维能力和出色的沟通能力。
  • 30k-50k 经验不限 / 硕士
    人工智能,工具 / 天使轮 / 少于15人
    团队介绍: 技术团队由北京大学计算机学院副院长教育部长江学者特聘教授崔斌教授领衔指导,团队研发实操经验丰富,显卡资源丰富,发表前沿论文,欢迎AI、大数据领域的大牛加入共创AIGC未来!   工作内容:   1、 推动文生图、图片编辑、视频编辑等AIGC技术研发,包括算法创新、工程实现与系统评测等;  2、参与模型的产品落地,包括大模型推理效率优化、基于反馈的算法调优等。 职位要求:   1、硕士及以上学历,具备机器学习/计算机视觉/软件工程相关专业知识;  2、熟悉PyTorch等深度学习框架;  3、熟悉前沿的神经网络架构(Transformer, ViT, CLIP)并有实际动手经验;  4、在生成式模型(VQ-VAE, VQ-GAN, Diffusion Models)和视觉自监督学习(MIM, MAE)方向有经验者优先,有目标检测、语义分割等研究经验者亦可;  5、在学术期刊(ICLR, NeurIPS, ICML, CVPR)发表过论文或在大型国际比赛中取得优秀名次者优先;  6、具备优秀的沟通能力和团队协作精神。 联系方式:请把简历发送至*************************