-
1、负责PDF/Word/Excel等格式图文识别、分类、入库; 2、负责内外部网页内容抓取、去除干扰数据、标准化入库; 3、负责图片中文字内容识别、排版、纠错、标准化入库; 4、编写公共接口,为公司其他项目提供 PDF解析、网页解析、图文解析 等接口服务; 5、跟进OCR、爬虫、NLP前沿技术,将其工程化应用到公司产品中; 6、支持公司相关产品的研发工作。 任职要求: 1、**本科及以上学历;计算机、数学、信息技术、自然语言处理、数据挖掘相关专业;3年以上工作经验; 2、熟练使用 Python,熟悉相关环境部署,熟悉Linux常用命令; 3、熟悉 PyPDF2、PyMuPDF、Borb 等开源库,在项目中有实际使用经验; 4、熟悉 PaddleOCR、EasyOCR、Chineseocr、Tesseract、OpenCV 等开源库,有实际使用经验; 5、熟悉 Scrapy、Pyppeteer、Selenium,有实际使用经6、熟练使用SQL,熟悉MySQL等关系型数据库; 7、有Django、Docker经验者优先; 8、工作积极主动,富有学习精神,愿意挑战高难度任务,编码规范。
-
职位描述: 1、根据需求理解业务逻辑,实现业务逻辑和数据交互; 2、与前端工程师对接,编写、测试API; 3、负责数据分析和处理。 4、负责跟chatgpt(3.5,40)、通义千问等语言大模型做对接。 5、编写核心代码以及相关文档说明; 6、编写抓取互联网爬虫代码,负责数据采集,参与需求分析和梳理,爬虫采集策略制定和实现; 7、研究各种网页、app、小程序端接口,提高网页抓取效率和质量; 任职要求: 1、熟悉Python语言和Django框架; 2、有爬虫工作经验者优先; 3、熟悉Web开发基础知识,理解MVT开发模式和前后端分离开发模式; 4、熟悉使用git; 5、熟悉 Linux环境,熟练使用 Redis、MySQL等数据库; 6、具备良好的分析解决问题能力,能独立承担任务和有系统进度把控能力。
-
1.精通Python开发,3年以上Python开发经验,熟悉基于Python代码的性能分析和优化,必须会算法。 2.精通Flask/Django或者其他PythonWeb开发框架,熟悉MVC架构,熟悉常用设计模式 3.熟练使用mysql,熟悉mysql的各种存储引擎,熟悉索引工作原理; 4.熟悉celery等队列工具的开发使用; 5.有运维自动化、监控系统、应用发布系统、CMDB配置管理系统等运维开发或者维护经验优先; 6.熟悉开源监控软件Nagios/Zabbix/Cacti/Prometheus一种或以上的部署和应用经验优先 7.熟悉Web前端技能,有vue使用经验者优先; 8.熟悉多种开源组件有的kafka、redis、RabbitMq使用经验优先 9.熟悉Linux系统,具备编写shell脚本能力 10.熟悉网络基础、TCP/IP、HTTP等协议,熟悉操作系统原理
-
高级爬虫工程师(JJ4NV)
[深圳·科技园] 1天前发布18k-30k 经验5-10年 / 本科数据服务|咨询,人工智能服务 / 不需要融资 / 500-2000人职位描述: 1、负责攻克高难度的反爬,诸如人机识别、JS逆向、Android逆向等 2、负责开发及维护超大规模站点,深入挖掘站点有价值的数据 3、参与爬虫通用组件、工具、系统的设计开发 职位要求: 1、大专及以上学历,2年以上工作经验; 2、具备丰富的Python爬虫经验,熟悉JS逆向、Android逆向,有攻克高难度站点经验; 3、具备扎实的技术基础,如常见的网络协议、Linux操作系统、常用数据库等,可以独立分析解决新出现的技术问题; 4、有前后端开发经验; 5、缜密的逻辑思维能力; 6、热爱技术,喜欢钻研,注重代码质量; -
爬虫工程师(JBHD2)
[深圳·科技园] 1天前发布10k-18k·15薪 经验1-3年 / 大专数据服务|咨询,人工智能服务 / 不需要融资 / 500-2000人职位描述: 1、运用现有的开发框架,完成数据爬取、解析及后续的维护工作 2、解决常见的反爬问题 职位要求: 1. 大专及以上学历; 2. 熟悉 Linux 下的 Python 和 NodeJS开发; 3. 熟练使用 Requests、Scrapy、XPath、Bs4 等常用爬虫框架工具进行开发; 4. 熟练使用 Puppeteer 等模拟浏览器工具进行开发; 5. 了解常见的反爬手段及其应对措施; 6. 熟练使用常用数据库,包括 MySQL 、Redis、MongoDB 等; 7. 熟练使用各类抓包工具,如 Charles、Fiddler、Wireshark、Mitmproxy 等; 8. 了解常见的消息队列使用; 9. 有Web前后端经验优先。 -
(该岗位为外包岗位,优秀者入职后可转为正式员工) 职责描述: 1、负责网络爬虫,数据采集清洗等研发工作 2、负责对爬虫平台架构进行改造和优化 3、定期爬取指定数据,为业务部门提供数据支持。 技能要求: 1、会JS补环境; 2、会训练及协议过国内主流厂家的滑块,图标/文字点选验证码; 3、会使用docker容器; 4、计算机相关专业本科以上学历; 5、熟练的编程能力,熟悉数据结构;熟悉计算机网络的基础理论; 6、熟练的Python编程基础,熟练使用scrapy或feapder等爬虫框架;熟悉分布式爬虫;熟悉XPath等常用页面解析技术; 7、熟悉puppeteer等自动化工具的使用; 8、熟悉postgresql,mongodb等关系型或非关系型数据库; 9、熟悉kafka、redis等消息中间件/缓存的使用优先考虑;
-
职位描述: 1、负责天眼查海量商业数据中,部分数据域的数据抓取,对数据抓取的及时性负责; 2、负责对抓取数据进行解析、清洗,对数据一致性、准确性负责; 3、负责相关数据抓取服务的工程建设和指标建设,对数据生产链条的健壮性、高效性负责。 任职要求: 1、本科或以上学历,有3年以上数据抓取开发经验; 2、熟练掌握Python等编程语言,具有扎实的编程基础和良好的代码风格; 3、具备丰富的爬虫开发经验,熟悉各类爬虫框架和工具,如Scrapy、Selenium等; 4、熟悉HTTP协议和常见的网页解析技术,具备良好的数据清洗和处理能力; 5、熟悉MySQL、MongoDB、HBase、Redis等; 6、具备良好的沟通和团队合作能力,能够与数据开发、后端开发人员等协作,共同完成项目目标;
-
岗位职责: 1、参与研发各种Web平台产品,包括广告平台,营销平台,数据分析优化平台,后端云服务平台,效率工具平台,智能运维平台等; 2、有机会参与打造高性能,高并发,支持亿级DAU用户的广告平台和数据平台; 3、有机会参与为App开发打造分布式,高性能,高扩展的新一代Serverless后端云服务(Backend as a Service)系统; 4、有机会参与打造面向App产品的一站式优化平台,提供包括用户画像,产品跟踪优化,推荐系统等服务; 5、研发和维护针对全球用户的高可用高性能的后端服务; 6、研发面向海量数据的存储、管理、查询和ETL等服务。 任职要求: 1、**本科及以上学历,计算机及相关专业; 2、热爱编程,基础扎实,对数据结构,算法,数据库,网络原理等计算机基础有深入的理解; 3、熟悉Python、Go、C/C++、Java等语言中的一种或多种,愿意深入学习Python和Go; 4、热爱移动互联网,对该领域有浓厚的兴趣;有相关的开发和项目经验者优先; 5、优秀的分析问题和解决问题的能力,对解决具有挑战性问题充满激情。
-
岗位职责 1、独立和与他人合作,按计划完成软件项目的现场整体实施工作; 2、对公司各部门分别进行ERP系统的使用培训和辅导,使相关部门能够熟练使用; 3、与各部门保持良好的沟通,记录和反馈部门需求,报表需求以及其它要求等; 4、编写实施工作记录文档,编写项目档案的整理工作等; 5、根据各部门反馈的需求负责ERP系统(Odoo)的二次开发。 6、实现Odoo和其他系统的接口开发,比如CRM系统、企业微信等; 任职要求: 1、2年以上Odoo实施开发经验 (需要有Odoo二次开发经验),精通Python编程; 2、熟悉Odoo框架,精通Odoo后端代码,能够独立进行二次开发,了解Odoo使用的基本Python库; 3、熟悉PostgreSQL数据库,能熟练编写SQL语句; 4、***本科以上学历,计算机、信息管理、管理学、会计及相关专业优先; 5、良好的组织协调能力和沟通能力、学习能力、应变能力,良好的方案文档撰写能力; 6、有订单管理系统,crm系统开发实施经验优先
-
工作职责 1、负责基础设施(IaaS和PaaS)交付平台的设计、开发及维护。比如CMDB、SQL运营平台、网络运营平台等等 2、负责研究业界先进方案,提升基础设施交付的质量和效率。比如基础设施即代码、NetDevOps等等 工作要求 1、本科以上学历,计算机相关专业 2、2年以上开发经验,掌握golang/Python和Django框架 3、具备丰富的运维自动化经验,主导开发过运维自动化平台的优先 4、具备创新性思维、较强的抗压能力和技术钻研能力 5、有很强的责任心,做事严谨,良好的书面表达和工作总结能力
-
岗位职责: - 管理大规模的算力服务器集群,提升资源使用率 - 了解并行计算框架,高效调度任务,提升质量和稳定性 任职条件: - 三年年以上后端/算法工程/系统工程相关开发经验 - 开发语⾔以Python为主,熟练掌握至少其中一门语言(Python/Golang/C/C++) - 熟悉K8s/Docker技术优先 - 熟悉Pytorch深度学习框架优先 - 有大规模分布式服务器架构经验优先
-
岗位职责: 1.本职位主要是参与电子数据取证/分析产品模块设计和研发; 2.主语言是python,但会涉及go,要求代码能同时运行Windows与Linux平台; 3.根据项目计划按时完成软件开发和单元测试工作以及Bug修复; 4.不断学习并运用新的知识提升产品竞争力。 任职要求: 1.本科及以上学历,思维清晰,沟通良好,具备良好的分析、理解、解决问题的能力; 2.理解数组,链表,树的等基本数据结构。了解设计模式; 3.至少有python 1年以上实际项目经验; 4.了解Linux常用命令,了解TCP/IP协议簇; 5.熟悉git基本操作。 加分项: 1.维护技术博客/公众号,或者有开源项目者优先; 2.有C++/go开发基础者; 3.有Linux下开发经验者; 4.有Windows维护经验者(了解注册表,Powershell之类)。
-
工作职责: 1、参与产品需求评审,评估需求在技术上实现的可能性,辅助开发经理进行排期分工; 2、对公司现有产品的维护开发,新需求开发、现有功能的优化改进以及bug修复等; 3、负责产品研发过程中,核心部分代码的编写工作; 4、代码质量管理,注重代码可复用性; 任职资格: 1、**本科学历,计算机相关专业(必须); 2、良好的团队合作精神和沟通能力,有参与产品、技术交流的意识; 3、2年 Python 使用经验; 4、精通/熟练掌握 Flask 开发框架; 5、精通/熟练掌握 MySQL 数据库; 6、了解掌握 Redis 缓存数据库; 7、计算机操作系统基础知识扎实,熟悉同步/异步等网络编程模型,多线程, 协程等并发模型,有一定 OO 思想基础; 8、良好的编程习惯和文档阅读能力,良好的学习主动性和习惯。
-
工作职责:1. 负责云平台产品的研发工作,包括VM云、容器方向;2. 负责研究、维护云平台产品及新技术的研究,包括 docker, k8s, openstack 等主流云计算技术;3. 和运维团队、配置管理团合作进行功能和性能优化;4. 协助运维,开发、配置管理团队之间的合作;5. 关注国内外容器云最新发展,不断的对现有产品持续迭代与演进,寻找满足业务快速发展的需求的最佳技术;任职要求:0. 熟练使用Linux, 了解常用的troubleshooting手段,常见性能指标1. 熟练掌握Golang、Python、,并具备项目经验。良好的编码风格;2.熟悉Docker/Kubernetes/Openshift容器生态核心开源项目和周边服务生态项目,如监控、日志、网络等方案,精通或者有实施经验者加分3. 具备web开发经验,熟练掌握HTML、JavaScript和CSS;ReactJS和Vue中至少掌握一种;4. 掌握SQL语言,具备基本的SQL调优能力;熟悉PostgreSQL数据库优先;5. 对新技术有执着追求,热爱编程。善于抽象、总结、思考,能及时关注和学习业界最新技术;6. 逻辑思维清晰,有责任心,有良好的团队沟通和协作能力;
-
【岗位职责】1.负责对用户提出的学习问题进行解答指导;2.配合讲师开发高端课程,进行课程内容的审验,跟踪课程后期的编辑制作,以保证网站内容质量;3.监测网站用户的整体学习服务情况,推进用户服务的进度,以保障用户服务效率;4.跟踪用户学习过程,反馈用户需求及建议,并为提高学习效果及用户满意度提出改进性建议。【任职要求】1.大学本科及以上学历,热爱教育行业;2.具备一年以上IT培训领域课程辅导老师经验(掌握Python技术基本知识),一年以上的实际开发经验,具有扎实的理论基础及项目实操经验;3.熟练使用Mindmaneger、ppt、Excel等办公软件;4.喜欢在网络上与人沟通;工作态度积极主动;有亲和力,有服务精神,对学员有极强的责任心;思路清晰,具备一定的抗压力