运维开发工程师7k-12k

天津经验不限本科及以上运维开发工程师
岗位所属职位类型
全职

  • 硬件制造
海油发展工技数字中心智慧工技项目组
分享到微信
微信扫一扫,用小程序打开分享
职位诱惑:

福利待遇好

职位描述:

(一)运维自动化系统开发与维护
设计、开发和部署自动化运维脚本和工具,涵盖服务器配置管理、应用程序部署、监控告警、故障自愈等方面,减少人工干预,提高运维效率和准确性。
例如,利用 Python 语言编写脚本实现多服务器批量软件安装与配置更新,确保各服务器环境一致性。
开发自动化部署工具,结合容器技术(如 Docker、Kubernetes)实现应用的快速、可靠部署与弹性伸缩。
持续优化现有运维自动化平台和工具集,根据业务需求和技术发展趋势,引入新的技术和框架,提升系统性能和功能。
定期对自动化运维系统进行性能评估和瓶颈分析,通过代码优化、数据库调优、缓存策略调整等手段提升系统响应速度和处理能力。
研究并整合新兴的运维技术,如 Serverless 架构、云原生技术等,为运维团队提供更先进的解决方案。
(二)基础设施监控与管理
构建和完善 IT 基础设施监控体系,包括服务器、网络设备、存储系统等,实时采集性能指标、日志数据等信息,并通过可视化界面进行展示和分析。
部署和配置监控工具(如 Zabbix、Prometheus),定义监控指标阈值和告警规则,确保及时发现系统故障和性能异常。
开发监控数据可视化插件或定制化报表,为运维团队和其他相关部门提供直观、准确的基础设施运行状态视图,辅助决策制定。
负责基础设施容量规划和管理,根据业务增长趋势和历史数据,预测资源需求,提前规划和调整服务器、存储等资源配置,保障系统的高可用性和可扩展性。
定期对基础设施资源使用情况进行统计分析,建立容量模型,通过模拟和预测,为资源扩容或优化提供数据支持。
与采购部门合作,制定合理的硬件采购计划,确保在满足业务需求的前提下,控制成本并提高资源利用率。
(三)故障排查与处理
协助运维团队快速定位和解决系统故障,通过对监控数据、日志文件和系统状态的深入分析,找出故障根源,并提供有效的解决方案。
在系统出现故障时,及时响应并参与故障排查工作,利用技术手段(如调试工具、数据分析软件)快速定位问题点,如网络故障、服务器宕机、应用程序崩溃等。
针对常见故障类型,总结经验教训,制定故障排查手册和应急处理预案,提高运维团队整体故障处理能力和响应速度。
开发故障诊断工具和脚本,实现对系统潜在问题的自动检测和预警,提前发现并解决可能导致系统故障的隐患。
例如,编写脚本定期检查服务器硬件状态(如磁盘健康、内存使用情况)、应用程序关键进程运行状态等,在发现异常时及时发送告警信息,并提供初步的诊断建议。
(四)云计算与容器技术应用
参与企业云计算平台的架构设计和实施,熟悉主流云服务提供商(如 AWS、Azure、阿里云)的产品和服务,利用云原生技术构建和管理应用程序运行环境。
协助制定云计算迁移策略,将企业现有应用逐步迁移到云端,优化资源配置,降低运维成本。
深入研究容器编排技术(如 Kubernetes),负责集群的搭建、配置和管理,确保容器化应用的高效运行和动态扩展。
开发和维护与云计算、容器技术相关的自动化工具和脚本,实现云资源的自动化创建、配置和管理,以及容器化应用的持续集成 / 持续交付(CI/CD)流程自动化。
搭建基于 Jenkins、GitLab CI/CD 等平台的自动化构建和部署流水线,实现容器化应用从代码提交到生产环境部署的全自动化流程,确保开发团队能够快速、可靠地交付应用更新。
(五)与开发团队协作
与软件开发团队紧密合作,参与应用程序的设计和开发阶段,提供运维视角的建议和技术支持,确保应用在架构设计上具备良好的可运维性和扩展性。
在应用架构评审过程中,从运维角度对系统架构、技术选型、部署方案等提出意见和建议,如数据库架构优化、缓存策略设计、分布式系统部署方案等,避免因架构不合理导致的运维难题。
协助开发团队制定应用程序的监控指标和日志规范,确保在应用开发过程中能够充分考虑运维需求,便于后续的监控、故障排查和性能优化工作。
为开发团队提供自动化运维工具和平台的培训与技术支持,帮助开发人员了解和掌握运维流程和工具的使用方法,促进开发与运维的高效协同工作。
组织内部培训课程和技术分享会,向开发团队介绍运维自动化工具的功能和使用场景,如如何使用自动化部署工具进行应用发布、如何通过监控平台查看应用运行状态等。
为开发人员提供技术咨询和问题解答服务,及时处理开发过程中与运维相关的技术难题,确保开发工作的顺利进行。
(六)安全与合规性保障
协助制定和实施 IT 运维安全策略和规范,确保运维活动符合企业信息安全政策和行业法规要求。
参与安全漏洞扫描和风险评估工作,对运维系统和工具进行安全检查,及时发现并修复安全漏洞,防止数据泄露和恶意攻击。
制定服务器安全加固标准和操作流程,包括操作系统配置优化、用户权限管理、防火墙设置等,保障服务器和应用程序的安全运行。
开发和维护安全相关的自动化工具和脚本,实现安全漏洞检测、入侵检测与防御、数据加密等功能的自动化,提高安全运维效率和响应速度。
例如,编写脚本定期对服务器进行安全漏洞扫描,并与漏洞管理平台集成,实现漏洞信息的自动收集、分析和报告。
利用开源工具或自行开发脚本实现对网络流量的实时监测和分析,及时发现并阻止异常流量和入侵行为,保障网络安全。

工作地址

天津 - 滨海新区- 工程数字技术应用中心查看地图

职位发布者:

拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
该职位尚未收到面试评价
中海油能源发展股份有限公司工程技术分公司

海油发展工技数字中心

相似职位