来源:民工哥技术之路
ID:jishuroad
作者:菲宇
互联网运维工作,以服务为中心,以稳定、安全、高效为三个基本点,确保公司的互联网业务能够 7×24 小时为用户提供高质量的服务 。
文章插图
运维人员对公司互联网业务所依赖的基础设施、基础服务、线上业务进行稳定性加强,进行日常巡检发现服务可能存在的隐患,对整体架构进行优化以屏蔽常见的运行故障,多数据中接入提高业务的容灾能力 。
通过监控、日志分析等技术手段,及时发现和响应服务故障,减少服务中断的时间,使公司的互联网业务符合预期的可用性要求,持续稳定地为用户提供务 。
在安全方面,运维人员需要关注业务运行所涉及的各个层面,确保用户能够安全、完整地访问在线业务 。
从网络边界划分、ACL 管理、流量分析、DDoS 防御,到操作系统、开源软件的漏洞扫描和修补,再到应用服务的XSS、SQL注入防护;运维人员需要保障公司提供的互联网业 运行在安全、可控的状态下,确保公司业务数据和用户隐私数据的安全,同时还需要具备抵御各种恶意攻击的能力 。
从安全流程梳、代码白盒黑盒扫描、权限审计,到入侵行为检测、业务风险控制等 。
在确保业务稳定、安全的前提下,还需保障业务高效的运转,公司内快速的产出 。运维工作需要对业务进行各方面优化 。
比如,IO 优化提升数据库性能,图片压缩降低带宽使用量等,提供的互联网业务以较小的资源投入带来最大的用户价值和体验 。工作分类运维运维的工作方向比较多,随着业务规模的不断发展,越成熟的互联网公司,运维岗位会划分得越细 。
同时,还需要通过各种工具平台提升内部产品发布交付的效率,提升公司内运维相关的工作效率 。
当前很多大型的互联网公司,在初创时期只有系统运维,随着服务规模、服务质量的 要求,也逐渐进行了工作细分 。
一般情况下运维团队的工作分类(见图1-1)和职责如下 。
文章插图
系统运维系统运维负责IDC、网络、CDN和基础服务的建设(LVS、NTP、DNS);负责资产管理,服务器选型、交付和维修 。详细的工作职责如下:
1.IDC数据中心建设收集业务需求,预估未来数据中心的发展规模,从骨干网的分布,数据中心建筑,以及Internet接入、网络攻击防御能力、扩容能力、空间预留、外接专线能力、现场服务支撑能力等方面评估选型数据中心 。负责数据中心的建设、现场维护工作 。
2.网络建设设计及规划生产网络架构,这里面包括:数据中心网络架构、传输网架构、CDN网络架构等,以及网络调优等日常运维工作 。
3.LVS 负载均衡和 SNAT 建设LVS 是整个站点架构中的流量入口,根据网络规模和业务需求,构建负载均衡集群 。
完成网络与业务服务器的衔接,提供高性能、高可用的负载调度能力,以及统一的网络层防攻击能力 。
SNAT .集中提供数据中心的公网访问服务,通过集群化部署,保证出网服务的高性能与高可用 。
4.CDN 规划和建设CDN 工作划分为第三方和自建两部分 。
建立第三方 CDN 的选型和调度控制;根据业务发展趋势,规划CDN新节点建设布局;完善CDN业务及监控,保障CDN 系统稳定、高效运行 。
分析业务加速频道的文件特性和数量,制定最优的加速策略和资源匹配;负责用户劫持等CDN日常故障排查工作 。
5.服务器选型、交付和维护负责服务器的测试选型,包含服务器整机、部件的基础性测试和业务测试,降低整机功率,提升机架部署密度等 。
结合对公司业务的了解,推广新硬件、新方案减少业务的服务器投入规模 。负责服务器硬件故障的诊断定位,服务器硬件监控、健康检查工具的开发和维护 。6.OS、内核选型和 OS 相关维护工作负责整体平台的 OS 选型、定制和内核优化,以及 Patch 的更新和内部版本发布;建立基础的YUM包管理和分发中心,提供常用包版本库;跟进日常各类 OS 相关故障;针对不同的业务类型,提供定向的优化支持 。
7.资产管理记录和管理运维相关的基础物理信息,包括数据中心、网络、机柜、服务器、ACL、IP等各种资源信息,制定有效的流程,确保信息的准确性;开放API接口,为自动化运维提供数据支持 。
推荐阅读
- 如何分析竞争对手的SEO优化数据
- 禅即茶 茶即禅,解读国清寺里的寺院茶规
- 绵羊毛含量75%的大衣大约多少钱 绵羊毛大衣价格在多少左右
- 要精通Java,先研究Java的执行原理
- 加快Mac速度的10条简单技巧
- 每个python人都离不开的12个python库
- 牛仔裤顽固油渍怎么洗 牛仔裤上的绿草汁能洗掉吗
- MySQL 如何正确的使用索引
- 松树油干了怎么能洗掉 衣服上的松节油印记怎么去除
- 实用优先的CSS框架设计引擎,快速实现定制化——Tailwind.css