职位要求
工作内容
排除可能的单点故障和性能瓶颈
为开发和产品团队持续提供运维支持
让一切自动化:包括测试、部署、水平扩展、监控等
与开发团队一起,建立系统化的运维过程
在云上设计并部署高并发、高可用系统
设计并实施灾备方案
需要技能
精通Linux系统配置优化
精通LVS、Nginx、Tomcat、Redis、ZooKeeper、Hadoop(YARN)和Kafka的配置优化
精通一个自动化框架(如Puppet、Chef或Ansible)
精通监控系统(如Nagios、Tivoli等)和监控服务(如New Relic、Pingdom、阿里测等)
熟悉持续集成工具(如Jenkins),熟悉Git
熟悉一个轻量级容器(如Vagrant、Docker等)
熟悉阿里云 ECS和AWS EC2服务
熟悉CDN和缓存机制
加分
熟悉Spark
熟悉Cassandra
熟悉Storm或Spark Streaming
有参与过24*7高可靠、高并发系统的维护
能够通过调整内核参数优化系统
有广告行业背景