某运维负责人之死-阿里云开发者社区

开发者社区> zeusro> 正文

某运维负责人之死

简介: 我决定,亲手杀死传统运维工程师。
+关注继续查看

缘起

1.jpg

2018年3月,我正式成为运维负责人,接管阿米巴集团内部的云平台账户。

上一任运维负责人是个天才,在他离职交接的最后那三个月,打电话不接,发消息不回。他给我留了一堆完全没有密码的服务器,涵盖了腾讯云和阿里云,此外还有一大堆无效的DNS记录,CDN域名,处理这些垃圾的善后工作,陆陆续续花了我一年多时间。

2018年6月,因缘巧合之下,阿里云华南区P8大佬了哥给我科普了 Kubernetes,我当天下午立即决定,无论遇到多大的困难,必定要将其落地

当时我们的系统已经有一部分运行在阿里云的 docker swarm 上面,但我看了一下 release note ,预感那玩意应该是弃子。于是,在三个月左右的时间内,通过看英文版的《kubernetes in action》和参与社群,我从 0 docker 基础的渣渣进化为集团内部首席云原生步道师,并升级成为QQ群的管理员。

阿里云Kubernetes早期产品经理

此外,我还成为了阿里云 Kubernetes 的早期产品经理。很多产品建议都是我提出来,由他们内部加以评估改进的。

不过我有一个很皮的习惯:喜欢拆台。我在广州云栖大会的时候问了了哥一个关于存储的问题。🤣 那个问题到现在(2020-08-08)都没有很好解决。

  1. 容器镜像服务支持私有仓库海外机器构建
  2. kubernetes web控制台:支持ephemeral-storage的设置
  3. 容器镜像服务:支持gcr.io等镜像的代理
  4. kubernetes:尽快废弃 dashboard,并将其功能集成到阿里云控制台
  5. Kubernetes:改进创建svc
  6. kubernetes:改进RBAC
  7. 阿里云kubernetes:SchedulingDisabled节点会被自动剔除出虚拟服务器组
  8. Kubernetes:扩充"节点不可调度"的功能,改为"维护节点"
  9. Kubernetes:改进创建集群选项
  10. k8s:增强云盘数据卷
  11. k8s:变更service的证书标签无法生效
  12. k8s:增加集群节点管理的相关文档
  13. 云监控:改进K8S云监控
  14. 容器服务:pv显示不友好
  15. K8S:进入POD终端之后的可操作时间过短
  16. k8s:配置deployment页面有问题
  17. k8s:volume的相关局限性以及改进
  18. k8s:namespace信息同步有问题
  19. k8s:取消ingress的TLS不生效
  20. 阿里云镜像仓库:优化用户体验
  21. k8s:维护master的时候会多出一些奇怪的负载均衡
  22. k8s:改进HPA
  23. 希望阿里云容器服务K8S 能够支持自主绑定 SLB
  24. k8s-给路由(Ingress)加上 TLS的时候会有问题
  25. k8s:改进LoadBalancer型服务和负载均衡的绑定
  26. k8s-使用私有镜像创建部署(deployment)的时候会有问题
  27. 无意中发现 K8S的部署详情页面有 bug
  28. 希望阿里云的容器kubernetes界面不要强行翻译专有名词!!!
  29. K8S-创建应用页面的相关教程改进
  30. 优化K8S部署应用的用户体验
  31. 让用户灵活选择 K8S master 付费方式
  32. 容器服务-健康检查形同鸡肋
  33. 容器服务-改进日志服务

2018-05-13 至今,围绕容器领域,陆陆续续提了几十个建议。虽然有一部分没被采纳,但我觉得我应该担得起“阿里云Kubernetes早期产品经理”这个称号。

最有印象的 BUG 是这个
k8s:取消ingress的TLS不生效

当时我跟进了近三个月,还发了个视频给当时的阿里云对接人“仙游”,也不知道TA人现在在哪。

NoOps

2.jpg

传统应用的瀑布模型,我就不吐槽有多糟糕啦,懂的人自然懂。当初在那个运维负责人坑了我一把之后,我看到 Kubernetes 简直像看到了救星一样。后来我就用 Kubernetes 回收了大部分的服务器,至于那些没密码的服务器,要么用休克疗法半夜重置密码后重启,要么耗个一两年,备份云盘后直接退款。

Kubernetes 时代服务器的忘记密码

可参考我写的 《扩容阿里云kubernetes集群,并升级节点内核》。

3.png

略有区别的在于,节点维护 这里要设置为“不可调度”。然后慢慢耗死节点里面的 pod 。

当节点里面剩下的 pod 都不再重要时,便可以直接删除节点并退款相应的ECS。

Alibaba Cloud Kubernetes 社群联合管理员

QQ20200808-145653.png

2020-07-22,我终于成为钉群的联合运营,可以管理钉群啦。

降职成弼马温之后,再也不能乱怼人了,哭哭。
阿里云联合CNCF做了一个 云原生技术公开课 ,欢迎大家一起学习进步。

QQ20200808-145919.png

吐槽

阿里云能不能别老是给我发代金券了,我所有的域名已经续满10年了。

参考链接

[1]
2017年云趋势——从DevOps到NoOps
http://dockone.io/article/2126

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
怎么设置阿里云服务器安全组?阿里云安全组规则详细解说
阿里云服务器安全组设置规则分享,阿里云服务器安全组如何放行端口设置教程
7005 0
使用OpenApi弹性释放和设置云服务器ECS释放
云服务器ECS的一个重要特性就是按需创建资源。您可以在业务高峰期按需弹性的自定义规则进行资源创建,在完成业务计算的时候释放资源。本篇将提供几个Tips帮助您更加容易和自动化的完成云服务器的释放和弹性设置。
7830 0
windows server 2008阿里云ECS服务器安全设置
最近我们Sinesafe安全公司在为客户使用阿里云ecs服务器做安全的过程中,发现服务器基础安全性都没有做。为了为站长们提供更加有效的安全基础解决方案,我们Sinesafe将对阿里云服务器win2008 系统进行基础安全部署实战过程! 比较重要的几部分 1.
5478 0
阿里云服务器安全组设置内网互通的方法
虽然0.0.0.0/0使用非常方便,但是发现很多同学使用它来做内网互通,这是有安全风险的,实例有可能会在经典网络被内网IP访问到。下面介绍一下四种安全的内网互联设置方法。 购买前请先:领取阿里云幸运券,有很多优惠,可到下文中领取。
9445 0
腾讯云服务器 设置ngxin + fastdfs +tomcat 开机自启动
在tomcat中新建一个可以启动的 .sh 脚本文件 /usr/local/tomcat7/bin/ export JAVA_HOME=/usr/local/java/jdk7 export PATH=$JAVA_HOME/bin/:$PATH export CLASSPATH=.
2154 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,云吞铺子总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系统盘、创建快照、配置安全组等操作如何登录ECS云服务器控制台? 1、先登录到阿里云ECS服务器控制台 2、点击顶部的“控制台” 3、通过左侧栏,切换到“云服务器ECS”即可,如下图所示 通过ECS控制台的远程连接来登录到云服务器 阿里云ECS云服务器自带远程连接功能,使用该功能可以登录到云服务器,简单且方便,如下图:点击“远程连接”,第一次连接会自动生成6位数字密码,输入密码即可登录到云服务器上。
16931 0
+关注
zeusro
嘤嘤嘤嘤嘤嘤嘤嘤嘤嘤嘤嘤嘤嘤嘤嘤嘤嘤嘤嘤
20
文章
20
问答
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载