张卿
个人博客作者
Kubernetes 运维工程师,持续学习云原生与自动化技术,在实践中沉淀经验,记录技术成长与运维思考。
关于这个博客
欢迎来到我的个人博客!这里是我分享技术心得、生活感悟和学习笔记的地方。
我热爱编程,喜欢探索新技术,也享受在代码中解决问题的过程。通过这个博客,我希望能够:
- 记录学习过程中的思考和总结
- 分享实用的技术经验和技巧
- 与同行交流技术观点和见解
- 建立自己的知识体系和思维框架
技术栈
云原生平台
可观测性体系
基础设施与数据组件
GitOps与自动化
项目经历
基于Helm的云原生CI/CD自动化流水线建设项目
2022.08 - 2022.12项目背景:基于控制大量yaml文件,且控制版方式低效且不够标准。基于Helm的CI/CD应用交付,可以轻松使用打包chart,由CI/CD平台全负责自动部署和测试。同时,通过Helm release管理来实现版本应用版本管理,实现应用的稳定和安全。
核心职责:
- 构建自动化工具链:基于Jenkins(调度)→GitLab(触发)→Harbor(Chart仓库)→Kubernetes(运行),实现跨集群流水线
- 标准化Helm文件:基于Java/Vue/Python/Go应用为模版创建Chart模版,支持values.yaml动态配置注入
- 开发多分支流水线:基于Groovy全量Pipeline引擎,集成SonarQube代码扫描/单元/冒烟测试/Docker镜像构建
- 强化流水线安全:实施Jenkins凭据加密与关键应用及节审批流程,降噪降产风险
- 设计部署发布策略:实施金丝雀发布与自动化扩缩机制,降低生产环境变更风险
- 优化弹性调优:配置基于Kubernetes Pod的Jenkins Agent动态伸缩,提升资源利用率超40%
项目成果:
- 提升部署效率90%(30分钟→3分钟),降低人工事故率70%
- 沉淀10+通用HelmChart模版,节省手工YAML维护人力成本70%
Kubernetes 高可用集群架构与运维体系建设
2023.01 - 至今项目背景:负责生产环境 K8s 高可用集群的规划、部署与日常运维,涵盖集群安装优化、组件部署、监控告警及故障排查,保障业务系统稳定运行。
核心职责:
- 基于 kubeadm 部署多 Master 节点的 K8s 高可用集群,搭配 IPVS、Calico 网络方案
- 部署和管理 Ingress Nginx、Metrics Server、Dashboard 等核心组件
- 设置 Kube-proxy 模式为 IPVS,优化集群网络性能
- 构建 Prometheus + Grafana + Alertmanager 全链路监控告警体系
- 制定集群升级策略、数据备份方案与灾难恢复流程
项目成果:
- 集群可用性保持 99.9% 以上,故障恢复时间缩短至分钟级
- 沉淀完整的 K8s 运维手册与故障排查知识库
可观测性体系建设与 SRE 实践
2023.06 - 至今项目背景:构建完善的可观测性体系,集成 Prometheus + Grafana + Loki + SkyWalking,实现指标、日志、链路追踪三位一体的监控告警平台。
核心职责:
- 设计并部署 Prometheus 监控体系,覆盖集群、节点、容器、应用多维度指标
- 搭建 Loki + Promtail 日志收集方案,替代 ELK 降低资源消耗
- 集成 SkyWalking 实现微服务链路追踪与性能分析
- 构建 Grafana 统一可视化平台,整合指标、日志和链路数据
- 配置 Alertmanager 分级告警策略,对接企业微信和邮件通知
项目成果:
- 故障发现时间从小时级缩短至分钟级,MTTR 降低 80%
- 日志存储成本降低 60%,查询效率提升 5 倍
111
22项目背景:33
核心职责:
- 21313
- 13231
项目成果:
- 3132
个人简历
运维工程师 - 张卿
包含完整的工作经历、项目经验和技术能力概述
暂未配置简历链接。
博客统计
0
文章总数
0
总浏览量
0
评论总数
20
标签数量