订阅专栏后,戳此加入交流群
杨胜辉,eBay资深运维专家,流量系统负责人。主要负责eBay全球的流量管理业务,推动Kubernetes在eBay流量管理场景中的落地。
杨胜辉是一名经验丰富的运维专家。在UCloud,他解决过很多网络相关的疑难杂症,是技术服务团队的中流砥柱。在eBay,他作为Team Leader,积极推动新技术的落地,包括Envoy、eBPF等。他对于网络排查这个领域也深感兴趣,在18年工作经验的基础上,不断打磨出了对网络排查这个宏大主题的认知和实践体系,尤其在抓包分析这个领域的能力颇为突出。
杨胜辉乐于分享,擅长把复杂的技术用简单的语言讲清楚。他坚信,在容器化的今天,网络通信已经取代本地通信,成为应用间进行沟通的主要媒介,网络排查是每个工程师都应该掌握的必备技能。
网络排查可以说是每个开发、运维、测试的基本能力,尤其是对服务端工程师来说,一个功能上线后出了问题,能快速定位、排查、解决十分必要,这也是为什么面试时经常会考HTTP、TCP协议相关的内容,你总要弄清楚网络传输的底层逻辑。
当然,程序本身还好排查,主要是因为程序在自己这边,只要花时间总有希望搞定。而网络的难度,一方面是领域不同,很多专门写程序(特别是偏上层的应用)的工程师,对网络很不了解;一方面网络是双方的事,也就是客户端和服务端,还包括中间路径上的设备等,“变量”更多……
尤其是这几年,随着微服务和云计算的普及应用,越来越多的系统从本地的单体服务,变成跨网络的分布式的微服务。随之而来的,就是数不清的跟网络相关的问题。比如:
面对这么多问题,我们经常束手无策。当然也有一波优秀的 “SRE”(Server Restart Engineer),遇到问题先上“重启大法”,也许也能搞定不少问题。但是,根因依然是未知,即使问题暂时消失了,不知道什么时候,它又会再次到来,然后再次重启……
可见,我们的工程师,太需要网络排查方面的能力了。
但是,因为大部分同学并不是网络出身,对于跟网络相关的问题,经常无从下手,或者事倍功半。所以这次,我们邀请了eBay的资深运维专家杨胜辉,围绕案例这个核心,展开排查过程,并会聚焦到工具的使用,以及深入到关键技术点的分析上,让你能真正把问题根因搞清楚,把抓包分析技术掌握住。并通过对底层原理和实践经验的理解,达成融会贯通的目的,从而实现真正突破网络排查瓶颈的最终目标。
课程主要分为五大模块。
从网络分层模型出发,来带你了解、学习并掌握整个网络世界的大体层次,以及每层的相关工具。然后带你进入抓包分析这个技术殿堂,了解它的历史和现在,以及初步的使用方法。通过对分层模型和每层工具的理解,以及对抓包分析技术的认识,你就能打下网络排查的底层基础,为后续的学习铺平道路。
接下来,我们就要进入真正的实战了。这个部分会从各种跟TCP相关的实际案例出发,来带你了解、学习并掌握TCP这个精密仪器的核心技术,包括传输性能的关键点、TCP重传的原因和对策、拥塞的优化策略、TCP保活机制等。通过一个个真实的案例,帮助你达成对这些核心知识点的真正理解,最后能够融会贯通,再也不怵TCP相关的难题。
在理解了TCP这部重要篇章之后,网络排查的核心知识,你就掌握了快一半了。不过,还有另外一个同等重量级的篇章等待你去学习,它就是应用层网络排查。所以,这个模块会从一个个典型的应用层网络排查案例出发,来带你了解、学习并掌握如何排查应用层的网络问题,让你通过对抓包分析这个核心技术在应用层的运用,搭建起应用和网络之间的“桥梁”。学完这个部分后,你在应对应用层的网络问题时就会成竹在胸了。
掌握抓包分析相当于掌握了网络排查的主干,但还需要补充枝叶,这样你的网络排查技能树才足够完整。所以在这个模块里,依然是从实际案例出发,来带你了解、学习并掌握抓包分析之外的其他网络排查方法,包括工具的背后原理、使用场景、个人总结,让你能够通过对原理和实践经验的理解,达成融会贯通的目的。
最后,会带你整体沉淀升华一下,一起把前面学习过的网络知识、抓包分析技术、所有其他的网络工具的技巧复习一遍,把它们打碎后,再次拼接在一起,形成你自己的技术体系。这样,你不仅可以学习到老师的经验,还能够转化为你自己的理解,从而实现你真正突破网络排查瓶颈的这个最终的目标。