田逸,男,33岁,重庆人。在网络管理方面从事了多年的研究和实践工作,对Linux等操作系统有着深厚的功底。现任“空中网”系统管理员,主要负责办公网络主干维护、业务系统的上线、全部业务系统的服务监控、网络接口流量监控、系统故障处理与恢复、为开发团队提供系统方面的技术支持工作。
我们单位的网络环境有上千个入网设备,分布在一个大楼的不同楼层,各楼层交换机间通过光纤连接到一个中心机房的一个三层交换上。由于联网的计算机数目较多,我们在交换机上划分了VLAN,并以802.1X做客户端验证,然后再以DHCP的方式分配给客户端IP地址。三层交换的主要功能是路由各个VLAN,在三层交换的前端,有一台FreeBSD的机器做NAT,同时充当防火墙。机房里还有几十台内部用的服务器。
在业务系统方面,公司有数百台业务平台服务器托管在不同的IDC机房,这些平台的操作系统主要是linux和unix,也有少数几台windows的,另外还有一些合作伙伴提供的测试服务器(如网通3G试验项目),还有少许托管在外地的服务器。
人员分工方面,办公网络的维护和故障处理有行政部的网络管理员负责,办公网的主干维护和重大的故障处理有技术部门的网络管理团队的管理员负责;业务系统的所有维护工作由技术部门的网络管理团队负责。由此可以了解技术部门网络管理团队的工作是相当繁重的。
一直以来,工作的中心主要集中在业务系统的上线、维护、故障处理以及办公网络主干的维护。有那么多的服务器托管在外面,怎样才能更准确的知道服务器已经网络的运行状态,对于我们来说是一个考验;而且由于某些原因,服务器会经常性的从一个地方搬迁到别的地方,这也是增加管理难度的一个重要因素。因此,对网络流量及服务器存活状态的监控,则是了解整个网络是否正常运行的基本手段。以前,由于某些原因,服务器的使用者都是直接分配了root权限,这些开发人员因为对系统的熟悉程度已经安全问题是没有多少经验的,因为开发人员不恰当的拥有超级用户权限进行不恰当的操作,引起了很多系统故障,所以,收回root权限,重新分配用户权限也势在必行。然而,绝大部分的用户程序是以root权限运行的,要改变这种状况而且有不引起新的问题,将有大量的工作要做(包括技术上和用户使用习惯)。相对说来,内部网络相对要好一些,不过有些问题值得注意的—前些日子由于空调坏了,路由和交换设备无法散热而温度过高引起整个网络中断,害得我5.1长假还去公司机房开电风扇散热。