网络流量的访客

发布网友

我来回答

1个回答

热心网友

UV(访客):即Unique Visitor,访问网站的一台电脑客户端为一个访客。00:00-24:00内相同的客户端只被计算一次。就像要根据来往车辆的多少和流向来设计道路的宽度和连接方式一样,根据网络流量设计校园网络是十分必要的。 在传统网络中,一般将使用相同应用程序的用户放到同一工作组中,他们经常使用的服务器也放在一起。工作组位于同一物理网段或VLAN(虚拟局域网)中。这样做的目的是将网络上客户机与服务器之间产生的数据流量*在同一网段中。在同一网段,可以使用带宽相对高的交换机连接客户机和服务器,而不必使用带宽相对较低的路由器。将大部分网络流量控制在本地的这种网络设计模式,被称为“80/20规则”,即80%的网络流量是本地流量(采用交换机交换数据),在同一网段中传输;只有20%的网络流量才需要通过网络主干(路由器或三层交换机)。
“80/20”规则中的“80”和“20”不能简单地理解为数字,应该理解为网络流量分布的方式,即大部分网络流量局限在本地工作组,小部分流量通过网络主干。因此在实际网络设计中,只要大部分网络流量在本地、小部分网络流量通过主干,就认为它符合了“80/20”规则,而不管实际的数字比例是多少。 随着网络应用的逐渐丰富,“80/20”规则已经不能完全满足网络设计的需要。而一种被称为“集中存储、分布计算”的模式逐渐得到推广。集中存储,就是数据集中在网络中心存储,如已经得到普遍使用的Web服务、电子邮件系统和逐渐流行的VOD(视频点播)、多媒体资源库、教育数据中心(EDC)、数字图书馆等;分布计算,就是数据被下载到各个工作站上处理,如使用网络上的多媒体资源库制作多媒体课件、浏览数字图书馆等。在“集中存储、分布计算”的网络应用模式下,对网络流量的要求已经大大偏离了“80/20”规则,一种新的规则应运而生,这就是“20/80”规则。
在符合“20/80”规则的网络中,只有大约20%的网络流量局限在本地工作组,而大约80%网络流量经过网络主干传输。这种网络流量模式的转变,给校园网主干交换机带来了很大的负荷。因此理想状态下主干交换机应该能够提供与下面连接的支干交换机相匹配的性能,即提供线速三层交换,也就是说,下面的支干交换机能够跑多快,上面的主干交换机也应该能够跑多快。同样,如果网络中有许多按功能(如教学、科研、行政管理)划分的VLAN,这些VLAN也很难管理。在以往的“80/20”规则中,服务器往往分布在VLAN中,因此对于各工作组来说,访问起来比较快。但是在“20/80”规则中,服务器往往集中在网络中心,因此对于各工作组,必须实现跨VLAN的访问。 很多网络应用具有自身的特性,对于网络环境的需求也不尽相同,因此只有对网络流量进行及时准确的识别和分类,才能准确地为不同应用提供合适的网络环境,有效利用网络资源,为用户提供更好的服务质量。网络流量分类的研究很广泛,使用的方法也很多,但主要是基于以下三个层面的:
(1)Packet-level的流量分类:主要关注数据包(packet)的特征及其到达过程,如数据包大小分布、数据包到达时间间隔的分布等;
(2)Flow-level的流量分类:主要关注流(flow)的特征及其到达过程,可以为一个TCP连接或者一个UDP流。其中,流通常指一个由源IP地址、源端口、目的IP地址、目的端口、应用协议组成的五元组;
(3)Stream-level的流量分类:主要关注主机对及它们之间的应用流量,通常指一个由源IP地址、目的IP地址、应用协议组成的三元组,适用于在一个更粗粒度上研究骨干网的长期流量统计特性。
在上述三个层面的流量分类中,使用最广泛的是Flow-level的流量分类。这种以流为单位分析网络中传输数据的方法,是分组交换网络发展的必然需求。 流量分类的一个关键度量标准是某个分类技术或分类模型对未知数据对象进行分类的准确率。通常用于衡量分类准确率的评估标准,主要包括以下四个方面:
真正(true positive,TP):表示被分类模型正确预测的正样本数,即属于类别A并被预测为类别A的样本数。
假负(false negative,FN):表示被分类模型错误预测为负类的正样本数,即属于类别A但被预测为不属于类别A的样本数。
假正(false positive,FP):表示被分类模型错误预测为正类的负样本数,即不属于类别A但被预测为属于类别A的样本数。
真负(true negative,TN):表示被分类模型正确预测的负样本数,即不属于类别A并被预测为不属于类别A的样本数。
此外,基于机器学习的分类方法通常采用另外两种度量标准对其分类结果进行评估,其定义如下:召回率(recall):recall=TP/(TP+FN),表示类别A中被正确预测的样本所占比例。
精度(precision):precision=TP/(TP+FP),表示在所有被预测为类别A的样本中,真正属于类别A的样本所占比例。很多流量分类研究都使用流准确率或字节准确率作为其实验结果的度量标准,流准确率表示被正确分类的流所占的比例,而字节准确率则更关注被正确分类的流所携带的字节数。其中,准确率的定义如下:
准确率(accuracy):accuracy=(TP+TN)/(TP+TN+FP+FN),表示被分类模型正确预测的样本数在总样本中所占比例。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com