四.数据通讯基本概念
数据(Data):传递(携带)信息的实体。
信息(Information):是数据的内容或解释。
信号(Signal):数据的物理量编码(通常为电编码),数据以信号的形式传播。
模拟信号与数字信号
基带(Base band)与宽带(Broad band)
信道(Channel):传送信息的线路(或通路)
比特(bit):信息量的单位。比特率为每秒传输的二进制位个数。
码元(Code Cell):时间轴上的一个信号编码单元
同步脉冲:用于码元的同步定时,识别码元的开始。同步脉冲也可位于码元的中部,一个码元也可有多个同步脉冲相对应。
波特(Baud):码元传输的速率单位。波特率为每秒传送的码元数(即信号传送速率)。 1 Baud = log2M (bit/s) 其中M是信号的编码级数。也可以写成:Rbit = Rbaud log2M 上式中:Rbit-比特率,Rbaud-波特率。一个信号往往可以携带多个二进制位,所以在固定的信息传输速率下,比特率往往大于波特率。换句话说,一个码元中可以传送多个比特。例如,M=16,波特率为9600时,数据传输率为38.4kbit/s
误码率:信道传输可靠性指标,是概率值信息编码:将信息用二进制数表示的方法。数据编码:将数据用物理量表示的方法。例如:字符‘A’的ASCII编码(是信息编码的一种)为01000001
带宽:带宽是通信信道的宽度,是信道频率上界与下界之间之差,是介质传输能力的度量,在传统的通信工程中通常以赫兹(Hz)为单位计量。在计算机网络中,一般使用每秒位数(b/s 或bps) 作为带宽的计量单位。主要单位:Kb/s,Mb/s,Gb/s,一个以太局域网理论上每秒可以传输1千万比特,它的带宽相应为10Mb/s。
时延 △信息从网络的一端传送到另一端所需的时间 △时延之和=处理时延+排队时延 +发送时延+传播时延 △处理时延=分组首部和错误校验等处理(微秒) △排队时延=数据在中间结点等待转发的延迟时间 △发送时延=数据位数/信道带宽 △传播时延=d/s(毫秒)d:距离 s:传播速度≈光速
时延带宽乘积:某一链路所能容纳的比特数。时延带宽乘积=带宽×传播时延。例如,某链路的时延带宽乘积为100万比特,这意味着***个比特到达目的端时,源端已发送了100万比特。
往返时延 (Round-Trip Time ,RTT) 从信源发送数据开始,到信源收到信宿确认所经历的时间RTT≈2×传播时延,传输可靠性两个含义: 1、数据能正确送达 2、数据能有序送达(当采用分组交换时)
信息通信系统传输
1、信道及其主要特征:数字信道和模拟信道
数字信道:以数字脉冲形式(离散信号)传输数据的信道。
模拟信道:以连续模拟信号形式传输数据的信道。模拟信号和数字信号
模拟信号:时间上连续,包含无穷多个信号值
数字信号:时间上离散,仅包含有限数目的信号值周期信号和非周期信号
周期信号:信号由不断重复的固定模式组成(如正弦波)
非周期信号:信号没有固定的模式和波形循环(如语音的音波信号)。
2、数字数据的传输方式
基带传输:不需调制,编码后的数字脉冲信号直接在信道上传送。例如:以太网
宽带传输:数字信号需调制成频带模拟信号后再传送,接收方需要解调。例如:通过电话模拟信道传输。例如:闭路电视的信号传输。
3、数据同步方式:目的是使接收端与发送端在时间基准上一致 (包括开始时间、位边界、重复频率等)。有三种同步方法:位同步、字符同步、帧同步。
位同步 目的是使接收端接收的每一位信息都与发送端保持同步,有下面两种方式: △外同步——发送端发送数据时同时发送同步时钟信号,接收方用同步信号来锁定自己的时钟脉冲频率。 △自同步——通过特殊编码(如曼彻斯特编码),这些数据编码信号包含了同步信号,接收方从中提取同步信号来锁定自己的时钟脉冲频率。
字符同步 以字符为边界实现字符的同步接收,也称为起止式或异步制。每个字符的传输需要:1个起始位、5~8个数据位、1,1.5,2个停止位。
字符同步的性能评估: △频率的漂移不会积累,每个字符开始时都会重新同步。 △每两个字符之间的间隔时间不固定。 △增加了辅助位,所以效率低。例如,采用1个起始位、 8个数据位、 2个停止位时,其效率为8/11<72%。
帧同步 识别一个帧的起始和结束。 △帧(Frame)数据链路中的传输单位——包含数据和控制信息的数据块。 △面向字符的——以同步字符(SYN,16H)来标识一个帧的开始,适用于数据为字符类型的帧。 △面向比特的——以特殊位序列(7EH,即01111110)来标识一个帧的开始,适用于任意数据类型的帧。
4、信道最大数据传输率
奈奎斯公式:用于理想低通信道 C = 2W×log2 M C = 数据传输率,单位bit/s W = 带宽,单位Hz M = 信号编码级数奈奎斯公式为估算已知带宽信道的最高数据传输速率提供了依据。
非理想信道:实际的信道上存在损耗、延迟、噪声。损耗引起信号强度减弱,导致信噪比S/N降低。延迟会使接收端的信号产生畸变。噪声会破坏信号,产生误码。持续时间0.01s的干扰会破坏约560个比特(56Kbit/s) △香农公式:有限带宽高斯噪声干扰信道 C = W log2 (1+S/N) S/N: 信噪比例:信道带宽W=3.1KHz,S/N=2000,则 C = 3100*log2(1+2000) ≈ 34Kbit/s 即该信道上的最大数据传输率不会大于34Kbit/s
奈奎斯公式和香农公式的比较 △C = 2W log2M 数据传输率C随信号编码级数增加而增加。 △C = W log2(1+S/N) 无论采样频率多高,信号编码分多少级,此公式给出了信道能达到的最高传输速率。原因:噪声的存在将使编码级数不可能无限增加。 5、数据编码
编码与调制的区别 △用数字信号承载数字或模拟数据——编码 △用模拟信号承载数字或模拟数据——调制
数字数据的数字信号编码:把数字数据转换成某种数字脉冲信号常见的有两类:不归零码和曼彻斯特编码。 △不归零码(NRZ,Non-Return to Zero)二进制数字0、1分别用两种电平来表示,常常用-5V表示1,+5V表示0。缺点:存在直流分量,传输中不能使用变压器;不具备自同步机制,传输时必须使用外同步。 △曼彻斯特编码(Manchester Code)用电压的变化表示0和1,规定在每个码元的中间发生跳变:高→低的跳变代表0,低→高的跳变代表1。每个码元中间都要发生跳变,接收端可将此变化提取出来作为同步信号。这种编码也称为自同步码(Self-Synchronizing Code)。缺点:需要双倍的传输带宽(即信号速率是数据速率的2倍)。 △差分曼彻斯特编码(Differential ~)每个码元的中间仍要发生跳变,用码元开始处有无跳变来表示0和1 ,有跳变代表0,无跳变代表1。
数字数据的调制编码[三种常用的调制技术]: △幅移键控ASK (Amplitude Shift Keying) △频移键控FSK (Frequency Shift Keying) △相移键控PSK (Phase Shift Keying) 基本原理:用数字信号对载波的不同参量进行调制。载波 S(t) = Acos(ωt+ψ) S(t)的参量包括: 幅度A、频率ω、初相位ψ,调制就是要使A、ω或ψ随数字基带信号的变化而变化。 △ASK:用载波的两个不同振幅表示0和1。 △FSK:用载波的两个不同频率表示0和1。 △PSK:用载波的起始相位的变化表示0 和1。
模拟数据的数字信号编码采样定理:如果模拟信号的最高频率为F,若以2F的采样频率对其采样,则采样得到的离散信号序列就能完整地恢复出原始信号。要转换的模拟数据主要是电话语音信号,语音信号要在数字线路上传输,必须将语音信号转换成数字信号。这需要经过三个步骤: △采样:按一定间隔对语音信号进行采样 △量化:对每个样本舍入到量化级别上 △编码:对每个舍入后的样本进行编码编码后的信号称为PCM信号
6、多路复用技术复用:多个信息源共享一个公共信道。为何要复用?——提高线路利用率。适用场合:当信道的传输能力大于每个信源的平均传输需求时。复用类型 △频分复用FDM (Frequency Division Multiplexing) △波分复用WDM (Wave Division Multiplexing) △时分复用TDM (Time Division Multiplexing)
频分复用原理:整个传输频带被划分为若干个频率通道,每路信号占用一个频率通道进行传输。频率通道之间留有防护频带以防相互干扰。
波分复用——光的频分复用。原理:整个波长频带被划分为若干个波长范围,每路信号占用一个波长范围来进行传输。
时分复用原理:把时间分割成小的时间片,每个时间片分为若干个时隙,每路数据占用一个时隙进行传输。由于每路数据总是使用每个时间片的固定时隙,所以这种时分复用也称为同步时分复用。时分复用的典型例子:PCM信号的传输,把多个话路的PCM话音数据用TDM的方法装成帧(帧中还包括了帧同步信息和信令信息),每帧在一个时间片内发送,每个时隙承载一路PCM信号。
统计(异步)TDM——STDM TDM的缺点:某用户无数据发送,其他用户也不能占用该时隙,将会造成带宽浪费。改进:用户不固定占用某个时隙,有空时隙就将数据放入。
7、差错控制与语音、图像传输不同,计算机通信要求极低的差错率。产生差错的原因: △信号衰减和热噪声 △信道的电气特性引起信号幅度、频率、相位的畸变; △信号反射,串扰; △冲击噪声,闪电、大功率电机的启停等。差错控制的基本方法是:接收方进行差错检测,并向发送方应答,告知是否正确接收。
差错检测主要有两种方法:
奇偶校验(Parity Checking)在原始数据字节的最高位增加一个奇偶校验位,使结果中1的个数为奇数(奇校验)或偶数(偶校验)。例如1100010增加偶校验位后为11100010,若接收方收到的字节奇偶校验结果不正确,就可以知道传输中发生了错误。此方法只能用于面向字符的通信协议中,只能检测出奇数个比特位错。
循环冗余校验 (CRC, Cyclic Redundancy Check) 差错检测原理:将传输的位串看成系数为0或1的多项式。收发双方约定一个生成多项式G(x),发送方在帧的末尾加上校验和,使带校验和的帧的多项式能被G(x)整除。接收方收到后,用G(x)除多项式,若有余数,则传输有错。校验和是16位或32位的位串,CRC校验的关键是如何计算校验和。
差错控制技术 △自动请求重传Automatic Repeat Request (ARQ) △停等 ARQ △Go-back-N ARQ △选择重传 ARQ
附:
一.数据通信中的主要技术指标
数据通信的任务是传输数据信息,希望达到传输速度快、出错率低、信息量大、可靠性高,并且既经济又便于使用维护。这些要求可以用下列技术指标加以描述。
1.数据传输速率 所谓数据传输速率,是指每秒能传输的二进制信息位数,单位为位/秒(bits per sec-ond),记作bps或b/s,它可由下式确定: s=1/T?log2N (bps) 式中T为一个数字脉冲信号的宽度(全宽码情况)或重复周期(归零码情况),单位为秒。一个数字脉冲也称为一个码元,N为一个码元所取的有效离散值个数,也称调制电平数,N一般取2的整数次方值。若一个码元仅可取0和1两种离散值,则该码元只能携带一位(bit)二进制信息;若一个码元可取00、01、10和11四种离散值,则该码元就能携带两位二进制信息。以此类推,若一个码元可取N种离散值,则该码元便能携带log2N位二进制信息。 当一个码元仅取两种离散值时,S =(1/T),表示数据传输速率等于码元脉冲的重复频率。由此,可以引出另一个技术指标一一'信号传输速率,也称码元速率、调制速率或波特率,单位为波特(Baud)。信号传输速率表示单位时间内通过信道传输的码元个数,也就是信号经调制后的传输速率。若信号码元的宽度为T秒,则码元速率定义为: B=1/T (Baud) 在有些调幅和调频方式的调制解调器中,一个码元对应于一位二进制信息,即一个码元;,有两种有效离散值,此时调制速率和数据传输速率相等。但在调相的四相信号方式中,一个码元对应于两位二进制信息,即一个码元有四种有效离散值,此时调制速率只是数据传输速率的一半。由以上两式合并可得到调制速率和数据传输速率的对应关系式: S =B ?log2N (bps) 或B =S/log2N(Baud) 一般在二元调制方式中,S和B都取同一值,习惯上二者是通用的。但在多元调制的情况下,必须将它们区别开来。例如采用四相调制方式,即N=4,且T=833×10-6秒,则可求出数据传输速率为: S=1/T?log2N=1/(833×10-6)?log24=2400 (bps) 而调制速率为: B=1/T=1/(833×10-6)=1200 (Baud) 通过上例可见,虽然数据传输速率和调制速率都是描述通信速度的指标,但它们是完全不同的两个概念。打个比喻来说,假如调制速率是公路上单位时间经过的卡车数,那么数据传输速率便是单位时间里经过的卡车所装运的货物箱数。如果一车装一箱货物,则单位时间经过的卡车数与单位时间里卡车所装运的货物箱数相等,如果→车装多箱货物,则单位时间经过的卡车数便小于单位时间里卡车所装运的货物箱数。
2.信道容量 信道容量表征一个信道传输数据的能力,单位也用位/秒(bps)。信道容量与数据传输速率的区别在于,前者表示信道的最大数据传输速率,是信道传输数据能力的极限,而后者则表示实际的数据传输速率。这就像公路上的最大限速值与汽车实际速度之间的关系一样,它们虽然采用相同的单位;但表征的是不同的含义。奈奎斯特(Nyquist)首先给出了无噪声情况下码元速率的极限值与信道带宽的关系: B =2?H (Baud) 其中,H是信道的带宽,也称频率范围,即信道能传输的上、下限频率的差值,单位为HZ。由此可推出表征信道数据传输能力的奈奎斯特公式: C =2?H?log2N (bpe) 此处,N仍然表示携带数据的码元可能取的离散值的个数,C即是该信道最大的数据传输速率。 由以上两式可见,对于特定的信道,其码元速率不可能超过信道带宽的两倍,但若能提高每个码元可能取的离散值的个数,则数据传输速率便可成倍提高。例如,普通电话线路的带宽约为3KHz,则其码元速率的极限值为6kBaud。若每个码元可能取的离散值的个数为16(即N=16),则最大数据传输速率可达C=2×3k×log216=24k bps。 实际的信道总要受到各种噪声的干扰,香农(Shannon)则进一步研究了受随机噪声干扰的信道的情况,给出了计算信道容量的香农舍式: C =H?log2(1+S/N) (bps) 其中,S表示信号功率,N为噪声功率,S/N则为信噪比。由于实际使用的信道的信噪比都要足够大,故常表示成10log10(S/N),以分贝(dB)为单位来计量,在使用时要特别注意。例如,信噪比为30dB,带宽为3kHZ的信道的最大数据传输速率为: C=3k×log2(1+1030/10)=3k×log2(1+1001)=30kbps. 由此可见,只要提高信道的信噪比,便可提高信道的最大数据传输速率。 需要强调的是,上述两个公式计算得到的只是信道数据传输速率的极限值,实际使用时必须留有充足的余地。
3.误码率 误码率是衡量数据通信系统在正常工作情况下的传输可靠性的指标,它定义为二进制数据位传输时出错的概率。设传输的二进制数据总数为N位,其中出错的位数为风,则误码率表示为: Pe =Ne/N 计算机网络中,一般要求误码率低于10-6,即平均每传输106位数据仅允许错一位。可若误码率达不到这个指标,可以通过差错控制方法进行检错和纠错。
二.编码技术
模拟信号:是指模拟数据在某个区间产生连续的值。例如,声音和视频就是强度 连续变化的信号。大多数用传感器收集的数据,例如温度和压力都是连续值。
数字信号:是指数字数据产生离散的值。例如,文本信息和整数。
调制解调:当需要在只能传输模拟信号的线路上传输数据信号时(例如,通过一 条公用电话线将数据从一台计算机传输到另一台计算机),在发送方,数据开始是数字数据,但是由于电话线只能传输模拟信号,所以数据必须进行数字到模拟的转换。这个转换过程就叫作调制。在接收方需要进行模拟到数字的转换,使它还原为原来的数字数据这个过程叫作解调。整个从数字数据到模拟信号再到数字数据的过程称作调制解调。
调制解调有三种基本形式:幅移键控法(AmplitudeShift Keying,ASK)、频移键控法(Frequency Shift Keying,FSK)和相移键控法(PhaseShift Keying,PSK)。
不归零(Non-Return to Zero,NRZ)编码:在用数字信号传输数字数据时,信号的电平是根据它所代表的二进制数值决定的。一个正电压值代表1,而一个负电压值代表0,因而信号的电平依赖于它所代表的数值。
曼彻斯特编码:在曼彻斯特编码中,每个比特中间引入跳变来同时代表不同数值 和同步信息。一个负电平到正电平的跳变代表0,而一个正电平到负电平的跳变则代表1。通过这种跳变使曼彻斯特编码获得了同步信息和数字编码。
差动曼彻斯特编码:在差动曼彻斯特编码中,用两个比特之间的跳变来代表不同 的数值,在间隙中有跳变的代表0,没有跳变的代表1。比特中间的跳变只用来表示同步信息,不同的数值通过在比特间隙是否跳变来表示。
三.数据传输技术
多路复用:在计算机网络系统中,当传输介质的能力超过传输单一信号的情况时, 为了有效地利用传输系统,希望一个信道能够同时传输多路信号。多路复用,就是把许多信号在单一的传输线路上进行传输。一般普遍使用三种多路复用技术,即频分多路复用(FDM)、时分多路复用(TDM)和统计时分多路复用(STDM)。
同步传输:是使接收端接收的每一位数据信息都要和发送端准确地保持同步,中间没有间断,实现这种同步方法又有自同步法和外同步法。
异步传输:是基于字节的,每字节作为一个单位通过链路传输,因为没有同步脉 冲,接收方不可能通过计时方式来预测下一个字节何时到达,因而在每个字节的开头都要附加一个0,通常称为起始位,在每个字节尾部还加上一个或多个1,被称为停止位。 单工通信:是指在通信链路上的两个站点,只能一个发送信息,另一个接收。
半双工通信:在通信链路上的两个站点都可以发送和接收信息,但是不能同时发 送和接收,当其中一个站点在发送信息时,另一个站点只能接收,反之亦然。
全双工通信:在通信链路上的两个站点可以同时发送和接收信息,即一个站点发 送信息的同时也能接收信息。
四.差错控制方法
差错的产生原因及其控制差错控制是指在数据通信过程中能发现或纠正差错,把差错限制在尽可能小的允许范围内的技术和方法。 信号在物理信道中传输时线路时,线路本身电气特性造成的随即噪声、信号幅度的衰减、频和相位的畸变、电气信号在线路上产生反射造成的回音效应、相邻线路间的串扰以及各种外界因素(如大气中的闪电、开关的跳火、外界强电流磁场的变化、电源的波动等)都会造成信号的失真。在数据通信中,将会使接收端收到的二进制数位和发送端实际发送的二进制数位不一致,从而造成由"0"变成"1"或由"1"变成"0"的差错。
一般来说,传输中的差错都是由噪声引起的。噪声有两大类,一类是信道固有的、持续存在的随机热噪声;另一类是由外界特定的短暂原因所造成的冲击噪声。 热噪声引起的差错称为随机错,所引起的某位码元的差错是孤立的,与前后码元没有关系。由于物理信道在设计时,总要保证达到相当大的信噪比,以尽可能减少热噪声的影响,因而由它导致的随机错通常较少。 冲击噪声呈突发状,由其引起的差错称为突发错。冲击噪声幅度可能相当大,无法靠提高信号幅度来避免冲击噪声造成的差错,它是传输中产生差错的主要原因。冲击噪声虽然持续时间很短,但在一定的数据速率条件下,仍然会影响到一串码元。例如,一个冲击噪声(如一次电火花)持续时间为10ms,但对于4800bps的数据速率来说,就可能对连续48位数据造成影响,使它们发生差错。从突发错误发生的***个码元到有错的最后一个码元间所有码元的个数,称为该突发错的突发长度。
数据通信中不加任何差错控制措施,直接用信道来传输数据是不可靠的。最常用的差错控制方法是差错控制编码。数据信息位在向信道发送之前,先按照某种关系附加上一定的冗余位,构成一个码字后再发送,这个过程称为差错控制编码过程。接收端收到该码字后,检查信息位和附加的冗余位之间的关系,以检查传输过程中是否有差错发生,这个过程称为校验过程。
利用差错控制编码来进行差错控制的方法基本上有两类,一类是自动请求重发ARQ(Automatic Repeat reQuest),另一类是前向纠错FEC(FOIW盯d Eπor Correction)。在ARQ方式中,接收端检测出有差错时,就设法通知发送端重发,直到正确的码字收到为止。在FEC方式中,接收端不但能发现差错,而且能确定二进制码元发生错误的位置,从而加以纠正。因此,差错控制编码又可分为检错码和纠错码。检错码是指能自动发现差错的编码,纠错码是指不仅能发现差错而且能自动纠正差错的编码。 ARQ方式只使用检错码,但必须有双向信道才可能将差错信息反馈至发送端。同时,发送方要设置数据缓冲区,用以存放已发出去的数据,以便知道出差错后可以调出数据缓冲区的内容重新发送。FEC方式必须用纠错码,但它可以不需要反向信道来传递请求重发的信息,发送端也不需要存放以备重发的数据缓冲区。虽然FEC有上述优点,但由于纠错码一般说来要比检错码使用更多的冗余位,也就是说编码效率低,而且纠错设备也比检错设备复杂得多,因而除非在单向传输或实时要求特别高(FEe由于不需要重发,实时性较好)等场合外,数据通信中使用更多的还是ARQ差错控制方式。有些场合也可以将上述两者混合使用,即当码字中的差错个数在纠正能力以内时,直接进行纠正;当码字中的差错个数超出纠正能力时,则检出差错,使用重发方式来纠正差错。 衡量编码性能好坏的一个重要参数是编码效率R,它是码字中信息位所占的比例。若码字中信息位为k位,编码时外加冗余位为r位,则编码后得到的码字长度为n=k+r位,由此编码效率R可表示为: R=k/n=k/(k+r) 显然,编码效率越高,即R越大,信道中用来传送信息码元的有效利用率就越高。
奇偶校验码、循环冗余码和海明码是几种最常用的差错控制编码方法。 *
奇偶校验码 奇偶校验码是一种通过增加冗余位使得码字中"1"的个数恒为奇数或偶数的编码方法,它是一种检错码。在实际使用时又可分为垂直奇偶校验、水平奇偶校验和水平垂直奇偶校验等几种。
【编辑推荐】