计算机基础
计算机基础
组成原理
计算机基本硬件系统五大组成部分:运算器、控制器、存储器、输入设备和输出设备
CPU
寄存器
运算器的四个重要寄存器:
算术逻辑单元ALU(实现对数据的算术和逻辑运算)
累加寄存器AC(运算结果或源操作数的存放区)
数据缓冲寄存器DR(暂时存放内存的指令或数据)、
状态条件寄存器 PSW(保存指令运行结果的条件码内容,如溢出标志等)组成。
执行所有的算术运算,如加减乘除等;执行所有的逻辑运算并进行逻辑测试,如与、或、非、比较等。
控制器的四个重要寄存器:
指令寄存器IR(存储即将执行的CPU指令)
程序计数器PC(存放 下一条指令所在内存单元地址 )
地址寄存器AR(保存当前CPU所访问的内存地址)
指令译码器ID(分析指令操作码)等组成。
先从PC (存储即将执行的CPU指令) 中将指令的地址取出,
放入AR(保存当前CPU所访问的内存地址)中,然后从主存M中取出指令,
放入DR(暂时存放内存的指令或数据)中,
然后放入IR(存储即将执行的CPU指令)中,
ID 分析指令 (分析指令操作码)
指令流水线
流水线周期:指令分成不同执行段,其中执行时间最长的段为流水线周期。
流水线执行时间:1条指令总执行时间+(总指令条数-1)*流水线周期。
流水线吞吐率计算:吞吐率即单位时间内执行的指令条数。 公式:指令条数/流水线执行时间。
流水线的加速比计算:加速比即使用流水线后的效率提升度,即比不使用流水线快了多少表明流水线效率越高,公式:不使用流水线执行时间/使用流水线执行时间。
最大吞吐率:1/ 流水线周期 。一个流水线周期执行一个指令,
指令系统
复杂指令系统
- 指令数量众多。
- 指令使用频率相差悬殊。
- 支持很多种寻址方式。
- 变长的指令。指令长度不是固定的。
- 指令可以对主存单元中的数据直接进行处理
- 以微程序控制为主
精简指令系统
- 指令数量少
- 指令的寻址方式少。
- 指令长度固定,指令格式种类少。
- 以硬布线逻辑控制为主。
- 单周期指令执行,采用流水线技术。
- 优化的编译器。
- CPU中的通用寄存器数量多,
总线
总线带宽
总线本身所能达到的最高传输速率,单位兆字节每秒(MB/s)。
如果一个总线周期中产行传送64位数据,总线时钟频率升为66MHz,则总线带宽是 $ 66 * 10^6 * 64 \div 8 = 528 * 10^6 b/s = 528 MB/s $
连接方式
星形连接 | 网状连接 | 三总线 |
---|---|---|
总线的特性
- 物理特性:指总线的物理连接方式,包括总线的根数,总线的插头、插座的形状,,刷脚线的排列方式等。
- 功能特性:描述总线中每一根线的功能。
- 电气特性:定义每一根线上信号的传递方向及有效电平范围。送入CPU的信号叫输入信号IN),从CPU发出的信号叫输出信号(OUT)
- 时间特性:定义了每根线在什么时间有效。规定了总线上各信号有效的时序关系,CPU才能正确无误地使用。
总线的分类
- 内部总线:CPU内部连接各寄存器及运算部件之间的总线。
- 系统总线:CPU同计算机系统的其他高速功能部件,如存储器、通道等互相连接的总线。
- I/0总线 中、低速IO设备之间互相连接的总线
总线的仲裁
集中式仲裁
链式(菊花链)查询方式
- 只用很少几根线就能按一定优先次序实现总线仲裁,很容易扩充设备
- 容错性低 。 对询问链的电路故障很敏感,如果第i个设备的接口中有关链的电路有故障,那么第i个以后的设备都不能进行工作。
- 优先级不固定 查询链的优先级是固定的如果优先级高的设备频繁的请求时,优先级低的设备可能长期无法使用总线
- 响应速度慢
计数器定时查询方式
- 使用了更多的线,能使得各个设备的优先级相同。
独立请求方式
- 响应时间快
- 优先级控制灵活;可以屏蔽某些设备,不响应他们的请求
- 使用了更多的线,和内部仲裁设备,能更快、更灵活的响应请求的设备
链式(菊花链)查询方式 | 计数器定时查询方式 | 独立请求方式 |
---|---|---|
分布式仲裁
分布式仲裁不需要中央仲裁器,每个潜在的主方功能模块都有自己的仲裁号和仲裁器,当它们有总线请求时,把它们唯一的仲裁号发送到共享的仲裁总线上,每个仲裁器将仲裁总线上得到的号与自己的号进行比较。如果仲裁总线上的号大,则它的总线请求不予响应,并撤消它的仲裁号。最后,获胜者的仲裁号保留在仲裁总线上。显然,分布式仲裁是以优先级仲裁策略为基础。
存储系统
cache
时间局部性:指程字中的某条指令一旦执行,不久以后该指令可能再次执行,典型例子:循环操作
空间局部性:一旦程序访问了某个存储单元,不久以后,其附近的存储单元也将被访问,例子:程
序顺序执行 、 数组遍历
构成存储层次的主要依据是:程序的局部性
映像方式:
直接相联映像:硬件电路较简单,但冲突率很高。 ( 求余 mod )
全相联映像:电路难于设计和实现,只适用于小容量的cache,冲突率较低。
组相联映像:直接相联与全相联的折中。 (每个组含n个行,就称为n路组相联)
磁盘阵列
多个磁盘存储器组合成一个大的磁盘。
- RAID0级 无冗余和无校验的数据分块
- RAID1级 磁盘镜像阵列 。 磁盘对组成,每一个工作盘都有其对应的镜像盘,上面保存着与工作盘完全相同的数据拷贝,具有最高的安全性,但磁盘空间利用率只有50% 。
- RAID2级 采用纠错海明码的磁盘阵列 。 大量数据传输时I/O性能较高,但不利于小批量数据传输。
- RAID3、RAID4级 采用奇偶校验码的磁盘阵列 。 RAID3采用位交叉奇偶校验码,RAID4采用块
交叉奇偶校验码 - RAID5 无独立校验盘的奇偶校验码磁盘阵列 。当有N块阵列盘时,用户空间为N-1块盘容量。(有三个盘 80 、80 、40)用户空间为: 40 + 40
- RAID6 具有独立的数据硬盘与两个独立的分布式校验方案
- RAID7 具有最优化的异步高I/O速率和高数据传输率的磁盘阵列
- RAID10 高可靠性与高性能的组合 ,建立在RAID 0和RAID1基础上
输入输出
DCPU和I/0(外设)只能串行工作CPU需要一直轮询检查,
程序查询方式 | CPU需要一直轮询检查, | CPU和I/0(外设)只能串行工作 | 中低速设备 | 设备→CPU→内存 内存→CPU→设备 |
字 |
中断驱动方式 | 中断是外围设备用来“主动”通知CPU | CPU和I/0(外设)可并行工作 | 中低速设备 | 设备→CPU→内存 内存→CPU→设备 |
字 |
DMA | DMA控制器从CPU完全接管对总线的控制 数据交换不经过CPU而直接在内存和外围设备之间进行 |
可并行工作 | 用于内存和高速外围设备之间 大批数据交换 |
设备→内存 内存→设备 |
块 |
通道方式 | CPU将部分权力下放给通道 | 可并行工作 | 设备→内存 内存→设备 |
一组块 |
性能评判
主频:机器内部主时钟的频率。通常以MHz(兆赫兹)为单位,1Hz表示每秒1次。
CPU时钟周期 = 1/ 主频
其中的2.40GHz就是主频,表示我的电脑一秒可以完成 $ 2.40×10^9 $ 个时钟周期,就表示计算机
一秒可以经历 $ 2.40×10^9 $ 个时钟周期。则,一个时钟周期仅需 $ 1 / ( 2.40×10^9 ) $ 秒。
CPU时钟周期 :通常为节拍脉冲 ,它是CPU中最小的时间单位,每个动作至少需要一个时钟周期。
指令周期 :CPU从主存中每取出并执行一条指令所需的全部时间 ,也就是CPU完成一条指令的时间
指令周期常常用若干机器周期表示 。 一个机器周期又包含若干时钟周期
CPI (Cycles PerInstruction,每条指令执行所用的时钟周期数),由于不同指令的功能不同,造成指令执行时间不同,所以CPI是一个平均值。
MIPS(MillionInstructions PerSecond,每秒百万条指令 的执行速度 。 指令条数 / (执行时间 x $ 10^6 $ )
浮点数
S:浮点数的符号位,1位,0表示正数,1表示负数。
M : 尾数,23位,用原码小数表示,小数点放在尾数域的最前面。
E :阶码,8位,阶符采用隐含方式, 采用移码方式来表示正负指数。
移码
单精度 | 双精度 | |
---|---|---|
指数域 | 8 bit | |
尾数 | 23 bit | |
最小值 (最小负数) | S=-1 , M=1.111… , E= 127 $-( 2 - 2^{-23} ) \times 2^{127} $ |
|
最大负数 | S= -1 ,M=1.0 , E = 1 - 127 = -126 $-2^{-126}$ |
|
最小正数 | S= 1 ,M=1.0 , E = 1 - 127 = -126 $2^{-126}$ |
|
最大正数 | S=1 , M=1.111… , E= 127 $( 2 - 2^{-23} ) \times 2^{127} $ |
校验码
奇偶校验
奇偶校验码:在编码中增加1位校验位来使编码中1的个数为奇数(奇校验) 或者偶数(偶校验),从而使码距变为2。
只能发现奇数个位出错的情况,不能纠错
CRC循环冗余校验码
操作系统
存储管理
页式存储
进程中使用的是逻辑地址 ,假如一段逻辑地址是连续的,但是它们所对应存放在内存中的位置却不一定连续。所以需要一个表格记录逻辑地址和物理地址之间的关系,这就是页表。
物理地址:页帧号 + 页内地址
逻辑地址:页号 + 页内地址
例如,页式存储系统中,每个页的大小为4KB。默认按字节编址,即一个存储单元是1byte 。
内存中共有 $ 2^{12} $ 个存储单元,即 4K 。 假如有一逻辑地址 10 1100 1101 1110
, 查页表 10 (十进制 2)对应 6 (二进制 110),其物理地址就是 110 1100 1101 1110
当根据逻辑地址访问数据时,先通过逻辑页号在页表中查找块号,
- 若找到块号,则结合页内地址生成物理地址。
- 找不到块号,则表示该块还没有放进内存,
- 内存不满,那就会把相应的块调入到内存中(缺页中断),然后更新页表。
- 如果内存满了,就会采用某种策略淘汰内存中的其中的一个块。
淘汰优先级
- 状态为1的才能被淘汰。 在内存的页面才能够被淘汰。
- 淘汰访问位为 0
- 淘汰修改位为 0 。 因为修改过的页面,淘汰的时候要考虑一致性
优点:利用率高,碎片小,分配及管理简单。
缺点:增加了系统开销,可能产生抖动现象
快表:将页表存于Cache上;(访问最频繁的少数页面)
慢表:将页表存于内存上。
段式存储
按用户作业中的自然段来划分逻辑空间,然后调入内存,段的长度可以不一样。
◆优点:多道程序共享内存(公用函数),各段程序修改互不影响。
◆缺点:内存利用率低,内存碎片浪费大。
段页存储
段式与页式的综合体。先分段,再分页。1个程序有若干个段,每个段中可以有若干页,每个页的大小相同,但每个段的大小不同。
优点:空间浪费小、存储共享容易、存储保护容易、能动态链接。
缺点:由于管理软件的增加,复杂性和开销也随之增加,需要的硬件以及占用的内容也有所增加,使得执行速度大大下降。
计算机网络
OSI七层模型
传输单位
1 Byte = 8 bit
1 KB = 1024 B (KB, KiloByte)
1MB = 1024 KB (MB, MegaByte)
1 GB = 1024 MB (GB, GigaByte)
1 TB = 1024 GB (TB, TeraByte)
Mbps、Mb/s 兆比特每秒
MB/s 兆字节每秒
b,通常为bit的简称,中文为比特,计算机存储传输中的最小单位
B,通常为Byte的简称,中文为字节,其中1Byte=8bit
值得注意的是,在描述计算机网络传输速率时,它们之间的转换倍数不再是1024而是1000
1 Kb/s = 1000 b/s
1 Mb/s = 1000 Kb/s
1 Gb/s = 1000 Mb/s
搞明白了这个基本含义,那么我们可以很轻松得到这几个常见单位之间的转换关系了
1 MB/s = 8 Mb/s = 8 Mbps
常用端口号
FTP | 文件传输协议 | TCP | 传送控制信息(21号端口),传送数据内容(20号 端口)O |
TFTP | 简单文件传输协议 | UDP | 端口号69。 |
HTTP | 超文本传输协议 | TCP | 端口号80。HTTPS(HTTP+SSL)端口号443。 |
DHCP | 动态主机配置协议 | UDP | 端口号67。租约默认为8天,租约过半需续约。 |
Telnet | 远程登录协议 | TCP | 端口号23。 |
DNS | 域名系统 | UDP | 较少情况下使用TCP协议,端口号均为53。 |
SNMP | 简单网络管理协议 | UDP | 端口号为161。 |
SFTP / SSH | 安全传输 | 端口:22 |
SMTP | 简单邮件传输协议 | TCP | 邮件的发送。 端口号25 |
---|---|---|---|
IMAP | 交互式邮件存取协议 | 邮件的收取。端口号 143 或 993 与POP3类似。不同的是,在电子邮件客户端收取的邮件仍然保留在服务器上,同时在客户端上的操作都会反馈到服务器上, 如:删除邮件,标记已读等,服务器上的邮件也会做相应的动作 |
|
POP3 | 邮局协议 | TCP | 邮件的收取。 端口号110。 POP3允许用户从服务器上把邮件存储到本地主机上,同时删除保存在邮件服务器上的邮件 |
MIME | 多用途互联网邮件扩展类型 | MIME消息能包含文本、图像、音频、视频等多媒体数据。多用于指定一些客户端自定义的文件名以及一些媒体文件打开方式 | |
MIME/S | 与安全电子邮箱服务相关 |
网络规划与设计
逻辑网络设计
逻辑网络设计是体现网络设计核心思想的关键阶段,在这一阶段根据需求规范和通信规范,选择一种比较适宜的网络逻辑结构,并基于该逻辑结构实施后续的资源分配规划、安全规划等内容。
逻辑网络设计工作主要包括以下内容:
- 网络结构的设计
- 物理层技术的选择
- 局域网技术的选择与应用
- 地址设计和命名模型
- 网络管理
- 逻辑网络设计文档
- 广域网技术的选择与应用
- 路由选择协议
- 网络安全设计
输出内容包括以下几点:
逻辑网络设计图
IP地址方案
安全管理方案
具体的软/硬件、广域网连接设备和基本的网络服务
招聘和培训网络员工的具体说明
对软/硬件费用、服务提供费用、员工和培训的费用初步估计
物理网络设计
物理网络设计是对逻辑网络设计的物理实现,通过对设备的具体物理分布、运行环境等确定,确保网络的物理连接符合逻辑连接的要求。在这一阶段,网络设计者需要确定具体的软/硬件、连接设备、布线和服务的部署方案,
输出如下内容:
网络物理结构图和布线方案
设备和部件的详细列表清单
软硬件和安装费用的估算
安装日程表,详细说明服务的时间以及期限
安装后的测试计划
用户的培训计划
层次化网络设计
核心层:主要是高速数据交换,实现高速数据传输、出口路由,常用冗余机制。
汇聚层:网络访问策略控制、数据包处理和过滤、策略路由、广播域定义、寻址。
接入层:主要是针对用户端,实现用户接入、计费管理、MAC地址认证、MAC地址过滤、收集用户信息。
综合布线
工作区子系统:曲信息插座、插座盒、连接跳线和适配器组成。
水平子系统:由一个工作区的信息插座开始,经水平布置到管理区的内侧配线架的线缆所组成。
管理子系统:由交连、互连配线架组成。管理子系统为连接其它子系统提供连接手段。
垂直干线子系统:由建筑物内所有的垂直干线多对数电缆及相关支撑硬件组成,以提供设备间总配线架与干线接线间楼层配线架之间的干线路由。
设备间子系统:是由设备间中的电缆、连接器和有关的支撑硬件组成,作用是将计算机、PBX、摄像头、监视器等弱电设备互连起来并连接到主配线架上。
建筑群子系统:将一个建筑物的电缆延伸到建筑群的另外一些建筑物中的通信设备和装置上,是结构化布线系统的一部分,支持提供楼群之间通信所需的硬件。它由电缆、光缆和入楼处的过流过压电气保护设备等相关硬件组成,常用介质是光缆。
网络存储技术 RAID
磁盘阵列 (RAID,Redundant Arrays of Independent Disk)
Raid0 | (条块化) | 性能最高,并行处理,无冗余,100%利用率,损坏无法恢复 |
Raid1 | (镜像结构) | 可用性,可修复性好,仅有50%利用率 |
Raid0+1、Raid10 | Raid0与Raid1长处的结合 | Raid0与Raid1长处的结合,高效也可靠 |
Raid2 | 奇偶校验 | 位校验 |
Raid3 | 奇偶校验并行传送 | N+1模式,有固定的校验盘,坏一个盘可恢复 块校验 |
Raid5 | 分布式奇偶校验的独立磁盘 | N+1模式,无固定的校验盘,坏一个盘可恢复 |
Raid6 | 两种存储的奇偶校验 | N+2模式,无固定的校验盘,坏两个盘可恢复 |
RAID 7 | 高I/O速率和高数据传输率 |
TCP 协议
三次握手
ACK=1
表示确认收到了消息SYN=1
表示同意了这次连接,并与客户端建立新连接
四次挥手
FIN=1
表示释放连接
第二次挥手是服务端收到了客户端的断开请求,通知客户端俺收到了,此时客户端没有数据向服务端发送了,但不代表服务端也没有数据向客户端发送,因为服务端要把剩余还没有发送的报文发送完毕再断开连接;第三次挥手是服务端数据全部发送完毕,向客户端发送断开请求报文(FIN=1)