吉林大学远程教育学院—计算机原理及系统结构

当前位置: 第四章　计算机中的运算器部件 >> 第十七讲

讲选： 13/14/15/16/17

浮点数在计算机内的格式

浮点数: X = M_S E_S E_m-1 ...E₁ E₀ M_-1M_-2...M_-n
IEEE 标准：阶码用移码，基为2

　　按国际电子电气工程师协会规定的国际通用标准，浮点数的阶码用整数给出，并且要用移码表示，用作为以 2为底的指数的幂。既然该指数的底一定为 2 ，可以不必在浮点数的格式中明确表示出来，只需给出阶码的幂值即可。
　　移码表示只用于表示整数，只用在浮点数的阶码部分，其定义类似于整数的补码定义，差别在符号位。
　　移码的符号位是 0 表示负，1 表示正，与补码的符号位正好相反，移码是指机器数在数轴上有个移位关系；
　　移码的数值位则与补码的数值位完全相同。

浮点数格式：关于移码的知识

浮点数: X = M_S E_S E_m-1 ...E₁ E₀ M_-1M_-2...M_-n
移码表示只用于表示整数，只用在浮点数的阶码部分。
一位符号位和 n 位数值位组成的移码, 其定义为；
[E]_移 = 2ⁿ + E 　-2ⁿ<=E<2ⁿ 表示范围： 00000000 11111111

浮点数格式：关于移码的知识

　　8 位的阶码能表示-128~+127，当阶码为-128时，其移码表示为 00000000，该浮点数的绝对值<2^-128,人们规定此浮点数的值为零，若尾数不为 0 就清其为 0，并特称此值为机器零。

一位符号位和 n 位数值位组成的移码, 其定义为；
[E]_移 = 2ⁿ + E 　-2ⁿ<=E<2ⁿ 表示范围： 00000000 11111111
8 位移码表示的机器数为数的真值在数轴上向右平移了 128 个位置

移码只执行二数的加减运算与增 1、减 1 操作。加减运算时，符号位计算结果求反后, 才是加减运算的正确符号位的值。

浮点数算术运算

浮点数加减运算

（1）对阶操作，求阶差： ΔE= M_X -M_Y，
使阶码小的数的尾数右移│ΔE│位，
其阶码取大的阶码值；
（2）尾数加减；
（3）规格化处理；
（4）舍入操作，可能带来又一次规格化；
（5）判结果的正确性，即检查阶码上下溢出

浮点数加运算举例

X=2⁰¹⁰*0.1101111， Y=2¹⁰⁰*（-0.1010110）
写出X、Y的正确的浮点数表示：
阶码用 4 位移码　　尾数用 8 位原码
　（含符号位）　　（含符号位）
[X]_浮 = 0 1010 1101111
[Y]_浮 = 1 1100 1010110
为运算方便，尾数的符号位写在数值位之前：
[MX]_浮 = 1010 0 1101111
[MY]_浮 = 1100 1 1010110
（1）计算阶差：

注意：阶码计算结果的符号位在此变了一次反，结果为 -2 的移码，是X的阶码值小，使其取 Y 的阶码值1100（即 +4）；
因此，相应地修改 [MX]补 =00 001101111（即右移 2 位）
（2）尾数求和：

此处是原码加法，符号不相同，绝对值大的减小的，结果符号取决于绝对值大的数
（3）规格化处理：
相加结果，数值的最高位为0，应执行1次左规操作,
故得 [MX]_原 = 1 1110110，阶码减1，[EX]_移 = 1 011
（4）舍入处理：结果为负，警戒位为正，在最低位减 1

（5）检查溢出否：和的阶码为 1011，不溢出
计算后的 [X]_移 = 1 1011 1110101 ，
即数的实际值为 2³*(-0.1110101)

浮点数乘除运算

(1) 阶码加、减：乘：E_X+E_Y ，除：E_X- E_Y
(2) 尾数乘、除：乘：E_X*E_Y ，除：E_X / E_Y
(3) 规格化处理；
(4) 舍入操作，可能带来又一次规格化；
(5) 判结果的正确性，即检查阶码上下溢出

浮点数乘法运算举例

X=2⁰¹⁰*0.1101111， Y=2¹⁰⁰*（-0.1010110）
写出X、Y的正确的浮点数表示：
阶码用 4 位移码　　尾数用 9 位原码
　（含符号位）　　（含符号位）
[X]_浮 = 0 1010 1011
[Y]_浮 = 1 1100 1101
（1）阶码相加：

注意：计算结果的阶码符号位在此变了一次反，
移码结果为 +6
（2）尾数相乘：M_X*M_Y = 0.1011*(-0.1101)
= -0.10001111
(3) (4) (5) 已是规格化数, 不必舍入, 也不溢出
最终乘积 [M_X]_移 = 1 1110 10001111，
即 2⁶ * （-0.10001111）

浮点数除运算举例

X=2⁰¹⁰*0.1101111， Y=2¹⁰⁰*（-0.1010110）
(1) 阶码相减：
积的阶码 = E_X - E_Y = E_X + (-E_Y)
　　　　 = 1 010 + 0 100 = 0 110
注意：计算结果的阶码符号位在此变了一次反，为移码 -2
(2) 尾数相除：M_X/M_Y = 0.1011/(-0.1101)
　　　　　　　　　　 = -0.1101
(3) (4) (5) 已是规格化数, 不必舍入, 也不溢出
最终的商 [M_X]_移 = 1 0110 1101，
即 2^-2 *（-0.1101）

IEEE 浮点数标准 754

浮点数: X = M_S E_S E_m-1 ...E₂ E₁ M_-1M_-2...M_-n
IEEE 标准：阶码用移码，基为2；尾数用原码

	符号位	阶码位	尾数数码位	总位数
短浮点数:	1	8	23	32
长浮点数:	1	11	52	64
临时浮点数:	1	15	64	80

　　规定对长、短浮点数的尾数使用隐藏位技术，即把非 0 值的尾数的最高位上的 1 经过左移操作后强行去掉，则原来不能表示的更低一位就进到最低一位，使 23 位的尾数数值位就能给出 24 位的精度，此时还应把阶码位相应的减 1，变原来的移 128 为移 127。
　　正常的阶码值范围：01h~FEh，表示 -126~+127
特定的阶码：
　　00h，23位的非 0 尾数表示非规格化浮点数（隐藏位此时一定为0）；
　　FFh, 尾数为全 0 时表示无穷大的浮点数，可正可负，由符号位决定。尾数非全 0 时属于非法数值

讲选： 13/14/15/16/17