当前位置： C语言 -- 专题 -- 浮点模型和浮点宏的关系

浮点模型和浮点宏的关系

以下模型描述了一个满足ISO/IEC 9899:2024标准最低要求的人工浮点表示（artificial floating-point representation）。

（注：人工浮点表示并不是指某个特定硬件（例如：Intel x86。）上真实的IEEE 754标准浮点数格式，而是标准文档为了阐述概念而设计的一个假设的、简化的格式。人工浮点表示的目的是用来说明：只要一种浮点表示法满足标准规定的一系列最低要求（例如:精度、范围等。），就认为是符合标准的实现。）

$x = s 16^{e} \sum_{k =1}^{6} f_{k} 16^{- k}, -31 \leq e \leq +32$

对于float类型，<float.h>头文件中对应的宏分别为：

以下模型分别描述了满足ISO/IEC 60559标准中32位二进制数和64位二进制数要求的浮点表示。

（注：ISO/IEC 60559标准中的浮点模型对b的幂求和是从0开始的，因此指数极值比这里显示的数值要少1。）

$x_{f} = s 2^{e} \sum_{k =1}^{24} f_{k} 2^{- k}, -125 \leq e \leq +128$

$x_{d} = s 2^{e} \sum_{k =1}^{53} f_{k} 2^{- k}, -1021 \leq e \leq +1024$

对于float类型和double类型，<float.h>头文件中对应的宏分别为：

如果宏FLT_EVAL_METHOD值不为0，或者支持除ISO/IEC 60559默认模式外的编译舍入模式，十进制浮点常量可能无法提供正确值；但十六进制浮点常量在所有情况下都是正确的，因此它们的值可以精确表示。

主要参考资料：