ieee-754

4热度

1回答

关于这个话题已经有很多人说过，但是我找不到我的问题的确切答案。 JavaScript不能准确地表示十进制数字，如0.1，这是可以理解的。例如，这是因为该multilication期间发生舍入误差的真实： 0.1 * 3 === 0.30000000000000004 这是精 - 所有根据IEEE标准浮点运算（IEEE 754）。什么我不明白的是为什么同样使用标准的其他语言给出更精确的测量 0.

0热度

1回答

减去单精度IEEE 754数字

问题是（-1.100 x 2^5）+（1.1001 x 2^7）。转移到他们都得到相同的数量级之后，你会得到 1.10010 x 2^7 -0.01100 x 2^7 我的问题是与携带。我不确定我是否做得对。我得到的答案是0.01110 x 2^7，这是正确的吗？另外，当我减去如何知道我是否会得到一个负值？如果答案我上面是正确的，将在单精度IEEE正确的表示是 0 10000110 01

4热度

1回答

Python中为什么不使用Inf，-Inf和NaN关键字？

在PEP 754的拒绝通知，它指出：这PEP已被拒绝。坐了四年后，它有未能产生足够的社区兴趣。这个PEP的一些想法是为Python 2.6实现的。 float（'inf'）和repr（float（'inf'））现在可以保证在支持IEEE 754语义的每个支持平台上工作。然而，的eval（再版（浮动（“INF”）））往返仍然不支持，除非你定义INF和楠自己： >>> inf = float

0热度

1回答

IEEE 754如何定义平等？

IEEE-754如何定义相同的“常规”双浮点数？是否符合IEEE-754的Double.equal的java实现？如果我忽略像NaN这样的特殊值，-0等IEEE-754双浮点数相等，当且仅当它们具有相同的64位表示它们时？ IEEE-754定义了“10.12”的近似值如何在64位中表示为双精度。 IEEE-754定义了如何计算“6.0 + 4.12”，通过在64位中表示两个值以及如何推导表示结

2热度

1回答

球拍中的熔合乘加

球拍中是否可以使用fused multiply-add？我试图移植一些数字代码，它依赖于融合操作的单个舍入，但几次搜索后都没有找到任何方式在Racket中使用fma或类似代码。谢谢！

-1热度

1回答

如何将单精度浮点数转换为十进制？

如果这个值0010 0100 1001 0010 0100 1001 0010 0100是一个单精度浮点数，我该如何将它转换成十进制数？

2热度

2回答

为什么教科书中使用的二进制十四位浮点模型使用偏差16，因为IEEE单精度使用偏差127？

在我的计算机体系结构课程中，我们使用14位二进制模型（1位为符号，5位为指数，8位为尾数）。当输入指数时，我的指导员让我们加16来抵消它（偏差16）为什么我们使用16偏差？是否因为5位只能表示多达31个数字？如果是这样，请详细说明并比较使用指数时使用127偏差的IEEE单精度。最后，如果有人能够给我一个关于这方面和二进制使用的偏见的明确定义，我将不胜感激。如果我说的内容不清楚，请发表评论。

0热度

1回答

将CGFloat设置为double是否安全？

我有一个64位的设备上运行下面的代码： CGFloat myFloat = 123.45f; CGFloat myDouble = 123.45; 跨32位和64位器件这样安全吗？由于CGFloat根据处理器体系结构更改大小，给定的变量是否会在两个平台上包含接近123.45的值，或者是否会由于位错误放置而导致它们炸毁？这两件事情能发生吗？在64位： myFloat == 0x000000

0热度

1回答

IEEE 754浮点数可以用多位排列表示完全相同的值吗？

IEEE 754浮点数可以用多位排列表示完全相同的值吗？例如： 128 EXP 3 == 1024.0 256 EXP 2 == 1024.0 1024 EXP 0 == 1024.0 是否IEEE 754标准考虑不同的位排列是在值相等时相比之下，只要净值最终看起来是一样的？我正在处理一些自定义的压缩算法，并且知道是否有多种方法来表示相同的值（用于增强压缩）会非常有用。

-2热度

2回答

对于IEEE 754双精度数字，长度为1的范围包含最多的双精度数？

范围的长度等于Range.Max - Range.Min 例如，“[0-1]”和“[3.5-4.5]”是长度1范围的示例。那么什么样的长度为1的范围（如果有的话）的双精度数最多？我的猜测是[-0.5 - 0.5]或[0-1]，但没有办法证明这种方式或其他方式。