ieee-754

    4热度

    1回答

    关于这个话题已经有很多人说过,但是我找不到我的问题的确切答案。 JavaScript不能准确地表示十进制数字,如0.1,这是可以理解的。 例如,这是因为该multilication期间发生舍入误差的真实: 0.1 * 3 === 0.30000000000000004 这是精 - 所有根据IEEE标准浮点运算(IEEE 754)。 什么我不明白的是为什么同样使用标准的其他语言给出更精确的测量 0.

    0热度

    1回答

    问题是(-1.100 x 2^5)+(1.1001 x 2^7)。 转移到他们都得到相同的数量级之后,你会得到 1.10010 x 2^7 -0.01100 x 2^7 我的问题是与携带。我不确定我是否做得对。 我得到的答案是0.01110 x 2^7,这是正确的吗?另外,当我减去如何知道我是否会得到一个负值?如果答案我上面是正确的,将在单精度IEEE正确的表示是 0 10000110 01

    4热度

    1回答

    在PEP 754的拒绝通知,它指出: 这PEP已被拒绝。坐了四年后,它有 未能产生足够的社区兴趣。 这个PEP的一些想法是为Python 2.6实现的。 float('inf')和repr(float('inf'))现在可以保证在支持IEEE 754语义的每个支持平台上工作。然而, 的eval(再版(浮动(“INF”)))往返仍然不支持,除非你 定义INF和楠自己: >>> inf = float

    0热度

    1回答

    IEEE-754如何定义相同的“常规”双浮点数? 是否符合IEEE-754的Double.equal的java实现? 如果我忽略像NaN这样的特殊值,-0等IEEE-754双浮点数相等,当且仅当它们具有相同的64位表示它们时? IEEE-754定义了“10.12”的近似值如何在64位中表示为双精度。 IEEE-754定义了如何计算“6.0 + 4.12”,通过在64位中表示两个值以及如何推导表示结

    2热度

    1回答

    球拍中是否可以使用fused multiply-add? 我试图移植一些数字代码,它依赖于融合操作的单个舍入,但几次搜索后都没有找到任何方式在Racket中使用fma或类似代码。 谢谢!

    -1热度

    1回答

    如果这个值0010 0100 1001 0010 0100 1001 0010 0100是一个单精度浮点数,我该如何将它转换成十进制数?

    2热度

    2回答

    在我的计算机体系结构课程中,我们使用14位二进制模型(1位为符号,5位为指数,8位为尾数)。当输入指数时,我的指导员让我们加16来抵消它(偏差16)为什么我们使用16偏差?是否因为5位只能表示多达31个数字?如果是这样,请详细说明并比较使用指数时使用127偏差的IEEE单精度。最后,如果有人能够给我一个关于这方面和二进制使用的偏见的明确定义,我将不胜感激。如果我说的内容不清楚,请发表评论。

    0热度

    1回答

    我有一个64位的设备上运行下面的代码: CGFloat myFloat = 123.45f; CGFloat myDouble = 123.45; 跨32位和64位器件这样安全吗?由于CGFloat根据处理器体系结构更改大小,给定的变量是否会在两个平台上包含接近123.45的值,或者是否会由于位错误放置而导致它们炸毁? 这两件事情能发生吗? 在64位: myFloat == 0x000000

    0热度

    1回答

    IEEE 754浮点数可以用多位排列表示完全相同的值吗? 例如: 128 EXP 3 == 1024.0 256 EXP 2 == 1024.0 1024 EXP 0 == 1024.0 是否IEEE 754标准考虑不同的位排列是在值相等时相比之下,只要净值最终看起来是一样的? 我正在处理一些自定义的压缩算法,并且知道是否有多种方法来表示相同的值(用于增强压缩)会非常有用。

    -2热度

    2回答

    范围的长度等于Range.Max - Range.Min 例如,“[0-1]”和“[3.5-4.5]”是长度1范围的示例。 那么什么样的长度为1的范围(如果有的话)的双精度数最多? 我的猜测是[-0.5 - 0.5]或[0-1],但没有办法证明这种方式或其他方式。