2014-12-03 72 views
13
3,200,056,496 bytes allocated in the heap 

Wut?这是STRef的一个小测试:为什么我的小STRef Int需要分配千兆字节?

bigNumber = 
    runST $ do 
     ref <- newSTRef (0 :: Int) 
     replicateM_ 100000000 $ modifySTRef' ref (+1) 
     readSTRef ref 

modifySTRef'是严格的。 STRef应该直接在内存上运行,所以我没有看到需要大量分配。

下面是完整的代码:

import Control.Monad.ST 
import Control.Monad 
import Data.STRef 

bigNumber :: Int 
bigNumber = 
    runST $ do 
     ref <- newSTRef (0 :: Int) 
     replicateM_ 100000000 $ modifySTRef' ref (+1) 
     readSTRef ref 

main :: IO() 
main = print bigNumber 

建立像分析:

ghc -O2 -rtsopts -prof -auto-all -caf-all -fforce-recomp tryST.hs 

运行,如:

./tryST +RTS -pa -sstderr 

亮点来自tryST.prof

bigNumber Main 95 1 95.7 100.0 95.7 100.0 1357 1600000032 

的RTS报告:

3,200,056,496 bytes allocated in the heap 
     360,624 bytes copied during GC 
     46,040 bytes maximum residency (2 sample(s)) 
     23,592 bytes maximum slop 
      1 MB total memory in use (0 MB lost due to fragmentation) 

            Tot time (elapsed) Avg pause Max pause 
Gen 0  6102 colls,  0 par 0.03s 0.03s  0.0000s 0.0002s 
Gen 1   2 colls,  0 par 0.00s 0.00s  0.0007s 0.0013s 

INIT time 0.00s ( 0.00s elapsed) 
MUT  time 1.33s ( 1.38s elapsed) 
GC  time 0.03s ( 0.04s elapsed) 
RP  time 0.00s ( 0.00s elapsed) 
PROF time 0.00s ( 0.00s elapsed) 
EXIT time 0.00s ( 0.00s elapsed) 
Total time 1.35s ( 1.42s elapsed) 

%GC  time  1.9% (2.5% elapsed) 

Alloc rate 2,413,129,982 bytes per MUT second 

Productivity 98.1% of total user, 93.6% of total elapsed 

这个程序是不一样快,我想,但生产效率为98%。大。最大居住率46k。凉。但是,所有这些分配是什么?

回答

9

Int类型是一个盒子整数表示。当(+1)作用于STRef的内容 时,会创建一个新的堆对象。在内部,STRef包含一个指向堆对象的指针,并写入该修改指针的STRef,而不是更新整数字段。正如你所看到的,做这个1,000,000,000次可能会导致大量的Int对象被创建,在大量的内存中搅动。

幸运的是,这些对象并不是很长寿,这就是为什么垃圾收集器复制的字节数相对较少的原因 。事实上,这个计划仅花费适量的时间来执行GC。像Haskell这样的短期对象在Haskell(以及其他许多函数式编程语言)中很常见,并且垃圾收集器旨在有效地处理这种情况。

+0

有趣。我刚刚在无盒装矢量的背景下了解拆箱的好处。有没有在STRef中有一个unboxed Int的方法? – 2014-12-03 01:42:41

+1

@MichaelFox [This](https://hackage.haskell.org/package/ArrayRef-0.1.3.1/docs/Data-Ref-Unboxed.html)是一种可能的解决方案。但是,我不知道是否有标准化的解决方案。如果你绝望,我想你可以使用长度为1的无盒矢量。 – sabauma 2014-12-03 01:59:04

+0

它在实践中并不重要。您不要将常用值放在Ref类型中,而是将它们传递给它。如果您的代码和值的类型允许,则该值将被拆箱。 – Carl 2014-12-03 03:37:19