回答
读共享内存时发生的bank冲突都与读取的数据量有关。所以,由于int
和float
是相同的大小(至少我认为它们在所有CUDA平台上),所以没有区别。
聚并通常是指全局内存访问 - 同样,这与读取的字节数有关,而不是数据类型。
int
和float
都是四个字节,因此它在合并全局内存访问或共享内存访问上的存储体冲突方面没有任何区别(如果您以相同的方式访问它们) 。
话虽如此,你可能会有更好的性能与float
s,因为设备的设计尽可能快,它们通常用于控制和索引等,因此具有较低的性能。当然它比这更复杂 - 如果你什么也没有,但是整数硬件会闲置,这将是一种浪费。
INTS周围* Y典型GTX卡慢10倍。典型GPU上的整数单位少得多。除非您有特定的理由,否则不要使用整数或双宽度浮点数。 – 2017-10-05 06:11:07
存储体冲突和聚合都与内存访问模式有关(无论线程内的线程是否都以统一的跨度读取/写入不同位置)。因此,这些问题与数据类型无关(float,int,double等)
请注意,数据类型确实会影响计算性能。单精度浮点数比双精度浮点数要快。GPU中强壮的FPU通常意味着在固定点进行计算是不必要的,甚至可能是有害的。
查看CUDA开发人员指南的“数学函数”部分。使用设备运行时功能(内在功能)可以为各种类型提供更好的性能。您可以在较少的时钟周期内以一次操作执行多个操作。
对于SectionC.1的某些功能,设备运行时组件中存在一个不太准确但速度更快的版本;它具有以__为前缀的相同名称 (例如__sinf(x))。编译器有一个选项 (-use_fast_math),强制Table中的每个函数编译为其内部函数...有选择地替换数学函数 调用通过调用固有函数,只有在性能提高的情况下,以及可以容忍更改的属性(如精确度降低和不同的特殊情况处理)的情况下才可以使用。
- 例如,而不是使用=>使用:X/Y => __fdividef(X,Y); SINF(X)=> __sinf(X)
,你会发现更多的方法,比如x + c。与一个函数执行..
- 1. NSNumber VS Int,Float in Swift Dictionary
- 2. always int int = float float in python
- 3. df.set_index()中的Float vs Int行为
- 4. OpenGL Shader vs CUDA
- 5. 命名为int vs命名为float
- 6. Float variable in C++
- 7. float in wordpress
- 8. Integer * float =? in C
- 9. C++ int float casting
- 10. Android Float To Int
- 11. C++ float to int
- 12. float value in - struct itimerspec
- 13. Numpy float64 vs Python float
- 14. NSDecimal vs Float(iOS)
- 15. Double vs Float - Java
- 16. Python float vs numpy.float32
- 17. 将字符串[]转换为十进制[],int [],float [] .double [] in c#
- 18. Java - int/long,float/double
- 19. CUDA 4.0 vs 3.2
- 20. System.Convert.ToInt VS(INT)
- 21. CUDA中的全局vs共享内存
- 22. inline asm in C++ in vs __asm
- 23. CUDA理论带宽vs有效带宽
- 24. Float-In Div需要延迟
- 25. Float right fixed svg in div
- 26. int pixels in bmp in java
- 27. 是否可以使用一行命令将[int,bool,float]转换为['int','bool','float']?
- 28. C-structs,NSObjects,float,int,double,
- 29. float:“left”vs display:“inline-block”
- 30. x64 vs x86 for CUDA
它们具有相同的大小,但不同的目的 – Anycorn 2010-08-18 05:46:05