2011-02-07 306 views
2

我不确定主题是否正确,但我会尝试在下面解释我的问题。我正在寻找的是某种“学术答案”,因为我想我的两个解决方案在运行时都会给出类似的结果。网络I/O和C++的缓冲区的动态与静态内存分配

我在Linux上有一个C++程序,它执行大量的网络I/O操作,我想知道是否更好地将内置缓冲区放入客户端类或动态分配它。第一个解决方案使用内置的缓存:

template <size_t buffer_size> class Buffer 
{ 
    // ... 

    char buffer [buffer_size]; 
} 

class TcpClient 
{ 
    // ... 

    Buffer<1024> input_buffer; 
    Buffer<1024> output_buffer; 
} 

其次使用动态分配的缓冲区:

class Buffer 
{ 
    Buffer (size_t buffer_size) : 
     buffer (malloc (buffer_size)) 
    { 
     // ... 
    } 

    // ... 

    char* buffer; 
} 

class TcpClient 
{ 
    // ... 

    Buffer input_buffer (1024); 
    Buffer output_buffer (1024); 
} 

现在,比较两个方案我看到的第一需要较少的内存分配操作,那么第二个,接下来的事情 - 感谢模板编译器在编译时知道类的大小。第一个解决方案应该提供更好的参考局部性(?),并且编译器也可以将类的大小与其想要的任何对齐。我们也可以直接访问缓冲区,因为我们不需要执行额外的指针取消引用操作。

我开始思考第一个解决方案中的TcpClient对象如何在处理器缓存中运行。每次我们在代码中访问这样的对象时,它都会被加载到处理器缓存中,并且它的缓冲区也会被复制,即使我们不需要它们。它会使缓存效率低下,因为我们在那里存储了大量数据,增加了内存查找错误的概率,对吗?

是不是浪费处理器的时间来复制缓冲区来缓存所有的时间? 从处理器和操作系统的角度来看,这两种解决方案的其他效果是什么? 将班级规模缩小或尽可能多地增加班级规模会更好吗?

+0

您可以在堆栈中分配缓冲区,并使用成员加入班级。顺便说一句,你编写C++,使用新的,而不是malloc! – neuro 2011-02-07 12:57:43

回答

4

处理器不会根据它在哪里以不同的方式查找内存。在堆栈上分配速度要快得多,而且容易出错。如果分配需要为动态,则只使用动态分配,即需要变量生存期或对象类型。否则,使用静态分配。

3

我不会在这里关心缓存效果。无论如何,Socket I/O速度很慢且缓存效率低下,因为它需要将系统调用和数据从内核缓冲区复制到用户空间,所以没有POSIX方法来执行零拷贝套接字I/O(可以使用自定义硬件来完成此操作)。你可以做的最好的事情是尽量减少通过套接字发送和接收数据所需的系统调用次数。

理想情况下,用户空间接收缓冲区的大小应该与内核中套接字接收缓冲区的大小相同。这样您就可以在一个recv/recvmsg/read()系统调用中读取所有接收到的数据。

如果您没有多次创建客户端,构建对象需要多少分配可能并不重要。识别和优化I/O的快速路径通常会更好,因此一旦构建客户端对象,发送和接收数据就不涉及用户空间中的内存分配和数据副本。