我目前正在运行贝叶斯优化,用C++编写。我使用Ruben Martinez-Cantin的工具箱调用Bayesopt(http://rmcantin.bitbucket.org/html/)。我在做关于贝叶斯优化的论文(https://en.wikipedia.org/wiki/Bayesian_optimization)。由于函数调用永远不会运行,程序需要(很多)时间比它应该更长
我以前曾试用这个工具箱,本周我注意到代码运行速度比我记忆的要慢很多。值得一提的是,我确实编写了一些适用于该工具箱的代码。
我决定尝试了解为什么会发生这种情况,并且我看到代码运行得比应该慢得多。
要尝试了解它是我的代码的错误还是其他原因,我尝试了一个不使用我的代码的示例。
请看下面的例子:
#include <iostream>
#include <bayesopt.hpp>
class ExampleMichalewicz: public bayesopt::ContinuousModel
{
public:
ExampleMichalewicz(bopt_params par);
double evaluateSample(const vectord& x);
bool checkReachability(const vectord &query) {return true;};
void printOptimal();
private:
double mExp;
};
ExampleMichalewicz::ExampleMichalewicz(bopt_params par):
ContinuousModel(10,par)
{
mExp = 10;
}
double ExampleMichalewicz::evaluateSample(const vectord& x)
{
size_t dim = x.size();
double sum = 0.0;
for(size_t i = 0; i<dim; ++i)
{
double frac = x(i)*x(i)*(i+1);
frac /= M_PI;
sum += std::sin(x(i)) * std::pow(std::sin(frac),2*mExp);
}
return -sum;
}
void ExampleMichalewicz::printOptimal()
{
std::cout << "Solutions: " << std::endl;
std::cout << "f(x)=-1.8013 (n=2)"<< std::endl;
std::cout << "f(x)=-4.687658 (n=5)"<< std::endl;
std::cout << "f(x)=-9.66015 (n=10);" << std::endl;
}
int main(int nargs, char *args[])
{
bopt_params par = initialize_parameters_to_default();
par.n_iterations = 20;
par.n_init_samples = 30;
par.random_seed = 0;
par.verbose_level = 1;
par.noise = 1e-10;
par.kernel.name = "kMaternARD5";
par.crit_name = "cBEI";
par.crit_params[0] = 1;
par.crit_params[1] = 0.1;
par.n_crit_params = 2;
par.epsilon = 0.0;
par.force_jump = 0.000;
par.verbose_level = 1;
par.n_iter_relearn = 1; // Number of samples before relearn kernel
par.init_method = 1; // Sampling method for initial set 1-LHS, 2-Sobol (if available),
par.l_type = L_MCMC; // Type of learning for the kernel params
ExampleMichalewicz michalewicz(par);
vectord result(10);
michalewicz.optimize(result);
std::cout << "Result: " << result << "->"
<< michalewicz.evaluateSample(result) << std::endl;
michalewicz.printOptimal();
return 0;
}
如果我单独编译这个例子中,运行时间约为23秒。
有了这个cmake的文件
PROJECT (myDemo)
ADD_EXECUTABLE(myDemo ./main.cpp)
find_package(Boost REQUIRED)
if(Boost_FOUND)
include_directories(${Boost_INCLUDE_DIRS})
else(Boost_FOUND)
find_library(Boost boost PATHS /opt/local/lib)
include_directories(${Boost_LIBRARY_PATH})
endif()
include_directories(${PROJECT_SOURCE_DIR}/include)
include_directories("../bayesopt/include")
include_directories("../bayesopt/utils")
set(CMAKE_CXX_FLAGS " -Wall -std=c++11 -lpthread -Wno-unused-local-typedefs -DNDEBUG -DBOOST_UBLAS_NDEBUG")
target_link_libraries(myDemo libbayesopt.a libnlopt.a)
现在考虑同主要的例子,但在这里我另外三个文件添加到我的cmake的项目(不包括他们的main.cpp)。这三个文件是我所有代码的子部分。
PROJECT (myDemo)
ADD_EXECUTABLE(myDemo ./iCubSimulator.cpp ./src/DatasetDist.cpp ./src/MeanModelDist.cpp ./src/TGPNode.cpp)
find_package(Boost REQUIRED)
if(Boost_FOUND)
include_directories(${Boost_INCLUDE_DIRS})
else(Boost_FOUND)
find_library(Boost boost PATHS /opt/local/lib)
include_directories(${Boost_LIBRARY_PATH})
endif()
include_directories(${PROJECT_SOURCE_DIR}/include)
include_directories("../bayesopt/include")
include_directories("../bayesopt/utils")
set(CMAKE_CXX_FLAGS " -Wall -std=c++11 -lpthread -Wno-unused-local-typedefs -DNDEBUG -DBOOST_UBLAS_NDEBUG")
target_link_libraries(myDemo libbayesopt.a libnlopt.a)
这次运行时间约为3分钟。这对我的工作至关重要,因为如果我增加par.n_iterations
它往往会变得更糟。
我进一步得出的结论是,如果我在TGPNode.cpp
utils::cholesky_decompose(K,L); (NOTICE THAT THIS LINE IS NEVER CALLED).
注释行,我得到23秒。该功能属于bayesopt工具箱中的文件:ublas_cholesky.hpp。
同样重要的是要注意,在工具箱代码中也调用了相同的函数。该行未被评论,并在michalewicz.optimize(result);
期间运行。
有没有人有任何理念为什么发生这种情况?如果有人对这个主题有一些了解,这将是一个很大的帮助。
非常感谢。
请问,何塞诺盖拉
您是否使用调试器('gdb')?你用所有的警告和调试信息('-Wall -Wextra -g')编译了('g ++')吗?通过优化('-O2 -march = native')?分析('-pg')然后'gprof'和/或'oprofile'? –
此外,我怀疑其中一个文件有一些全局静态变量,其初始化需要一些时间。但这只是一个猜测。 –
_“本周我注意到代码运行速度比我记得的慢很多”_ - 你能回到以前使用的版本吗? – sehe