我试图对抄袭做一些算法比较。我发现很多TEXT比较剽窃。如何混淆C++变量和函数
但是在算法中它是非常不同的。假设某些算法使用了大量的变量,函数和用户定义的结构。如果有人从别人那里复制源代码,他至少会改变变量和函数名称。通过简单的文本比较算法,函数和变量字母之间的这种差异将被视为“差异”,从而使算法为抄袭提供“假”。
我想要做的是在C++源代码中“泛化”(我不知道这是否是正确的词)所有变量,函数和用户定义的结构名称。所以这些变量将被命名为“a”,“b”,对于函数“... fa(...)”,“... fb(...)”也是如此。 我有PHP中的字符串变量的C++源码算法进行比较。
我知道应该对许多其他事情进行分析以获得准确的源代码比较,但这对我来说就足够了。
我也想给在换行符一些额外的重要性, “;”后面的换行符,以及大括号的位置。我知道某些类型的算法很难以某种“不同的方式”制作,例如在一些简单的初始示例中,“2个值的总和”。 但全文比较也是一个问题。 而且由于它在Web主机上运行,我无法编译代码。 – IPValverde 2012-02-10 12:01:06