2012-05-04 56 views
6

我有一个弯路问题。众所周知,Detours只能在5个字节的空间中移动(即'jmp'调用和4个字节的地址)。正因为如此,在一个类(方法)中不可能有'钩子'函数,所以你不能提供'this'指针,因为没有足够的空间(here's这个问题更加彻底的解释)。所以我一整天都在为解决方案进行头脑风暴,现在我想要关于这个问题的想法,所以我不开始一个3-5天的项目,不知道它是否可行。我想让'钩子'函数成为类方法,我希望整个方法都是面向对象的(没有静态函数或全局对象),最坏/最难的部分是完全动态。这是我的(理论上)解决方案;用程序集可以在运行时修改函数(一个完美的例子就是任何绕行方法)。所以,因为我可以动态地修改函数,所以我不能动态创建它们吗?例如;我分配内存,比如说~30个字节(通过malloc/new)。难道仅仅用对应于不同汇编操作符的二进制数替换所有字节(如0xE9是'jmp'),然后直接调用地址(因为它包含一个函数)?C++和FULLY动态函数

注意:我事先知道返回值以及所有要绕行的函数的所有参数,而且由于我使用的是GCC,因此这种调用约定与_cdecl约定几乎相同。

所以这是我的想法/即将实施;我创建了一个'Function'类。该构造函数接受可变参数(除了第一个参数,它描述目标函数的返回值)。

每个参数都是钩子将接收的参数(大小,以及它是否是指针)的描述。假设我想为int * RandomClass::IntCheckNum(short arg1);创建一个Function类。然后我只需要这样做:Function func(Type(4, true), Type(4, true), Type(2, false));。其中“类型”定义为Type(uint size, bool pointer)。然后通过汇编,我可以动态地创建函数(注意:这将全部使用_cdecl调用约定),因为我可以计算参数的数量和总大小。

编辑:随着例如,Type(4, true)是返回值(INT *),则scond Type(4, true)是RandomClass this指针和Type(2, false)描述的第一个参数(短ARG1)。

在这个实现中,我可以很容易地将类方法作为回调函数,但是它需要大量的汇编代码(我甚至没有经验过)。 最后,唯一的非动态的东西将是我的回调类中的方法(这也需要前后回调)。

所以我想知道;这可能吗?它需要多少工作,我是否会在我的头上?

编辑:对不起,如果我提出了一切有点模糊,但如果有什么你想要更彻底地解释,请问!编辑2:我也想知道,如果我能找到所有装配操作符的十六进制值在某处?列表将有助于一吨!和/或如果可以以某种方式“保存”asm(“”);代码在一个内存地址(我非常怀疑)。

+0

为什么要使用弯路呢?你不能使用纯粹的C++解决方案,比如'std :: function',还是我错过了一些东西? –

+0

不像我能帮你澄清事情。 你想要一个类中的可重写函数吗?(我的意思是你可以在运行时改变它们) 如果是这样,我认为它(完成时)可能会为C++中的AI编程开启巨大的机会。 +1 – akaltar

+0

@akaltar这被称为[遗传编程](http://en.wikipedia.org/wiki/Genetic_programming),实际上并不需要可重写的函数。 –

回答

4

你所描述的通常被称为“thunking”,并且通常被实现。从历史上看,最常见的用途是在16位和32位代码之间进行映射(通过自动生成一个新的32位函数来调用现有的16位或反之亦然)。我相信一些C++编译器也会产生类似的函数来调整基类指针到多继承中的子类指针。

它似乎是一个可行的解决方案,您的问题,我不会预见任何大问题。只要确保在内存中分配操作系统中所需的任何标志以确保内存可执行(大多数现代操作系统默认情况下都会发出不可执行的内存)。

你会发现这个链接有用的,特别是如果在Win32中工作:http://www.codeproject.com/Articles/16785/Thunking-in-Win32-Simplifying-Callbacks-to-Non-sta

关于寻找组装业务的十六进制值,我所知道的最好的参考是附录的NASM汇编的说明书(和我不要只因为我帮忙写出来而这么说)。这里有一份副本:http://www.posix.nl/linuxassembly/nasmdochtml/nasmdoca.html

+0

哇!伟大的链接!阅读thunking过程真的非常有趣(尽管Win32太糟糕了)。现在请原谅,如果我听起来很愚蠢,但正如前面提到的,我对程序集没有特别的经验(我只知道一点AT&T语法),所以我不得不询问你引用的NASM汇编程序。我有2个问题;所有的ASM操作员只使用1个字节吗?其次,由于每个运营商都有许多不同的价值,我对哪一个感兴趣?我想这取决于我的变量的大小;但对于'推'有13个不同的值,我怎么知道我想要哪一个? –

+1

对于不同类型的推送指令(寄存器种类,即时值,间接存储器引用),这些是不同的变体。指南的顶部有所有不同模式的描述,所以使用它来确定你想要的是哪一个,然后只需查看列表就可以找到你需要的指令格式。假设你想推EBX:这是一个reg32,所以你需要第二个变种,即“o32 50 + r”。 o32是一个操作数大小前缀,如果您使用的是32位代码,则会被忽略; 50 + r是50十六进制加上寄存器的代码(3,它们在顶部列出),所以53h是你的代码。 – Jules

+1

在回答你的第一个问题时,不存在多于一个字节的指令,并且一些指令的大小取决于上下文而变化(参见上面的PUSH示例:'o32'前缀不会在32位中生成任何代码模式,但是如果你生成的是16位代码,它将是在指令开始时出现的额外的66h字节)。然而,所有最常见的指令都是单字节。 – Jules