2011-10-13 38 views
0

the wikipedia page,它说,使用独特的终止字符串$0$1,...,$n-1的树n字符串,s1,... sn填充广义后缀树和实施资源

我的问题是:如何处理字符串i+1的文字后缀$i的情况?例如,我的第一个字符串s1example$0。这样做的聪明方式是什么?

另外,我发现的后缀树的实现大多为单个字符串,而不是广义版本。给定单个字符串的实现,如何轻松扩展它?

谢谢!

回答

0

第一个问题:如果您使用的是Unicode,则可以使用未在您的环境中分配的PUA代码(http://en.wikipedia.org/wiki/Mapping_of_Unicode_characters#Private_use_characters)。从U + E000开始可以。如果您使用的是8位ASCII码,请使用您知道不在字符串中的字节码 - \ 003(文本结尾)听起来合适 - 而不是'$'。

第二个问题:重新开始,只能从当前树而不是空的树开始。独特的终结者保证你永远不会发现自己试图分裂叶节点。