2010-12-05 68 views
3

有没有文化敏感的方法来识别字符串中的句子?C#文化敏感句子识别

还是有在.NET框架中的东西(或其他地方),提供特定的文化句子终止

例如在英国使用说“”,‘!’,‘?’ (和其他人)来标记句子的结尾,中国人使用,泰国人使用空间。

+0

是的,继续,惹恼6500万法国人。当然这不起作用。 – 2010-12-05 01:38:36

+0

@Hans:什么都行不通?法语与其他语言一样具有句子分隔符(实际上与英语一样) – Cameron 2010-12-05 04:35:10

回答

4

我看不到框架内建的东西。你可以做的一件事就是制作一系列解析器,并根据CultureInfo.CurrentCulture选择正确的解析器。也就是说,有一个解析器实现了一个名为ISentenceParser的新接口,并制作了一组实现,每个实现都根据特定语言处理句子解析。然后,当你需要解析时,你会得到你的语言所需的一个。

更好的问题是,为什么这是必要的?我可以想到很少的情况下,你想解析成句子(虽然也许我只是没有足够的创造力:))。

-1

我认为在网点中没有句子末尾这样的事情。所以你必须使用你自己的这个实现。你想做什么?