我想生成编程的单词同音字。意思是听起来类似于原始单词的单词。如何在子字符串级别生成同音字符?
我碰到过Soundex算法,但它只是用其他字符替换某些字符(如t而不是d)。是否有任何列表或算法有点复杂,至少意味着同音字子串?
重要的是,我想将它应用于不在字典中的单词,意味着它不能依赖整个真实的单词。
编辑:
输入是一个字符串,他们往往是命名实体,因此在没有真正的(同音字)词典。一个例子可能是谷歌或麦当劳(仅举两个流行的命名实体,但许多更不受欢迎)。
然后输出是该字符串的(随机)同音字。由于单词经常有多个同音字,所以单个(随机)单是我的目标。在谷歌的情况下,同音字可分别古格尔,麦当劳为麦当劳。
分享你的代码,输入和期望的输出 – skrubber