有没有某种算法或概念,可以帮助解决以下问题?字符串含义比较
说我有两段文字,代码段1和代码段二。
片段1内容如下:
“狗吓得不敢出门到风暴”
片段2如下:
“犬被吓倒进入阴雨天气“
有没有一种方法可以比较使用某种算法的片段,或者某种字符串理论系统?我想知道在解决这个问题之前是否有任何种类的系统解决了这个问题。
更新: 好的,举一个更具体的例子,说我想减少票务系统中的错误数量。我想做一些扫描,看看是否有任何相关或相似的门票。我想知道根据票证的主体来确定问题的最佳系统方式。 Levenshtein距离算法并不是特别有效,因为它不会知道湿度和干度之间的差异。
此存储库对您的问题有一个词嵌入方法:https://bitbucket.org/yunazzang/aiwiththebest_byor – Aaron