我希望你能帮我创建一个算法。 我需要的是从人类输入的字符串中提取数据(某人并不在意我必须这样做)。在这个字符串中他提出了语言要求。数据已经存在,所以要求用户输入正确的信息已经太晚了。字符串可能看起来像这样:从非常可变的字符串中提取数据
"English good arabic good german basic knowledges"
"good in english, a little bit german"
"english, german"
"english - very good, german - preferred"
现在我只想关注德语结尾英语在这里。我想知道他们是否需要,以及如果可能的话,多少(可能是一个等级形式 - “知道一点点”到5--“完美无缺”)
I想到一种算法将字符串分解为单词(这不是问题),然后循环遍历它们,检测这个单词是指德语还是英语(可能通过一些正则表达式,如/(deu|ger)/Ui
和/(eng)/Ui
),然后获得需求的级别棘手的部分),它应该放在下面或之前的词语中(或者根本不存在)。
对于如何创建这样的功能你有什么想法吗?
它应该运行在PHP7顺便说一句,但它是关于算法的想法在这里,而不是实现(还)。
更好的给力一致的输入不是试图破译任何可以想象的组合。 – AbraCadaver
可悲的是太迟了。数据库已经填满。它不一定非常完美。如果可能,我只是想检测。 –