我正在做一个简单的函数,应该从阿拉伯文字删除tashkeel,替换技术适用于英文,但不适用于阿拉伯文,你会建议什么? Lua代码: - function replacePartOfString(arg,old,new)
local zzz = arg.gsub(arg, old, new)
return zzz
end
function wordLengthIgnorin
我想通过用一个字符替换重复的字符来规格化阿拉伯文字符串。例如:单词 رااااائع
将被标准化为 رائع
我找到了适合英语(Python)的正则表达式: s="I loooooooooooooooooove you"
s = re.sub(r'(.)\1+', r'\1', s) // s= "I love you"
但是,这个正则表达式不起作用阿拉伯文字符串。我不认识这个事业。