2
我在这里所描述的确切问题:从字符串中删除Niqqud在JavaScript
removing Hebrew "niqqud" using r
一直在努力去除niqqud(用变音标志代表元音或的字母替代的发音区别希伯来字母)。我有例如这个变量:sample1 < - “הֻסְמַק”
而我找不到有效的方式来删除字母下的标志。
但在我的情况下,我必须在javascript中执行此操作。
根据描述的UTF-8值表here,我试过这regex没有成功。
文本中存在Maqaf('u5BE')问题。它被删除,并且两个单词连接在一起。例如_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ – Avraham