2016-06-09 86 views
2

我在这里所描述的确切问题:从字符串中删除Niqqud在JavaScript

removing Hebrew "niqqud" using r

一直在努力去除niqqud(用变音标志代表元音或的字母替代的发音区别希伯来字母)。我有例如这个变量:sample1 < - “הֻסְמַק”

而我找不到有效的方式来删除字母下的标志。

但在我的情况下,我必须在javascript中执行此操作。

根据描述的UTF-8值表here,我试过这regex没有成功。

回答

4

只是你的正则表达式的一个小问题。请尝试以下操作:

const input = "הֻסְמַק"; 
console.log(input) 
console.log(input.replace(/[\u0591-\u05C7]/g, '')); 

/* 
$ node index.js 
הֻסְמַק 
הסמק 
*/ 
+0

文本中存在Maqaf('u5BE')问题。它被删除,并且两个单词连接在一起。例如_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ – Avraham