2016-09-25 124 views
-1

我正在使用节点html-to-text包。但是,当我将HTML转换为文本图像路径也在该文件中。我只想要html的文本版本。我怎样才能做到这一点?如果有任何其他选项将html转换为文本,请让我知道。想要从文本文件中删除图像路径?

+0

SO假设一个编程问题,但我看不到任何代码在这里 –

回答

0

如果您使用的浏览器,然后让浏览器为你做..

function strip(html) 
{ 
    var tmp = document.createElement("DIV"); 
    tmp.innerHTML = html; 
    return tmp.textContent || tmp.innerText || ""; 
} 

编号:Strip HTML from Text JavaScript

进一步要删除图片的路径,你可以使用正则表达式或更换或简单的jquery函数并替换路径。

function strip(html) 
{ 
    var tmp = document.createElement("DIV"); 
    $('body img').removeAttr('src') 
    tmp.innerHTML = html; 
    return tmp.textContent || tmp.innerText || ""; 
} 

也可以尝试节点包https://github.com/werk85/node-html-to-text

+0

我使用同样的包节点的HTML文本转换,但得到的文本图像路径文件 – user6160824

+0

如果您在调用html-to-text之前使用浏览器,请尝试删除选定dom中的所有img标签并调用html-to-text。 –