我正在刮一个静态html网站并将内容移动到数据库支持的CMS。我想在CMS中使用Textile。如何将HTML转换为Textile?
是否有一个工具可以将HTML转换为Textile,所以我可以刮掉现有网站,将HTML转换为Textile,并将数据插入数据库?
我正在刮一个静态html网站并将内容移动到数据库支持的CMS。我想在CMS中使用Textile。如何将HTML转换为Textile?
是否有一个工具可以将HTML转换为Textile,所以我可以刮掉现有网站,将HTML转换为Textile,并将数据插入数据库?
这是一个简单的标记替换,没有一个好的正则表达式无法修复。
我建议的Perl,LWP ::简单一些正则表达式做这件事(蜘蛛,剥设计和菜单,转换为纺织品,然后发布到数据库。)
这里是一个c# lib converting html 2 textile。虽然它是纺织品与他们的补充。不是纯纺织品。
我知道这是一个古老的问题,但我发现自己试图做这个有一天,没有找到任何有用的东西,直到我找到Pandoc。它也可以转换其他标记格式的负载 - 这相当出色。
试试这个简单的Java代码,希望它为你工作
import java.net.*;
import java.io.*;
class Crawle
{
public static void main(String ar[])throws Exception
{
URL url = new URL("https://www.google.co.in/#q=i+am+happy");
InputStream io = url.openStream();
BufferedReader br = new BufferedReader(new InputStreamReader(io));
FileOutputStream fio = new FileOutputStream("crawler/file.txt");
PrintWriter pr = new PrintWriter(fio,true);
String data = "";
while((data=br.readLine())!=null)
{
pr.println(data);
System.out.println(data);
}
}
}
}
与Textile无关 – cmroanirgo 2017-03-21 09:22:57
由于没有JavaScript实现,我写了一个: https://github.com/cmroanirgo/to-textile
这是此刻有点简陋,因为它是一个盲人相当于“降价”的端口,但应完成工作。
但你会失去风格和其他的东西。那么你可以转换为Markdown。 – Bruno 2016-12-06 00:04:49