我目前正在将内容从一个非常旧的网站迁移到一个新网站。新网站有一个新的结构,所以我只想复制主要内容 - 主要是标题,段落和图像。新网站使用Wordpress。目前,我将进入每个页面,复制内容,在Wordpress中创建一个新页面,粘贴内容,然后发布它。自动网站迁移技术
我想到可能有更好的做法比蛮力。我想也许我可以编写一个机器人脚本来访问旧网站上的每个页面,复制我想要的内容,并根据需要重新设置它的格式,然后将其返回给我。
我不知道这是否可能。我甚至想过让它更进一步,然后让机器人登录到新网站的Wordpress仪表板,根据需要自动创建页面,并在适当的位置输入内容。
我的后端技能是非常基本的,但我的倾向是说这是可能的。我的问题是,是否有可能,如果是这样,你能指出我在正确的方向,我需要学习做什么吗?我会使用PHP,这是我最熟悉的。
当然可能,但是对于SO来说太宽泛了 - 你可以用几百种编程语言中的任何一种编写bot。 – Steve
'file_get_contents'是一种使用'php'获取网页html内容的方法。虽然取决于网站,但可能会变得很sl。。 http://php.net/manual/en/function.file-get-contents.php – mattslone
如果你想为了教育目的做到这一点,那么首先写出你的程序需要做的步骤。然后选择一种程序语言并研究每一步,如果遇到困难,将返回到SO,并提出具体问题(包括代码尝试) – Steve