2010-11-14 82 views
1

我知道防止人们窃取我们的数据是不可能的,但是我有一个大型数据库,并且我想至少防止自动脚本窃取我的数据库。防止数据被盗取

我的想法而已:

  • 使用的JavaScript或HTML编码=很重,很容易被解码
  • 验证码的搜索=没办法,用户将刚刚离开我的网站
  • 插入随机数据和标签在网站的HTML,以避免正则表达式rip =好?

任何想法表示赞赏。

+1

这不是一个值得的努力。花时间担心人们窃取你的数据是浪费时间。你可能会担心人们会阅读你的数据,并将它“复制”到他们的大脑中。 *通过设计*,无法让浏览器显示数据,同时防止复制数据。 – meagar 2010-11-14 17:53:33

回答

0

我认为Alexa将随机标签插入标记,它给了我一段时间,当我试图挖掘它......他们在Alexa排名中加入了一些额外的标签,如<span class="a5r">35</span><span class="et4">52</span><span class="arer">16</span>,除非您下载了样式并且看着渲染规则,你无法弄清楚应该是什么数字。

但是......如果我足够耐心,我可以“渲染”数字然后挖掘它,但这对我来说并不值得。将页面请求限制为可能的人数可能会运作良好(50 /分钟或其他)。

2

为什么人们想窃取你的数据库?为什么他们这样做很重要?会问他们不够?

明确您的政策并确保您的公司法务部门已检查过措辞。通过明确表示不允许,并阻止未经授权的联合,您将采取法律措施来阻止它。

还是更好,鼓励授权联合。如果没有合理的方式让他们以授权的方式这样做,人们只会进行未经授权的联合。

技术措施可能会产生一些影响,但只会阻止那些不具备专业能力或决心的人。

1

您提出的这些解决方案都不起作用。一位好的剧本作家可以轻松绕过这些。但是,在应用服务器端有一个技术解决方案:实现速率限制。每10秒钟只允许从一个给定的IP地址进行一次搜索。这将使您的网站的自动数据挖掘非常缓慢。