2010-11-10 68 views
2

我张贴在另一个线程以下问题:机械土耳其人工作吗?

“有谁知道,可以从PHP这将有效地去除如电话号码,电子邮件地址,联系人信息,甚至从文档联系地址使用一个好的解决方案吗? “

我很快就告诉我怀疑......我要求得太多了:)

所以现在我正在寻找替代方案。我正在考虑使用亚马逊的Mechanical Turk来删除联系信息。

那么两个问题呢?

  1. 这会非常适合机械特克吗?
  2. 服务的有效性如何?
+2

大概你是为了隐私的原因这么做的。但是你正在考虑通过将数据发送给许多你不认识的随机人来完成工作? – 2010-11-10 16:16:34

+0

这就是MicroTask.com的商业模式。 (我不隶属于他们。) – John 2010-11-10 16:32:34

回答

2

结帐http://www.microtask.com。 (我不隶属于这家公司)

您可能可以使用正则表达式建立一个宽网络,然后让人类工作人员筛选出真实地址,电话号码和电子邮件地址。对于某人来说,“诸如此类”是一个地址,电话号码还是电子邮件地址是一个相当直接的问题。因为他们将表格剪掉(或者说他们这样做 - 我没有用过),您没有太多担心隐私的担忧,或者可以证明他们是正确的。如果MicroTask拥有数百个客户,他们能够做的就是把所有的微任务拿到一个巨大的漏斗中,随机分配每个工人看到的漏斗。因此,他们几乎可以保证工人几乎没有任何手段来关联他们工作的任何敏感信息。每个工作人员每天都会看到数千条独立的信息。在这些情况下,谁能够在第1天看到任务347的电子邮件地址对应于第3天的任务1133?即使他们可以,这对他们来说也不值得。他们可能会做更多的钱,只是做他们所要求的。

+0

谢谢约翰我会看看。不用担心隐私,因为无论如何,用户都可以公开提供内容。 – Introgy 2010-11-10 16:25:30

+0

是URL正确的约翰,当我尝试它时没有工作。 – Introgy 2010-11-10 16:26:20

+0

谢谢...纠正它。 – John 2010-11-10 16:32:01