2017-07-28 50 views
0

我的数据管道 - >从Web服务器获取UTF-8编码的数据

Web服务器 - >资料撷取通过管道 - > Solr的

在Nifi利用GetHTTP处理器,我从读书Web服务器。处理器正在与Accept Content-Type = content-type: text/plain; charset=utf-8合作。但是,当我在Solr中加载这些内容时,我会看到奇怪的字符。

当文件是通过浏览器下载(从服务器上),我看到了一个不同的一组奇怪的字符(包括在浏览器窗口,并在诸如记事本编辑++)

横跨整个管道,我有工作仅限UTF 8字符集。

有什么能看到Solr中,浏览器和下载的文件不同人物的理由(记事本++ - 编码成UTF-8)

+0

GetHTTP后可以存储文件(PutFile)并发布有问题吗?你也说过你可以用浏览器下载文件。你可以比较文件吗?或发布第二个文件.. – daggett

回答

0

我用InvokeHTTP代替GetHTTP或任何其他处理器做一些类似的HTTP动作。 调用HTTP云帮助您了解详细信息。使用此处理器并将响应保存在文件中共享我们云帮助您的这个文件。或者您可以更改处理器中的调试lv,然后查看日志。