实施分布式grep

我正在尝试实现分布式grep。我如何从不同的系统访问日志文件？我知道我需要使用网络，但我不知道您是否使用ssh，telnet或其他任何东西？我需要了解哪些机器将从我的机器连接到哪些机器？我希望能够连接到不同的Linux机器并读取其日志文件并将其传回到我的机器。实施分布式grep

来源

2014-09-01 user3521929

这一切都取决于你的用例，现在这个问题太宽泛了。 – 2014-09-01 02:48:28

您可以配置rsyslogd将日志发送到中央服务器。 – 2014-09-01 05:13:13

您的系统包含许多可生成日志数据的Linux机器（SERVER），以及您操作的一台机器（CLIENT）。对？

问题1）要访问的文件。通常，日志文件被生成日志数据的软件锁定，因为软件必须能够随时将数据写入日志文件。要从其他软件访问日志文件，您需要准备解锁的日志数据文件。软件安装程序/软件（程序）本身的一些修改。

问题2）为日志文件提供服务的程序。要从SERVER获取日志数据，每个SERVER必须运行一些服务器程序。对于远程shell访问，需要rshd（远程shell deamon）。（ssh是rsh和安全通信的组合）。对于FTP访问，需要ftpd（文件传输协议deamon）。需要的软件取决于CLIENT如何访问SERVER。

问题3）分发了grep。您使用单词'distribued grep'。你的意思是什么？什么是分布在你的'分布式grep'？许多senarios在我心中。 a）日志文件在SERVER中分发。所有的日志数据都被收集到客户端，并且grep程序在CLIENT上收集日志数据。 b）日志文件在SERVER中分发。 Grep函数也在每个SERVER上实现。 CLIENT向每个SERVER请求获取应用于日志数据的grep结果，并将结果收集到CLIENT。等你的计划是什么？

问题4）访问SERVER。安全通信的必要性取决于它们之间的机器和网络的位置。如果所有机器都在一个房间内，并且机器之间的网络没有连接到互联网，则不需要安全通信。如果日志数据是绝密的，您可能需要在网络上发送数据之前引用数据。您的日志数据如何重要？

在开发的最初阶段，您应该确定上述内容。这是我的建议。

来源

2014-09-01 05:08:44

实施分布式grep

回答

相关问题