2014-09-01 78 views
0

我正在尝试实现分布式grep。我如何从不同的系统访问日志文件?我知道我需要使用网络,但我不知道您是否使用ssh,telnet或其他任何东西?我需要了解哪些机器将从我的机器连接到哪些机器?我希望能够连接到不同的Linux机器并读取其日志文件并将其传回到我的机器。实施分布式grep

+0

这一切都取决于你的用例,现在这个问题太宽泛了。 – 2014-09-01 02:48:28

+0

您可以配置rsyslogd将日志发送到中央服务器。 – 2014-09-01 05:13:13

回答

1

您的系统包含许多可生成日志数据的Linux机器(SERVER),以及您操作的一台机器(CLIENT)。对?

问题1)要访问的文件。 通常,日志文件被生成日志数据的软件锁定,因为软件必须能够随时将数据写入日志文件。 要从其他软件访问日志文件,您需要准备解锁的日志数据文件。 软件安装程序/软件(程序)本身的一些修改。

问题2)为日志文件提供服务的程序。 要从SERVER获取日志数据,每个SERVER必须运行一些服务器程序。 对于远程shell访问,需要rshd(远程shell deamon)。 (ssh是rsh和安全通信的组合)。 对于FTP访问,需要ftpd(文件传输协议deamon)。 需要的软件取决于CLIENT如何访问SERVER。

问题3)分发了grep。 您使用单词'distribued grep'。你的意思是什么? 什么是分布在你的'分布式grep'? 许多senarios在我心中。 a)日志文件在SERVER中分发。所有的日志数据都被收集到客户端,并且grep程序在CLIENT上收集日志数据。 b)日志文件在SERVER中分发。 Grep函数也在每个SERVER上实现。 CLIENT向每个SERVER请求获取应用于日志数据的grep结果,并将结果收集到CLIENT。 等 你的计划是什么?

问题4)访问SERVER。 安全通信的必要性取决于它们之间的机器和网络的位置。 如果所有机器都在一个房间内,并且机器之间的网络没有连接到互联网,则不需要安全通信。 如果日志数据是绝密的,您可能需要在网络上发送数据之前引用数据。 您的日志数据如何重要?

在开发的最初阶段,您应该确定上述内容。 这是我的建议。