我需要帮助创建一个轮询文件创建,然后处理在scala中创建的函数的scala服务。让我简单介绍一下我在做什么。Scala文件轮询器设计
我正在使用基于python的工具scrappy在一些财务网站上搜索数据,并在我的linux系统上创建存储为csv文件。当csv创建完成时,它还会在目录中创建一个完整的文件。那个奇怪的文件产生了47个csv文件,并且因此完成了45个完整的文件。
我已经了解到(虽然对它很新颖)scala,并在scala中编写了csv分析器和mongo db loader。它工作正常,如果它单独运行,但我需要一个机制在斯卡拉这是
- 像服务.i.e。过程应该在一天中的某个时间开始,并在一天的特定时间停止。
- 在该服务活动期间,应查看完整文件夹并以多线程方式运行每个文件。
例如在完整的目录中,它将写入2个文件NASDAQ_20141114.com和NYSE_20141114.com。该服务应该为纳斯达克和纽约证券交易所启动2个孩子。
我试过看阿卡,但它看起来很复杂。
请帮助和建议的东西。