2017-10-13 78 views
0

下面是我的代码,它抓取数据并将数据转换为CSV文件(这是工作)。我试图只关注当前日期返回的数据。如何抓取当前日期的数据 - Python

有人可以告诉我这是怎么做的,DTDT是日期。 我的代码:

from elasticsearch import Elasticsearch 
import csv 

es = Elasticsearch(["9200"]) 

# Replace the following Query with your own Elastic Search Query 
res = es.search(index="search", body= 
       { 
        "_source": ["DTDT", "TRDT", "SPLE", "RPLE"], 
        "query": { 
         "bool": { 
          "should": [ 
           {"wildcard": {"CN": "TEST*"}} 

          ] 
         } 
        } 
}, size=10) 



header_names = { 'DTDT': 'DATE', 'TRDT': 'TIME', ...} 

with open('mycsvfile.csv', 'w') as f: # Just use 'w' mode in 3.x 
    header_present = False 
    for doc in res['hits']['hits']: 
     my_dict = doc['_source'] 
     if not header_present: 
      w = csv.DictWriter(f, my_dict.keys()) 
      w.writerow(header_names) # will write DATE, TIME, ... in correct place 
      header_present = True 


     w.writerow(my_dict) 

例如,我只想从午夜返回数据,直到下午2时(使用当前日期)。

回答

0

您可以使用范围过滤器做到这一点:

{ 
    "_source": [ 
    "DTDT", 
    "TRDT", 
    "SPLE", 
    "RPLE" 
    ], 
    "query": { 
    "bool": { 
     "should": [ 
     { 
      "wildcard": { 
      "CN": "TEST*" 
      } 
     } 
     ], 
     "must": [ 
     { 
      "range": { 
      "DTDT": { 
       "gte": "now/d", 
       "lte": "now+1d/d" 
      } 
      } 
     } 
     ] 
    } 
    } 
} 

*编辑,以范围与舍入当前日历天,而不是过去的24小时。

+0

嗨迈克,它现在只抓取当前日期的数据,但是,通配符不再工作。它抓住了所有的用户,而不仅仅是那些用名字进行测试的用户。 – Rich