2017-10-09 103 views
0
from sanic import Sanic 
from sanic import response 


app = Sanic(__name__) 

@app.route('/v1/ok', methods=['GET']) 
async def post_handler(request): 
    return response.text("hey all good") 

if __name__ == '__main__': 
     app.run(host="0.0.0.0", port=8001, debug=True) 

我试图用sanic开发的REST API

这里是我的结论编写REST API的Python中:

我试着标杆这个使用运行wrk有50个线程GET API 30s测试。 拥有4GB内存的机器使用AWS EC2 t2.medium和2 CPU 命令使用

wrk -t50 -c4000 -d30s http://XXX.XX.XXX.XXX:8001/v1/ok

标杆结果

Running 30s test @ http://XXX.XX.XXX.XXX:8001/v1/ok 
50 threads and 4000 connections 
    Thread Stats Avg  Stdev  Max +/- Stdev 
    Latency 559.30ms 117.86ms 1.99s 94.47% 
    Req/Sec 41.92  44.33 361.00  86.14% 
    53260 requests in 30.10s, 6.70MB read 
    Socket errors: connect 1493, read 15631, write 0, timeout 4 
Requests/sec: 1769.21 
Transfer/sec: 228.06KB 

我的疑问是,我怎么能在

提高
  1. 超时请求的数量。目前它是4.它应该是零。
  2. 平均延迟,这是〜550ms(太多)

在POST请求的情况下,这是非常非常糟糕的,其中我试图加载keras模型,并做了预测。

这是代码写入问题吗?

OR

这是中信高科的限制?

我应该尝试其他REST框架吗?

P.S:我的烧瓶经验在等待时间和超时请求方面更糟糕。

import sys 
import os 
import json 
import pandas 
import numpy 
import optparse 
from keras.models import Sequential, load_model 
from keras.preprocessing import sequence 
from keras.preprocessing.text import Tokenizer 
from collections import OrderedDict 
from sanic import Sanic 
from sanic import response 
import time 

app = Sanic(__name__) 

@app.route('/v1/mal/prediction', methods=['POST']) 
async def post_handler(request): 
    csv_file = 'alerts.csv' 
    log_entry = request.json 
    dataframe = pandas.read_csv(csv_file, engine='python', quotechar='|', header=None) 
    dataset = dataframe.values 
    X = dataset[:,0] 
    for index, item in enumerate(X): 
     reqJson = json.loads(item, object_pairs_hook=OrderedDict) 
     del reqJson['timestamp'] 
     del reqJson['headers'] 
     del reqJson['source'] 
     del reqJson['route'] 
     del reqJson['responsePayload'] 
     X[index] = json.dumps(reqJson, separators=(',', ':')) 

    tokenizer = Tokenizer(filters='\t\n', char_level=True) 
    tokenizer.fit_on_texts(X) 
    seq = tokenizer.texts_to_sequences([log_entry]) 
    max_log_length = 1024 
    log_entry_processed = sequence.pad_sequences(seq, maxlen=max_log_length) 
    model = load_model('model.h5') 
    model.load_weights('weights.h5') 
    model.compile(loss = 'binary_crossentropy', optimizer = 'adam', metrics = ['accuracy']) 
    prediction = model.predict(log_entry_processed) 
    return response.text(prediction[0]) 

if __name__ == '__main__': 
     app.run(host="0.0.0.0", port=8000, debug=True) 

请提出更好的方法来改善API响应时间并减少超时请求吗?

回答

1

禁用debug并设置workers到CPU的数量在您的实例(2 t2.med):

app.run(host="0.0.0.0", port=8001, workers=2) 
+0

感谢输入,性能似乎已经改善了一下,这里的基准测试的比较'https:// jpst.it/166oe',但我认为还有很多事情可以做,以改善延迟和不。的每秒请求数。一些额外的输入将对我有很大的帮助。 – x0v