2016-11-04 56 views
1

我想在python上使用RestfulAPI。发送一串OCR文本到resAPI

在OCR a pdf之后,我想将文本发送到restfulAPI以获取特定单词以及它们在文本中的位置。我还没有设法将该字符串发送到API。

代码如下:

import requests 
import PyPDF2 
import json 

url = "http://xxapi.xxapi.org/xxx.util.json" 

pdfFileObj = open('/Users/xxx/pdftoOCR.pdf','rb') 
pdfReader = PyPDF2.PdfFileReader(pdfFileObj) 
pageObj = pdfReader.getPage(1) # To try with the text found in the first page 

data = {"text": pageObj.extractText()}  
data_json = json.dumps(data)  
params = {'text':'string'} 


r = requests.post(url, data=data_json, params=params) 
r1 = json.loads(r.text) 

虽然我从请求的响应200,该数据应该来以JSON格式需要轮询一些象征性的URL(我不`吨知道该怎么做)我也不认为这个请求是正确的,因为当我将标记url粘贴到浏览器时,即使我知道我想发送的文本片段包含一个空Json文件(无字,无位置)所需的单词。

在此先感谢!我的OS X,蟒蛇3.5

+0

与pdfReader.getPage(1)我的意思是第二页(从蟒蛇开始0)我学会了第一个R,而我是Python的新手 –

回答

0

好,非常感谢工作@ Jose.Cordova.Alvear解决这个问题

import json 
import requests 

pdf= open('test.pdf','rb') 
url = "http://xxapi.xxapi.org/xxx.util.json" 

payload = { 
    'file' :pdf 

    } 

response = requests.post(url, files=payload) 

print response.json()