1
我想在python上使用RestfulAPI。发送一串OCR文本到resAPI
在OCR a pdf之后,我想将文本发送到restfulAPI以获取特定单词以及它们在文本中的位置。我还没有设法将该字符串发送到API。
代码如下:
import requests
import PyPDF2
import json
url = "http://xxapi.xxapi.org/xxx.util.json"
pdfFileObj = open('/Users/xxx/pdftoOCR.pdf','rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
pageObj = pdfReader.getPage(1) # To try with the text found in the first page
data = {"text": pageObj.extractText()}
data_json = json.dumps(data)
params = {'text':'string'}
r = requests.post(url, data=data_json, params=params)
r1 = json.loads(r.text)
虽然我从请求的响应200,该数据应该来以JSON格式需要轮询一些象征性的URL(我不`吨知道该怎么做)我也不认为这个请求是正确的,因为当我将标记url粘贴到浏览器时,即使我知道我想发送的文本片段包含一个空Json文件(无字,无位置)所需的单词。
在此先感谢!我的OS X,蟒蛇3.5
与pdfReader.getPage(1)我的意思是第二页(从蟒蛇开始0)我学会了第一个R,而我是Python的新手 –