2017-12-18 213 views
0

最近,我一直在试验phantomjs-node库。我想实现的目的基本上是创建一个动态网页模板,使用phantomjs-node库“运行”它,最后从渲染页面中提取一些数据。Node.js&co - 避免混合承诺和事件回调

在最简单的设置,解决这个第一次尝试看起来像这样(在下面的例子中,模板仅仅是静态的,但它可能会在原则上包含利用外部库的一些进一步的逻辑等):

var phantom = require('phantom'); 
var co = require('co'); 
var sleep = require('system-sleep'); 
var winston = require('winston'); 

const logger = new winston.Logger({ 
    level: 'debug', 
    transports: [new winston.transports.Console({ 
     json: false, timestamp:() => (new Date()).toLocaleString() 
    })] 
}); 

co(function*() { 
    logger.info('start'); 
    var instance = yield phantom.create(); 
    try { 
     const html = ` 
       <!DOCTYPE html> 
       <html> 
        <head> 
         <title>Page title</title> 
        </head> 
        <body> 
         <div id='results'>Page data</div> 
        </body> 
       </html> 
      `; 

     var page = yield instance.createPage();  

     yield page.on('onLoadFinished', function(){ 
      logger.info('onLoadFinished'); 

      page.evaluate(function(){ 
       return document.getElementById('results').textContent;  
      }).then(function(val){ 
       logger.info(`RESULT = ${val}`);  
      }).catch(function(val){ 
       logger.error(val.message);  
      }); 
     }); 

     yield page.setContent(html, 'http://localhost'); 

    }catch (e){ 
     logger.error(e.message);  
    }finally{ 
     instance.exit(); 
    } 
    logger.info('done'); 
}); 

然而,这种失败与输出:

12/18/2017, 2:44:32 PM - info: start 
12/18/2017, 2:44:33 PM - info: done 
12/18/2017, 2:44:33 PM - info: onLoadFinished 
12/18/2017, 2:44:33 PM - error: Phantom process stopped with exit code 0 

很可能是因为当page.evaluate返回的承诺的then -callback最后调用,主要幻象过程已经退出。

为了“修正”这一点,我使出以下即兴策略(省略了实施例的其余部分下方):

var page = yield instance.createPage(); 

    var resolver; 
    var P = new Promise(function(resolve, reject){ resolver = resolve; }); 

    yield page.on('onLoadFinished', function(){ 
     logger.info('onLoadFinished'); 

     resolver(page.evaluate(function(){ 
      return document.getElementById('results').textContent; 
     })); 
    }); 

    yield page.setContent(html, 'http://localhost'); 

    const val = yield P; 
    logger.info(`RESULT = ${val}`); 

这实质上创建一个新的承诺,这是“外部”与分辨诺言从page.evaluate返回。然后阻塞,直到所需的结果是准备好了,因此如预期在co块末尾的yield P语句的输出:

12/18/2017, 2:53:47 PM - info: start 
12/18/2017, 2:53:48 PM - info: onLoadFinished 
12/18/2017, 2:53:48 PM - info: RESULT = ..... 
12/18/2017, 2:53:48 PM - info: done 

尽管这似乎工作,感觉相当“哈克”(例如抛出异常在调用resolver之前的回调将不会在try/catch主块中检测到),所以我想知道为了将控制从onLoadFinished回调“转移”回到由co管理的领域,更简洁的方法是什么?

回答

2
  • 请勿使用co +生成器函数。 async/await在这里。
  • 是的,您应该将所有一次触发(最多)的事件回调转换为承诺。
  • 不,永远不要创造那样的承诺,并“在外部解决它们”。只需将解析它们的东西放入promise构造函数中即可。

(async function() { 
    logger.info('start'); 
    var instance = await phantom.create(); 
    try { 
     const html = `…`; 
     const page = await instance.createPage();  

     await new Promise((resolve, reject) => { 
      page.on('loadFinished', resolve); 
      page.on('resourceError', reject); // or something like that? 
      page.setContent(html, 'http://localhost'); // this doesn't appear to return a promise 
     }) 
     logger.info('onLoadFinished'); 

     try { // this extra inner try looks superfluous 
      const val = await page.evaluate(function(){ 
       return document.getElementById('results').textContent;  
      }); 
      logger.info(`RESULT = ${val}`); 
     } catch(e) { 
      logger.error(e.message);  
     } 
    } catch(e) { 
     logger.error(e.message);  
    } finally { 
     instance.exit(); 
    } 
    logger.info('done'); 
}()); 
+0

感谢您的详细评论!是否需要在'Promise'构造函数中嵌套另一个'async'函数?据我所知,'page.on'调用是异步的(或原则上返回另一个承诺),所以如果确实如此,原则上可能会发生'page.setContent'执行并在loadFinished'回调之前完成组? – ewcz

+0

@ewcz编号[永远不要将'异步函数'传递给'new Promise'构造函数](https://stackoverflow.com/a/43083793/1048572)! 'page.on'似乎没有返回一个承诺,这就是为什么我们要包装它(promisify它)。此外,*回调*是异步的,这意味着[它总是在'setContent'调用之后执行](https://stackoverflow.com/a/31099819/1048572)(也是因为它是由它造成的,所以它不会发生之前)。 – Bergi

+0

据我所知,回调本身是启动与内容被设置,我的意思,而不是通过'page.on'分配/注册回调操作 - 据我了解[源](https:// github。com/amir20/phantomjs-node/blob/master/src/page.js)基本上调用[execute](https://github.com/amir20/phantomjs-node/blob/master/src/phantom.js )函数返回一个promise(如果我在控制台输出'page.on'的返回值,我得到'Promise {}') – ewcz