我在查找使用YQL处理Web服务器日志文件的示例代码。YQL Web服务器日志文件正则表达式示例
YQL table for Apache access logs问:“Apache访问日志的表怎么样?” 到spullara回复:
如果加上像这样它可能会与基于正则表达式的行阅读器,你可以再申请到Apache日志。
后Paul Tarjan说:
现在有一个正则表达式表
http://developer.yahoo.com/yql/console/?q=select%20%20from%20regex%20where%20expression%20%3D%20%22%28。%29%22%20于是%20text%3D%22test%22 & ENV = HTTP%3A%2F%2Fdatatables.org%2Falltables.env
因此,它看起来正则表达式功能已被添加到YQL。
我希望看到一个完整的YQL示例,使用这个正则表达式使用this sample log file。下面是从the sample log file一行:
69.12.127.10 - - 02/Sep/2009:01:53:52 MDT "GET /holeman/cgi-bin/get_page.cgi?../cxx/sw_stack" HTTP/1.1 200 999 Mozilla/5.0 (X11; U; Linux x86_64; en-US; rv:1.9.1.2) Gecko/20090810 Ubuntu/9.10 (karmic) Firefox/3.5.2
显示只是IP地址和引用的页,其用于上述样品线将是:
69.12.127.10 /holeman/cgi-bin/get_page.cgi?../cxx/sw_stack
在保罗的Tarjan例如用于expression
和text
的值是硬编码。如何参考文件http://sky.prohosting.com/holeman/yql/serverlog/20090902.txt中的text
?另外,对于expression
如何使用参考而不是硬编码值?
正则表只在其查询中支持文本和表达式。所以,直到它支持一个url参数,它不能用于解析在线日志文件。 – seth 2009-09-03 03:50:43