2014-11-04 80 views
1

我收到的XML文件可能不完整,在这种情况下,我需要忽略它们。如何检查XML是否在Elixir中格式正确

我正在使用包装xmerl的SweetXml。

我有两个属性之间没有空格的示例格式错误的XML。

没有is_well_formed函数 - 有一个简单的布尔响应会很好。

Xmerl尝试解析文件,不喜欢它,因此发送出口。

我还没有听说过主管,但这在我看来就像是一个案例。

是否有菜鸟或简单的方式来处理退出信号?

defmodule XmlIsWellFormed.WellFormed do 
    def is_well_formed(xml) do 
    import SweetXml 
    xml_string = to_string xml 
    result = xml_string |> parse # parse sends exit. 

    # FYI - SweetXml.parse : 
    # def parse(doc) do 
    #  {parsed_doc, _} = :xmerl_scan.string(doc) 
    #  parsed_doc 
    # end 

    # Note:  inspecting result is no use because xmerl sends an exit with: 
    #   "whitespace_required_between_attributes" 

    # Something like this would be handy: 
    # try do 
    #  result = :xmerl_scan.string(xml) 
    # rescue 
    #  :exit, _ -> nil 
    # end 
    end 
end 

rubbish_xml = '<rubbishml><html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="en-US"xmlns:og="http://ogp.me/ns#" xmlns:fb="http://www.facebook.com/2008/fbml"></rubbishml>' 
XmlIsWellFormed.WellFormed.is_well_formed rubbish_xml 
+0

也许我在这里错过了一些东西,但是您评论过的尝试/救援代码有什么问题? – 2014-11-05 00:43:24

回答

3

您使用了try/rescue,它只拦截异常。退出,而另一方面,可以用try/catch construct截获:

def is_well_formed(xml) do 
    try do 
    xml |> to_string |> parse 
    true 
    catch 
    :exit, _ -> false 
    end 
end 

IEX将打印退出消息到控制台,但程序将继续执行:

iex> XmlIsWellFormed.WellFormed.is_well_formed ~s(<a b=""c=""/>) 
3437- fatal: {whitespace_required_between_attributes} 
false 

iex> XmlIsWellFormed.WellFormed.is_well_formed ~s(<a b="" c=""/>) 
true 

然而,catch荷兰国际集团在Elixir中非常罕见。你应该用监督树来设计你的应用程序,以便它知道如何正确地重新生成自己。那么你可以只需let it crash,主管将负责其余的事情。

+1

谢谢。我确信我会蛮横逼迫所有组合 - 我现在对我错过的东西感到困惑。我认为主管将是正确的方式,但这是我第一个药剂周,并认为这应该是第二周的材料。并且| | to_string |> - 当然! – 2014-11-05 13:22:35

相关问题