2010-03-02 60 views

回答

3

尽管是可选的,但大多数RSS提要为每个项目提供了一个“guid”元素,这是一个唯一标识它的字符串。

如果要解析的提要提供了此类元素,则可以通过在某处存储GUID来保存已处理的项目,然后在提取提要时,可以验证每个项目是否已存储该GUID。 但是请记住也要保存发布的日期,因为某个项目可能在同一时间已更新。

不幸的是,GUID元素不是强制性的,所以如果Feed没有提供它,你可能不得不使用标题和描述的组合来检查它们。我的建议是使用SHA-1或MD5对描述进行散列处理,然后根据保存的散列检查新项目的描述。