`
mmdev
  • 浏览: 12894111 次
  • 性别: Icon_minigender_1
  • 来自: 大连
文章分类
社区版块
存档分类
最新评论

iOS解析HTML

 
阅读更多

xml,json都有大量的库来解析,我们如何解析html呢?

TFHpple是一个小型的封装,可以用来解析html,它是对libxml的封装,语法是xpath。

今天我看到一个直接用libxml来解析html,参看:http://www.cocoanetics.com/2011/09/taming-html-parsing-with-libxml-1/#comment-3090那张图画得一目了然,很值得收藏。这个文章中的源码不能遍历所有的html,我做了一点修改可以将html遍历打印出来



不过我还是喜欢用TFHpple,因为它很简单,也好用,但是它的功能不是很完完善。比如,不能获取children node,我就写了两个方法,一个是获取children node,一个是获取所有的contents. 还有node的属性content的key与node's content的key一样,都是@"nodeContent", 正确情况下属性的应是@"attributeContent",

所以我写了这个方法,同时修改node属性的content key.


TFHppleElement.m里加了两个key 常量


并修改获取属性方法为:


并添加获取children node 方法:



最后我还加了一个获取所有content的主法:


请看源码



参看:http://giles-wang.blogspot.com/2011/08/iphoneansi.html







分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics