Lowden

now

本周结节

 

学习计划(06.11-06.18

任务:HtmlParser的包,包括tags,nodesvisitors的掌握

要求:1、认真理解各包内的类, 2、测试各包内的各类, 3、能熟练综合运用上面的包。

分工:每两天解决一个包,最后一天综合运用

时间:每天上午两小时,下午两小时,晚上两小时

坚持坚持~~

步骤:

1、会将整个页面生成Node树(包括树的遍历,树的访问情况)

2、会判断Node的类型(判断各类型的有哪些node)

3、会调用不同类型的Node的成员函数(API

4、测试Tags里面的各个类的使用

5、测试用Visitors包内的类

结论:

1、·结点是以html为始开始计算,自定义标签的开头与结尾均算一个独立结点.

   ·html标签前的一个或多个换行算一个独立结点,html标签之后的一个或多个换行算一个独立结点

   ·html之前或之后的一个或多个字符算各算一个独立结点

   ·Node树的遍历,编写函数.完成了Node结点的高度求解。并不知道父子关系

   ·树的生成是按照嵌套来的,类似于树的定义

2、·RearkNode一般时div标签等,TextNode是文本内容,TagNode是除了前两项的所有标签

3、·测试各Tags内的成员函数

4、·找到一个环境,知道什么时候会用Visitors里的包

   ·再测试各类

posted on 2009-06-20 01:56 Lowden 阅读(37) 评论(0)  编辑  收藏 所属分类: Java - HtmlParser

My Links

Blog Stats

常用链接

留言簿

随笔分类

随笔档案

文章分类

文章档案

好友链接

搜索

最新评论

阅读排行榜

评论排行榜