在读王涛师兄给的论文时发现文章中描述的问题与我们的实际工作相关度并不是很高,于是自己也搜索了Web数据自动化抽取方面的文章,找到了几篇与我们工作紧密相关,与当前数据抽取过程中遇到的问题十分契合的论文,重点阅读了《基于自动生成模板的Web信息抽取技术》和《Automatic Extraction Rules Generation Based on XPath Pattern Learning》这两篇(附件),准备在周五报告。在读论文的过程中体会到文章一定要有针对性的看,这些文章的内容一定要紧密贴合实际工作中想要解决的问题,这样才不会浪费时间,这一点王涛师兄之前也多次强调。