面向开源社区的Web数据自动抽取技术研究与实现

登录注册

【周报】汇报 1.20 正常

由张方添加于 2016-01-20 23:27

在读王涛师兄给的论文时发现文章中描述的问题与我们的实际工作相关度并不是很高，于是自己也搜索了Web数据自动化抽取方面的文章，找到了几篇与我们工作紧密相关，与当前数据抽取过程中遇到的问题十分契合的论文，重点阅读了《基于自动生成模板的Web信息抽取技术》和《Automatic Extraction Rules Generation Based on XPath Pattern Learning》这两篇（附件），准备在周五报告。在读论文的过程中体会到文章一定要有针对性的看，这些文章的内容一定要紧密贴合实际工作中想要解决的问题，这样才不会浪费时间，这一点王涛师兄之前也多次强调。

基于自动生成模板的Web信息抽取技术.pdf

( 574.267 KB) 张方, 2016-01-20 23:25

Automatic Extraction Rules Generation Based on XPath Pattern Learning.pdf

( 288.822 KB) 张方, 2016-01-20 23:25

回复（1）▪ 赞

尹刚 10年前

很好！尽快理顺思路，形成问题，开展实验。寒假期间要完成开题报告的初稿的撰写。

赞回复︿

登录后可添加回复

当前状态新增
选定优先级正常
指派给张方
里程碑 --
开始日期 2016-01-20
结束日期
预计工时(H) 0.00 小时
完成度 0%
关联Commit 无

Trustie(确实)
QQ群：1071514693

头像设置