大三开始加入了实验室,说来惭愧,毫无成果。
再这样下去真不知道保研后,实验室的老师能不能收留我。
为了监督自己学习,特开此博客,记录下读论文的点点滴滴。
真正开始读论文,是从这篇开始《Entity Matching:How Similar is Similar》。说来也巧,论起渊源,论文的作者Wang Jiannan和Li Guoliang都是在哈工大读的本科,然后到清华读硕士,博士。实验室的老师王宏志貌似和他们很熟的样子,可能当年是同学。Li Guoliang现在又开始在工大招收博士了,只是我没这份能力,连申请的胆量都没有。
计划写的下一篇博客便是这份论文的笔记。总不能等到Latex完全学会了再来写论文吧,到时候黄花菜都凉了。
然后下一篇,《MinWise Independent Permutations(extended abstract)》。这篇论文是我在读另一篇论文《Hashing Tree-Structured Data: Methods and Applications》时,里面直接应用的算法。据推测应该是比较经典的方法吧。无奈我见识太短,只好找来论文拜读,等读懂个大概,在老师面前也好抬起头来。
第三篇《Hashing Tree-Structured Data: Methods and Applications》,有了上一篇的基础,这份笔记才写的出来。
上面两篇都是对树结构数据进行HASH的方法。我的课题是XML实体识别,而XML一般公认为树状结构数据。当然,XML数据也可以用图结构来表示。这就不得不提到王宏志老师和骆吉洲老师的那篇论文《Hashbased Subgraph Query Processing Method for Graphstructured XML Documents》。暂时读不下来这篇文章。等上面的论文2和论文3的笔记写完, 再编写一份演示程序。
有了上面的基础,仿照论文1,融合一下论文3,希望可以写出一份paper。
post:Latex学习起来还是需要一定时间的。在实践中学习,加把劲。
(=@__@=)先写这些。