纪念博客开通

大三开始加入了实验室，说来惭愧，毫无成果。

再这样下去真不知道保研后，实验室的老师能不能收留我。

为了监督自己学习，特开此博客，记录下读论文的点点滴滴。

真正开始读论文，是从这篇开始《Entity Matching：How Similar is Similar》。说来也巧，论起渊源，论文的作者Wang Jiannan和Li Guoliang都是在哈工大读的本科，然后到清华读硕士，博士。实验室的老师王宏志貌似和他们很熟的样子，可能当年是同学。Li Guoliang现在又开始在工大招收博士了，只是我没这份能力，连申请的胆量都没有。

计划写的下一篇博客便是这份论文的笔记。总不能等到Latex完全学会了再来写论文吧，到时候黄花菜都凉了。

然后下一篇，《MinWise Independent Permutations(extended abstract)》。这篇论文是我在读另一篇论文《Hashing Tree-Structured Data: Methods and Applications》时，里面直接应用的算法。据推测应该是比较经典的方法吧。无奈我见识太短，只好找来论文拜读，等读懂个大概，在老师面前也好抬起头来。

第三篇《Hashing Tree-Structured Data: Methods and Applications》，有了上一篇的基础，这份笔记才写的出来。

上面两篇都是对树结构数据进行HASH的方法。我的课题是XML实体识别，而XML一般公认为树状结构数据。当然，XML数据也可以用图结构来表示。这就不得不提到王宏志老师和骆吉洲老师的那篇论文《Hashbased Subgraph Query Processing Method for Graphstructured XML Documents》。暂时读不下来这篇文章。等上面的论文2和论文3的笔记写完，再编写一份演示程序。

有了上面的基础，仿照论文1，融合一下论文3，希望可以写出一份paper。

post：Latex学习起来还是需要一定时间的。在实践中学习，加把劲。

(=@__@=)先写这些。