今天看到一段代码,用于动态解析网页内容并表现为xml,虽然我不会PHP,但是思路认可借鉴。
下面的例子从http://www.oursci.org/news.htm 生成RSS Feed的PHP代码。效果看这个
[url=http://www.small-island.org/readnews/hackrss_.php/oursci.xml]http://www.small-island.org/readnews/hackrss_.php/oursci.xml[/url]
其实很简单,就是把网页抓下来,把各个条目分出来,然后把各个部分分开。关键是先通过读网页总结一下格式的特征,用正则表达式表达出来就好了。很简单的。
PS:你还需要分析一下搜索引擎的调用参数,比如中文Gooogle搜索是像这样。
http://www.google.com/search?q=要搜索的字符串&hl=zh-CN&ie=gb2312
PHP代码: