在 Common Lisp 中抓取 HTML 表格？

【问题标题】：Scraping an HTML table in Common Lisp?在 Common Lisp 中抓取 HTML 表格？
【发布时间】：2011-01-22 02:14:29
【问题描述】：

我想从包含在 HTML

中的网页中提取一些信息。怎样才能把所有的表信息提取成一个不错的|分开的文件？作者|书籍|年份|评论比尔·布赖森|几乎所有事物的简史|2004 斯蒂芬霍金|时间简史|1998|还没读完。

理想情况下，我想要一个函数，将 URL 和输出文件作为参数，然后给出上述输出。

(defun 提取表 (url 文件名) （从 html 表中提取（获取网页 url）））（提取表“http://www.mypage.com”“output.txt”）

上述输出的示例 HTML 输入：

Lisp

欢迎使用 Lisp

作者	图书	年份	评论
比尔·布莱森	几乎所有事物的简史	2004
史蒂芬·霍金	时间简史	1998	还没读完。

正文>

标签： common-lisp

【解决方案1】：

从Drakma 开始获取数据。要解析这件事，您可能会发现 cxml 很有帮助。或者更好：您可以使用closure-html，它应该解析任意HTML 4。closure-html 包的Common-Lisp.net 页面有一个screen scraping example。

【讨论】：

猜你喜欢

1970-01-01
2022-01-04
1970-01-01
2011-03-31
1970-01-01
1970-01-01
1970-01-01
2015-08-15
1970-01-01

相关资源

下载 2022-11-30
下载 2022-12-17
下载 2023-01-25

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode