【发布时间】:2012-10-04 07:01:43
【问题描述】:
我构建了一个网络爬虫,但它是单线程的。现在我正在扩展它以使用多个线程。我无法理解以下内容:
- 我应该创建多少个线程?它应该是一个固定的数字还是一个动态的,根据持有 URI 的队列的长度而变化? (也考虑到可用内存)
- 我已经通过可运行接口为线程创建了一个新类,我希望每个线程的
run方法能够访问我在调用thread.start()的Main 类中创建的对象。我应该如何从每个线程访问这个对象?
我正在使用 NetBeans。
【问题讨论】:
-
1.使用线程池,您不必携带线程数。您可以根据当前的 cpu 数量创建它们。 (更准确的信息,-> anserws)
标签: java multithreading web-crawler