【问题标题】:Dial tcp I/O timeout on simultaneous requests在同时请求时拨打 tcp I/O 超时
【发布时间】:2019-01-31 16:23:06
【问题描述】:

我正在用 Go 构建一个工具,它需要向许多不同的服务器同时发出大量的 HTTP 请求。我在 Python 中的初始原型可以同时处理数百个请求。

但是,我发现在 Go 中,如果同时请求的数量超过 ~30-40,这几乎总是会导致 Get http://www.google.com: dial tcp 216.58.205.228:80: i/o timeout

我已经在 macOS、openSUSE、不同的硬件、不同的网络和不同的域列表上进行了测试,并且按照 Stackoverflow 其他答案中的描述更改 DNS 服务器也不起作用。

有趣的是,失败的请求甚至不会产生数据包,这可以在使用 Wireshark 进行检查时看到。

我做错了什么还是 Go 中的错误?

以下最小可重现程序:

package main

import (
    "fmt"
    "net/http"
    "sync"
)

func main() {
    domains := []string{/* large domain list here, eg from https://moz.com/top500 */}

    limiter := make(chan string, 50) // Limits simultaneous requests

    wg := sync.WaitGroup{} // Needed to not prematurely exit before all requests have been finished

    for i, domain := range domains {
        wg.Add(1)
        limiter <- domain

        go func(i int, domain string) {
            defer func() { <-limiter }()
            defer wg.Done()

            resp, err := http.Get("http://"+domain)
            if err != nil {
                fmt.Printf("%d %s failed: %s\n", i, domain, err)
                return
            }

            fmt.Printf("%d %s: %s\n", i, domain, resp.Status)
        }(i, domain)
    }

    wg.Wait()
}

出现了两条特定的错误消息,一条没有任何意义的 net.DNSError 和一条无法描述的 poll.TimeoutError

&url.Error{Op:"Get", URL:"http://harvard.edu", Err:(*net.OpError)(0xc00022a460)}
&net.OpError{Op:"dial", Net:"tcp", Source:net.Addr(nil), Addr:net.Addr(nil), Err:(*net.DNSError)(0xc000aca200)}
&net.DNSError{Err:"no such host", Name:"harvard.edu", Server:"", IsTimeout:false, IsTemporary:false}

&url.Error{Op:"Get", URL:"http://latimes.com", Err:(*net.OpError)(0xc000d92730)}
&net.OpError{Op:"dial", Net:"tcp", Source:net.Addr(nil), Addr:net.Addr(nil), Err:(*poll.TimeoutError)(0x14779a0)}
&poll.TimeoutError{}

更新:

使用单独的 http.Client 以及 http.Transportnet.Dialer 运行请求没有任何区别,正如从 this playground 运行代码时可以看到的那样。

【问题讨论】:

  • 您正在使用 http.DefaultClient 发出所有请求。当您通过几个独立的 http 客户端分发请求时会发生什么?可能连接池仅限于一定数量的连接。
  • 重新编写了您的代码 (play.golang.org/p/HnKdFG5roj-),是的,我还发现一些结果相当可疑。不知道为什么它不能解决 web.mit.edu/fda.gov/geocities.jp/clickbank.net。但是恕我直言,它与并发率无关。
  • 在路上也发现了这个,2018/08/25 17:24:53 Unsolicited response received on idle HTTP channel starting with "HTTP/1.0 408 Request Time-out\r\nServer: AkamaiGHost\r\nMime-Version: 1.0\r\nDate: Sat, 25 Aug 2018 15:24:53 GMT\r\nContent-Type: text/html\r\nContent-Length: 218\r\nExpires: Sat, 25 Aug 2018 15:24:53 GMT\r\n\r\n&lt;HTML&gt;&lt;HEAD&gt;\n&lt;TITLE&gt;Request Timeout&lt;/TITLE&gt;\n&lt;/HEAD&gt;&lt;BODY&gt;\n&lt;H1&gt;Request Timeout&lt;/H1&gt;\nThe server timed out while waiting for the browser's request.&lt;P&gt;\nReference&amp;#32;&amp;#35;2&amp;#46;3ff90a17&amp;#46;1535210693&amp;#46;0\n&lt;/BODY&gt;&lt;/HTML&gt;\n"; err=&lt;nil&gt;
  • 是的,和我之前的测试很相似,40次左右失败。还有一些我不安静,因为挖掘解决了它们。甚至googleusercontent.com 也经常失败。另见github.com/golang/go/issues/18588。我在 1.10 上运行它,我还没有花时间切换到 1.11,可能值得测试。
  • @Neverbolt 鉴于 GIL,python 代码很可能会变慢。很惊讶没有 DNS 工具来测量 QPS。在gopacket 中执行似乎很简单,但通过ebpf 实现可能更有用。

标签: http go network-programming go-http


【解决方案1】:

我认为您的许多net.DNSErrors 实际上是伪装的too many open files 错误。您可以通过运行带有netgo 标签 (recommendation from here) (go run -tags netgo main.go) 的示例代码来看到这一点,这将发出如下错误:

…dial tcp: lookup buzzfeed.com on 192.168.1.1:53: dial udp 192.168.1.1:53: socket: too many open files

而不是

…dial tcp: lookup buzzfeed.com: no such host

确保您正在关闭请求的响应正文 (resp.Body.Close())。您可以在What's the best way to handle "too many open files"?How to set ulimit -n from a golang program? 找到有关此特定问题的更多信息。 (在我的机器 (macOS) 上,手动增加文件限制似乎有帮助,但我认为这不是一个好的解决方案,因为它并不能真正扩展,而且我不确定您总共需要多少打开文件。 )


正如@liam-kelly 所建议的,我认为i/o timeout 错误来自DNS 服务器或其他一些安全机制。设置自定义(错误)DNS 服务器 IP 会给我同样的错误。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2018-09-12
    • 1970-01-01
    • 2022-01-22
    • 2019-08-21
    • 1970-01-01
    • 2019-12-31
    • 1970-01-01
    • 2021-09-11
    相关资源
    最近更新 更多