【发布时间】:2021-09-02 18:25:57
【问题描述】:
我正在尝试将终端输出流(在终端 T1 中)转发到本地主机端口,在终端 T2 上收听。然后,使用一个简单的 Python 套接字脚本来捕获该流数据并将其打印出来。我在 ubuntu 命令中引用了 this post,在 Python 套接字脚本中引用了 this post:
情况1: 在终端 T2 中,我首先运行:监听 2003 端口
nc -l 2003
然后在终端 T1 中运行流式传输命令 (Kafka)。 kafka 服务器在 9092 端口:
.bin/kafka-console-consumer --topic <topic_name> --from-beginning --bootstrap-server <dns:port> | pv | netcat localhost 2003
在这种情况下,我可以看到流数据显示在 T2 上。因此,流已经从 Kafka 终端发送到另一个端口,被另一个进程监听。
情况2: 这是我在终端 T3 上运行的 Python 代码
import socket
client_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
client_socket.connect(('localhost', 2003))
while True:
data = client_socket.recv(512)
if len(data) > 0:
print("RECEIVED: %s" % data)
顺序是:我运行 T2,在 T3 中运行 Python 代码,然后在 T1 中运行 Kafka 命令。这一次,我在 T3 或 T2 中都没有看到任何消息。
其目的是通过中间转发器使用 Python 脚本捕获 Kafka 流式传输的数据。这是正确的方法还是有什么方法可以做到这一点?
【问题讨论】:
-
您的 python 代码作为客户端工作,它连接到作为服务器工作的
nc -l 2003,但nc -l 2003必须向客户端发送一些内容才能在 Python 终端中查看某些内容 - 但通常它不会向客户端发送任何内容.您应该使用socket.listen()和socket.bind()作为服务器运行Python 而不是nc -l 2003
标签: python sockets ubuntu apache-kafka localhost