【发布时间】:2019-01-06 10:45:57
【问题描述】:
我正在使用以下技术堆栈并尝试使用 PySpark 代码连接 Phoenix 表。我已经从 url 下载了以下 jars 并尝试执行以下代码。在日志中,与 hbase 的连接已建立,但控制台被卡住而无所事事。如果有人遇到并解决了类似问题,请告诉我。
https://mvnrepository.com/artifact/org.apache.phoenix/phoenix-spark/4.11.0-HBase-1.2
罐子: phoenix-spark-4.11.0-HBase-1.2.jar phoenix-client.jar
Tech Stack 都在同一主机上运行:
Apache Spark 2.2.0 版本
Hbase 1.2 版本
凤凰4.11.0版
复制文件夹路径/spark/conf/hbase-site.xml中的hbase-site.xml。
执行的命令 ->
usr/local/spark> spark-submit phoenix.py --jars /usr/local/spark/jars/phoenix-spark-4.11.0-HBase-1.2.jar --jars /usr/local/spark/ jars/phoenix-client.jar
凤凰.py:
from pyspark import SparkContext, SparkConf
from pyspark.sql import SQLContext
conf = SparkConf().setAppName("pysparkPhoenixLoad").setMaster("local")
sc = SparkContext(conf=conf)
sqlContext = SQLContext(sc)
df = sqlContext.read.format("org.apache.phoenix.spark").option("table",
"schema.table1").option("zkUrl", "localhost:2181").load()
df.show()
错误日志:Hbase 连接已建立,但在控制台中卡住并抛出超时错误
18/07/30 12:28:15 WARN HBaseConfiguration:不推荐使用配置选项“hbase.regionserver.lease.period”。相反,使用“hbase.client.scanner.timeout.period”
18/07/30 12:28:54 INFO RpcRetryingCaller:调用异常,尝试 = 10,重试 = 35,开始 = 38367 毫秒前,取消 = 假,msg = 行'SYSTEM:CATALOG,'在表' hbase:meta' at region=hbase:meta,,1.1588230740, hostname=master01,16020,1532591192223, seqNum=0
【问题讨论】: