如何在 Python 中读取 cx_Oracle.LOB 数据？答案

【问题标题】：How do I read cx_Oracle.LOB data in Python?如何在 Python 中读取 cx_Oracle.LOB 数据？
【发布时间】：2012-01-28 15:19:05
【问题描述】：

我有这个代码：

    dsn = cx_Oracle.makedsn(hostname, port, sid)
    orcl = cx_Oracle.connect(username + '/' + password + '@' + dsn)
    curs = orcl.cursor()
    sql = "select TEMPLATE from my_table where id ='6'"
    curs.execute(sql)
    rows = curs.fetchall()
    print rows
    template = rows[0][0]
    orcl.close()
    print template.read()

当我执行print rows 时，我得到了这个：

[(<cx_Oracle.LOB object at 0x0000000001D49990>,)]

但是，当我执行print template.read() 时，我得到了这个错误：

cx_Oracle.DatabaseError: 无效句柄！

如何获取和读取这些数据？谢谢。

【问题讨论】：

标签： python cx-oracle

【解决方案1】：

我发现如果在使用 cx_Oracle.LOB.read() 方法之前关闭与 Oracle 的连接，就会发生这种情况。

orcl = cx_Oracle.connect(usrpass+'@'+dbase)
c = orcl.cursor()
c.execute(sq)
dane =  c.fetchall()

orcl.close() # before reading LOB to str

wkt = dane[0][0].read()

我得到：DatabaseError: Invalid handle!
但以下代码有效：

orcl = cx_Oracle.connect(usrpass+'@'+dbase)
c = orcl.cursor()
c.execute(sq)
dane =  c.fetchall()

wkt = dane[0][0].read()

orcl.close() # after reading LOB to str

【讨论】：

知道为什么会这样吗？
我什至无法再重现该错误，但很高兴知道这一点。谢谢！编辑：实际上，我只是复制了它，并且在我将orcl.close() 移动到read() 之后它就起作用了。谢谢！
我做了更多的测试。这只发生在 LOB 数据上。这真的很有趣。我可能会就此提出另一个问题。
代码显示“流式传输”lob，这可能需要对数据库进行多次访问。这意味着连接需要保持打开状态，直到读取 LOB。如果您使用更快的方法将 LOB 获取为字符串（或字节），则没有必要这样做。请参阅 cx_Oracle 文档：cx-oracle.readthedocs.io/en/latest/user_guide/lob_data.html

【解决方案2】：

想通了。我必须这样做：

curs.execute(sql)        
for row in curs:
    print row[0].read()

【讨论】：

只是添加到这个，如果行是 int 只需要 row[0] 。对于 int，没有 read()。

【解决方案3】：

你基本上必须遍历 fetchall 对象

dsn = cx_Oracle.makedsn(hostname, port, sid)
orcl = cx_Oracle.connect(username + '/' + password + '@' + dsn)
curs = orcl.cursor()
sql = "select TEMPLATE from my_table where id ='6'"
curs.execute(sql)
rows = curs.fetchall()
for x in rows:
   list_ = list(x)
   print(list_)

【讨论】：

【解决方案4】：

for 循环中应该有一个额外的逗号，见下面的代码，我在 for 循环中的 x 之后提供了一个额外的逗号。

dsn = cx_Oracle.makedsn(hostname, port, sid)
orcl = cx_Oracle.connect(username + '/' + password + '@' + dsn)
curs = orcl.cursor()
sql = "select TEMPLATE from my_table where id ='6'"
curs.execute(sql)
rows = curs.fetchall()
for x, in rows:
    print(x)

【讨论】：

【解决方案5】：

我在稍微不同的环境中遇到了同样的问题。我需要查询一个 +27000 行的表，结果发现 cx_Oracle 会在一段时间后切断与数据库的连接。

当与数据库的连接打开时，您可以使用 cx_Oracle.Lob 对象的 read() 方法将其转换为字符串。但是，如果查询带来的表太大，它将无法工作，因为连接会在某个时候停止，并且当您想从查询中读取结果时，您会在 cx_Oracle 对象上出现错误。

我尝试了很多东西，比如设置 connection.callTimeout = 0（根据文档，这意味着它会无限期地等待），使用 fetchall() 然后将结果放在数据帧或 numpy 数组中，但我永远无法读取 cx_Oracle.Lob 对象。

如果我尝试使用 pandas.DataFrame.read_sql(query, connection) 运行查询，数据帧将包含 cx_Oracle.Lob 对象，连接已关闭，使它们无用。（同样只有在表很大时才会发生这种情况）

最后，我找到了一种解决方法，即在之后查询并创建一个 csv 文件，尽管我知道这并不理想。

def csv_from_sql(sql: str, path: str="dataframe.csv") -> bool:
try: 
    with cx_Oracle.connect(config.username, config.password, config.database, encoding=config.encoding) as connection:
        connection.callTimeout = 0
        data = pd.read_sql(sql, con=connection)
        data.to_csv(path)
        print("FILE CREATED")
except cx_Oracle.Error as error: 
    print(error)
    return False
finally: 
    print("PROCESS ENDED\n")
    return True

def make_query(sql: str, path: str="dataframe.csv") -> pd.DataFrame:
if csv_from_sql(sql, path):
    dataframe = pd.read_csv("dataframe.csv")
    return dataframe
return pd.DataFrame()

这需要很长时间（大约 4 到 5 分钟）才能带来我的 +27000 行表，但它在其他一切都没有的情况下工作。

如果有人知道更好的方法，那对我也有帮助。

【讨论】：

cx_Oracle 不会“切断连接”。也许你的进程内存用完了。也许您达到了 DBA 强加的用户配置文件/资源管理器限制。查看有关 LOB 处理的 cx_Oracle 文档。（另外，既然你有一个问题，为什么不发布一个新的 SO 问题而不是在这里标记它？）