【问题标题】:How do I read cx_Oracle.LOB data in Python?如何在 Python 中读取 cx_Oracle.LOB 数据?
【发布时间】:2012-01-28 15:19:05
【问题描述】:

我有这个代码:

    dsn = cx_Oracle.makedsn(hostname, port, sid)
    orcl = cx_Oracle.connect(username + '/' + password + '@' + dsn)
    curs = orcl.cursor()
    sql = "select TEMPLATE from my_table where id ='6'"
    curs.execute(sql)
    rows = curs.fetchall()
    print rows
    template = rows[0][0]
    orcl.close()
    print template.read()

当我执行print rows 时,我得到了这个:

[(<cx_Oracle.LOB object at 0x0000000001D49990>,)]

但是,当我执行print template.read() 时,我得到了这个错误:

cx_Oracle.DatabaseError: 无效句柄!

如何获取和读取这些数据?谢谢。

【问题讨论】:

    标签: python cx-oracle


    【解决方案1】:

    我发现如果在使用 cx_Oracle.LOB.read() 方法之前关闭与 Oracle 的连接,就会发生这种情况。

    orcl = cx_Oracle.connect(usrpass+'@'+dbase)
    c = orcl.cursor()
    c.execute(sq)
    dane =  c.fetchall()
    
    orcl.close() # before reading LOB to str
    
    wkt = dane[0][0].read()
    

    我得到:DatabaseError: Invalid handle!
    但以下代码有效:

    orcl = cx_Oracle.connect(usrpass+'@'+dbase)
    c = orcl.cursor()
    c.execute(sq)
    dane =  c.fetchall()
    
    wkt = dane[0][0].read()
    
    orcl.close() # after reading LOB to str
    

    【讨论】:

    • 知道为什么会这样吗?
    • 我什至无法再重现该错误,但很高兴知道这一点。谢谢!编辑:实际上,我只是复制了它,并且在我将orcl.close() 移动到read() 之后它就起作用了。谢谢!
    • 我做了更多的测试。这只发生在 LOB 数据上。这真的很有趣。我可能会就此提出另一个问题。
    • 代码显示“流式传输”lob,这可能需要对数据库进行多次访问。这意味着连接需要保持打开状态,直到读取 LOB。如果您使用更快的方法将 LOB 获取为字符串(或字节),则没有必要这样做。请参阅 cx_Oracle 文档:cx-oracle.readthedocs.io/en/latest/user_guide/lob_data.html
    【解决方案2】:

    想通了。我必须这样做:

    curs.execute(sql)        
    for row in curs:
        print row[0].read()
    

    【讨论】:

    • 只是添加到这个,如果行是 int 只需要 row[0] 。对于 int,没有 read()。
    【解决方案3】:

    你基本上必须遍历 fetchall 对象

    dsn = cx_Oracle.makedsn(hostname, port, sid)
    orcl = cx_Oracle.connect(username + '/' + password + '@' + dsn)
    curs = orcl.cursor()
    sql = "select TEMPLATE from my_table where id ='6'"
    curs.execute(sql)
    rows = curs.fetchall()
    for x in rows:
       list_ = list(x)
       print(list_)
    

    【讨论】:

      【解决方案4】:

      for 循环中应该有一个额外的逗号,见下面的代码,我在 for 循环中的 x 之后提供了一个额外的逗号。

      dsn = cx_Oracle.makedsn(hostname, port, sid)
      orcl = cx_Oracle.connect(username + '/' + password + '@' + dsn)
      curs = orcl.cursor()
      sql = "select TEMPLATE from my_table where id ='6'"
      curs.execute(sql)
      rows = curs.fetchall()
      for x, in rows:
          print(x)
      

      【讨论】:

        【解决方案5】:

        我在稍微不同的环境中遇到了同样的问题。我需要查询一个 +27000 行的表,结果发现 cx_Oracle 会在一段时间后切断与数据库的连接。

        当与数据库的连接打开时,您可以使用 cx_Oracle.Lob 对象的 read() 方法将其转换为字符串。但是,如果查询带来的表太大,它将无法工作,因为连接会在某个时候停止,并且当您想从查询中读取结果时,您会在 cx_Oracle 对象上出现错误。

        我尝试了很多东西,比如设置 connection.callTimeout = 0(根据文档,这意味着它会无限期地等待),使用 fetchall() 然后将结果放在数据帧或 numpy 数组中,但我永远无法读取 cx_Oracle.Lob 对象。

        如果我尝试使用 pandas.DataFrame.read_sql(query, connection) 运行查询,数据帧将包含 cx_Oracle.Lob 对象,连接已关闭,使它们无用。 (同样只有在表很大时才会发生这种情况)

        最后,我找到了一种解决方法,即在之后查询并创建一个 csv 文件,尽管我知道这并不理想。

        def csv_from_sql(sql: str, path: str="dataframe.csv") -> bool:
        try: 
            with cx_Oracle.connect(config.username, config.password, config.database, encoding=config.encoding) as connection:
                connection.callTimeout = 0
                data = pd.read_sql(sql, con=connection)
                data.to_csv(path)
                print("FILE CREATED")
        except cx_Oracle.Error as error: 
            print(error)
            return False
        finally: 
            print("PROCESS ENDED\n")
            return True
        
        def make_query(sql: str, path: str="dataframe.csv") -> pd.DataFrame:
        if csv_from_sql(sql, path):
            dataframe = pd.read_csv("dataframe.csv")
            return dataframe
        return pd.DataFrame()
        

        这需要很长时间(大约 4 到 5 分钟)才能带来我的 +27000 行表,但它在其他一切都没有的情况下工作。

        如果有人知道更好的方法,那对我也有帮助。

        【讨论】:

        • cx_Oracle 不会“切断连接”。也许你的进程内存用完了。也许您达到了 DBA 强加的用户配置文件/资源​​管理器限制。查看有关 LOB 处理的 cx_Oracle 文档。 (另外,既然你有一个问题,为什么不发布一个新的 SO 问题而不是在这里标记它?)
        猜你喜欢
        • 2023-03-19
        • 1970-01-01
        • 2017-01-16
        • 2015-09-27
        • 2013-06-20
        • 1970-01-01
        • 2021-05-25
        • 2011-06-13
        相关资源
        最近更新 更多