【问题标题】:Insert Pandas dataframe into Cassandra Table将 Pandas 数据框插入 Cassandra 表
【发布时间】:2018-02-27 01:21:49
【问题描述】:

documentation,有一种方法可以将数据插入到表中:

session.execute(
    """
    INSERT INTO users (name, credits, user_id)
    VALUES (%s, %s, %s)
    """,
    ("John O'Reilly", 42, uuid.uuid1())
)

必须在此处说明列名。但是,就我而言,我有一个数据框,它只有一个标题行和一行数据,例如: "sepal_length" : 5.1,"sepal_width" : 3.5,"petal_length" : 1.4 ,"petal_width" : 0.2, "species" : "Iris"

用户将为我的 API 提供信息以连接到他们特定的 Cassandra 数据库表,其中包含存储在数据框中的列名称。如何插入数据框的数据相对于映射到表的列标题,而不像文档中所述的那样实际硬编码列名,因为不同情况下的标题不同。

我正在尝试实现这样的目标:

def insert_table(df, table_name, ... #connection details):
    #Set up connection and session
    session.execute(
        """
        INSERT INTO table_name(#df's column header)
        VALUES (%s, %s, %s)
        """,
        (#df's data for the only row)
    ) 

我发现了this,但实际上我只需要一个简单的插入操作。

【问题讨论】:

    标签: python pandas dataframe cassandra cassandra-python-driver


    【解决方案1】:

    您可以通过以下方式获取 Dataframe 的列名

    column_names = list(my_dataframe.columns.values)
    

    您可以重写insert_table(...) 以接受列名列表作为参数。

    例如,可以使用字符串替换来形成 CQL 语句:

    cql_query = """
        INSERT INTO {table_name} ({col_names})
        VALUES (%s, %s, %s)
        """.format(table_name="my_table", col_names=','.join(map(str, column_names)))
    ...
    

    【讨论】:

      猜你喜欢
      • 2019-04-10
      • 2016-07-17
      • 2018-06-14
      • 1970-01-01
      • 2018-06-19
      • 2017-05-05
      • 2021-09-23
      • 2018-08-13
      • 1970-01-01
      相关资源
      最近更新 更多