【发布时间】:2020-03-13 10:48:49
【问题描述】:
我已经完成了连接 Clickhouse 服务器/客户端的任务并创建了 TABLE。然后我想将数据从 csv 导入到该表中。问题是 ClickHouse 中的 DateTime 类型需要这样的格式:YYYY-MM-DD hh:mm:ss,但我下载的数据集只有这种时间格式:2016-01-13 6:15:00 AM (YYYY-MM- DD h:mm:ss) 我的数据集中的小时只有 h,应该是 hh。 请告诉我如何将 csv 文件中的所有数据转换为正确的数据格式(可能是 Python 代码或其他)?请给我一个样品。
下面是我的数据库表:
CREATE TABLE ChicagoTaxi
(
taxi_id Int32,
trip_start_timestamp DateTime,
trip_end_timestamp DateTime,
trip_seconds Int16,
trip_miles Float32,
pickup_community_area Int8,
dropoff_community_area Int8,
fare Nullable(Float32),
tips Float32,
tolls Nullable(Float32),
extras Nullable(Float32),
trip_total Nullable(Float32),
payment_type Nullable(String),
company Int16,
pickup_latitude Int16,
pickup_longitude Int16,
dropoff_latitude Nullable(Float64),
dropoff_longitude Nullable(Float64)
) ENGINE = Log
【问题讨论】:
-
您能否提供错误消息以及如何从文件中导入数据(是 clickhouse-client 还是 clikhouse-driver)?看看这个git issue。
-
我在上面添加了错误消息和用于导入 csv 数据的命令。请告诉我如何编写 Python 代码或任何语言将 csv 时间数据 h:mm:ss 转换为 hh:mm:ss 例如 6:04:07 转换为 06:04:07
-
只是友好的建议 - 插入原始文本比插入截图更好..
标签: python database bigdata olap clickhouse