【发布时间】:2017-01-05 05:02:33
【问题描述】:
我每天有几次收到各种 CSV 文件,存储来自传感器的时间序列数据,这些传感器是传感器站的一部分。每个 CSV 都以其来源的传感器站和传感器 ID 命名,例如“station1_sensor2.csv”。目前,数据是这样存储的:
> cat station1_sensor2.csv
2016-05-04 03:02:01.001000+0000;0;
2016-05-04 03:02:01.002000+0000;0.1234;
2016-05-04 03:02:01.003000+0000;0.2345;
我创建了一个 Cassandra 表来存储它们并能够查询它们以执行各种已识别的任务。 Cassandra 表如下所示:
cqlsh > CREATE KEYSPACE data with replication = {'class' : 'SimpleStrategy', 'replication_factor' : 3};
CREATE TABLE sensor_data (
station_id text, // id of the station
sensor_id text, // id of the sensor
tps timestamp, // timestamp of the measure
val float, // measured value
PRIMARY KEY ((station_id, sensor_id), tps)
);
我想使用 Apache Nifi 将 CSV 中的数据自动存储到这个 Cassandra 表中,但我找不到正确的示例或方案。我曾尝试使用“PutCassandraQL”处理器,但我在没有任何明确的例子的情况下苦苦挣扎。因此,对于如何使用 Apache Nifi 执行 Cassandra put 查询以将数据插入表中的任何帮助将不胜感激!
【问题讨论】:
标签: cassandra cql data-integration apache-nifi