cassandra

cassandra的多节点集群-无法互相闲聊

为了在 2 个 azure VM 中运行 2 个 cassandra 实例,我在 cassandra.yaml 文件中配置了种子、监听地址、rpc 地址。我在 cassandra.env.sh 文件中设置了不同的端口。两个 yml 文件中的集群名称相同。但我无法在 nodetool status 中看到两个节点的运行状态。 VM1: cassandra.yaml: seeds: "10.50.1.... »

java.io.IOException:无法在 127.0.0.1:9042 打开到 Cassandra 的本机连接

我found a similar post 但没有帮助。 我使用 Cassandra 已经有一段时间了,现在我正在尝试设置 spark 和 spark-cassandra-connector。我正在使用 IntelliJ IDEA 来做到这一点(第一次使用 IntelliJ IDEA 和 Scala,所以你明白了) 我的操作系统是 Windows 10。这就是我所做的: 内部../spark... »

用于范围查询的 cassandra 的表定义语句?

这是表格数据 video_id uuid user_id timeuuid added_year int added_date timestamp title text description text 我想根据以下查询构造表 select * from video_by_year where added_year<2013; 创建表 videos_by_year ( video... »

使用 Solr 对 Cassandra 列进行分组

是否可以使用 solr 按 Cassandra 列分组? 我有 2 列 ColumnA ColumnB A XYZ B BCD C CDE D DEF A XYZ D DEF E XYZ A XYZ 我想获取 ColumnA 的计数,其中 ColumnB='XYZ... »

CQL 选择列值

我正在 Cassandra 中创建帐户数据。最常根据帐户 ID 查询帐户。但是,通常通过登录名查询该帐户。我创建了一个带有主键(account_id 和 login_name)的用户表。因此,我必须在表上“允许过滤”才能通过 login_name 进行查询。 有没有更好的方法来创建不受可过滤表影响的表?... »

非主键上的 NoSQL 分区

我正在设计一个使用 NoSQL 数据库(如 MongoDb/Cassandra)的聊天应用程序。 对时间最敏感的查询是查找属于聊天的消息。 我知道会有一个Message 集合,但不确定如何根据 chatId 对这个集合进行分区。我想即使clustered index 也不适合这种类型的用例。 假设Message 将遵循以下结构: { "chatId" : 123, "message... »

连接到 Cassandra 时连接被拒绝

我正在尝试运行 cassandra,但每次连接时都会出现相同的错误...我需要在配置文件或属性文件中编辑什么 ('无法连接到任何服务器', {'127.0.0.1:9042': error(61, "尝试连接到 [('127.0.0.1', 9042)]。最后一个错误:连接被拒绝")} ) 启动cassandra时出错 # A fatal error has been detected by th... »

Cassandra CQL:过滤一系列值之间的行

我的列族的结构类似于 CREATE TABLE product ( id UUID PRIMARY KEY, product_name text, product_code text, status text,//in stock, out of stock mfg_date timestamp, exp_date timestamp ); ... »

对 cassandra 的一些插入请求后出现 NoNodeAvailableException

我正在尝试使用异步执行和驱动程序版本 4(与我的 Cassandra 实例相同)将数据插入 Cassandra 本地集群 我已经用这种方式实例化了 cql 会话: CqlSession cqlSession = CqlSession.builder() .addContactEndPoint(new DefaultEndPoint( InetSocketAddress.create... »

ES 和 Cassandra 上的 CPU 负载极高

我们在一个非常大的系统上使用 ES 1.7.5 和 Cassandra 3.7 设置了 usergrid (2.1.0):12 台机器用于 UG,9 台用于 cassandra,9 台用于 elasticsearch。所有(虚拟)机器都有 16 个内核和 32 个 Gig ram。然而,即使有 3000 个并发用户,es 和 c* 服务器也会发疯并达到 100% 的 cpu 使用率。当 es cp... »

使用 Cassandra 的第一个preparedStatement 总是很慢

我注意到如果我有一个 java 方法,其中我有一个 prepareStatement 使用 Cassandra 附带的 JDBC 驱动程序,它总是很慢。但是,如果我第二次在方法中两次输入相同的查询,它的速度会快 20 倍。这是为什么?我认为第二、第三、四次调用 java 方法会比第一次更快。我正在使用 Cassandra 1.2.5。我还在行缓存中缓存了 100MB 的行,并将表设置为缓存 =“全... »

确保在 10 分钟后删除以前版本的单元格

在 Cassandra 中,我想在处理完一行后更新一行以删除一些敏感数据。 一行有以下过程。 插入记录 处理记录(更新) 设置要处理的行并从该行的一列中删除敏感数据 我知道更新实际上并没有根据 Cassandra 的设计更新磁盘上的数据。但是,我想确保在不太长的一段时间后,数据实际上会从磁盘中删除。没有从该表中显式删除行(使用 CQL 语句),只有插入和更新语句。 据我了解,我必须使用相对... »

具有多个字段的 Cassandra SASI 索引

Cassandra SASI 索引允许在单个字段上进行类似于 SQL LIKE 的查询。我想知道是否可以对多个字段执行 LIKE 查询: SELECT * FROM CUSTOMERS WHERE FIRSTNAME LIKE 'joh%' AND LASTNAME LIKE 'smi%' 这可以在 Cassandra 中使用 SASI 索引或其他东西吗?... »

如何在同一个分区中保留 2 个 Cassandra 表

我尝试阅读 datastax 博客和文档,但找不到任何具体内容 有没有办法让 Cassandra 中的 2 个表属于同一个分区? 例如: CREATE TYPE addr ( street_address1 text, city text, state text, country text, zip_code text, ); CREATE TABLE foo ( a... »

无法在 unix 机器上启动 Cassandra 服务器

我是 cassandra 的新手,在 Unix 机器上启动 cassandra 服务器时需要帮助。我安装了 cassandra,在执行 ./bin/cassandra -f 时出现以下错误 - ./bin/cassandra: 测试:未知操作员> 另一个错误是在同一目录中执行 cqlsh。 cqlsh:第 21 行的语法错误:`print' 意外 我的环境中有 jdk 1.8 和 pyt... »

如何使用 DataFrames 来利用 Cassandra 分区器?

根据documentation 的说法,Cassandra Partitioner 可以帮助减少洗牌,从而提高整体性能。要利用分区器,我应该使用 keyBy 方法。给定表: CREATE TABLE data_storage.dummy ( id text, value bigint, PRIMARY KEY (id) ) 我可以使用 RDD API 和 DataFrame API 查询表... »

Spring Cassandra 3.0.1.RELEASE(Datastax 4.6+) 日志查询

我正在使用最新版本的 spring data cassandra,它使用 datastax 4.6 在旧版本中,有一种方法可以使用 QueryLogger 和 Cluster 记录较慢和正常的查询 但是我无法找到记录查询和更新版本所用时间的方法... »

任务在火花中有一个不可序列化的结果

我正在尝试使用 cassandra 驱动程序读取 cassandra 表。 这是代码。 val x = 1 to 2 val rdd = sc.parallelize(x) val query = "Select data from testkeyspace.testtable where id=%d" val cc = CassandraConnector(sc.getConf) val... »