Cassandra 是一个高性能的分布式数据库,常用于处理大规模数据。以下是一些常见的数据操作方法和最佳实践:

1. 基础操作

  • 插入数据
    使用 INSERT INTO 语句添加记录,例如:

    INSERT INTO users (id, name, email) VALUES (1, '张三', 'zhangsan@example.com');
    

    📌 了解更多 Cassandra 基础语法

  • 查询数据
    通过 SELECT 从表中获取数据,支持条件筛选和排序:

    SELECT * FROM users WHERE id = 2 ORDER BY name ASC;
    
  • 更新数据
    使用 UPDATE 修改现有记录:

    UPDATE users SET email = 'zhangsan_new@example.com' WHERE id = 1;
    
  • 删除数据
    通过 DELETE 移除数据:

    DELETE FROM users WHERE id = 1;
    

2. 高级操作

  • 批量操作
    使用 BATCH 进行多条语句的原子性操作:

    BEGIN BATCH
      INSERT INTO ...;
      UPDATE ...;
    APPLY BATCH
    
  • 索引与查询优化
    为频繁查询的列创建索引,例如:

    CREATE INDEX ON users (email);
    

    ⚠️ 注意:Cassandra 的索引性能需谨慎使用。

  • 数据分片与复制
    通过 replication 配置控制数据复制策略,确保高可用性:

    replication: {class: 'SimpleStrategy', replication_factor: 3}
    

3. 工具与命令

  • CQL Shell
    使用 cqlsh 命令行工具管理数据:

    cqlsh -e "SELECT * FROM system.local;"
    
  • 数据导入导出
    通过 COPY 命令或工具如 csv2sstable 实现数据迁移。

4. 常见问题

  • TTL(存活时间)
    为数据设置过期时间:

    INSERT INTO logs (id, message) VALUES (1, 'error') USING TTL 86400;
    

    ⏳ 数据将在 86400 秒后自动删除。

  • 数据一致性
    通过 CONSISTENCY 修饰符控制读写一致性级别:

    CONSISTENCY ONE SELECT * FROM table;
    

Cassandra Data Operations

📌 探索更多 Cassandra 实践案例


注意:所有操作需结合实际业务场景和集群配置调整。