Cassandra 是一个高性能的分布式数据库,常用于处理大规模数据。以下是一些常见的数据操作方法和最佳实践:
1. 基础操作
插入数据
使用INSERT INTO
语句添加记录,例如:INSERT INTO users (id, name, email) VALUES (1, '张三', 'zhangsan@example.com');
查询数据
通过SELECT
从表中获取数据,支持条件筛选和排序:SELECT * FROM users WHERE id = 2 ORDER BY name ASC;
更新数据
使用UPDATE
修改现有记录:UPDATE users SET email = 'zhangsan_new@example.com' WHERE id = 1;
删除数据
通过DELETE
移除数据:DELETE FROM users WHERE id = 1;
2. 高级操作
批量操作
使用BATCH
进行多条语句的原子性操作:BEGIN BATCH INSERT INTO ...; UPDATE ...; APPLY BATCH
索引与查询优化
为频繁查询的列创建索引,例如:CREATE INDEX ON users (email);
⚠️ 注意:Cassandra 的索引性能需谨慎使用。
数据分片与复制
通过replication
配置控制数据复制策略,确保高可用性:replication: {class: 'SimpleStrategy', replication_factor: 3}
3. 工具与命令
CQL Shell
使用cqlsh
命令行工具管理数据:cqlsh -e "SELECT * FROM system.local;"
数据导入导出
通过COPY
命令或工具如csv2sstable
实现数据迁移。
4. 常见问题
TTL(存活时间)
为数据设置过期时间:INSERT INTO logs (id, message) VALUES (1, 'error') USING TTL 86400;
⏳ 数据将在 86400 秒后自动删除。
数据一致性
通过CONSISTENCY
修饰符控制读写一致性级别:CONSISTENCY ONE SELECT * FROM table;
Cassandra Data Operations
📌 探索更多 Cassandra 实践案例
注意:所有操作需结合实际业务场景和集群配置调整。