redis作为一个服务,和普通的oracle,mysql服务器运维维护和系统调优是一样的。
关注内存,CPU,网络IO,阻塞等。由于不会涉及复杂的SQL业务逻辑,缺少SQL调优这一块。
1.通过INFO命令,要清楚了解服务器的现状。
参照:http://redisdoc.com/server/info.html
| section | |
server |
记录了 Redis 服务器的信息 |
| clients | 记录了已连接客户端的信息(确认并发情况,繁忙程度) |
memory |
记录了服务器的内存信息 (确认内存消耗,内存碎片) |
| persistence |
记录了跟 RDB 持久化和 AOF 持久化有关的信息(确认是否引起性能IO)
|
stat
|
一般统计信息(确认并发情况,繁忙程度,命中率) |
|
replication |
主/从复制信息(同步情况) |
cpu |
CPU 的计算量统计信息 |
keyspace |
记录了数据库相关的统计信息 |
2.常用运维操作
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
|
#探测服务是否可用[[email protected] redis]# bin/redis-cli
127.0.0.1:6379> ping
PONG#监控redis请求执行信息127.0.0.1:6379> monitorOK1472956931.192969 [0 127.0.0.1:42936] "COMMAND"
1472956948.127475 [0 127.0.0.1:42936] "set" "title" "moniter"
1472956964.712026 [0 127.0.0.1:42936] "keys" "*"
#查看redis数据库统计信息127.0.0.1:6379> info# Serverredis_version:3.2.3redis_git_sha1:00000000redis_git_dirty:0redis_build_id:7994844ebb5a3a63redis_mode:standalone...#查看配置127.0.0.1:6379> config get loglevel1) "loglevel"
2) "notice"
#临时修改配置127.0.0.1:6379> config set loglevel 111
(error) ERR Invalid argument '111' for CONFIG SET 'loglevel'
127.0.0.1:6379> config set loglevel debug
OK#这会导致修改redis.conf文件127.0.0.1:6379> config rewriteOK#批量执行操作+PONG+OK$3abc 在一个脚本中批量执行多个写入操作:先把插入操作放入操作文本insert.dat:set a b
set 1 2
set h w
set f u
然后执行命令:cat insert.bat | ./redis-cli --pipe,或者如下脚本:
#!/bin/shhost=$1port=$;password=$3cat insert.dat | ./redis-cli -h $host -p $port -a $password --pipe
|
以下内容来自[http://www.cnblogs.com/gnuhpc/]
1.10 模拟宕机
redis-cli debug segfault
1.11 模拟hang
redis-cli -p 6379 DEBUG sleep 30
1.12 重命名命令
rename-command,例如:rename-command FLUSHALL ""。必须重启。
1.13 执行lua脚本
- -eval 。例如:
redis-cli --eval myscript.lua key1 key2 , arg1 arg2 arg3
1.14 设置密码
config set requirepass [passw0rd]
1.15 验证密码
auth passw0rd
1.16 性能测试命令
redis-benchmark -n 100000
1.17 获取慢查询
SLOWLOG GET 10
结果为查询ID、发生时间、运行时长和原命令
1.18 查看日志
日志位置在/redis/log下,redis.log为redis主日志,sentinel.log为sentinel监控日志。
一般处理(发现问题)流程
| 1 |
探测服务是否可用 |
127.0.0.1:6379> ping |
| 2 |
探测服务延迟 | redis-cli --latency 显示的单位是milliseconds,作为参考,千兆网一跳一般延迟为0.16ms左右 |
| 3 |
监控正在请求执行的命令 | 在cli下执行monitor,生产环境慎用。 |
| 4 |
查看统计信息 |
info |
| 5 |
获取慢查询 |
SLOWLOG GET 10 结果为查询ID、发生时间、运行时长和原命令 默认10毫秒,默认只保留最后的128条。单线程的模型下,一个请求占掉10毫秒是件大事情,注意设置和显示的单位为微秒,注意这个时间是不包含网络延迟的。 slowlog get slowlog len |
| 6 |
查看客户端 | client list 列出所有连接 client kill 杀死某个连接, 例如CLIENT KILL 127.0.0.1:43501 client getname # 获取连接的名称 默认nil client setname "名称" 设置连接名称,便于调试 |
| 7 |
查看日志 |
本文转自 randy_shandong 51CTO博客,原文链接:http://blog.51cto.com/dba10g/1846068,如需转载请自行联系原作者