模拟进程故障
本文主要介绍如何使用 Chaosd 模拟进程故障。该功能通过使用 kill
的 Golang 接口模拟进程被终止或暂停的场景,支持通过命令行模式或服务模式创建实验。
使用命令行模式创建实验
在创建进程故障实验前,可运行以下命令行查看 Chaosd 支持的进程故障类型:
chaosd attack process -h
输出结果如下所示:
Process attack related commands
Usage:
chaosd attack process [command]
Available Commands:
kill kill process, default signal 9
stop stop process, this action will stop the process with SIGSTOP
Flags:
-h, --help help for process
Global Flags:
--log-level string the log level of chaosd, the value can be 'debug', 'info', 'warn' and 'error'
Use "chaosd attack process [command] --help" for more information about a command.
目前 Chaosd 支持模拟进程被终止或暂停的故障。
使用命令行模式模拟进程被终止
模拟进程被终止命令
chaosd attack process kill -h
输出结果如下所示:
kill process, default signal 9
Usage:
chaosd attack process kill [flags]
Flags:
-h, --help help for kill
-p, --process string The process name or the process ID
-r, --recover-cmd string The command to be run when recovering experiment
-s, --signal int The signal number to send (default 9)
Global Flags:
--log-level string the log level of chaosd. The value can be 'debug', 'info', 'warn' and 'error'
--uid string the experiment ID
模拟进程被终止相关配置说明
配置项 | 配置缩写 | 说明 | 值 |
---|---|---|---|
process | p | 需要注入故障的进程的名字或者进程的标识符 | string 类型,默认为 "" |
recover-cmd | r | 需要在实验恢复时执行的命令 | string 类型,默认为 "" |
signal | s | 所提供的进程信号值 | int 类型,默认为 9 。目前只支持 SIGKILL 、SIGTERM 和 SIGSTOP 三种信号值。 |
模拟进程被终止示例
chaosd attack process kill -p python
输出结果如下所示:
Attack process python successfully, uid: 10e633ac-0a37-41ba-8b4a-cd5ab92099f9
注意
只有 signal
为 SIGSTOP
的实验支持被恢复。
使用命令行模式模拟进程被暂停
模拟进程被暂停命令
chaosd attack process stop -h
输出结果如下所示:
stop process, this action will stop the process with SIGSTOP
Usage:
chaosd attack process stop [flags]
Flags:
-h, --help help for stop
-p, --process string The process name or the process ID
Global Flags:
--log-level string the log level of chaosd, the value can be 'debug', 'info', 'warn' and 'error'
模拟进程被暂停相关配置说明
配置项 | 配置缩写 | 说明 | 值 |
---|---|---|---|
process | p | 需要暂停的进程的名字或者进程的标识符 | string 类型,默认为 "" |
模拟进程被暂停示例
chaosd attack process stop -p python
输出结果如下所示:
Attack process python successfully, uid: 9cb6b3be-4f5b-4ecb-ae05-51050fcd0010
使用服务模式创建实验
要使用服务模式创建实验,请进行以下操作:
以服务模式运行 Chaosd。
chaosd server --port 31767
向 Chaosd 服务的路径
/api/attack/process
发送POST
HTTP 请求。curl -X POST 172.16.112.130:31767/api/attack/process -H "Content-Type:application/json" -d '{fault-configuration}'
在上述命令中,你需要按照故障类型在 fault-configuration
中进行配置。有关对应的配置参数,请参考下文中各个类型故障的相关参数说明和命令示例。
注意
在运行实验时,请注意保存实验的 UID 信息。当要结束 UID 对应的实验时,需要向 Chaosd 服务的路径 /api/attack/{uid}
发送 DELETE
HTTP 请求。
使用服务模式模拟进程故障
进程故障相关参数说明
参数 | 说明 | 值 |
---|---|---|
process | 需要注入故障的进程的名字或者进程的标识符 | string 类型,默认为 "" |
signal | 所提供的进程信号值 | int 类型,默认为 9 。 |
使用服务模式模拟进程故障示例
进程被终止
curl -X POST 172.16.112.130:31767/api/attack/process -H "Content-Type:application/json" -d '{"process":"12345","signal":15}'
输出如下所示:
{"status":200,"message":"attack successfully","uid":"c3c519bf-819a-4a7b-97fb-e3d0814481fa"}
进程被暂停
curl -X POST 172.16.112.130:31767/api/attack/process -H "Content-Type:application/json" -d '{"process":"12345","signal":19}'
输出如下所示:
{"status":200,"message":"attack successfully","uid":"a00cca2b-eba7-4716-86b3-3e66f94880f7"}
注意
只有 signal
为 SIGSTOP
的实验支持被恢复。