RPC:Remote Procedure Call
DRPC:Distributed RPC
Hadoop提供了RPC的实现机制,实现方法见:《》,本文主要介绍Storm的DRPC。
1、Storm DRPC工作流程
Storm的DRPC由DRPC Server和一个特殊的topology组成。DRPC Server主要起协调客户端和topology的作用,其接收客户端的请求,并将请求发送给topology,然后将topology的处理结果返回给客户端。
下面是官网给出的流程图:
1)客户端向DRPC Server发送请求,发送了想要执行的方法及其参数。
2)DRPC topology提供了一个特殊的spout DRPCSpout,DRPC Server将客户端的请求信息(函数、参数)发送给DRPCSpout,客户端请求进入了topology的处理。
3)DRPC topology的一系列bolt开始处理请求,最后一个bolt是ReturnResult,它负责将处理结果发送给DRPC Server。
4)DRPC Server将结果发送给客户端。
上面的流程也可以具体化为:
其中蓝色的bolt是需要用户自己定义的。
2、DRPC Server
(1)、编辑$STORM_HOME/conf/storm.yaml,配置drpc.servers,Storm会在配置的这些机器上启动DRPC Server
|
1
2
3
|
drpc.servers: - "vm1"
- "vm2"
|
注意:drpc.servers:前面不能有空格(yaml文件格式)
(2)、在上面配置的那些机器上运行DRPC Server
|
1
|
storm drpc |
3、DRPC topology
1)用户需要定义自己的bolt来执行自己的业务逻辑,如下面的MyBolt.java简单的将输入字符串转换成大写:
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
|
package com.test.storm.bolt;
import backtype.storm.topology.BasicOutputCollector;
import backtype.storm.topology.OutputFieldsDeclarer;
import backtype.storm.topology.base.BaseBasicBolt;
import backtype.storm.tuple.Fields;
import backtype.storm.tuple.Tuple;
import backtype.storm.tuple.Values;
public class MyBolt extends BaseBasicBolt{
private static final long serialVersionUID = 1L;
@Override
public void execute(Tuple input, BasicOutputCollector collector) {
try {
//input里有两个字段:{request:6170525749586968710,args:hello}
//request字段是Long类型, args是String类型
Long id = input.getLong(0);
System.out.println("request id: " + id);
String args = input.getString(1);
System.out.println("args: " + args);
String result = args.toUpperCase();
//如果这个bolt是最有一个用户的bolt,则必须是两个字段id、result
//如果是中间bolt,则第一个字段必须是id
//第一个字段是request的id,第二个字段是处理后的结果
collector.emit(new Values(id, result));
} catch (Exception e) {
e.printStackTrace();
}
}
@Override
public void declareOutputFields(OutputFieldsDeclarer declarer) {
//如果这个bolt是最有一个用户的bolt,则必须是两个字段,建议是id、result(经测试,字段名字可以随意)
//如果是中间bolt,则第一个字段必须是id
//后面的内置bolt会根据字段位置获取值,0、1
declarer.declare(new Fields("id", "result"));
}
} |
代码中需要注意的地方和解释。
2)构建topology
Storm提供了LinearDRPCTopologyBuilder类来创建这个特殊的topology,它的作用有:
a、创建DRPCSpout
b、创建ReturnResult,返回topology的处理结果
c、提供有限的聚合操作
|
1
2
3
|
LinearDRPCTopologyBuilder builder = new LinearDRPCTopologyBuilder(FUNC_NAME);
builder.addBolt(new MyBolt());
StormTopology drpcTopology = builder.createLocalTopology(drpcServer); |
4、运行模式
1)本地模式
本地模式会在一个进程中模式DRPC Server,不需要绑定到端口,必须使用LocalDRPC对象才能调用方法,本地模式仅供测试用。
LocalDRPCTest.java:
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
|
package com.test.storm.drpc;
import backtype.storm.Config;
import backtype.storm.LocalCluster;
import backtype.storm.LocalDRPC;
import backtype.storm.drpc.LinearDRPCTopologyBuilder;
import backtype.storm.generated.StormTopology;
import com.test.storm.bolt.MyBolt;
public class LocalDRPCTest {
private static final String FUNC_NAME = "upper";
public static void main(String[] args) {
LocalDRPC drpcServer = new LocalDRPC();
LinearDRPCTopologyBuilder builder = new LinearDRPCTopologyBuilder(FUNC_NAME);
builder.addBolt(new MyBolt());
StormTopology drpcTopology = builder.createLocalTopology(drpcServer);
LocalCluster cluster = new LocalCluster();
Config config = new Config();
config.setDebug(true);
cluster.submitTopology("drpcupper", config, drpcTopology);
String result = drpcServer.execute(FUNC_NAME, "hello");
System.out.println("result: " + result);
drpcServer.shutdown();
cluster.shutdown();
}
} |
2)远程模式
RemoteDRPCTest.java如下:
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
package com.test.storm.drpc;
import backtype.storm.Config;
import backtype.storm.StormSubmitter;
import backtype.storm.drpc.LinearDRPCTopologyBuilder;
import com.test.storm.bolt.MyBolt;
public class RemoteDRPCTest {
private static final String FUNC_NAME = "upper";
public static void main(String[] args) throws Exception {
LinearDRPCTopologyBuilder builder = new LinearDRPCTopologyBuilder(FUNC_NAME);
builder.addBolt(new MyBolt());
StormSubmitter.submitTopology("drpcupper", new Config(), builder.createRemoteTopology());
}
} |
在真实的Storm集群上运行,需要如下三个步骤:
(1)如上面(2、DRPC Server)说明的那样配置并运行DRPC Server
(2)提交DRPC topology到Storm集群上
|
1
|
storm jar drpc.jar com.test.storm.drpc.RemoteDRPCTest |
(3)客户端调用程序
DRPCClientTest:
|
1
2
3
4
5
6
7
8
9
10
11
12
13
|
package com.test.storm.drpc;
import backtype.storm.utils.DRPCClient;
public class DRPCClientTest {
public static void main(String[] args) throws Exception {
DRPCClient client = new DRPCClient("vm1", 3772);
String result = client.execute("upper", "hellmmo");
System.out.println(result);
}
} |
5、补充
一次可以部署多个DRPC:
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
|
package com.test.storm.drpc;
import backtype.storm.Config;
import backtype.storm.LocalCluster;
import backtype.storm.LocalDRPC;
import backtype.storm.drpc.LinearDRPCTopologyBuilder;
import backtype.storm.generated.StormTopology;
import com.test.storm.bolt.MyBolt;
public class LocalDRPCMutipleTest {
public static void main(String[] args) {
LocalDRPC drpcServer = new LocalDRPC();
LinearDRPCTopologyBuilder builder = new LinearDRPCTopologyBuilder("upper");
builder.addBolt(new MyBolt());
StormTopology drpcTopology = builder.createLocalTopology(drpcServer);
LinearDRPCTopologyBuilder builder2 = new LinearDRPCTopologyBuilder("upper2");
builder2.addBolt(new MyBolt());
StormTopology drpcTopology2 = builder2.createLocalTopology(drpcServer);
LocalCluster cluster = new LocalCluster();
Config config = new Config();
config.setDebug(true);
cluster.submitTopology("drpcupper", config, drpcTopology);
cluster.submitTopology("drpcupper2", config, drpcTopology2);
String result = drpcServer.execute("upper", "hello");
System.out.println("result1: " + result);
String result2 = drpcServer.execute("upper2", "hello");
System.out.println("result2: " + result);
drpcServer.shutdown();
cluster.shutdown();
}
} |