Spring Batch 初探、使用样例
工作里用到了Spring Batch项目,以前我也是做并行计算的,听说过Spring Batch不过并没有去具体了解过。今天抽空看看官方文档进行下初步的了解。
官方文档地址:http://docs.spring.io/spring-batch/trunk/reference/html/index.html
层次架构如上图。分三层:应用层,核心层,基础设施层。应用层包括所有的batch任务和用户开发的代码。核心层包括在运行期运行一个任务所需要的类,例如:JobLauncher,Job和Step的实现。应用和核心层都在基础设施层之上,基础设施层包括通用的读写器(readers and writers)以及如RetryTemplate等服务。
Spring Batch中的一些概念:
Job
Job是Step的容器,用来定义和配置整个任务的信息:
- Job的名字
- 定义Step的顺序
- 定义任务可否重启
Job Config Sample:
1
2
3
4
<job id="footballJob">
<step id="playerload" next="gameLoad"/>
<step id="gameLoad" next="playerSummarization"/>
<step id="playerSummarization"/></job>
JobInstance
是实际运行的Job实例,实例间数据也和业务独立。
JobParameters
Job运行的参数。。似乎没什么好解释的。
JobExecution
JobExecution是一个技术上的概念,只一次单独的执行任务。执行可以以成功和失败结尾,但是JobInstance只有在JobExecution成功结束的情况下,才被认为是完成的。例如,一个JobInstance第一次执行失败,重新执行,即为另一个JobExecution但是是同一个JobInstance。
Step
一个Job是有一个或者多个Step组成的。Step可复杂可简单。与Job类似,Step也有对应的StepExecution。
StepExecution
Step的每一次执行都是即为一个StepExecution。每次Step执行都会创建一个StepExecution。每个execution都包含了相关的Step和JobExecution的引用以及事务相关的数据和起始、结束时间。每个StepExecution也包含了一个ExecutionContext,包含了开发需要持久化的数据。
ExecutionContext
key/value对的对象,用于保存需要记录的上下文信息。scope是包括StepExecution和JobExecution。类似于Quartz中的JobDataMap。可以保存执行过程的信息,用于故障时重新执行和继续执行,甚至状态回滚等等,不过需要用户自行记录。任何时刻,一个StepExecution只会有一个ExecutionContext,由Spring Batch框架负责持久化和保证读取的准确性。
另外,需要注意的是,每个JobExectuion都有一个ExecutionContext,每个StepExecution也有一个独立的ExecutionContext。例如:
ExecutionContext ecStep = stepExecution.getExecutionContext(); ExecutionContext ecJob = jobExecution.getExecutionContext(); //ecStep does not equal ecJob
上述代码中,两个ExecutionContext是不相等的,Step中的context是在每个提交点上被保存,而job的context会在两个Step执行之间被保存。
JobRepository
JobRepository是关于前面提到的Job模版(Stereotypes)的持久化机制。提供了对了JobLauncher,Job和Step实现类的CRUD操作。当初次加载Job的时候,从repository中获取 JobExecution,在执行的过程中,StepExecution和JobExectuion的实现类通过repository持久化。
JobLauncher
JobLauncher是用于用指定的JobParameters加载Job的接口。
1
2
3
4
5
public interface JobLauncher {
public JobExecution run(Job job, JobParameters jobParameters)
throws JobExecutionAlreadyRunningException, JobRestartException;
}
Item Reader、 Item Writer、Item Processor
分别用于读、写和转换业务数据。转换即是进行数据模型的转换。
命名空间(Batch Namesapce)
1
2
3
4
5
6
7
8
<beans:beans xmlns="http://www.springframework.org/schema/batch"
xmlns:beans="http://www.springframework.org/schema/beans"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="
http://www.springframework.org/schema/beans
http://www.springframework.org/schema/beans/spring-beans.xsd
http://www.springframework.org/schema/batch
http://www.springframework.org/schema/batch/spring-batch-2.2.xsd">
完整使用样例:
配置文件 batch-context.xml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
<beans:beans xmlns= "http://www.springframework.org/schema/batch"
xmlns:beans="http://www.springframework.org/schema/beans" xmlns:xsi= "http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="
http://www.springframework.org/schema/beans
http://www.springframework.org/schema/beans/spring-beans.xsd
http://www.springframework.org/schema/batch
http://www.springframework.org/schema/batch/spring-batch-2.2.xsd">
<beans:bean id ="first-tasklet"
class= "com.coderli.spring.batch.firstjob.FirstTasklet" ></beans:bean >
<beans:bean id ="jobRepository"
class= "org.springframework.batch.core.repository.support.MapJobRepositoryFactoryBean" >
<beans:property name ="transactionManager" ref= "transactionManager" />
</beans:bean >
<beans:bean id ="transactionManager"
class= "org.springframework.batch.support.transaction.ResourcelessTransactionManager" ></beans:bean >
<job id ="onecoder-job">
<step id ="first-step" next="secend-step">
<tasklet ref ="first-tasklet"></ tasklet>
</step >
<step id ="secend-step" >
<tasklet >
<chunk reader ="myReader" writer= "myWriter" processor ="myProcessor"
commit-interval= "1"></chunk >
</tasklet >
</step >
</job >
<beans:bean id ="myReader" class= "com.coderli.spring.batch.firstjob.MyReader" ></beans:bean >
<beans:bean id ="myWriter" class= "com.coderli.spring.batch.firstjob.MyWriter" ></beans:bean >
<beans:bean id ="myProcessor"
class= "com.coderli.spring.batch.firstjob.MyProcessor" ></beans:bean >
<beans:bean id ="myFirstJobLauncher"
class= "org.springframework.batch.core.launch.support.SimpleJobLauncher" >
<beans:property name ="taskExecutor" ref= "syncTaskExecutor" />
<beans:property name ="jobRepository" ref= "jobRepository" />
</beans:bean >
<beans:bean id ="syncTaskExecutor"
class= "org.springframework.core.task.SyncTaskExecutor" />
<beans:bean id ="jobLauncherTestUtils"
class= "org.springframework.batch.test.JobLauncherTestUtils" >
<beans:property name ="job" ref= "onecoder-job"></beans:property >
</beans:bean >
</beans:beans>
First-Tasklet类
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
package com.coderli.spring.batch.firstjob;
import lombok.extern.slf4j.Slf4j;
import org.springframework.batch.core.StepContribution;
import org.springframework.batch.core.scope.context.ChunkContext;
import org.springframework.batch.core.step.tasklet.Tasklet;
import org.springframework.batch.repeat.RepeatStatus;
@Slf4j
public class FirstTasklet implements Tasklet {
@Override
public RepeatStatus execute(StepContribution contribution,
ChunkContext chunkContext) throws Exception {
log.info( "This is tasklet one in step one of job MyJob");
return RepeatStatus.FINISHED;
}
}
Reader类:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
package com.coderli.spring.batch.firstjob;
import lombok.extern.slf4j.Slf4j;
import org.springframework.batch.item.ItemReader;
import org.springframework.batch.item.NonTransientResourceException;
import org.springframework.batch.item.ParseException;
import org.springframework.batch.item.UnexpectedInputException;
/**
* 自定义Reader类
*
* @author OneCoder
* @date 2014年9月28日 下午2:33:43
*/
@Slf4j
public class MyReader implements ItemReader<MyModel> {
private int count;
@Override
public MyModel read() throws Exception, UnexpectedInputException,
ParseException, NonTransientResourceException {
log.info( "This is my reader in step two of job: [MyJob.]");
MyModel model = null;
if ( count < 2) {
model = new MyModel();
model.setDescription( "My Description");
model.setId( "My ID");
model.setName( "My Name");
count++;
}
return model;
}
}
writer类
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
package com.coderli.spring.batch.firstjob;
import java.util.List;
import lombok.extern.slf4j.Slf4j;
import org.springframework.batch.item.ItemWriter;
/**
* 自定义Writer类
*
* @author OneCoder
* @date 2014年9月28日 下午2:46:20
*/
@Slf4j
public class MyWriter implements ItemWriter<String> {
@Override
public void write(List<? extends String> items) throws Exception {
log.info( "This is my writer in step two for job: [MyJob].");
log.info( "Write the JSON string to the console.");
for (String item : items) {
log.info( "Write item: {}", item);
}
}
}
processor类
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
package com.coderli.spring.batch.firstjob;
import lombok.extern.slf4j.Slf4j;
import org.springframework.batch.item.ItemProcessor;
import com.google.gson.Gson;
/**
*
* @author OneCoder
* @date 2014年9月28日 下午2:39:48
*/
@Slf4j
public class MyProcessor implements ItemProcessor<MyModel, String> {
@Override
public String process(MyModel item) throws Exception {
log.info( "This is my process in step two of job: [MyJob].");
log.info( "Transfer MyModel to JSON string.");
Gson gson = new Gson();
return gson.toJson( item);
}
}
测试类
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
package com.coderli.spring.batch.firstjob;
import org.junit.Assert;
import org.junit.Test;
import org.junit.runner.RunWith;
import org.springframework.batch.core.JobExecution;
import org.springframework.batch.test.JobLauncherTestUtils;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.test.context.ContextConfiguration;
import org.springframework.test.context.junit4.SpringJUnit4ClassRunner;
/**
* 任务启动器,通过JUnit测试方式启动
*
* @author OneCoder
* @date 2014年9月28日 下午3:03:03
*/
@RunWith(SpringJUnit4ClassRunner. class)
@ContextConfiguration(locations = { "../batch-context.xml" })
public class MyFirstJobTest {
@Autowired
private JobLauncherTestUtils jobLauncherTestUtils;
@Test
public void testJob() throws Exception {
jobLauncherTestUtils.launchJob();
JobExecution jobExecution = jobLauncherTestUtils .launchJob();
Assert. assertEquals("COMPLETED", jobExecution.getExitStatus().getExitCode());
}
}
简单介绍上述代码里用到的东西,@SLF4J注解是lombok中的,之前介绍过。测试用的Spring-test和spring-batch-test提供的相关功能。