【问题标题】:Spring Batch read step running in loopSpring Batch 读取步骤循环运行
【发布时间】:2023-03-13 20:02:01
【问题描述】:

我遇到了一段读取一些数据的代码,如下所示:

public class StudioReader implements ItemReader<List<Studio>> {
   @Setter private AreaDao areaDao;
   @Getter @Setter private BatchContext context;
   private HopsService hopsService = new HopsService();

   @Override
   public List<Studio> read() throws Exception {
      List<Studio> list = hopsService.getStudioHops();
      if (!isEmpty(list)) {
         for (Studio studio : list) {
            log.info("Studio being read: {}", studio.getCode());
            List areaList = areaDao.getArea(studio
                  .getCode());
            if (areaList.size() > 0) {
               studio.setArea((String) areaList.get(0));
               log.info("Area {1} is fetched for studio {2}", areaList.get(0), studio.getCode());
            }
            this.getContext().setReadCount(1);
         }
      }
      return list;
   }

但是,当我运行作业时,此读取会循环运行。我从另一个 stackoverflow answer 发现这是预期的行为。那么我的问题是给定这个特定示例的最佳解决方案是什么?从 JdbcCursorItemReader 扩展 StudioReader ?我找到了一个示例,它定义了 xml 中我不想要的所有内容。这是供读者阅读的 context.xml 部分:

  <bean class="org.springframework.batch.core.scope.StepScope" />
   <bean id="ItemReader" class="com.syc.studio.reader.StudioReader" scope="step">
      <property name="context" ref="BatchContext" />
      <property name="areaDao" ref="AreaDao" />
   </bean>

这里是 xml 中的作业定义:

 <bean id="StudioJob" class="org.springframework.batch.core.job.SimpleJob">
      <property name="steps">
         <list>
                     <bean id="StudioStep" parent="SimpleStep" >
                     <property name="itemReader" ref="ItemReader"/>
                     <property name="itemWriter" ref="ItemWriter"/>
                     <property name="retryableExceptionClasses">
                        <map>
                           <entry key="com.syc.studio.exception.CustomException" value="true"/>
                        </map>
                     </property>
                     <property name="retryLimit" value="2" />
                     </bean>
         </list>
      </property>
      <property name="jobRepository" ref="jobRepository" />
   </bean>

作者:

public void write(List<? extends Object> obj) throws Exception {
   List<Studio> list = (List<Studio>) obj.get(0);
   for (int i = 0; i <= list.size(); i++) {
      Studio studio = list.get(i);
      if (apiClient == null) {
        apiClient = new APIClient("v2");
     }
      this.uploadXML(studio);
   }

@holi-java 建议后的读取方法:

public List<Studio> read() throws Exception {
    if (this.listIterator == null) {
        this.listIterator = initializing();
    }
    return this.listIterator.hasNext() ? this.listIterator.next() : null;
}

private Iterator<List<Studio>> initializing() {
    List<Studio> listOfStudiosFromApi = hopsService.getStudioLocations();
    for (Studio studio : listOfStudiosFromApi) {
        log.info("Studio being read: {}", studio.getCode());
        List areaList = areaDao.getArea(studio.getCode());
        if (areaList.size() > 0) {
            studio.setArea((String) areaList.get(0));
            log.info("Area {1} is fetched for studio {2}", areaList.get(0), studio.getCode());
        }
        this.getContext().setReadCount(1);
    }
    return Collections.singletonList(listOfStudiosFromApi).iterator();
}

【问题讨论】:

  • @MichaelMinella 他确实链接到那个帖子,更不用说那个帖子甚至没有解决方案......
  • @Yana foreach initializing 方法中的循环应该使用 ItemProcessor 。这不是ItemReaderItemReader 违反SRP 的责任。

标签: spring-boot java-8 spring-batch


【解决方案1】:

ItemReader.read assert 的 spring-batch 文档:

实现必须在输入数据集的末尾返回 null

但是你的 read 方法总是返回一个 List 并且应该是这样的:

public Studio read() throws Exception {
    if (this.results == null) {
        List<Studio> list = hopsService.getStudioHops();
        ...
        this.results=list.iterator();
    }
    return this.results.hasNext() ? this.results.next() : null;
}

如果您希望您的读取方法返回一个列表,那么您必须像这样对结果进行分页:

public List<Studio> read() throws Exception {
    List<Studio> results=hopsService.getStudioHops(this.page++);
    ...
    return results.isEmpty()?null:results;
}

如果您无法从 Service 中分页结果,您可以这样解决:

public List<Studio> read() throws Exception {
    if(this.results==null){
     this.results = Collections.singletonList(hopsService.getStudioHops()).iterator();
    }

    return this.results.hasNext()?this.results.next():null;
}

最好不要阅读项目列表List&lt;Studio&gt;,而是一次阅读一个项目Studio。当您阅读项目列表时,您可能在 writersprocessors 之间重复了迭代逻辑,正如您在 cmets 中展示的演示一样。如果您有大量数据列表要处理,您可以在阅读器中结合分页,例如:

public Studio read() throws Exception {
    if (this.results == null || !this.results.hasNext()) {
        List<Studio> list = hopsService.getStudioHops(this.page++);
        ...
        this.results=list.iterator();
    }

    return this.results.hasNext() ? this.results.next() : null;
}

也许你需要看看step processing mechanism

【讨论】:

  • 谢谢-但有点困惑,因为您的示例没有返回列表-您能澄清一下吗?
  • @Yana 读者一次阅读一个项目而不是项目列表。如果您阅读项目列表,那么您的作者可能是这样的:write(List&lt;List&lt;Studio&gt;&gt;)
  • @Yana 如果您一次阅读项目列表。您必须在reader.read 中分页结果。
  • @Yana 最好不要一次读取项目列表,这将导致 readerwriterprocessor 重复。
  • read() 方法是我在这里的 - 我也看到了这个 example - 但是我不确定它里面会发生什么
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2018-06-20
  • 1970-01-01
  • 1970-01-01
  • 2022-01-07
  • 2018-02-26
  • 2018-09-27
  • 1970-01-01
相关资源
最近更新 更多