Iyoungman Back-end Developer

Java8. 병렬 데이터 처리와 성능


Summary

  • 병렬 스트림에 대해 알아본다.
  • 포크/조인 프레임워크를 알아본다.


Java7 이전 vs 이후

  • Java7 이전에는 데이터 컬렉션을 병렬 처리하기 힘들었다.
  • 다음은 Java7 이전에 데이터 컬렉션을 병렬 처리하는 과정이다.

데이터를 서브 파트로 분할한다.

분할된 서브 파트를 각각의 스레드로 할당한다.

스레드로 할당한 후 적절한 동기화 처리를 한다.

마지막으로 부분 결과를 합친다.


  • Java7 부터는 위의 기능을 지원하는 포크/조인 프레임워크 를 기능을 제공한다.
  • 또한 Java8의 병렬 스트림은 내부적으로 포크/조인 프레임워크를 사용한다.


병렬 스트림

정의

  • 스트림 요소를 분할하여 각각의 스레드에서 처리하도록 하는것.

image


사용

  • 컬렉션에 parallel() 혹은 parallelStream() 을 호출한다.
public long parallelSum(long n) {
    return Stream.iterate(1L, i -> i +1)
            .limit(n)
            .parallel()
            .reduce(0L, Long::sum);
}


parallel을 호출하면 병렬 불리언 플래그 설정된다.

최종연산에서 플래그를 확인하여 처리된다.

image


  • 만약 parallel과 sequential 두개를 모두 사용했을 때에는
    최종적으로 호출된 메서드로 전체 스트림 파이프라인에 영향이 미친다.


내부

  • 병렬스트림으로 사용하는 스레드는 ForkJoinPool을 사용한다.
  • ForkJoinPool은 CPU 코어 개수와 관련있다.
  • 정확하게는 하이퍼스레딩과 관련된 가상 프로세서 개수이다.
Runtime.getRuntime().availableProcessors()


효과적으로 사용하기

병렬 스트림은 순차 스트림보다 성능이 떨어질 수도 있다.

아래와 같은 요소를 고려하자.

1) 직접 성능을 측정하라.


2) 박싱을 주의


3) 요소의 순서와 관련있는 연산 피하기

  • limit, findFirst


4) 소량의 데이터의 경우 사용하지 말자.


5) 스트림을 구성하는 자료구조 확인


포크/조인 프레임워크

  • Java7에 추가된 기능.
  • Java8 병렬스트림에서는 내부적으로 포크/조인 프레임워크로 처리.


RecursiveTask 활용

  • ForkJoinPool을 이용하려면 RecursiveTask의 서브클래스를 만든다.
  • RecursiveTask의 추상 메서드 compute를 구현한다.

  • compute의 의사코드이다.
if (태스크가 충분히 작거나  이상 분할   없으면) {
    순차적으로 태스크 계산
} else {
    태스크를  서브태스크로 분할
    태스크가 다시 서브태스크로 분할되도록  메서드를 재귀적으로 호출함
    모든 서브태스크의 연산이 완료될 때까지 기다림
     서브태스크의 결과를 합침
}


  • long[] 의 sum을 구하는 것을 포크/조인 프레임워크를 사용한 예제이다.
public class ForkJoinSumCalculator extends RecursiveTask<Long> {

    public static final ForkJoinPool FORK_JOIN_POOL = new ForkJoinPool();
    public static final long THRESHOLD = 10_000;

    private final long[] numbers;
    private final int start;
    private final int end;

    public ForkJoinSumCalculator(long[] numbers) {
        this(numbers, 0, numbers.length);
    }

    private ForkJoinSumCalculator(long[] numbers, int start, int end) {
        this.numbers = numbers;
        this.start = start;
        this.end = end;
    }

    @Override
    protected Long compute() {
        int length = end - start;
        if (length <= THRESHOLD) {
            return computeSequentially();
        }
        ForkJoinSumCalculator leftTask = new ForkJoinSumCalculator(numbers, start, start + length / 2);
        leftTask.fork();
        ForkJoinSumCalculator rightTask = new ForkJoinSumCalculator(numbers, start + length / 2, end);
        Long rightResult = rightTask.compute();
        Long leftResult = leftTask.join();
        return leftResult + rightResult;
    }

    private long computeSequentially() {
        long sum = 0;
        for (int i = start; i < end; i++) {
            sum += numbers[i];
        }
        return sum;
    }

    public static long forkJoinSum(long n) {
        long[] numbers = LongStream.rangeClosed(1, n).toArray();
        ForkJoinTask<Long> task = new ForkJoinSumCalculator(numbers);
        return FORK_JOIN_POOL.invoke(task);
    }

}


  • 이를 그림으로 나타내면 아래와 같다.

Untitled


포크/조인 프레임워크를 제대로 사용하는 방법

1) 두 서브태스크가 시작된 다음에 join 호출.

  • join은 태스크의 결과가 처리될 때까지 기다린다.


2) RecursiveTask 내에서는 invoke() 메서드 사용하지 말아야한다.

  • 순차 코드에서 병렬 계산을 시작할때만 invoke()를 사용한다.
  • invoke()는 Task를 Pool에 제출하는 메서드이다.


3) 한쪽 작업에는 fork, 한쪽 작업에는 compute 가 효율적.

  • compute 쪽에서는 같은 스레드를 재사용.


작업 훔치기

  • 일반적으로 멀티 스레드로 처리를 하면 각 작업의 완료 시간이 다르다.
  • 이 경우, 어떤 스레드는 바쁜 상태인데
    어떤 스레드는 할일이 없는 상태가 될 수 있다.

  • 포크/조인 프레임워크는 작업 훔치기 기법으로 이 문제를 해결한다.
  • 작업 훔치기는 각각의 태스크에 작업을 공정하게 분할한다.

image


Spliterator 인터페이스

  • Java8부터 제공하는 인터페이스.
  • 스트림을 분할하여 처리할때 사용.
  • 스트림의 요소를 커스텀하게 분할하고 싶을때 구현하면된다.


메서드

  • 다음은 Spliterator 인터페이스에서 필수로 구현해야하는 메서드이다.
public interface Spliterator<T> {
    boolean tryAdvance(Consumer<? super T> action);
    Spliterator<T> trySplit();
    long estimateSize();
    int characteristics();
}


boolean tryAdvance(Consumer<? super T> action);

  • Spliterator의 요소를 하나씩 순차적으로 소비하면서 탐색해야 할 요소가 남아 있으면 참을 반환.


Spliterator trySplit();

  • Spliterator의 일부 요소를 분할해서 두 번째 Spliterator를 생성하는 메서드.


long estimateSize();

  • 탐색해야 할 요소 수 정보를 제공.


int characteristics();

  • Spliterator에서 정의한 int형으로 Spliterator의 특성을 나타낸다.

KakaoTalk_20200530_195210607


분할 과정

  • trySplit()의 결과가 null을 반환할때까지 재귀적으로 반복.
  • 분할 과정은 characteristics() 메서드로 정의되는 Spliterator의 특성에 영향.

image


Reference


Comments

Content