Kotlin Iterable과 Sequence는 언제 다르게 동작할까? ::

들어가며: 컬렉션 처리의 두 가지 접근법

Kotlin에서 List나 Set과 같은 컬렉션을 다룰 때, 우리는 filter, map과 같은 다양한 고차 함수를 사용합니다. 이러한 함수들은 대부분 Iterable 인터페이스의 확장 함수로 구현되어 있습니다. 그런데 Kotlin 표준 라이브러리에는 Iterable과 매우 유사해 보이는 Sequence라는 또 다른 인터페이스가 존재합니다.

두 방식은 겉보기에는 비슷하지만, 내부적으로는 즉시 평가(Eager Evaluation) 와 지연 평가(Lazy Evaluation) 라는 차이가 있습니다. 대용량 데이터를 다루거나 연산 체인이 길어질 때 이 차이가 성능과 메모리 사용량에 영향을 줍니다. 이 글에서는 Iterable과 Sequence의 동작 방식을 예제로 비교합니다.

1. 즉시 평가 (Eager Evaluation): `Iterable`의 방식

List, Set 등 우리가 일반적으로 사용하는 컬렉션은 Iterable을 구현합니다. Iterable에 대한 연산은 즉시 평가 방식으로 동작합니다. 이는 각 연산(filter, map 등)이 호출되는 즉시 전체 컬렉션을 순회하며, 그 결과를 담은 새로운 중간 컬렉션 을 생성하여 반환한다는 의미입니다.

`Iterable`의 동작 과정

아래 코드로 Iterable의 동작을 단계별로 보겠습니다.

val words = "The quick brown fox jumps over the lazy dog".split(" ")

println("--- Iterable 프로세스 시작 ---")
val lengthsList = words
    .filter { println("filter: $it"); it.length > 3 } // 첫 번째 연산
    .map { println("map: ${it.length}"); it.length }      // 두 번째 연산
    .take(4)                                            // 세 번째 연산

println("\n--- 최종 결과 ---")
println(lengthsList)

출력 결과:

--- Iterable 프로세스 시작 ---
filter: The
filter: quick
filter: brown
filter: fox
filter: jumps
filter: over
filter: the
filter: lazy
filter: dog
map: 5
map: 5
map: 5
map: 4
map: 4

--- 최종 결과 ---
[5, 5, 5, 4]

출력 결과를 보면 Iterable의 동작 방식이 드러납니다.

filter 단계: words 리스트의 모든 요소(9개) 에 대해 filter 연산을 수행합니다. 그 결과로 [quick, brown, jumps, over, lazy]라는 새로운 리스트(중간 컬렉션 1) 가 메모리에 생성됩니다.
map 단계: filter에서 생성된 중간 컬렉션의 모든 요소(5개) 에 대해 map 연산을 수행합니다. 그 결과로 [5, 5, 5, 4, 4]라는 또 다른 새 리스트(중간 컬렉션 2) 가 생성됩니다.
take 단계: map에서 생성된 리스트에서 앞의 4개 요소를 가져와 [5, 5, 5, 4]라는 최종 리스트 를 생성합니다.

이처럼 Iterable은 각 단계를 수평적으로(horizontally) 처리하며, 단계마다 새로운 컬렉션을 만들어 메모리 사용량이 증가하고, 불필요한 계산(예: lazy와 dog에 대한 filter, lazy의 길이를 계산한 map)이 발생할 수 있습니다.

2. 지연 평가 (Lazy Evaluation): `Sequence`의 방식

Sequence는 지연 평가 방식으로 동작합니다. asSequence()를 통해 컬렉션을 Sequence로 변환하면, filter나 map과 같은 중간 연산(intermediate operations) 은 즉시 실행되지 않습니다. 대신, 어떤 연산을 수행해야 하는지에 대한 계획만 세워둡니다.

실제 연산은 toList(), count()와 같은 최종 연산(terminal operation) 이 호출될 때 비로소 시작됩니다. 이때 Sequence는 각 요소를 하나씩 가져와 전체 연산 파이프라인을 통과시키는 방식으로 동작합니다.

`Sequence`의 동작 과정

동일한 작업을 Sequence로 처리해 보겠습니다.

val words = "The quick brown fox jumps over the lazy dog".split(" ")

println("--- Sequence 프로세스 시작 ---")
val lengthsSequence = words.asSequence() // Sequence로 변환
    .filter { println("filter: $it"); it.length > 3 } // 중간 연산 1
    .map { println("map: ${it.length}"); it.length }      // 중간 연산 2
    .take(4)                                            // 중간 연산 3

println("\n--- 최종 연산(toList) 호출 ---")
println(lengthsSequence.toList()) // 최종 연산

출력 결과:

--- Sequence 프로세스 시작 ---

--- 최종 연산(toList) 호출 ---
filter: The
filter: quick
map: 5
filter: brown
map: 5
filter: fox
filter: jumps
map: 5
filter: over
map: 4
[5, 5, 5, 4]

Iterable과 다른 출력 결과를 통해 Sequence의 동작 방식을 볼 수 있습니다.

중간 연산 단계: asSequence(), filter, map, take가 호출될 때는 아무런 계산도 일어나지 않습니다. println 구문이 실행되지 않은 것을 통해 이를 확인할 수 있습니다.
최종 연산 단계 (toList()): toList()가 호출되자 비로소 연산이 시작됩니다.
- 첫 번째 요소 “The"가 filter를 통과하지 못합니다.
- 두 번째 요소 “quick"이 filter를 통과하고, 즉시 map으로 전달되어 5가 됩니다. 이 5는 take로 전달됩니다.
- 이 과정이 반복되어 “brown”, “jumps”, “over"가 차례로 파이프라인을 통과합니다.
- take(4)가 4개의 요소를 수집하는 순간, 더 이상 뒤의 요소를 처리할 필요가 없으므로 연산을 중단 합니다. 따라서 “lazy"와 “dog"는 filter조차 되지 않습니다.

이처럼 Sequence는 각 요소를 수직적으로(vertically) 처리합니다. 중간 컬렉션을 만들지 않고, take 같은 단축(short-circuiting) 연산에서는 뒤쪽 요소를 계산하지 않습니다.

`Iterable` vs `Sequence`: 언제 무엇을 써야 할까?

상황	추천 방식	이유
작은 컬렉션 에 대한 단순한 연산	`Iterable` (기본)	`Sequence` 생성에 따른 약간의 오버헤드가 오히려 성능에 불리할 수 있습니다. 코드가 더 간단하고 직관적입니다.
대용량 컬렉션 또는 무한한 데이터 스트림	`Sequence`	중간 컬렉션을 생성하지 않아 메모리 사용량이 매우 적고, OutOfMemoryError를 방지할 수 있습니다.
복잡한 연산 체인 (여러 단계의 `map`, `filter` 등)	`Sequence`	각 요소에 대해 전체 파이프라인을 실행하므로 중간 컬렉션 생성 비용이 없고, 전체 순회 횟수가 줄어듭니다.
`find`, `any`, `take` 등 단축 연산 을 포함할 때	`Sequence`	조건을 만족하는 즉시 연산을 중단하므로, 전체 컬렉션을 순회할 필요가 없어 성능이 크게 향상됩니다.

결론

Iterable과 Sequence는 각각 즉시 평가와 지연 평가라는 특징을 가집니다. 작은 컬렉션에 단순한 연산을 적용할 때는 Iterable로 충분한 경우가 많습니다. 반면 대용량 데이터를 다루거나 여러 단계의 변환과 단축 연산이 섞인다면 asSequence()를 검토할 만합니다. 무조건 Sequence가 빠른 것은 아니므로, 데이터 크기와 연산 형태를 보고 선택하는 편이 좋습니다.

참고 자료:

이 글은 AI의 도움을 받아 교정 및 정리되었습니다.

검색

Kotlin Iterable과 Sequence는 언제 다르게 동작할까?

들어가며: 컬렉션 처리의 두 가지 접근법 #

1. 즉시 평가 (Eager Evaluation): Iterable의 방식 #

Iterable의 동작 과정 #

2. 지연 평가 (Lazy Evaluation): Sequence의 방식 #

Sequence의 동작 과정 #

Iterable vs Sequence: 언제 무엇을 써야 할까? #

결론 #