API가 너무 많은 정보를 준다면?

API를 개발하다 보면 클라이언트가 실제로 필요한 것보다 훨씬 많은 데이터를 응답으로 보내는 ‘오버페칭(Over-fetching)’ 문제를 마주하게 됩니다.

화면에는 상품 이름과 가격만 표시하면 되는데, API는 상품 설명, 리뷰 목록, 판매자 정보, 배송 정책 등 수십 가지 필드를 몽땅 내려주곤 하죠. 이는 불필요한 네트워크 트래픽을 유발하고, 모바일 환경에서 앱 반응 속도를 떨어뜨리는 주된 원인이 됩니다.

이 글에서 소개할 Sparse Fieldsets 패턴은, 바로 이 오버페칭 문제를 해결하기 위해 등장한 기술입니다.

1. Sparse Fieldsets란?

먼저 핵심 개념부터 알아보겠습니다.

Sparse Fieldsets는 클라이언트가 API 요청 시 “필요한 필드만 지정해서 받겠다” 고 선언하는 패턴입니다. 예를 들어, 상품 목록 API에서 전체 정보가 아닌 id와 name만 필요하다면 이렇게 요청합니다:

# 요청 (필요한 필드만 명시)
GET /products?fields=id,name

// 응답 (요청한 필드만 반환)
[
  { "id": 1, "name": "스마트폰" },
  { "id": 2, "name": "노트북" }
]

기존 API라면 description, reviews, sellerInfo 등 수십 개 필드가 모두 포함되었을 응답이, 딱 필요한 것만 간결하게 내려옵니다.

📖 같은 개념, 다른 이름들

이 패턴은 기술 스택이나 회사마다 다른 이름으로 불리지만, 핵심 아이디어는 “클라이언트가 원하는 필드를 지정한다” 로 동일합니다.

용어	사용처
Sparse Fieldsets	JSON:API 스펙 (REST 진영의 표준적 명칭)
Field Mask	Google API (AIP-161) 및 gRPC/Protobuf 생태계
Projections	LinkedIn API 등

이 글에서는 REST 환경에서 가장 널리 쓰이는 Sparse Fieldsets라는 용어를 사용하되, Google/gRPC 관련 내용에서는 Field Mask로도 지칭합니다.

2. GraphQL과 무엇이 다를까?

오버페칭 문제를 해결하는 대표적인 기술로 GraphQL이 있습니다. 둘을 비교해보겠습니다.

GraphQL: 강력하지만 도입 비용이 큰 선택

Facebook이 만든 GraphQL은 클라이언트가 필요한 데이터 구조를 쿼리 언어로 정의해서 요청하면, 정확히 그 형태대로 응답을 주는 기술입니다.

장점: 클라이언트에게 데이터 선택권이 100% 주어집니다. 여러 리소스의 연관 관계(Graph)를 한 번 요청으로 가져올 수 있어 오버페칭과 언더페칭(Under-fetching)을 동시에 해결합니다.
단점: 도입 비용이 매우 비쌉니다. 기존 REST API와는 완전히 다른 생태계(Schema, Resolver 등)를 새로 구축해야 합니다.

Sparse Fieldsets: REST API를 그대로 활용하는 실용적 접근

JSON:API 스펙에서 정의한 이 방식은, REST API 요청에 fields=id,name과 같이 필요한 필드 목록을 함께 보내는 것입니다.

장점: 기존 REST API 구조를 그대로 유지하면서 적용할 수 있습니다. 구현이 비교적 간단하고, 클라이언트에게도 익숙한 방식입니다.
단점: GraphQL처럼 복잡한 그래프 관계를 깊이 탐색하기에는 표현력이 부족할 수 있습니다.

한눈에 비교

기준	GraphQL	Sparse Fieldsets
도입 비용	높음 (새 스택 구축 필요)	낮음 (기존 REST에 추가)
유연성	매우 높음 (중첩 쿼리 가능)	중간 (단일 리소스 필드 선택)
학습 곡선	가파름	완만함
적합한 상황	신규 프로젝트, 복잡한 관계형 데이터	기존 REST API 개선

3. 언제 선택해야 할까?

그렇다면 우리 팀은 언제 Sparse Fieldsets를 선택해야 할까요?

✅ 이런 상황이라면 좋은 선택입니다

이미 운영 중인 REST API가 있는 경우: 멀쩡한 시스템을 갈아엎지 않고 성능만 개선하고 싶을 때 최소한의 변경으로 적용 가능합니다.
클라이언트마다 필요한 데이터가 다른 경우: 모바일 리스트 화면에서는 썸네일과 제목만, 웹 상세 화면에서는 전체 정보가 필요한 것처럼, 동일한 리소스에 대해 클라이언트마다 필요한 정보의 양이 다를 때 유연하게 대처할 수 있습니다.
Public API를 만드는 경우: Google, Netflix, LinkedIn 등 글로벌 기업들이 이미 이 패턴을 표준으로 채택하고 있습니다.

❌ 다른 대안을 고려해야 하는 경우

새 프로젝트를 시작하며 복잡한 관계형 데이터를 다루는 경우: 처음부터 설계한다면 GraphQL이 더 나은 개발 경험을 제공할 수 있습니다.
단순한 내부 관리 도구(Admin)인 경우: 트래픽이 적고 성능이 중요하지 않다면, 굳이 이런 최적화를 적용해 개발 복잡도를 높일 필요가 없습니다.

4. 더 깊이 알기: 조회를 넘어서

단순히 “필드를 골라 쓴다"는 개념을 넘어, 이 패턴의 추가적인 장점들을 알아봅시다.

API 진화와 하위 호환성

Netflix 기술 블로그에서도 강조하듯, 이 패턴의 숨겨진 장점은 API 변경에 대한 내성입니다. 클라이언트가 필요한 필드를 명시적으로 요청하기 때문에, 서버가 새로운 필드를 추가하더라도 기존 클라이언트는 영향을 받지 않습니다.

즉, v1, v2 버전을 무수히 만들지 않고도 API를 우아하게 진화(Evolve)시킬 수 있습니다.

쓰기 작업(Update/PATCH)에서의 활용

Google AIP-161에 따르면, 이 패턴은 조회(GET)뿐만 아니라 수정(PATCH) 작업에서도 빛을 발합니다.

# "status 필드만 변경하겠다"고 명시적으로 선언
PATCH /orders/123?update_mask=status
Content-Type: application/json

{ "status": "shipped" }

update_mask 필드를 사용하면 “나는 이 리소스의 status 필드만 변경하고 싶어"라고 명시할 수 있어, 실수로 다른 필드를 덮어쓰는 사고를 방지하고 의도를 명확히 할 수 있습니다.

지연 로딩과 결합하면 더 강력해진다

필드를 선택해서 내려준다고 해도, 서버에서 모든 필드를 미리 조회해둔다면 성능 이점이 반감됩니다. 예를 들어, 클라이언트가 reviews 필드를 요청하지 않았는데도 서버가 DB에서 리뷰 데이터를 조회한다면 불필요한 연산이 발생하죠.

이를 해결하려면 지연 로딩(Lazy Loading) 을 결합해야 합니다. “요청된 필드일 때만” 실제 데이터를 조회하도록 구현하면, 네트워크 비용뿐 아니라 서버의 DB 조회 비용도 함께 절감할 수 있습니다. 이 내용은 아래 구현 섹션에서 Supplier를 활용해 다룹니다.

⚠️ 주의: 프로덕션 환경에서는 와일드카드(*) 사용을 지양하세요. 모든 필드를 요청하는 것은 오버페칭을 유발할 뿐만 아니라, 향후 필드가 추가되었을 때 예상치 못한 데이터 노출이나 성능 저하로 이어질 수 있습니다.

5. 실전! Sparse Fieldsets 구현하기 (Kotlin & Spring)

개념을 이해했으니 이제 직접 구현해봅시다. 이 패턴을 제대로 구현하려면 ‘값이 null인 필드’ 와 ‘요청하지 않아서 생략된 필드’ 를 명확히 구분해야 합니다. 이를 위해 JsonWrapper라는 개념을 도입합니다.

전체 흐름 미리보기

┌─────────────────────────────────────────────────────────────────────────┐
│ 1. 클라이언트 요청                                                       │
│    GET /products/1?fields=id,name                                       │
└────────────────────────────────────┬────────────────────────────────────┘
                                     ▼
┌─────────────────────────────────────────────────────────────────────────┐
│ 2. Interceptor가 요청 파라미터를 ThreadLocal에 저장                      │
│    SparseFieldsetsContext.setRequestedFields(["id", "name"])            │
└────────────────────────────────────┬────────────────────────────────────┘
                                     ▼
┌─────────────────────────────────────────────────────────────────────────┐
│ 3. 컨트롤러 → 서비스 → DTO 생성 (모든 필드를 JsonWrapper로 감쌈)           │
└────────────────────────────────────┬────────────────────────────────────┘
                                     ▼
┌─────────────────────────────────────────────────────────────────────────┐
│ 4. Serializer가 ThreadLocal 확인 후, 요청된 필드만 JSON에 출력             │
│    → { "id": 1, "name": "스마트폰" }                                     │
└─────────────────────────────────────────────────────────────────────────┘

1단계: 요청 정보 저장하기 (`SparseFieldsetsInterceptor`)

먼저 클라이언트가 요청한 필드 목록을 쓰레드 별로 저장해둘 공간이 필요합니다.

// 1. ThreadLocal로 요청 컨텍스트 관리
object SparseFieldsetsContext {
    private val requestedFieldsHolder = ThreadLocal<Set<String>>()
    
    fun setRequestedFields(fields: Set<String>) { requestedFieldsHolder.set(fields) }
    fun getRequestedFields(): Set<String> = requestedFieldsHolder.get() ?: emptySet()
    fun clear() { requestedFieldsHolder.remove() }
}

// 2. Interceptor에서 파라미터 파싱
@Component
class SparseFieldsetsInterceptor : HandlerInterceptor {
    override fun preHandle(request: HttpServletRequest, response: HttpServletResponse, handler: Any): Boolean {
        request.getParameter("fields")?.let {
            val fields = it.split(",").map(String::trim).toSet()
            SparseFieldsetsContext.setRequestedFields(fields)
        }
        return true
    }

    override fun afterCompletion(request: HttpServletRequest, response: HttpServletResponse, handler: Any, ex: Exception?) {
        SparseFieldsetsContext.clear() // 메모리 누수 방지, 필수!
    }
}

2단계: `JsonWrapper`와 DTO 설계

모든 필드를 그냥 내보내는 것이 아니라, JsonWrapper로 감싸서 직렬화 로직이 개입할 틈을 만들어줍니다.

// Sparse Fieldsets 대상 필드를 감싸는 Wrapper
class JsonWrapper<T>(val value: T)

@JsonInclude(JsonInclude.Include.NON_EMPTY)
data class ProductResponse(
    val id: JsonWrapper<Long>,
    val name: JsonWrapper<String>,
    // 다른 엔티티 조회가 필요한 필드는 Supplier로 감싸서 지연 로딩
    val reviews: JsonWrapper<Supplier<List<ReviewDto>>>
)

⚠️ 핵심 포인트: DTO는 서비스 레이어에서 생성됩니다. 이때 reviews처럼 별도 조회가 필요한 필드는 실제 DB 조회 로직을 Supplier 안에 넣어둡니다. 이 시점에서는 아직 리뷰 조회가 실행되지 않습니다.

// 서비스 레이어 - DTO 생성 시점
@Service
class ProductService(
    private val productRepository: ProductRepository,
    private val reviewRepository: ReviewRepository
) {
    fun getProduct(id: Long): ProductResponse {
        val product = productRepository.findById(id) ?: throw NotFoundException()
        
        return ProductResponse(
            id = JsonWrapper(product.id),
            name = JsonWrapper(product.name),
            // ⚠️ 여기서 리뷰를 조회하지 않음! Supplier 안에 로직만 담아둠
            reviews = JsonWrapper(memoize { 
                reviewRepository.findByProductId(id).map { it.toDto() }
            })
        )
    }
}

// 컨트롤러 - 서비스에서 받은 DTO를 그대로 반환
@RestController
class ProductController(private val productService: ProductService) {
    @GetMapping("/products/{id}")
    @UseSparseFieldsets
    fun getProduct(@PathVariable id: Long): ProductResponse {
        return productService.getProduct(id)
    }
}

클라이언트가 ?fields=id,name으로 요청하면:

Serializer가 reviews 필드는 요청되지 않았음을 확인
Supplier.get()을 호출하지 않음 → 리뷰 DB 조회 자체가 발생하지 않음!

클라이언트가 ?fields=id,name,reviews로 요청하면:

Serializer가 reviews 필드도 요청되었음을 확인
Supplier.get() 호출 → 이때 비로소 리뷰 조회 실행

3단계: 마법이 일어나는 `SparseFieldsetsSerializer`

이제 Jackson Serializer가 실제로 필드를 걸러내는 로직을 수행합니다.

class SparseFieldsetsSerializer : JsonSerializer<JsonWrapper<*>>() {
    override fun serialize(wrapper: JsonWrapper<*>, gen: JsonGenerator, serializers: SerializerProvider) {
        val currentFieldName = gen.outputContext.currentName
        val requestedFields = SparseFieldsetsContext.getRequestedFields()

        // 요청된 필드가 아니면 빈 값을 써서 @JsonInclude(NON_EMPTY)에 의해 제외되도록 함
        if (requestedFields.isNotEmpty() && currentFieldName !in requestedFields) {
            return // 아무것도 쓰지 않으면 NON_EMPTY 설정과 함께 필드가 제외됨
        }

        val rawValue = wrapper.value
        // Supplier라면 이때 실행 (지연 로딩 효과!)
        val finalValue = if (rawValue is Supplier<*>) rawValue.get() else rawValue

        if (finalValue != null) {
            serializers.defaultSerializeValue(finalValue, gen)
        } else {
            gen.writeNull()
        }
    }

    // 빈 값일 때 필드를 제외하기 위한 설정
    override fun isEmpty(provider: SerializerProvider, value: JsonWrapper<*>): Boolean {
        val requestedFields = SparseFieldsetsContext.getRequestedFields()
        // 요청된 필드 목록이 있고, 현재 필드가 포함되지 않으면 "비어있는 것"으로 처리
        return requestedFields.isNotEmpty()
    }
}

💡 동작 원리: 요청되지 않은 필드는 isEmpty()가 true를 반환하고, DTO의 @JsonInclude(NON_EMPTY) 설정과 결합되어 JSON 출력에서 완전히 제외됩니다.

4단계: Update/PATCH에 적용하기 (update_mask)

앞서 설명한 것처럼, 이 패턴은 수정 작업에도 유용합니다. update_mask로 지정된 필드만 업데이트하도록 구현해봅시다.

먼저 리플렉션을 활용한 범용 유틸리티를 만들어두면, 필드가 추가되어도 코드 수정 없이 자동으로 처리됩니다.

import kotlin.reflect.KMutableProperty1
import kotlin.reflect.full.memberProperties

// 범용 Field Mask 적용 유틸리티
// source에서 target으로, fieldMask에 포함된 필드만 복사
fun <T : Any> applyFieldMask(
    target: T,
    source: Map<String, Any?>,  // Request를 Map으로 변환하여 전달
    fieldMask: Set<String>
) {
    target::class.memberProperties
        .filterIsInstance<KMutableProperty1<T, Any?>>()
        .filter { it.name in fieldMask && it.name in source }
        .forEach { prop ->
            prop.set(target, source[prop.name])
        }
}

이제 서비스 계층에서 간단하게 사용할 수 있습니다.

// 컨트롤러
@PatchMapping("/orders/{id}")
fun updateOrder(
    @PathVariable id: Long,
    @RequestParam("update_mask") updateMask: String,
    @RequestBody request: OrderUpdateRequest
): OrderResponse {
    val fieldsToUpdate = updateMask.split(",").map(String::trim).toSet()
    return orderService.partialUpdate(id, request, fieldsToUpdate)
}

// 서비스
fun partialUpdate(id: Long, request: OrderUpdateRequest, fieldsToUpdate: Set<String>): OrderResponse {
    val order = orderRepository.findById(id) ?: throw NotFoundException()
    
    // fieldMask에 포함된 필드만 request에서 order로 복사
    applyFieldMask(
        target = order,
        source = request.toMap(),  // { "status": "shipped", "memo": "빠른 배송 요청" }
        fieldMask = fieldsToUpdate
    )
    
    return orderRepository.save(order).toResponse()
}

// Request DTO에 toMap() 확장 함수 추가
fun OrderUpdateRequest.toMap(): Map<String, Any?> = mapOf(
    "status" to this.status,
    "memo" to this.memo,
    // ... 다른 필드들
)

이 방식의 장점은 필드가 늘어나도 유틸리티 코드를 수정할 필요가 없다는 점입니다. 클라이언트가 의도하지 않은 필드를 실수로 덮어쓰는 것도 방지할 수 있습니다.

6. 실무 적용 팁

실제 운영 환경에 적용할 때 유용한 팁들을 모았습니다.

팁 1: 어노테이션 자동 적용 (`BeanSerializerModifier`)

모든 필드마다 @field:JsonSerialize(...)를 붙이는 건 번거롭습니다. Jackson의 BeanSerializerModifier를 사용하면 JsonWrapper 타입을 자동으로 인식해 Serializer를 적용할 수 있습니다.

@Component
class SparseFieldsetsModule : SimpleModule() {
    override fun setupModule(context: SetupContext) {
        context.addBeanSerializerModifier(object : BeanSerializerModifier() {
            override fun changeProperties(
                config: SerializationConfig,
                beanDesc: BeanDescription,
                beanProperties: List<BeanPropertyWriter>
            ): List<BeanPropertyWriter> {
                for (writer in beanProperties) {
                    if (JsonWrapper::class.java.isAssignableFrom(writer.type.rawClass)) {
                        writer.assignSerializer(SparseFieldsetsSerializer())
                    }
                }
                return beanProperties
            }
        })
    }
}

이제 DTO가 깔끔해집니다:

data class ProductResponse(
    val id: JsonWrapper<Long>,
    val name: JsonWrapper<String> // 어노테이션 생략 가능!
)

팁 2: 필요한 곳에만 적용하기 (`@UseSparseFieldsets`)

모든 API가 이 기능을 필요로 하지는 않습니다. 커스텀 어노테이션으로 특정 API에만 적용하도록 제한하는 것이 안전합니다.

@Target(AnnotationTarget.FUNCTION)
@Retention(AnnotationRetention.RUNTIME)
annotation class UseSparseFieldsets

// Interceptor에서 어노테이션 체크
override fun preHandle(request: HttpServletRequest, response: HttpServletResponse, handler: Any): Boolean {
    if (handler is HandlerMethod && handler.hasMethodAnnotation(UseSparseFieldsets::class.java)) {
        // Sparse Fieldsets 로직 수행
    }
    return true
}

팁 3: Supplier 중복 호출 방지 (`memoize`)

Supplier.get()이 직렬화 과정에서 여러 번 호출될 수 있습니다. 무거운 로직(DB 조회 등)은 최초 1회만 실행되도록 캐싱해야 합니다.

// Memoization을 위한 Wrapper 클래스
class Memoized<T>(private val supplier: () -> T) : Supplier<T> {
    private val cached: T by lazy(LazyThreadSafetyMode.NONE) { supplier() }
    override fun get(): T = cached
}

// 편의 함수
fun <T> memoize(supplier: () -> T): Supplier<T> = Memoized(supplier)

// 사용 예시
val reviews = JsonWrapper(memoize { reviewRepository.findByProductId(id) })

7. 마치며

Sparse Fieldsets 패턴은 “API의 유연함” 과 “시스템의 단순함” 사이에서 균형을 찾는 방법입니다. GraphQL처럼 완전히 새로운 패러다임을 도입하지 않으면서도, 오버페칭이라는 REST API의 고질적인 문제를 해결해줍니다.

특히 지연 로딩과 결합하면, 네트워크 비용 절감뿐 아니라 서버 측 불필요한 연산까지 줄일 수 있어 더욱 강력해집니다.

여러분의 API가 너무 많은 수다를 떨고 있다면, Sparse Fieldsets로 필요한 말만 하도록 변화시켜보세요.

이 글은 AI의 도움을 받아 교정 및 정리되었습니다.

검색

API 다이어트: Sparse Fieldsets(Field Mask)로 필요한 데이터만 쏙쏙 뽑아내기

API가 너무 많은 정보를 준다면? #

1. Sparse Fieldsets란? #

📖 같은 개념, 다른 이름들 #

2. GraphQL과 무엇이 다를까? #

GraphQL: 강력하지만 도입 비용이 큰 선택 #

Sparse Fieldsets: REST API를 그대로 활용하는 실용적 접근 #

한눈에 비교 #

3. 언제 선택해야 할까? #

✅ 이런 상황이라면 좋은 선택입니다 #

❌ 다른 대안을 고려해야 하는 경우 #

4. 더 깊이 알기: 조회를 넘어서 #

API 진화와 하위 호환성 #

쓰기 작업(Update/PATCH)에서의 활용 #

지연 로딩과 결합하면 더 강력해진다 #

5. 실전! Sparse Fieldsets 구현하기 (Kotlin & Spring) #

전체 흐름 미리보기 #

1단계: 요청 정보 저장하기 (SparseFieldsetsInterceptor) #

2단계: JsonWrapper와 DTO 설계 #

3단계: 마법이 일어나는 SparseFieldsetsSerializer #

4단계: Update/PATCH에 적용하기 (update_mask) #

6. 실무 적용 팁 #

팁 1: 어노테이션 자동 적용 (BeanSerializerModifier) #

팁 2: 필요한 곳에만 적용하기 (@UseSparseFieldsets) #

팁 3: Supplier 중복 호출 방지 (memoize) #

7. 마치며 #