함수형 프로그래머가 되고 싶다고? (part 5)

이 문서는 https://medium.com/@cscalfani/so-you-want-to-be-a-functional-programmer-part-5-c70adc9cf56a#.inibcu15i 를 번역한 내용입니다.

functinoal

함수형 프로그래밍 개념을 처음으로 접해본다는 것 자체가 중요하다. 그리고 이 단계가 가장 어렵기도 하다. 하지만, 올바른 관점으로 접근한다면 그렇게 어렵진 않다.

지난 글: 파트1, 파트2, 파트3, 파트4

참조 투명성

refer

참조 투명성은 순수한 함수가 표현식으로 안전하게 대체 될 수 있다고 설명하는 멋진 용어다. 아래의 예제가 이해하는 데 도움이 될 것이다.

대수학에서 아래의 공식을 받았을 때:

y = x + 10

그리고 아래의 값이 주어져있을 때

x = 3

x 값을 방정식에 대입하여 아래와 같은 값을 얻을 수 있다.

y = 3 + 10

아래의 방정식은 여전히 유효하다. 같은 의미로써의 대체를 순수함수로도 할 수 있다.

아래의 예제는 Elm에서의 문자열 주위에 작은 따옴표를 넣는 함수다.

quote str =
    "'" ++ str ++ "'"

아래는 위의 함수를 사용하는 예제다.

findError key =
    "Unable to find " ++ (quote key)

findError라는 함수는 key를 탐색에 실패할 때 오류 메세지를 만든다.

quote 함수가 순수하기 때문에, 우리는 간단하게 quote를 함수 내용으로 간단하게 대체할 수 있다.

findError key =
   "Unable to find " ++ ("'" ++ str ++ "'")

이게 바로 역 리팩토링이다. 이것은 코드에 대한 추론으로 프로그래머나 프로그램(컴파일러나 테스트 프로그램)에 의해 진행될 수 있는 절차다.

이것은 재귀함수를 추론할 때 특히 유용하다.

실행 순서

Line

대부분의 프로그램은 싱글 스레드(한번에 하나씩만 실행되는) 기반이다. 설령 멀티 스레드 기반의 프로그램일지라도 대부분의 스레드는 입출력(파일, 네트워크 등)이 완료될 때까지 차단된다.

이것이 우리가 코드를 작성할 때 자연스럽게 순서화 된 단계로 생각하는 이유 중 하나다.

빵을 꺼낸다
2조각을 토스터에 넣는다
손잡이를 찾는다
레버를 아래로 내린다
토스트가 튀어나오길 기다린다
토스트를 제거한다
버터를 꺼낸다
버터 칼을 꺼낸다
토스트에 버터를 바른다

이 예제에서는 2가지의 독립적인 실행이 있다. 버터를 꺼내는 것과 빵을 굽는 것이다. 이것들은 9단계가 되어서야 상호의존이 된다.

7단계와 8단계는 1단계에서 6단계까지 관련이 없기 때문에 별도로 동시에 수행될 수 있다.

하지만 우리가 이것을 할 때 상황은 복잡해진다.

쓰레드 1
--------
빵을 꺼낸다
2조각을 토스터에 넣는다
손잡이를 찾는다
레버를 아래로 내린다
토스트가 튀어나오길 기다린다
토스트를 제거한다
쓰레드 2
--------
버터를 꺼낸다
버터 칼을 꺼낸다
쓰레드 1이 종료되길 기다린다
토스트에 버터를 바른다

만약 쓰레드1이 실패하면 쓰레드2는 어떻게 될까? 두 쓰레드를 조정하는 것은 어떤 메커니즘일까? 토스트를 소유하는 쓰레드는 둘 중 어떤 것일까?

이런 복잡성에 대해 생각하지 않고, 싱글 쓰레드로 두는 게 더 쉽다.

하지만 프로그램의 가능한 모든 효율을 짜낼 때가 되면 멀티 쓰레드 기반의 소프트웨어를 만들기 위해 엄청난 노력을 해야한다.

하지만 멀티 쓰레드에는 2가지 주요 문제점이 있다. 첫째, 멀티 쓰레드 기반의 프로그램은 작성, 읽기, 추론, 테스트, 디버깅하기 어렵다.

둘째, 자바스크립트와 같은 언어에서는 멀티 쓰레드를 지원하지 않는다. 설령 지원하더라도 좋은 수준은 아니다.

하지만, 순서를 중요하게 생각지 않고, 모든 것을 병렬로 처리해버리면 어떻게 될까?

미친 소리로 들리겠지만, 생각만큼 혼란스럽지 않다. 이 개념을 이해하기 위해 아래의 Elm 코드를 살펴보자

buildMessage message value =
    let
        upperMessage =
            String.toUpper message
        quotedValue =
            "'" ++ value "'"
    in
        upperMessage ++ ": " ++ value

buildMessage은 message와 value를 입력 받고, 대문자 메세지와 콜론, value를 반환한다.

upperMessage와 quotedValue가 어떻게 독립적인지 주목하자. 어떻게 알 수 있을까?

독립적이기 위해서는 2가지가 반드시 참이어야 한다. 첫째, 모두 순수함수여야 한다. 이것은 중요하다. 왜냐하면 상대방의 실행에 영향을 받지 않기 때문이다.

만약 순수한 상태가 아니라면 결코 독립적이라는 것을 알 수 없다. 이 경우 실행 순서를 결정하기 위해 프로그램에서 호출 된 순서에 의존해야한다. 이러한 방식이 모든 명령형 언어가 작동하는 방식이다.

독립적이기 위해 참이어야 하는 둘째로 한 함수의 출력이 다른 함수의 입력으로 사용되지 않아야 한다는 것이다. 만약 그렇게 되면 두번째를 실행하기 전에 첫번째 동작이 끝나기를 기다려야 한다.

이 경우, upperMessage와 quotedValue는 모두 순수하고 다른 하나의 출력을 필요로 하지 않는다.

그러므로, 두 함수는 어떤 순서로 실행되어도 무방하다.

컴파일러는 프로그래머의 도움 없이 결정할 수 있다. 이것은 오직 순수한 프로그래밍 언어에서 가능하다. 왜냐하면 부작용의 파급효과를 파악하기 매우 어렵기 때문이다.

순수 함수형 언어에서의 실행 순서는 컴파일러에 의해 결정될 수 있다.

이것은 CPU의 발전 속도가 점점 더뎌질 때 매우 장점이 있다. 대신에 제조업체는 CPU에 더 많은 코어를 추가한다. 이것은 코드가 하드웨어 단에서 병렬로 실행된다는 것을 의미한다.

불행하게도, 명령형 언어에서는 매우 거친 수준을 제외하고는 이러한 코어의 모든 장점을 취할 수 없다. 하지만 그렇게 하려면 우리의 프로그램의 설계를 크게 변경해야 한다.

순수 함수형 언어에서는 코드를 변경하지 않고, 세분화된 수준의 CPU 코어를 자동을 활용할 수 있게 된다.

타입 명시

type

정적 타입 언어에서는 타입이 코드에 정의된다. 아래의 자바 코드를 살펴보자.

public static String quote(String str) {
    return "'" + str + "'";
}

함수 정의에서의 타입 선언이 어떻게 되는지 주목해보자. 만약 제네릭이 있다면 가독성은 더욱 나빠진다.

private final Map<Integer, String> getPerson(Map<String, String> people, Integer personId) {
   // ...
}

코드 상에서 실제 변수의 이름을 찾으려면 매우 주의깊게 읽어야 한다.

하지만 동적 타입 언어에서는 크게 문제되지 않는다. 자바스크립트에서는 아래와 같이 코드를 작성할 수 있다.

var getPerson = function(people, personId) {
    // ...
};

이전 코드와 비교해서 아무런 거리낌 없이 훨씬 쉽게 읽을 수 있는 것을 확인할 수 있다. 하나의 문제가 있다면 타입의 보장을 포기해야 한다는 점이다. 우리는 이 매개변수들을 쉽게 바꿔서 전달할 수 있다. 즉, people 대신에 숫자를, personId 대신에 객체를 넘길 수 있다.

우리는 프로그램이 실행할 때까지 잘못된 매개변수 타입을 알지 못할 것이다. 혹은 프로그램 제작이 완료된 후 몇달 후에 알 수도 있다. 이런 일은 자바에서는 일어나지 않을 것이다. 왜냐하면 자바스크립트의 경우, 컴파일 단계가 없기 때문이다.

하지만, 만약 두 가지의 모든 장점(자바스크립트의 유연함과 자바의 안정성)을 얻을 수 있다면 어떨까.

실제로 가능한 일이다. 아래의 함수는 Elm으로 짠 코드이며 타입이 명시 되어있다.

add : Int -> Int -> Int
add x y =
    x + y

각각의 라인에서 타입 정보가 어떻게 작성되었는지 확인해보자. 띄어쓰기는 분리를 위함이다.

타입이 명시 되어있는 곳에 아마 오타가 있을거라고 생각할 수도 있다. 사실 내가 처음에 이 코드를 봤을 때 그런 생각을 했었다. 나는 첫번째 -> 대신 ,로 대체되어야 한다고 생각했었다. 하지만 오타가 아니었다.

괄호 함축(implied parentheses)은 코드를 조금 더 이해하기 쉽게 만들어준다.

add : Int -> (Int -> Int)

위의 코드에서 add는 Int 타입의 매개변수 하나를 받아서 함수를 반환하고, 그 함수는 Int 타입의 매개변수 하나를 받아서 Int 타입을 반환하는 것을 의미한다.

아래는 괄호 함축(implied parentheses)이 적용된 또다른 타입 명시 코드다.

doSomething : String -> (Int -> (String -> String))
doSomething prefix value suffix =
    prefix ++ (toString value) ++ suffix

위의 코드는 doSomething은 String 타입의 매개변수 하나를 받아서 함수를 반환하고, 그 함수는 Int 타입의 매개변수 하나를 받아서 함수를 반환하고, 그 함수는 String 타입의 매개변수 하나를 입력받아서 String 타입을 반환하는 함수라는 것을 의미한다.

모든 게 하나의 매개변수를 받는 다는 것에 주목하자. Elm에서 모든 함수는 커링 방식이기 때문이다.

항상 코드는 오른쪽으로 흘러가기 때문에 괄호가 꼭 필요한 것은 아니다. 그래서 위의 코드는 간단하게 바꿀 수 있다.

doSomething : String -> Int -> String -> String

만약 함수를 매개변수로 전달할 때에는 괄호가 필요하다. 괄호가 없으면, 타입 명시가 애매해진다. 아래의 코드로 예제를 살펴보자.

takes2Params : Int -> Int -> String
takes2Params num1 num2 =
    -- do something

아래의 코드는 위의 코드와 다르다.

takes1Param : (Int -> Int) -> String
takes1Param f =
    -- do something

takes2Param은 Int 타입 2개의 매개변수를 필요로 하는 함수다. 하지만 takes1Param은 1개의 함수를 매개변수를 필요로 한다. 그리고 그 함수는 Int 타입 2개를 받는다.

아래는 map 함수를 위한 타입 명시다.

map : (a -> b) -> List a -> List b
map f list =
    // ...

여기에서는 괄호가 필요하다. 왜냐하면 f는 (a -> b)의 타입이기 때문이다. 즉 f는 a라는 타입의 매개변수를 받고 b라는 타입을 반환하는 함수다.

a라는 타입은 모든 타입이다. 만약 타입이 대문자(ex String)라면 그것은 명시적인 타입이다. 만약 타입이 소문자라면 모든 타입이 될 수 있다. 여기에서의 a는 String이 될 수도 있고, Int가 될 수도 있다.

(a -> a)는 입력 데이터와 출력 데이터의 타입이 반드시 같아야 한다는 의미다. 어떤 타입인지 중요하지 않지만, 그것들은 반드시 같아야 한다.

하지만 위의 map 함수의 경우, (a -> b)라는 게 있다. 이 코드는 입력 데이터 타입과 다른 타입을 반환할 수 있지만, 같은 타입을 반환할 수도 있다는 것을 의미한다.

하지만 a에 대한 타입이 정해지면, a는 전체 구문에서 대한 반드시 동일한 타입이어야 한다. 예를 들어, a가 Int 타입이고, b가 String 타입이면 구문은 다음과 같다.

(Int -> String) -> List Int -> List String

여기에서 모든 a는 Int로 대체되고, 모든 b는 String으로 대체되었다.

List Int 타입은 Ints를 포함하는 하나의 리스트라는 것을 의미하고, List String 타입은 Strings를 포함하는 하나의 리스트라는 것을 의미한다. 만약 자바나 다른 언어에서 제네릭을 사용해왔다면 이 개념은 훨씬 친숙할 것이다.

아이고 머리야!!!

Brain

오늘은 이걸로 충분하다.

마지막 문서에서는 지금까지 배운 것을 일상 업무(예를 들어, 자바스크립트나 Elm)에 어떻게 쓸 수 있는지 설명하겠다.

Written on January 1, 2018

Translated by 송헌용