이 F # 코드가 왜 이렇게 느린가요?


127

C # 및 F #의 Levenshtein 구현 C # 버전은 약 1500 자의 두 문자열에 대해 10 배 더 빠릅니다. C # : 69ms, F # 867ms. 왜? 내가 알 수있는 한, 그들은 똑같은 일을합니까? 릴리스 또는 디버그 빌드인지는 중요하지 않습니다.

편집 : 누군가가 거리 편집 구현을 위해 특별히 여기에 오면 깨졌습니다. 작업 코드는 여기에 있습니다 .

C # :

private static int min3(int a, int b, int c)
{
   return Math.Min(Math.Min(a, b), c);
}

public static int EditDistance(string m, string n)
{
   var d1 = new int[n.Length];
   for (int x = 0; x < d1.Length; x++) d1[x] = x;
   var d0 = new int[n.Length];
   for(int i = 1; i < m.Length; i++)
   {
      d0[0] = i;
      var ui = m[i];
      for (int j = 1; j < n.Length; j++ )
      {
         d0[j] = 1 + min3(d1[j], d0[j - 1], d1[j - 1] + (ui == n[j] ? -1 : 0));
      }
      Array.Copy(d0, d1, d1.Length);
   }
   return d0[n.Length - 1];
}

F # :

let min3(a, b, c) = min a (min b c)

let levenshtein (m:string) (n:string) =
   let d1 = Array.init n.Length id
   let d0 = Array.create n.Length 0
   for i=1 to m.Length-1 do
      d0.[0] <- i
      let ui = m.[i]
      for j=1 to n.Length-1 do
         d0.[j] <- 1 + min3(d1.[j], d0.[j-1], d1.[j-1] + if ui = n.[j] then -1 else 0)
      Array.blit d0 0 d1 0 n.Length
   d0.[n.Length-1]

7
인라인을 사용한 성능 차이는 무엇입니까?
gradbot

답변:


202

문제는 min3함수가 제네릭 비교를 사용하는 제네릭 함수로 컴파일된다는 IComparable것입니다.

> let min3(a, b, c) = min a (min b c);;
val min3 : 'a * 'a * 'a -> 'a when 'a : comparison

C # 버전에서 함수는 일반적이지 않습니다 (단지 걸립니다 int). C #에서와 같은 것을 얻기 위해 형식 주석을 추가하여 F # 버전을 향상시킬 수 있습니다.

let min3(a:int, b, c) = min a (min b c)

... 또는 다음 min3과 같이 작성 하면 inline(사용되는 경우에 특화 됨 int)

let inline min3(a, b, c) = min a (min b c);;

str길이가 300 인 임의의 문자열 의 경우 다음 숫자를 얻습니다.

> levenshtein str ("foo" + str);;
Real: 00:00:03.938, CPU: 00:00:03.900, GC gen0: 275, gen1: 1, gen2: 0
val it : int = 3

> levenshtein_inlined str ("foo" + str);;
Real: 00:00:00.068, CPU: 00:00:00.078, GC gen0: 0, gen1: 0, gen2: 0
val it : int = 3

1
왜 F #이 min3을 int를 취하는 함수로 컴파일하지 않습니까? 컴파일 타임에이를 수행하기에 충분한 유형 정보를 이미 알고 있습니다. min3이 C ++ 템플릿 함수 인 경우 이것이 작동하는 방식이므로 F #이 왜 이것을하지 않는지 조금 당황합니다.
sashang 2016 년

42
F #은 가능한 한 일반적인 것으로 추정합니다 (예 : "비교를 지원하는 모든 유형 X에 대해"). 호출 사이트 inlineint기반으로 하는 C ++ 템플릿처럼 작동 합니다.
Brian

13
C ++ 템플릿은 기본적으로 F #으로 작동합니다 inline. 기본 동작이 다른 이유는 런타임에 의해 처리되는 .Net 제네릭을 기반으로하기 때문입니다 (그리고 일반 숫자 코드를 작성하기에는 그리 좋지 않습니다). 그러나 F #에서 C ++ 동작을 사용하면 F #에서 제네릭을 훨씬 더 많이 사용하므로 코드가 부풀려 질 수 있습니다.
Tomas Petricek

4
C ++ 템플릿 시맨틱은 C ++에서도 코드 팽창을 초래할 수 있으며 런타임 메커니즘을 사용하여 전환하는 편리한 방법이 부족하여 때때로 번거 로움을 피할 수 있습니다. 그러나 코드 팽창에 대한 두려움은 일반적으로 비합리적입니다. 일반적으로 C ++ 템플릿은 잘 작동합니다.
Steve314

@ Steve314 : 일반적으로 종속 유형을 사용하지 않는 모든 코드를 리팩토링하여 피할 수 있으므로 코드가 다른 인스턴스화에 대해 복제되지 않습니다.
ildjarn
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.