여기 V8 개발자. 이 질문에 대한 관심의 정도와 다른 답변의 부족을 감안할 때, 나는 이것을 한 번에 줄 수 있습니다. 그래도 당신이 기대했던 대답이 아닐까 걱정됩니다.
팩형 SMI 어레이의 세계에 머무르면서 프로그래밍하는 방법에 대한 지침이 있습니까?
짧은 대답 : 바로 여기 있습니다 : const guidelines = ["keep your integers small enough"]
.
더 긴 대답 : 여러 가지 이유로 종합적인 지침 세트를 제공하는 것은 어렵습니다. 일반적으로 JavaScript 개발자는 자신과 사용 사례에 맞는 코드를 작성해야하며 JavaScript 엔진 개발자는 엔진에서 해당 코드를 빠르게 실행하는 방법을 알아야합니다. 반대로, 엔진 구현 선택 및 최적화 노력에 관계없이 일부 코딩 패턴은 다른 코딩 패턴보다 항상 더 높은 성능 비용을 가질 것이라는 점에서 이상적으로는 몇 가지 한계가 있습니다.
성능 조언에 대해 이야기 할 때, 우리는이를 염두에두고 여러 엔진에서 수년 동안 유효한 상태를 유지할 가능성이 높은 권장 사항을 신중하게 평가하며 또한 관용적이고 비 간섭 적입니다.
당장 예제로 돌아 가기 : Smis를 내부적으로 사용하는 것은 사용자 코드가 알 필요가없는 구현 세부 사항으로 간주됩니다. 그것은 어떤 경우를보다 효율적으로 만들 것이고 다른 경우에는 아프지 않아야합니다. 모든 엔진이 Smis를 사용하는 것은 아닙니다. 문제). V8에서 Smis의 크기는 내부 세부 사항이며 실제로 시간이 지남에 따라 버전이 변경되었습니다. 대부분의 유스 케이스였던 32 비트 플랫폼에서 Smis는 항상 31 비트 부호있는 정수였습니다. 64 비트 플랫폼에서는 32 비트 부호있는 정수로 사용되었습니다. Chrome 80에서 '포인터 압축'을 제공 할 때까지 가장 일반적인 경우처럼 보였습니다. 64 비트 아키텍처의 경우 Smi 크기를 32 비트 플랫폼에서 알려진 31 비트로 낮추어야했습니다. Smis가 일반적으로 32 비트라는 가정을 기반으로 구현 한 경우 다음과 같은 불행한 상황이 발생합니다.이것 .
고맙게도, 언급했듯이 이중 배열은 여전히 매우 빠릅니다. 숫자가 많은 코드의 경우 이중 배열을 가정 / 타겟팅하는 것이 좋습니다. JavaScript에서 doubles가 널리 퍼져 있으므로 모든 엔진이 double 및 double 배열을 잘 지원한다고 가정하는 것이 합리적입니다.
매크로 시스템과 같은 것을 사용하지 않고 vec.add ()와 같은 것을 호출 사이트에 인라인하지 않고 Javascript로 일반 고성능 프로그래밍을 수행 할 수 있습니까?
"일반"은 일반적으로 "고성능"과 상충됩니다. 이것은 JavaScript 또는 특정 엔진 구현과 관련이 없습니다.
"일반"코드는 런타임에 결정을 내려야 함을 의미합니다. 함수를 실행할 때마다 " x
정수입니까? 그렇다면 해당 코드 경로를 가져 x
옵니다. 문자열입니까? 그러면 여기로 건너 뜁니다. 개체입니까 .valueOf
? 아니오?" "아마도 .toString()
프로토 타입 체인에 있을까요?"라고 부르고 결과부터 처음부터 다시 시작하십시오. " "고성능"최적화 된 코드는 본질적으로 이러한 모든 동적 검사를 중단한다는 아이디어를 기반으로합니다. 그것은 엔진 / 컴파일러가 미리 유형을 미리 추론 할 수있는 방법이있을 때만 가능합니다 : x
항상 정수가 될 것임을 증명할 수 있거나 (또는 충분히 높은 확률로 가정 할 경우) 해당 사례에 대한 코드 만 생성하면됩니다 ( 입증되지 않은 가정이 포함 된 경우 유형 검사로 보호됩니다.
인라인은이 모든 것에 직교합니다. "일반적인"함수는 여전히 인라인 될 수 있습니다. 경우에 따라 컴파일러는 형식 정보를 인라인 함수로 전파하여 다형성을 줄일 수 있습니다.
(비교를 위해 : 정적으로 컴파일 된 언어 인 C ++에는 관련 문제를 해결하기위한 템플릿이 있습니다. 간단히 말해서, 프로그래머는 컴파일러가 주어진 유형에 대해 매개 변수화 된 함수 (또는 전체 클래스)의 특수한 사본을 작성하도록 컴파일러에 명시 적으로 지시 할 수 있습니다. 긴 컴파일 시간과 큰 이진과 같은 자체 단점이없는 경우도 있지만, 자바 스크립트는 템플릿과 같은 것이 없기 eval
때문에 다소 유사한 시스템을 구축하는 데 사용할 수 있습니다. 비슷한 단점이 있습니다 : 런타임에 C ++ 컴파일러의 작업과 동등한 작업을 수행해야하며 생성하는 코드의 양에 대해 걱정해야합니다.)
대형 콜 사이트 및 최적화 해제와 같은 관점에서 고성능 코드를 라이브러리로 모듈화하는 방법은 무엇입니까? 예를 들어, Linear Algebra 패키지 A를 고속으로 행복하게 사용하고 A에 의존하는 패키지 B를 가져 오지만 B는 다른 유형으로 호출하여 최적화하지 않고 갑자기 코드를 변경하지 않고 코드를 느리게 실행합니다 .
예, 이는 JavaScript의 일반적인 문제입니다. V8 Array.sort
은 JavaScript에서 내부적으로 특정 내장 (예 :)을 구현하는 데 사용되었으며이 문제 ( "유형 피드백 오염"이라고 함)는이 기술에서 완전히 벗어난 주된 이유 중 하나였습니다.
즉, 숫자 코드의 경우 많은 유형 (Smis 및 double 만)이 아니며 실제로 언급 한 바와 같이 실제로 유사한 성능을 가져야하므로 유형 피드백 오염은 실제로 이론적 인 문제이며 경우에 따라 유의미한 영향을 미치면 선형 대수 시나리오에서 측정 가능한 차이가 나타나지 않을 가능성이 상당히 높습니다.
또한 엔진 내부에는 "하나의 유형 == 빠름"및 "하나 이상의 유형 == 느림"보다 더 많은 상황이 있습니다. 주어진 작업에서 Smis와 Doubles가 모두 보이면 완전히 괜찮습니다. 두 종류의 배열에서 요소를로드하는 것도 좋습니다. 우리는 부하가 개별적으로 추적 할 때 너무 많은 다른 유형을 보았을 때 상황에 대해 "비정형 적"이라는 용어를 사용하고 대신 많은 유형으로 더 잘 확장되는보다 일반적인 메커니즘을 사용합니다. 여전히 최적화됩니다. "비 최적화"는 이전에 보지 못했던 새로운 유형이 보이고 최적화 된 코드가 처리 할 수 없기 때문에 함수에 대해 최적화 된 코드를 버리는 매우 구체적인 행위입니다. 그러나 그조차도 괜찮습니다. 최적화되지 않은 코드로 돌아가서 더 많은 유형 피드백을 수집하고 나중에 다시 최적화하십시오. 이 과정이 두 번 발생하면 걱정할 것이 없습니다. 병적으로 나쁜 경우에만 문제가됩니다.
따라서 모든 요약은 걱정하지 마십시오 . 합리적인 코드를 작성하고 엔진이 처리하도록하십시오. 그리고 "합리적"이란 말은 유스 케이스에 적합한 것은 읽기 쉽고 유지 관리가 가능하며 효율적인 알고리즘을 사용하며 배열의 길이를 넘어서 읽는 것과 같은 버그를 포함하지 않는 것입니다. 이상적으로는 그게 전부이며 다른 것을 할 필요가 없습니다. 무언가 를하는 것이 더 나아지 거나 실제로 성능 문제를 관찰하고 있다면 두 가지 아이디어를 제안 할 수 있습니다.
TypeScript 를 사용하면 도움이 될 수 있습니다 . 뚱뚱한 경고 : TypeScript의 유형은 실행 성능이 아닌 개발자 생산성을 목표로합니다 (이 두 관점은 유형 시스템과 요구 사항이 매우 다름). 예를 들어으로 일관되게 주석을 달면 number
실수 null
로 숫자 만 포함 / 연산 해야하는 배열이나 함수에 실수로 삽입하면 TS 컴파일러가 경고합니다 . 물론, 훈련은 여전히 필요합니다. number_func(random_object as number)
유형 주석의 정확성이 어느 곳에도 적용되지 않기 때문에 단일 탈출 해치가 모든 것을 자동으로 손상시킬 수 있습니다.
TypedArray를 사용하면 도움이 될 수 있습니다. 일반 JavaScript 배열에 비해 배열 당 오버 헤드 (메모리 소비 및 할당 속도)가 약간 더 많으므로 (작은 배열이 많은 경우 일반 배열이 더 효율적일 수 있음) 확장 할 수 없기 때문에 유연성이 떨어집니다. 또는 할당 후 축소되지만 모든 요소가 정확히 하나의 유형을 갖도록 보장합니다.
Javascript 엔진이 유형에 대해 내부적으로 수행중인 작업을 확인하는 데 사용하기 쉬운 측정 도구가 있습니까?
아니, 그건 의도적이야 위에서 설명했듯이, V8이 오늘날 특히 잘 최적화 할 수있는 패턴에 맞게 코드를 구체적으로 맞춤화하고 싶지는 않으며 실제로 그렇게하고 싶지도 않습니다. 사용하려는 패턴이있는 경우 향후 버전에서이를 최적화 할 수 있습니다 (이전에는 언 박스형 32 비트 정수를 배열 요소로 저장한다는 아이디어로 이전했습니다.) 그러나 아직 연구가 시작되지 않았으므로 약속은 없습니다.); 때로는 과거에 최적화하는 데 사용했던 패턴이있는 경우 더 중요하고 효과적인 다른 최적화 방법을 사용하지 않는 경우 해당 패턴을 제거하기로 결정할 수 있습니다. 또한 휴리스틱 인라이닝과 같은 것은 제대로 이해하기가 어렵습니다. 적절한 시점에 올바른 인라인 결정을 내리는 것은 지속적인 연구와 엔진 / 컴파일러 동작에 대한 해당 변경 영역입니다. 이것은 모두에게 불행한 또 다른 경우입니다.그리고 우리) 당신이 현재 브라우저 버전 중 일부가 대략 당신이 생각하는 (또는 알고 있습니까?) 최고의 결정을 내릴 때까지 코드를 조정하는 데 많은 시간을 소비했다면, 반 년 후에 다시 돌아와서 그 당시의 브라우저를 깨닫기 만하면됩니다. 휴리스틱을 변경했습니다.
물론 애플리케이션 전체의 성능을 항상 전체적으로 측정 할 수 있습니다. 즉, 엔진이 특별히 내부적으로 선택한 것이 아니라 궁극적으로 중요한 것입니다. 마이크로 벤치 마크에주의하십시오. 오해의 소지가 있습니다. 두 줄의 코드 만 추출하여 벤치마킹하면 엔진이 매우 다른 결정을 내릴 수 있도록 시나리오가 충분히 다를 수 있습니다 (예 : 다른 유형 피드백).