추상화 가격의 예?


112

이론적 인 컴퓨터 과학은 "추상화의 가격"에 대한 몇 가지 예를 제공했습니다. 가장 눈에 띄는 두 가지는 가우시안 제거 및 정렬입니다. 즉:

  • 가우시안 제거는 연산을 전체적으로 행과 열로 제한 하는 경우 결정자를 계산하는 데 최적 인 것으로 알려져 있습니다 [1]. 분명히 Strassen의 알고리즘은 이러한 제한을 따르지 않으며 가우시안 제거보다 점진적으로 좋습니다.
  • 정렬시 목록의 요소를 비교하고 이동할 수있는 블랙 박스로 취급하면 표준 로그 정보 이론적 하한이 있습니다. 그러나 퓨전 트리는 내가 이해하는 한 똑똑한 곱셈을 사용 하여이 한계를 극복했습니다.

추상화 가격의 다른 예가 있습니까?

좀 더 공식적으로, 나는 약한 계산 모델에서 하한이 무조건 알려져 있지만 더 강한 모델에서 위반되는 것으로 알려진 예를 찾고 있습니다. 또한, 약한 모델의 약점은 추상화의 형태로 나와야하며 , 이는 주관적인 개념입니다. 예를 들어, 모노톤 회로에 대한 제한을 추상화로 생각하지 않습니다. 바라건대 위의 두 가지 예가 내가 찾고있는 것을 분명히합니다.

[1] KLYUYEV, VV 및 NI KOKOVKIN-SHcHERBAK : 선형 대수 방정식의 해를위한 산술 연산 수를 최소화합니다. GI TEE 번역 : 기술 보고서 ​​CS 24, t965, 6 월 t4, t965, 스탠포드 대학교 컴퓨터 공학과.


3
나는이 질문을 정말 좋아한다. 더 많은 답변을 기대합니다.
randomwalker

1
'암시 적'추상화 비용도 있습니다. 정렬에서 추상화 가격의 예와 이러한 추상화 된 결과가 정렬 숫자에 적용되지 않는 방법 (사실 경우 버킷 정렬을 사용하여 O (n)에서도 수행 될 수 있음)에 대해 언급합니다. Voronoi 다이어그램의 하한은 종종 Voronoi 다이어그램에서 숫자 목록을 정렬하는 데 선형 시간 단축이 있음을 보여줌으로써 파생됩니다. 그리고 많은 기하학적 알고리즘은 보로 노이를 계산할 때이 하한에서 하한을 도출합니다.
로스 스나이더

왜 이것이 커뮤니티 위키입니까?
nanda

1
@ nanda : 단일 정답이 없기 때문에 실제로 질문은 많은 정답 을 생성하도록 설계되었습니다 .
Joshua Grochow

1
실제로 추상화 대신 이완을 언급하는 것 같습니다
vzn

답변:


38

추상화 가격의 또 다른 아름다운 예 : 네트워크 코딩 . 멀티 캐스트 설정에서 max-flow-min-cut 관계는 동등하지 않습니다 (원시 및 이중 일치하지 않음). 그러나 전통적인 모델은 어떤 방식 으로든 "처리되지 않은"전달 된 흐름을 가정합니다. 네트워크 코딩을 사용하면 흐름을 영리하게 결합하여이 한계를 극복 할 수 있습니다. 이 예제는 우선 네트워크 코딩 연구에 큰 동기가되었습니다.


33

순전히 기능적인 프로그래밍은 최소한 제안자에 따르면 코드의 표현력이 크게 향상되는 장점이있는 대중적인 추상화입니다. 그러나 머신의 제한적인 모델, 특히 가변 메모리를 허용하지 않기 때문에 일반적인 (RAM) 모델에 비해 점근 적 속도 저하 문제가 제기됩니다.

이 질문에는 큰 스레드가 있습니다 . 주요 테이크 아웃은 다음과 같습니다.

  1. 균형 잡힌 이진 트리를 사용하여 변경 가능한 메모리를 시뮬레이션 할 수 있으므로 최악의 속도 저하는 O (log n)입니다.
  2. 열망 평가 , 이것은 당신이 할 수있는 최선되는 문제가있다.
  3. 게으른 평가 , 차이가 있는지 여부를 알 수 없습니다. 그러나 순전히 기능적인 알고리즘이 최적의 RAM 복잡성과 일치하지 않는 많은 자연적인 문제가 있습니다.

이것은 놀랍게도 기본적인 질문 인 것 같습니다.


함수형 프로그래밍이 대용량 데이터 계산의 모델 인 경우 (MapReduce 참조)이 속도 저하는 잠재적으로 매우 중요합니다.
Suresh Venkat

5
또한 SO 스레드에 언급 된주의 사항을 명심해야합니다. 즉, 문제에 대한 하한은 원자 요소가있는 온라인 인 훨씬 제한된 모델입니다. 나는 함수형 프로그래밍의 표준 모델에서 그 형태의 하한이 여전히 열려 있다고 믿는다. Ω(로그)
Joshua Grochow

1
적어도 그 실에서 언급 된 논문 ([Bird, Jones and De Moor, 1997], 전체 참조는 거기 참조)은 간절하고 게으른 평가 사이에 격차를 설정한다.
Blaisorblade

매우 큰 데이터 계산의 경우 계산에서 로그 속도 저하가 중요하지 않도록 IO 비용이 너무 많이 지배되어야합니다.
adrianN

평가 순서는 무엇을 의미합니까?
libeako

28

귀하의 질문은 복잡성 이론에 중점을 두지 만 프로그래밍 언어 이론과 같은 다른 분야에서도 비슷한 일이 발생할 수 있습니다. 다음은 추상화가 결정 불가능한 것을 만드는 몇 가지 예입니다 (즉, 약한 모델의 하한은 불가능하지만 강한 모델은 알고리즘을 표현할 수 있음).

  • 람다 미적분학에는 직접 표현할 수없는 함수가 있습니다 (예 : 원하는 결과를 베타로 줄이는 람다 용어). 예는 병렬이거나 (종료되는 인수를 반환하는 두 인수의 함수)입니다. 또 다른 예는 인수를 문자 그대로 인쇄하는 함수입니다 (함수는 두 개의 베타 등가 인수를 구별 할 수 없음). 표현력의 부족은 베타-등가 람다 용어를 동일하게 취급해야한다는 추상화를 시행하기 때문입니다.

  • 만있는 정적으로 입력 된 언어에서 파라 메트릭 다형성 당신이 얻을 - 아니 공상 확장과 같은 ML 등을, 일부 함수를 작성하는 것은 불가능 무료로 정리를 . 예를 들어, 유형이 인 함수 (인수의 유형이 무엇이든 동일한 유형의 객체를 반환)는 항등 함수이거나 종료되지 않아야합니다. 표현력의 부족은 값의 유형을 모르는 경우 불투명하다는 것입니다 (불가능하다).α,αα


4
이것을 여러 번 투표 할 수 있기를 바랍니다.
Jacques Carette

26

암호화에서 이산 대수 문제를 해결할 때 "추상 가격"을 찾을 수도 있습니다. Shoup (1997) 은 모든 일반적인 접근 방식 (즉, 그룹 작업 만 사용하는 알고리즘)은 최소한 그룹 작업. 여기서m은 그룹의 크기입니다. 이는 일반적인생일 공격의 복잡성과 일치합니다. 그러나Index calculus또는Pohlig-Hellman알고리즘과 같은알고리즘 Z * n 의 숫자 이론 구조에 의존하여약간 더 빠른 알고리즘을 얻습니다 (최소한 순차 그룹으로).Ω()

이 관찰은 타원 곡선 암호화의 인기에 대한 한 가지 이유 ( 과 같은 그룹의 암호화와 반대 )는 본질적으로 타원 곡선을 기반으로하는 그룹에서 불연속 로그 문제를 해결하기위한 일반적인 접근 방식 만 알고 있기 때문입니다.


25

다음은 그래프 알고리즘의 예입니다. 가장자리에 음이 아닌 가중치를 갖는 방향 그래프가 주어지면 모든 쌍 병목 경로 문제는 모든 쌍의 정점 t 에 대해 s 에서 t로 경로를 따라 이동할 수있는 최대 흐름을 계산하는 것 입니다. (공식적으로, 우리는 s 에서 t 까지 경로에서 가장자리의 최소 가중치를 최대화하고 있습니다. 더 공식적으로, 모든 쌍의 최단 경로 정의에서 min+maxmin 으로 대체 합니다.)에스에스에스+최대

하자 입력 그래프의 정점의 숫자. 이 문제는 모든 쌍의 최단 경로 문제와 마찬가지로 Karger, Koller 및 Phillips 의 경로 비교 모델에서 Ω ( n 3 ) 시간 이 필요한 것으로 알려져 있습니다. (경로 비교 모델은 Floyd-Warshall과 같은 기존 알고리즘을 지원합니다.) 그러나 모든 쌍의 최단 경로와 달리 모든 쌍의 병목 경로는 빠른 행렬 곱셈을 사용하여 O ( n 2.8 ) 미만의 시간 으로 해결할 수 있습니다. .Ω()영형(2.8)


22

이 질문에 대한 논의에 따르면, 계산 기하학의 많은 문제는 정렬 또는 요소 구별 과 같은 근본적인 문제에서 비롯된 대수 결정 트리 또는 계산의 대수 계산 트리 모델에서 하한을 갖습니다 . 들로네 삼각 분할 (Delaunay Triangulation)의 구성과 같은 관련 문제에 대한 O ( n log n ) 상한은 이러한 하한과 일치하기 때문에 최적 이라고 주장하는 논문을 찾는 것은 어렵지 않습니다 .Ω(로그)영형(로그)

그러나 입력이 정수 직교 좌표로 지정되면 (실제로 부동 소수점이 계산 기하학에 적합하지 않음) 이러한 하한은 계산 모델과 일치하지 않습니다. 정수 정렬에서 적용된 기술을 사용하여 직교 범위 검색 유형 문제를 더 빨리 해결할 수 있다는 것은 놀라운 일이 아니지만 비 직교 문제도 알고리즘이 더 빠를 수 있습니다 (O로 정수 연산을 허용하는 계산 모델에서 문제를 정확하게 해결 함) ) 곱하기 입력 정수의 정밀도). 예를 들어 arXiv : 1010.1948 을 참조하십시오 .


"역설"과 Chan and Pǎtraşcu의 최근 논문을 강조해 주셔서 감사합니다.
András Salamon

17

암호화에는 많은 지식, 특히 제로 지식 증명이 있습니다. 예를 들어, 논문을 참조하십시오 :

보아스 바락 (Boaz Barak), 암호화의 비 블랙 박스 기법, 2003.

(우연히, 논문 제목은이 주석의 유효성에 대한 무 지식 증명을 제공합니다.)


인용 연도를 2006 년부터 2003 년까지 수정하십시오.
MS Dousti

@Sadeq Dousti : 끝났습니다. ;-) 그것은 커뮤니티 위키 그리고 당신은 나보다 더 명성을 가지고, 그래서 당신은 자신의 것을 수정 한 수도 있겠죠
Blaisorblade

17

대수 의사 결정 나무는 요소 고유성 같은 많은 간단한 문제를 보여 계산 기하학의 기초로되어 사용되는 . 이 하한은 Voronoi Diagrams에 Ω ( n log n ) 하한 이있는 것처럼보다 복잡한 문제를 표시하는 데 사용됩니다 . 나는 나중에 O ( n ) 을 읽는 것에 놀랐다.Ω(nlogn)Ω(nlogn)O(n)평면에서 가장 가까운 점 쌍을 해결하기위한 예상 시간 알고리즘으로, 요소 고유성을 일반화합니다. 해싱을 사용하여 대수 의사 결정 트리를 이스케이프 처리합니다. Klein과 Tardos의 Algorithm Design 책에서 찾았습니다. RJ Lipton의 블로그 에 설명 된 것과 동일한 문제를 해결하기위한 유사하지만 더 복잡한 알고리즘이 있습니다.

참고:


15

사이클 그래프의 색상 수를 에서 3으로 줄이는 동기 결정 론적 분산 알고리즘을 고려하십시오 . 즉, 사이클 의 적절한 k 색상 이 주어지고 적절한 3 색상의 사이클 을 출력하려고 합니다. 사이클의 각 노드는 프로세서입니다.케이케이

비교 기반 모델을 가정하는 경우 ( 색상을 한 노드에서 다른 노드로만 전송하고 서로 비교할 수있는 블랙 박스로 취급 ) 통신 횟수에 대한 Ω ( k ) 의 하한을 얻습니다. 반올림.케이Ω(케이)

그러나이 추상화는 명백히 틀렸다. 통신 네트워크에서 무언가를 전송할 수 있다면, "뭔가"를 비트 열로 인코딩 할 수있는 방법이있을 것이다. 이제 상황이 훨씬 나아지기 시작합니다.

당신의 색깔은 정수 그러나 블랙 박스가 아닌 경우 이면 O ( log * k ) 통신 라운드 에서 Cole–Vishkin 기술을 사용하여 색상 축소를 수행 할 수 있습니다 . 색상이 1 , 2 ,의 정수와 같은 거대한 비트 문자열 인 경우에도 마찬가지 입니다. . . , 10 10 k , 같은 경계 O ( log * k )를 얻게 됩니다.1,2,...,케이영형(로그케이)1,2,...,1010케이영형(로그케이)

결론 :은 "잘못"추상화의 가격 : Ω ( K ) .영형(로그케이)Ω(케이)


13

내 마음에 오는 예는 볼륨 계산입니다. Barany와 Furedi 의 결과 는 지수가 많은 쿼리가 필요하고 Dyer-Frieze-Kannan 의 무작위 다항식 시간 알고리즘이 있다는 것입니다 . 그 격차는 추상화의 상과 무작위성의 이점을 나타내지 만 그 격차의 주된 이유는 추상화의 가격이라고 생각합니다. (질문을 이해하고 올바른 방향으로 진행되기를 바랍니다.)


10

이것은 아마도 당신이 생각한 것이 아닐 것입니다. 그러나 어떤 의미에서 오라클의 P와 NP의 독립성은 그러한 예입니다. 실제로 말하는 것은 시뮬레이션과 열거 (즉, 계산의 "모델"인 경우) 만 있으면 이러한 클래스를 분리하거나 축소 할 수 없다는 것입니다.

보다 구체적인 알고리즘 예제는 "역"방향으로 근사 범위 검색에서 비롯됩니다. 특히, 대부분의 범위 검색 문제는 반 그룹 합계로 표시되며 하한 / 상한은이 반 그룹의 구조와 관계없이 표현됩니다 (약간의 기술적 조건 제외). Arya, Malamatos 및 Mount의 최근 연구에 따르면 반 그룹 구조 ( 등 전성과 무결성 의 속성)를 면밀히 살펴보면 대략적인 범위 검색에 대해 다른 (더 엄격한) 범위를 증명할 수 있습니다.


4
엑스엑스엑스엑스=엑스=영형. 그들의 작업은 다소 논란의 여지가 있지만 (작은 공간이 제한된 클래스를 상대화하는 문제가 발생한다고 생각합니다) 매우 흥미 롭습니다.
Joshua Grochow

10

Shannon-Nyquist 샘플링 정리는 통신에 관한 정보 이론적 경계를위한 충분한 조건을 제안합니다. 샘플링 이론은 들어오는 신호가 컴팩트 / 무작위로 표현되는 예제를 중심으로 작동합니다. 최근 샘플링의 발전은이 추상화가 아마도 가격과 함께 제공된다는 것을 보여줍니다. 우리가 측정하고 싶은 것들이 일반적으로 희박한 표현을 가지고 있기 때문에 이러한 한계가 엄격하지 않습니다. 또한 정보는 원래 생각했던 것보다 훨씬 더 조밀하게 인코딩 될 수 있습니다.

  • 오류 수정 코드는 노이즈가 발생할 수있는 네트워킹 환경에서 Shannon 제한의 일부 재평가를 제안합니다.
  • 압축 감지의 새로운 분야는 우리가 Shannon의 한계를 넘어 흥미로운 방식으로 찾은 다양한 이미지의 재구성을 가능하게합니다.

이것에 대한 참고 자료를 줄 수 있습니까? :)
Vivek Bagaria

8

자연 과학이 제기하는 많은 흥미로운 문제는 고전적인 의미에서 NP-hard로 밝혀졌습니다. 이 개념은 이론적으로는 완벽하게 유효하지만 생물학 자나 물리학 자에게 도움이되지는 않습니다. 우리는 일부 NP-hard 문제는 고정 된 매개 변수로 취급 할 수 있으며 종종 실제 환경에서 작은 상수에 의해 경계를 parameter 것으로 보이는 매개 변수를 가지고 있음을 발견합니다.

즉, TCS는 추상 문제에 대한 효율적인 솔루션을 기대하지 않지만 실제로 발생하는 인스턴스를 빠르게 해결할 수 있다고 말합니다.


5

본 논문 ( http://www.mimuw.edu.pl/~szymtor/papers/atom-turing.pdf)에서 우리는 데이터에 대한 접근이 제한적인 Turing Machine을 연구했습니다. 이것은 관계 구조의 이형성에서 변하지 않는 것으로 공식화된다. 예를 들어, 분류를위한 O (n log n) 하한에서, 기계가 합리적인 수를 처리하고 저장할 수 있다고 말하지만, (Q, <)의 자동 형성, 즉 모노톤 바이 젝션 (monomorphism)에서는 전이가 변하지 않아야합니다. 공식적인 정의는 기계가 어떤 종류의 데이터 구조를 메모리에 저장할 수 있는지를 정확하게 지정하기 위해 더 복잡합니다 (
어떤 의미에서 "유한"이어야 하지만, 우리는 단지 튜플의 데이터 값보다 더 복잡한 구조를 저장할 수 있습니다. 정렬되지 않은 튜플과 같은).

이 논문에서 우리는 "제한된 데이터 액세스"를 가진 다른 Turing 장비에 대한 하한을 입증했습니다. 특히 우리는 다음을 보여주었습니다.

• 벡터를 처리 할 수 ​​있지만 (2 요소 필드를 통해) 벡터 추가 및 동등성 테스트 만 사용할 수있는 결정 론적 Turing 기계는 주어진 벡터 목록이 선형 적으로 종속적인지 여부를 다항식 시간으로 결정할 수 없습니다 (공식적으로 기계 천이는 벡터 공간의 변형에서 변하지 않는다). 이것은 비결정론적인 기계와는 반대로, 단순히 0을 더하는 벡터의 조합을 추측 할 수 있습니다. 가우시안 제거는 다항식 시간에 실행되지만 벡터의 좌표에는 액세스 할 수 있습니다. 특히, 그것의 전이는 벡터 공간의 이형성에서 변하지 않는다.

• 적절하게 정의 된 모델에서 동등성 (<조차도)에 대해서만 자연수를 비교할 수있는 Turing Machine은 결정될 수 없습니다. 여기, 우리는 automorphisms에서 변하지 않는 관계 구조 (N, =)와 기계를 고려합니다. 실제로이 모델에서 P ≠ NP를 보여주는 구성 (Finite Model Theory의 Cai-Furer-Immerman 구성과 유사)이 있습니다. 기계가 <를 사용하여 숫자를 비교하게하면 결정하기에 충분한 전력이 제공됩니다.


2

일반적인 추상화 가격은 의사 결정 트리 복잡성 또는 양자 쿼리 복잡성과 같은 블랙 박스 프레임 워크에 존재합니다. 이러한 모델로 분석을 제한하면 작업의 복잡성에 대해 매우 좋은 경계를 찾을 수 있습니다. 실제로, 양자 쿼리의 경우 음의 적대적 방법이 (n / loglog n : 1005.1601 의 계수 내) 좁은 하한을 제공하기 때문에 기본적으로 문제의 복잡성을 해결할 수 있습니다 . 이로 인해 쿼리 복잡성을 분석 할 수있는 훌륭한 도구가 제공되지만 쿼리 복잡성을보다 일반적인 표준 터링 머신 시간 / 공간 복잡도와 비교하기 어려워지는 경우가 있습니다 (원유 하한 제외).


"블랙 박스를 열어서"끊어 질 수있는 하한을 나타내는 특정 예가 있습니까?
Joshua Grochow

잘 정렬은 의사 결정 트리 모델이 n log n을 제공하는 예이지만 입력 구조를 보면 더 나아질 수 있습니다.
Suresh Venkat

@Suresh : 나는 아직 언급되지 않은 예를 의미했습니다 :).
Joshua Grochow

미안해 내 잘못이다.
Suresh Venkat

글쎄, 때로는 상대적으로 좋은 양자 쿼리 복잡성을 가질 수 있지만 빠른 실행 알고리즘은 없습니다. 예를 들어, 다항식 쿼리가 필요한 숨겨진 하위 그룹 문제가 있지만 알려진 알고리즘에 대해 지수 시간 (아마도 하한 시간은 입증되지 않았 음)이 있습니다 [1]. 이것은 반대 방향의 가격입니다. [1] arxiv.org/abs/quant-ph/0401083
Artem Kaznatcheev

1

다음은 연속 모델과 개별 모델과 관련된 두 가지 예입니다.

  1. [0,1]엑스와이엑스<와이엑스=와이엑스>와이엑스|엑스와이|와이=엑스

    와이[0,1]와이=엑스

  2. 문제 A에 대한 동기는 부러워하지 않는 케이크 분할 문제에서 비롯됩니다 . Stromquist는 (무한한 경우에도) 유한 프로토콜이 각 플레이어가 하나의 연결된 조각을받는 경우 3 명 이상의 플레이어 사이에서 케이크를 부러워하지 않음을 보장 할 수 없음을 보여주었습니다 .

    나는α나는엑스V나는(0,엑스)=α

    또한 결과는 이동 나이프 절차와 같은 연속 작업이있는 알고리즘과 관련이 없습니다.


0

1 차 논리로 표현 될 때, 고정 된 n에 대한 비둘기 구멍 원리의 ​​증거는 길이가 지수입니다. 그러나 산술로 증명을 훨씬 더 간결하게 표현할 수 있습니다.

SMT 솔버의 성공은 문제를 줄이는 추상 모델에서 SAT로 거슬러 올라가서 더 풍부한 이론으로 필요한 계산량을 크게 줄일 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.