크래시 또는 비잔틴이 아닌 분산 컴퓨팅의 프로세서 오류


13

분산 컴퓨팅 모델에는 두 가지 주요 유형의 프로세서 장애가 있습니다.

(1) 충돌 실패 : 프로세서가 중지되고 다시 시작되지 않습니다. (2) 비잔틴 장애 : 프로세서가 악의적으로 악의적으로 행동합니다.

내 질문은 :

크래시 또는 비잔틴 오류를 줄이지 않는 다른 유형의 프로세서 오류는 무엇입니까?

또한 더 구체적인 질문 :

어떤 가능성으로 프로세스가 시간 단계 에서 켜져 있고 그렇지 않은 경우 모델이 연구 되었습니까? 따라서 각 프로세스는 이전과 마찬가지로 윙크하고 있습니다.t

이러한 실패가 합의 및 기타 분산 계약 문제와 어떤 관련이 있는지에 가장 관심이 있습니다.

감사합니다.


@Aaron : 몇 년 전에 "분산 시스템"과 "내결함성 시스템"에 대한 강의를했지만 실제로는 그 주제에 대해서는 다루지 않습니다. 그러나 키워드 동적 결함 모델 이 도움이 될 수 있다고 생각합니다 .
MS Dousti

1
자체 안정화 영역에서 사용되는 고장 모델 이 충돌 고장이나 비잔틴 고장으로 줄어들지 않는다고 생각합니다 . 비잔틴 장애와 관련시키는 한 가지 방법 : 일시적인 비잔틴 행동을 할 수 있지만 그러한 행동이 멈 추면 자체 안정화 시스템이 올바른 상태에 도달해야합니다.
Jukka Suomela

1
더 구체적인 질문과 관련하여 : 확률 "on"인 프로세서의 경우 프로세서가 항상 켜져 있지만 메시지가 목적지에 도달하기 위해 1 / p 반올림 하는 비동기 모델과 매우 흡사 합니다. 이것이 당신이 생각했던 모델과 어떻게 다른지 명확히 할 수 있습니까? p1/p
Jukka Suomela

1
@Aaron :이 모델이 얼마나 많이 연구되었는지는 잘 모르겠습니다. 그러나 실행 시간이 T 인 결정 론적 동기 알고리즘 가 있는 경우 비동기 모델에서 A 를 시뮬레이션하기 위해 α- synchroniser를 사용할 수 있으며 예상 실행 시간은 T / p 와 같습니다 . ( α- 동기화 장치는 단순히 A 의 시뮬레이션에서 이웃이 당신보다 1 배 앞선 뒤에서 결코 뒤쳐지지 않도록 보장합니다 .)ATαAT/pαA
Jukka Suomela

2
@Aaron : Michel Raynal과의 분산 컴퓨팅 이론을 취했으며 메시지를 무작위로 삭제할 수있는 세 번째 모델을 설명했습니다. 이 모델에서 메시지가 자동으로 전달되지 않을 수 있지만 반드시 노드가 실패한 것은 아닙니다. 이는 노드 장애 "공정 손실 채널 모델"이 아닌 링크 장애에 관한 것입니다. 여기에서 자세한 내용을 확인할 수 있습니다. 장애 감지기 Oracle에 대한 입문 조사로서 Quiescent Uniform 안정적인 브로드 캐스트 -Michel Raynal ( ftp.irisa.fr/techreports/2000/ PI-1356.ps.gz )
M. Alaggan

답변:


12

요청에 따라 질문에 대한 의견에서 복사했습니다.

나는 Michel Raynal과의 분산 컴퓨팅 이론을 취했으며 메시지를 무작위로 삭제할 수있는 세 번째 모델을 설명했습니다. 이 모델에서 메시지가 자동으로 전달되지 않을 수 있지만 반드시 노드가 실패한 것은 아닙니다. 노드 장애 "공정 손실 채널 모델"이 아닌 링크 장애에 관한 것입니다. 여기에서 자세한 내용을 확인할 수 있습니다. 장애 감지기 Oracle에 대한 입문 조사로서 Quiescent Uniform 안정적인 브로드 캐스트-Michel Raynal (ftp.irisa.fr/techreports/2000/ PI-1356.ps.gz)


10

비잔틴 내결함성과 관련된 높은 자원 비용으로 인해, 가정이 점점 더 강력 해지는 실패 모델, 특히 제한된 유형의 결함을 허용하기위한 자원 요구 사항에 대한 분석이 진행되었습니다. ( Azadmanesh and Kieckhafer, 2002 )는 매우 좋은 분류법을 제공한다 (그림 1 참조).

3f+1f+12f+1f

실패 모드 가정을 모델링하는 또 다른 방법은 발신자의 결함으로 모델링 된 메시지 손실이 링크 오류 모델로 향하는 노드 중심 관점에서 벗어나는 것입니다. 시스템이 고려됩니다. 이 모델은 ( Schmid, Weiss, Rushby, 2002 )에 의해 조사되어 링크 결함 하에서 Coordinated Attack 문제의 결정적 솔루션을 보여주는 ( Grey, 1978 ) 의 불가능한 결과를 우회했습니다 .


8

@M인지 모르겠습니다. Alaggan은 이러한 종류의 결함에 대해 이야기하고 있었지만 과도 결함과 같이 똑같이 보입니다.

에너지 소비를 줄이기 위해 주파수와 전압을 수정할 수있는 DVFS 모델 에서이 백서의 Zhu와 Aydin (pdf)은 DVFS의 결함 모델을 사용했습니다. 예를 들어 소프트웨어 오류로 인한 오류 인 일시적인 오류를 고려합니다. 현재 작업의 실행 만 무효화하고 해당 오류가 발생한 프로세서는 작업에 할당 된 후속 작업을 복구하고 실행할 수 있습니다 (있는 경우).

λ

λ(f)=λpedfmaxffmaxfmin,
fminffmaxd0λpfmaxpTipfi
Ri(fi)=eλ(fi)×Execution Time(Ti,fi).

원래 게시물 이후 에이 게시물을 너무 오래 게시하여 죄송하지만이 주제에 대해 작업 하면서이 질문을 발견했습니다. :). DVFS를 연구하지 않더라도 이러한 결함은 여전히 ​​존재하며 공식은 여전히 ​​유효하거나 적합 할 수 있습니다. DVFS가없는 일시적 장애에 대한 자세한 내용은 여기를 참조하십시오 .


4

이미 언급 한 생략 실패 모델에 대해서는 NeigerToueg를 살펴 보았습니다 .

프로세스가 시간 단계 t에서 켜져 있고 그렇지 않으면 꺼져있는 모델이 연구 되었습니까? 따라서 각 프로세스는 이전과 마찬가지로 윙크하고 있습니다.

충돌 복구 모델처럼 들립니다. 프로세스가 비전문적으로 켜지거나 꺼지는 모델을 알지 못합니다. 프로세스가 일정 시간 동안 비잔틴 인 다음 복구되는 변형도 있습니다. 시간이 지남에 따라 모든 프로세스가 비잔틴 일 수 있습니다 (주로 클록 동기화로 간주 됨).

꺼져 있으면 프로세스가 진행 중이 아님을 의미하고 (수신자가 "꺼짐"으로 인해 메시지가 손실되지 않고 상태가 느슨해지지 않으며)보고있는 것을 비동기라고합니다. 체계. 공유 메모리 환경에서 귀하의 질문은이 Aspnes 논문 과 밀접한 관련이있을 수 있습니다 .


1

다른 유형의 장애가있을 수 있습니다. 예를 들어, 일부 프로세서 (예 : 브로드 캐스트 또는 멀티 캐스트 프로토콜)는 오버로드되어 모든 수신 메시지를 처리 ​​할 수 ​​없습니다. 이로 인해 프로세서가 분산 시스템의 일부 프로세서에 오프라인으로 표시됩니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.