ps, w 및 다른 명령을 실행할 때 왜 시스템이 정지합니까?


10

이유를 모르지만 Ubuntu 10.04LTS 시스템 에서 ps또는 w명령을 실행할 수 없습니다 . 나는 둘 다에 대한 추적을했고 같은 파일의 일부를 읽을 때 둘 다 중지되었습니다.

다음 은 실행 결과입니다ps

그리고 여기에 대한 결과가 있습니다w

파일을 읽을 때 파일이 중지되었습니다 ... 자체? http://pastebin.com/9qRB5eHh

무슨 일이야?

답변:


9

NFS 서버가 다운되었을 때 그런 일이 한 번있었습니다.

pid 17398에 대한 정보를 읽으려고 시도하고 pid 17398이 D(디스크 대기) 상태에 있다는 사실은 당신에게도 원인이 될 수 있음을 시사합니다.

read(6, "Name:\tconvert\nState:\tD (disk sle"..., 1023) = 664
open("/proc/17398/cmdline", O_RDONLY)   = 6

NFS 마운트가있는 경우 가장 좋은 방법은 NFS 서버를 백업하는 것입니다.

그렇지 않으면 umount -f <mount>도움이 될 수 있습니다.


재부팅하면이 문제를 해결해야한다고 생각하지만이 원인이 무엇인지 확인하고 싶기 때문에 원하지 않습니다. : P

무엇합니까 mount말은? 너무 매달려있을 가능성이 있습니다 (나는 생각하지 않지만 100 % 확실하지는 않습니다).
Mikel

3

닫힌 질문 처리가 한숨입니다 .이 입력을 세 번째로 할 것이므로 간결함을 용서하십시오.

먼저 intrNFS 마운트를 사용하십시오 . 기본 hardNFS 마운트는 영구적으로 정지됩니다. soft시간 초과 후 NFS 마운트 오류 (일시적 오류에 대해 어리 석음)를 intr사용 하면 중단 된 NFS 작업을 중단 할 수 있습니다 . 바로.

둘째,이 어리석은 문제를 해결하기 위해 이전에 어리석은 트릭을 사용 했지만 아마도 여전히 작동합니다. 에 인터페이스 별칭을 가져 오기 lo는 NFS 서버의 IP 주소와 ( 편집 : ifconfig eth0:0 <ipaddress>). /etc/exports정지 된 파일 시스템을 내보낼 행이 포함 된 파일을 작성하십시오 ( 편집 : 'hung'파일 시스템과 동일한 이름으로 파일 시스템 내보내기; 마운트 한 것과 동일한 경로 이름을 작성해야합니다) . 로컬 시스템에서 NFS 서버를 시작하면 중단 된 프로그램이 "파일을 찾을 수 없음"또는 "디렉토리를 찾을 수 없음"등의 오류가 발생하여 재부팅하지 않고도 작업을 시작할 수 있습니다.

다시 NFS 서버를 해제하는 것을 잊지 마세요 작업이 완료되면 인터페이스 별칭을 제거합니다.


나는 intr NFS 마운트를 사용합니다 ... 당신은 어디에서 반대를 보았습니까?
user69239 2019

"두 번째 단락"에 대해 나는 그것을 잘 이해하지 못합니다 ... 죄송합니다! :(
user69239

@ user69239 자세한 내용은 제공하지 않았으므로 기본 hard마운트 유형을 사용한다고 가정했습니다 . :)
sarnold

@ user69239, 바보 같은 트릭으로 단락을 약간 확장했습니다. 지금 이해하기 쉽기를 바랍니다. :)
sarnold

2

NFS에 초점을 둔 이유를 잘 모르겠습니다. asker가 NFS를 실행 중입니까? 그것에 대해 아무것도 보지 못했습니다.

어쨌든, 이것은 / proc 이후로 매우 이상한 문제입니다. 문제에 대한 자세한 정보를 얻으려면 다음 사항을 시도하십시오.

  • / proc로 이동하여 다른 pid 디렉토리를 찾고 해당 디렉토리에서 cmdline 파일을 읽으십시오.
  • / proc / pid / stat도 읽어보십시오. 그래도 작동하지 않으면 시스템에 커널 문제가 있다고 말하고 싶습니다.
  • netstat -n을 실행할 수 있습니까? 이것은 / proc의 다른 부분에서 읽히므로 작동 할 수 있으며 proc 인터페이스에 대한 문제가 적습니다.
  • 이 상황에서 이것이 무엇을할지 모르겠지만 mount -o remount / proc로 / proc를 다시 마운트하십시오.

재부팅하는 것이 좋습니다. proc에서 기사를 읽을 수 없다면 다른 방법을 통해 무엇을 찾을 지 잘 모르겠습니다. 다시 발생하면 걱정을 시작하십시오.


예, NFS를 사용하고 있습니다 ... 문제는 s3 퓨즈 시스템을 통해 파일을 복사하는 것입니다
user69239

퓨즈와 nfs는 다릅니다. 당신이 할 수있는 모든 세부 사항을 제공해야한다고 생각합니다. strace를 많이 제공했지만 설정에 대한 자세한 내용과 이것이 어떻게 시작되었는지를 아는 것이 첫 단계입니다.
deltaray

문제는 호스트 (Amazon의 작은 인스턴스)에서 allow_other 옵션 만 사용하여 s3f3 1.40으로 연결된 S3으로 대규모 "cp"명령을 수행하는 것으로 나타났습니다. 내 우분투는 일반적인 업그레이드와 함께 일반적인 기본 10.10 설치입니다. 다른 건 없어 정말 : P
user69239
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.