Linux 서버를 얼마나 자주 재부팅해야합니까?

30

대규모 계산 그리드에 데이터를 제공하는 웹 서비스를 실행하는 데 사용되는 많은 Linux 서버 (SUSE 9 & 10)가 있습니다. 최근에 우리는 가동 중단을 설명하기가 어려웠습니다 (예 : 하드웨어 및 소프트웨어 로그에 명백한 오류가 표시되지 않음). 긴 가동 시간 (일반적으로 200-300 일)이 문제인지 궁금해지기 시작했습니다. 이러한 서버를 많이 사용한다고 가정하면 정기적 인 재부팅주기를 고려해야합니까?

linux

— 존 채닝
소스

47

KSplice를 사용하지 않는 한 커널 업데이트 후 재부팅해야합니다. 다른 옵션은 선택 사항입니다. 개인적으로 유지 관리 기간 동안 월 단위로 재부팅하여 서버와 모든 서비스가 예상대로 돌아 오도록합니다. 이 방법으로 시스템이 제대로 백업 될 수 있도록 일정이 지난 재부팅 (즉, 중요한 커널 업데이트)을 수행해야한다면 합리적으로 확신 할 수 있습니다. 서버 및 서비스 (예 : Nagios)의 자동 모니터링도이 프로세스를 지원하는 데 먼 길을갑니다 (재부팅, 표시등이 빨간색으로 바뀐 다음 모두 다시 녹색으로 바 watch).

PS 정기적으로 재부팅하는 경우 fsck 검사를 조정해야합니다 (즉, 검사 사이의 최대 마운트 수는 적절하게 검사해야합니다. 그렇지 않으면 서버가 몇 테라 바이트의 데이터를 fsck하기 시작하면 빠른 2 분 재부팅이 30 분이 걸릴 수 있습니다. 필자는 일반적으로 마운트 횟수를 0 (tune2fs -c 0)으로 설정하고 검사 간격을 6 개월 정도로 설정 한 다음 가끔씩 fsck를 수동으로 강제 설정하고 카운트를 재설정합니다.

— 커트
소스

1

DRBCP를 정기적으로 테스트하는 것이 필수적이며 이러한 유형의 검사는 그 방향으로 시작 하는 것이 좋습니다 .

— Scott Pack

커널 업데이트 후 재부팅하지 않아도됩니다.- ksplice.com

— raspi

1

KSplice는 정확합니다. KSplice를 사용하면 패치 실행 소프트웨어 (Kernel, Database 등)를 실시간으로 패치 할 수 있습니다. 그러나 오라클이 KSplice를 구매했기 때문에 Oracle을 사용하지 않는 사람 (최근에 KSplice를 구입 한 사람)에게는 솔루션이 아닐 수 있습니다.

— Kurt

11

실제로 주요 구성이 변경 될 때마다 서버를 상당히 정기적으로 재부팅합니다. 비상시 서버 소프트웨어가 번거 로움없이 나타날 것임을 아는 것이 중요합니다. 마지막으로 원하는 것은 중단에서 복구하려고하지만 설정시 철저하게 테스트하지 않았기 때문에 서버 구성을 망쳐 놓아야하는 위치에있는 것입니다.

— 카밀 키 시엘
소스

6

실행중인 커널 버전 을 절대 변경 하지 않으면 Linux 서버를 다시 부팅 할 필요가 없습니다. 구성 파일을 변경하고 init 스크립트로 서비스를 다시 시작하면 대부분의 문제를 해결할 수 있습니다.

서비스 구성 파일의 변경 사항을 반영하지 않고 "즉석에서"변경 한 내용은 재부팅 후 적용되지 않습니다.

그래도 예약 된 시스템 업데이트 후에 보통 재부팅합니다. 일반적으로 필요하지는 않지만 아무도 사무실에 없을 때 수행합니다. 왜 그렇지 않습니까? 어쨌든 업데이트를 할 때 종종 커널 업그레이드가 있습니다.

— 브래드 베엔 호프
소스

물론 때때로 재부팅해야합니다. 소프트웨어를 업데이트하고 해당 특정 소프트웨어가 현재 실행중인 경우 이전 버전의 사본이 여전히 RAM에서 활성 상태이므로 이전 버전의 소프트웨어를 계속 사용합니다. 업데이트가 적용 되려면 서비스를 다시 시작하거나 재부팅하여 해당 소프트웨어를 다시 시작해야합니다. 일부 응용 프로그램은 재부팅이 필요하고 서비스를 다시 시작 통해 업데이트 할 수 없습니다

— BlueWizard

1

@JonasDralle, 서비스는 업그레이드 될 때 자동으로 중지했다가 다시 시작해야합니다. 그렇지 않으면 해당 서비스 구현의 버그입니다!

— Alexis Wilke

4

실제로 필요하지는 않지만 리눅스 메모리 처리는 훌륭합니다. 그러나 가동 시간이 길면 취약점으로 알려진 커널을 실행하고있을 가능성이 높습니다.

— pete
소스

3

Linux는 메모리를 제대로 처리 할 수 있지만 개별 응용 프로그램은 그렇지 않을 수 있습니다. 오랫동안 실행하면 힙이 조각화 될 수 있습니다. 물론 prefork Apache (프로세스를 재활용하는)와 같은 것들은 일반적으로 이것으로 고통받지 않습니다. 매우 오래 지속되는 단일 프로세스 (예 : mysql)를 사용하는 다른 것들도 있습니다. 응용 프로그램에 따라 다릅니다.

— MarkR

4

최근 커널 업데이트 또는 libc 업데이트가 있으면 재부팅해야한다고 생각합니다. 많은 것들이 libc와 연결되어 있으며 재부팅하지 않으면 메모리에서 해당 lib를 완전히 언로드하고 새 버전으로 바꿀 수는 없습니다.

예를 들어, / bin / ls와 같은 기본 항목 및 / bin의 다른 항목도 libc를 사용합니다. 콘솔을 실행하고 bash를 사용하는 경우 libc를 사용하는 것입니다.

$ ldd /bin/bash
        linux-gate.so.1 =>  (0xffffe000)
        libtermcap.so.2 => /lib/libtermcap.so.2 (0xb8029000)
        libdl.so.2 => /lib/libdl.so.2 (0xb8025000)
        libc.so.6 => /lib/libc.so.6 (0xb7ed9000)
        /lib/ld-linux.so.2 (0xb804b000)

$ ldd /bin/ls
        linux-gate.so.1 =>  (0xffffe000)
        librt.so.1 => /lib/librt.so.1 (0xb7f3a000)
        libacl.so.1 => /lib/libacl.so.1 (0xb7f33000)
        libc.so.6 => /lib/libc.so.6 (0xb7de7000)
        libpthread.so.0 => /lib/libpthread.so.0 (0xb7dd0000)
        /lib/ld-linux.so.2 (0xb7f61000)
        libattr.so.1 => /lib/libattr.so.1 (0xb7dcc000)

그리고 예, 어떤 식 으로든 시작에 영향을 미치는 /etc/init.d의 파일을 변경하면 재부팅하는 것이 좋습니다. 작업이 필요할 때 다시 시작해야 할 때 시작 파일에서 약간의 실수를했다는 것을 알고 싶지 않습니다.

서버를 재부팅하지 않고 며칠이 지났다면 실제로 서버가 다시 제대로 작동하는지 확인할 방법이 없다는 것을 의미합니다. 다시 한번 이것은 많은 구성 파일이 변경되었을 수 있으며 아무도 그것을 다시 부팅하지 않았기 때문입니다. 또한 서버에 업데이트가 많고 오랫동안 재부팅 하지 않은 경우 업데이트를 적용 하기 전에 재부팅 하십시오. 오래 전에 또는 새로운 업데이트를 적용했습니다.

마지막으로 매우 긴 시간 후에 중요한 서버를 재부팅하는 경우 fsck는 서버가 다시 작동하기 위해 오랜 시간을 기다려야한다는 것을 의미 할 수 있습니다. 이것을 피하기 위해 tune2fs를 사용할 수는 있지만 정기적으로 확인하는 것이 좋습니다. 그렇기 때문에 단 하나의 서버에 의존하는 위치에 있지 않아야하며, 그렇게되면 전체 웹 사이트가 사라집니다. 대기중인 다른 장치가 있어야합니다.

— 아파
소스

3

"다시 부팅"에 +1

— kubanczyk

2

이 예기치 않은 가동 중지 시간이 발생하는 동안 찾아야 할 또 다른 사항은 메모리와 프로세서가 정확히 사용되는 방식과 프로그램이 무엇인지 확인하는 것입니다. top자원 손실의 원인이되는 프로세스를 파악한 다음 직접 관리 할 수 있어야합니다. 또 다른 아이디어는 특정 일정에 따라 프로세스를 종료하고 다시 시작하기 위해 cronjob을 초기화하는 것입니다.

— 순경
소스

+1-모든 중단이 커널 문제로 인한 것은 아닙니다.

— pcapademic

2

루트 파티션에서 디스크 검사 (fsck)를 실행할 수있을 정도로 오래 지속 된 경우 재부팅하는 것은 좋지 않습니다. 이것이 데이터 무결성을 보장하는 데 도움이된다고 주장 할 수 있습니다.

— 카일 브란트
소스

1

제대로 실행 된 Linux 서버는 커널 업데이트를 위해 재부팅 만하면됩니다. 일부 소프트웨어에 대해 항상 같은 말을 할 수는 없습니다. 예를 들어, 때때로 apache2 또는 mailman을 다시 시작해야합니다.

— 폴 툼린
소스

0

인프라에는 알파 (매일 작업이 수행되는 장소)와 베타 (알파에서 심각하게 잘못 될 경우를 대비 한 백업 사이트)의 두 데이터 사이트가 있습니다. 현재는 그렇지 않지만 6 개월마다 알파 사이트에서 다운 타임을 예약하여 베타에서 모든 서비스를 실행할 수 있도록 추진하고 있습니다.

이것은 두 가지를 달성 할 것입니다. 먼저 재난 복구 사이트가 완벽하게 운영되고 있음을 증명할 것입니다. 둘째, 알파에서 축적 된 부스러기를 제거하는 데 일주일의 시간이 필요합니다.

그대로, 서버를 자주 재부팅하지는 않습니다. 나는 필요할 때 서버가 다시 작동한다는 것을 아는 것이 중요하다고 말한 다른 포스터에 동의합니다. 당신은 그들이 당신이 무언가를 변경하고 올바르게 수행하지 않았거나 문서화하지 않았다는 것을 발견하기 위해서만 "생각"하고 싶지 않습니다.

— 매트 시몬스
소스

0

머신의 현재 상태가 재부팅 후 머신의 상태가 될 경우 점검 할 스크립트를 추가로 작성할 수 있습니다 (가능한 한 많이).

내가 의미하는 바는 ...

/etc/init.d/*
- 현재 실행중인 모든 서비스가 부팅시 시작되도록 플래그가 지정되어 있는지 확인
- 실행 중이 아닌 모든 서비스가 부팅시 시작되지 않도록 플래그가 지정되어 있는지 확인
/etc/fstab
- 마운트 된 모든 파일 시스템 (예 :) /etc/mtab에 해당 항목이 있는지 확인하십시오 ./etc/fstab
- 부팅시 마운트되도록 지정된 모든 파일 시스템 /etc/fstab이 현재 마운트되어 있는지 확인하십시오 .

이것은 물론 완벽한 검사는 아니지만 재부팅 후 문제의 위험을 줄입니다.

이 외에도 서버 패키지 업데이트에 대한 정책을 합리적인 순서로 설정해야합니다 (일주일에 한 그룹).

충돌 및 굽기 서버
개발 서버, 교육 서버
테스트 서버
사전 프로덕션 서버
프로덕션 서버

또한 "모든 서버는 6 개월마다 한 번씩 완전한 OS 업그레이드를 거칩니다"와 같은 전반적인 계획을 세우십시오.

— 크세르 크세스
소스

0

서버에서 실행중인 작업에 따라 다릅니다. 일부 가상 서버의 경우 종종 apachectl restart 대신 재부팅을 사용하며 5-10 초가 더 걸립니다. 그러나 일부 관리자는 프로세스를 모니터링하는 전체 관리자가 매년 몇 차례 재부팅합니다.

— Disserman
소스