답변:
모니터링 + 알림 -훌륭한 안전망입니다. 개발자가 코드를 업데이트 할 때 문제가 발생하지 않도록 유닛 테스트를 작성하는 것처럼, 서버를 분리하고 방화벽에서 생산 트래픽을 거부하는 등 무언가를 망칠 경우를 대비하여 추가 안전망으로 모니터링에 의존합니다. . 마음의 평안을줍니다. 만약 문제가 발생하면 고객이 전화하기 전에 알게됩니다.
나를 위해, 그것은 중앙 인증되었습니다.
40 대 정도의 슬랙웨어 컴퓨터를 관리하고 있었고 각 컴퓨터에는 로컬 인증 PLUS 로컬 Samba 인증이있었습니다. 또한 각 계정을 설정해야하는 VPN 솔루션과 내부 재버 서버 및 내부 전자 메일 서버가있었습니다. 모든 것이 자신의 계정을 가지고있었습니다. MAC (이동, 추가, 변경)은 미쳤다.
그래서 슬랙웨어에서 CentOS로 전환하고 Active Directory 인프라를 만들고 Likelike Open을 사용하여 AD에 대해 모든 Linux 컴퓨터를 인증했습니다. 아마 조금 농담하지 않고 한 달에 20 시간을 절약했습니다.
이제 AD를 통해 인증 된 모든 것이 가능하며 엄청나게 작동합니다. 여전히 오래된 방식으로 일을하고 있다면 중앙 집중식 인증을 충분히 권장 할 수 없습니다.
나는 명백한 선택에 동의합니다. 자동화 및 중앙 인증. 그러나 documentation 을 언급하는 사람이어야합니다 .
가능한 많은 문제, 워크 플로, 설치 및 가이드를 문서화하여 사람들이 부서를 열지 않고도 일부 문제를 해결할 수있었습니다.
또 다른 좋은 시간 절약은 이슈 트래킹 입니다.
작업의 우선 순위를 정하여 팀 구성원에게 할당하고 전자 메일, msn 또는 단순히 사무실로 오는 요청을 보내는 사람들의 모든 혼란을 제거합니다. 이것은 또한 우리의 좋은 친구, 관리자가 당신이 얼마나 효율적인지 (원하는 경우) 볼 수 있도록 도와줍니다.
물론 케이크 위에 씌우는 것은 나의 'RTFM'(The Fine Manual) 머그컵이 될 것입니다.
Chef 또는 Puppet 과 같은 도구를 사용한 인프라 자동화 는 내가 관리하는 시스템에서 구현 한 가장 좋은 방법입니다. 모니터링은 훌륭하지만 모두 다른 인프라에서 다양한 비트를 재생하려면 많은 작업이 필요합니다. Chef와 Puppet은 전체 인프라를 자동화하여 수작업으로 작성했던 많은 접착제를 제공합니다. 특히 어떤 서버가 어떤 서비스를 제공하는지 함께 연결합니다.
Chef는 서버에 다른 노드에 적용된 속성 및 레시피를 쿼리 할 수있는 기능을 내장하고 있으므로 프로덕션 웹 서버가 누구인지 또는 데이터베이스 마스터가 누구인지 물어 자동화가 훨씬 쉬워집니다. 꼭두각시도이 작업을 수행 할 수 있지만 iClassify 와 같은 외부 노드 분류 도구가 필요합니다 .
이것은 Nagios 및 Munin과 같은 모니터링 도구 및 추세 도구에 명백한 영향을 미칩니다. 예를 들어,로드 밸런싱 된 환경의 자동화 된 구성을 제공 할 수 있으므로 LB는 특정 앱에 대해 다루어야하는 모든 웹 서버를 쿼리 할 수 있습니다.
다양한 환경에서 구현 한 다른 큰 시간 절약 기능은 킥 스타트 (redhat / centos) 및 미리 설정 (debian / ubuntu)과 같은 자동화 된 빌드입니다. 이것은 대부분의 사람들에게 분명하지만, 핸드 오프 CD로 시스템을 구축하는 사이트 수는 놀랍습니다. 자동화 된 빌드로 시스템이 Chef 또는 Puppet을 실행하여 다른 모든 상품을 준비 할 수 있도록 준비하는 것이 더 좋습니다.
물론 모니터링은 훌륭하지만 시간을 절약 할 수는 없습니다. 내 돈을 위해 중앙 집중식 로깅이었고, 평범한 것을 걸러 내고 위험한 (디스크 오류, 바이러스 스캐너 발견)을 강조 표시하고 분류를위한 다른 모든 것을 표시하는보기 시스템을 사용했습니다.
승리를위한 syslog (및 perl).
기본적으로 베이글을 먹는 동안 네트워크에있는 모든 컴퓨터의 이벤트 로그를 읽을 수있었습니다. 적어도 무서운 것을 찾기 위해 궁극의 점검. 엄청난 시간 절약.
모든 사용자에 대한 로컬 관리자 권한을 제거했습니다. (만약 내가 할 수 있다면)
이것은 효과가 있었지만 X 응용 프로그램을 설치하려면 어떻게해야합니까 (지금 허용되지 않기 때문에) 컴퓨터에 바이러스 / 스파이웨어가 있으며 컴퓨터가 느리게 실행됩니다 그와 관련된 거의 모든 것.
감사, Windows 업데이트 등에서 완전히 누락 된 하나의 워크 스테이션을 발견 할 때까지 워크 스테이션이 얼마나 안정적인지 알 수 없었습니다. 단일 업데이트없이 약 4 년 동안 실행되었습니다. Windows SP1에 있다고 생각합니다. 그 사이트는 한 번도 그 문제에 대해 불평하지 않았으며 그것을 발견했을 때 나는 그것이 잘 돌아가는 것을 발견했습니다.
가상화 (VMware)
템플릿에서 서버를 배포하고, 단일 인터페이스에서 서버를 관리하고, 인프라 클라이언트에 내장 된 자세한 하드웨어 모니터링을 수행 할 때 인프라 관리 방식이 실제로 바뀌 었습니다.
그리고 우리가 "하드웨어"를 생각하는 방식에 미치는 영향은 실제로 게임 체인저가되었습니다. 클러스터를 가상으로 배포 할 수 있으므로 더 이상 "비싸지 않습니다". 더 많은 Citrix 서버가 필요하면 복제하십시오. 물리적 하드웨어 팜이 적절한 리소스를 제공하고 (그 서버가 실제로는 상품 일 경우) 모든 것이 번거 롭습니다.
데비안 / 리눅스에서 설정 관리를위한 cfengine .
위성 방송국을 연결하는 openvpn
위성 스테이션의 2300 Windows 클라이언트에 도달하기 위해 VPN을 통해 tighvnc .
모니터링 및보고를위한 munin 및 nagios
서버의 자동 상태 확인 (및 문제 발생시 상태 메일)을위한 smartmontools
서버의 raid1 (미러링) . 하나의 디스크에 장애가 발생해도 서버가 여전히 실행 중입니다. 시간 관리에있어 중요한 것은 아닙니다.
팀워크 -모든 일을 스스로하는 것은 쓸모가 없습니다. 작업을 공유하고 더 생산적입니다.
일하는 분위기 는 동료를 존중하고, 농담을하며 웃으며, 이것은 긍정적이고 창조적 인 분위기에 매우 유용합니다.
당신의 직업을 즐기십시오! 남자, 나는 내 직업을 사랑합니다! 이것은 나를 정말로 goog하게 만든다 (나는 생각한다;))
모니터링에 다른 투표를 추가하십시오. 원칙은 매우 간단합니다. 사용자에게 영향을주기 전에 무슨 일이 일어나고 있는지 알고 싶습니다. 시스템 관리는 투명한 역할이어야합니다. 사용자는 자신이하는 일을 알거나 신경 쓰지 않아야합니다. 그들의 관점에서 그것은 단순히 작동해야합니다. 행복하고 만족스러운 사용자는 행복하고 만족스러운 관리자와 같아야합니다.
IT에서 종종 간과되는 한 가지는 컴퓨터가 우리를 위해 일하기 위해 존재한다는 것입니다. 그럼에도 불구하고 나는 하루 중 많은 시간을 서버와 로그를 수동으로 검사하는 관리자를 알고 있습니다. 왜? 컴퓨터는 서로를 모니터링 할 수 있으며 약간의 스크립팅으로 로그의 흥미로운 부분 만 전달할 수 있습니다. 실제로 Fred의 인쇄 작업 또는 DNS 전송과 같은 수백만 개의 정보 항목을 처리 할 필요가 없습니다. 그들이 없을 때 말해줘.
내가 구현 한 최대 시간 절약은 프로덕션 워크 스테이션의 디스크 이미징이었습니다. 그것들은 모두 동일하며 아무도 로컬에 아무것도 저장하지 않으므로 문제가 발생하면 기계를 다시 이미지화하면 모든 것이 새로워 질 것입니다.
시스템이 다운 될 때 절약 된 시간이 가장 중요합니다.
모든 지원 계약 정보를 표준화 된 디렉토리 구조로 표준화 된 텍스트 파일로 문서화했습니다. 나는 중앙이 하나 있고 사본을 두 개 이상 보관했습니다.
이전 .ini 형식의 표준 태그 (태그 : 데이터) 앞에있는 각 정보 비트 (웹 포털, 전화 번호, 연락처, 만료 날짜, 계약 번호, 전화 메뉴 바로 가기 등)
전화 번호 찾기는 최상위 디렉토리로 이동하여 다음과 같이 간단합니다.
grep Phone */*support.txt | more
첫 번째 와일드 카드가 공급 업체 및 / 또는 제품 이름으로 확장되었습니다.
Excel, Word, OpenOffice, 데이터베이스 등을 사용하지 않았습니다. 단순히 문제가 발생했을 때 지원 정보를 보유하고있는 것일 수 있기 때문입니다. 또한 텍스트 모드 콘솔 화면에서는 쉽게 볼 수 없습니다.
또한 모든 방법을 동일한 방식으로 문서화했습니다.
지금까지 가장 큰 시간 절약 은 OpenSSH 키 관리에 대한 이 IBM 기사에서 설명한대로 SSH 키 + ssh-agent + 키 체인입니다.
쉘, 스크립트 및 scp에 대한 더 이상 비밀번호가 없습니다.
참고 : 개인 키에는 여전히 암호가 있습니다.
모니터링에 대해서는 pQd에 동의해야합니다.
아직까지 전체 이점을 얻지는 못했지만 Puppet을 사용하여 구성 관리를 구현하면 상당한 시간을 절약하고 실수를 크게 줄일 수 있습니다.
AutoIt 과 나중에 AutoHotkey를 발견 하고 사랑에 빠졌습니다.
마지막으로해야 할 일은 맞춤형 차량 제조업체였습니다. 어셈블러는 최소한의 숙련 된 컴퓨터 사용자였으며 어떤 작업을 시작하는 데 사용해야하는 프로그램을 중단시킬 수있었습니다. 매일 하루에 여러 번 3 개의 다른 건물에있는 15 개 이상의 워크 스테이션으로 가서 충돌 한 프로그램을 종료하고 다시 시작한 후 다시 데이터 입력 화면으로 가져와야했습니다. 나는 결국 VNC를 설치하여 원격으로 할 수 있었기 때문에 이동 시간을 줄 였지만 여전히 자주 들어가서 기계를 재설정하는 것을 기억해야했습니다. AutoIt을 찾았을 때 컴퓨터를 시청하도록 프로그램을 설정할 수 있고 5 분 동안 입력이 없으면 프로그램을 재설정하고 입력하고 다시 입력 화면으로 돌아가는 데 필요한 모든 것을 클릭 할 수 있음을 깨달았습니다.
++ 계정 생성 및 종료 처리를 포함한 중앙 인증 및 계정 관리 용. 우리는 AD (두 개의 포리스트)와 LDAP (및 최근 NDS까지)가 있으며 각 그룹에 존재하는 리소스에 액세스하는 다양한 그룹이 있습니다. 디렉토리를 동기화하고 디렉토리 중 하나 또는 다른 디렉토리에서 모든 자원을 관리하는 데 걸리는 시간은 스페이드에서 가치가 있습니다.
그 다음으로 가장 큰 승리는 계정 정리, 구성 중앙 집중화 또는 사용자가 무엇을하든 많은 자동화입니다.
실제로 모니터링하는 시간이 얼마나 절약되는지 확실하지 않지만 필수적입니다. "수동 검사"가 불가능하고 효과적이지 않을 정도로 환경이 충분히 커지거나 복잡 해지는 데 그렇게 많은 시간이 걸리지는 않습니다. 또한 때로는 잠을 잘 수 있습니다. ;)
이것은 이것에 대한 생각의 주된 맥락에서 약간 벗어 났을 수도 있지만 하드웨어 플랫폼을 표준화 할 때도 큰 승리를 거두었습니다. 우리는 사내 모든 OS에서 사용할 수있는 서버 플랫폼을 선택했으며 몇 년 동안이를 고수했습니다. 하드웨어를 배우고 원격 관리를 배웠으며 다양한 방법으로 시간과 에너지를 절약합니다.
표준, 문서화 및 검토 된 OS 빌드도 마찬가지입니다. 기본적으로 보일지 모르지만 빌드가 표준이 아닌 상점과 자주 충돌 하며이 도구 또는 해당 도구가 있는지 또는 특정 서버에 올바른 설정이 있는지 확인하기 위해 엉망이되지 않습니다. 그런 종류의 혼란은 가장 기본적인 작업과 문제조차도 소방 훈련으로 바꿀 수 있습니다.
동료를 위임하고 신뢰하는 법 배우기-다른 사람들에게 약간의 작업을 전달할 수 있다는 사실을 알게되면 훨씬 더 편안해집니다. 내가 게으르고 다른 사람들이 나를 위해 내 일을하도록해서가 아닙니다. 당신이 좋은 백업을 알고 함께 제공되는 것은 마음의 평화입니다. 물론 표준 하드웨어에서 잘 모니터링되고 표준화 된 OS 구성입니다. 말없이 간다.
자동화에 대한 나의 목표는 이제 다시 "서버 foo에서 그런 파산이 발생했습니다. 수정되었습니다"라는 이메일을 다시받는 것입니다. 그런 다음 개발자에게 버그를 보내면 신문을 읽고 커피를 마시는 것으로 돌아갈 수 있습니다. 우리는 아직 거기에 없지만 우리가 매일 싸워야했던 반응적인 혼란에서 먼 길을 왔습니다.
나는 최근 에 직장에서 AntHill Pro 를 구현 했으며 이제는 완전히 자동화되고 추적 된 많은 프로젝트에 대한 모든 빌드 및 배포를 보유하고 있습니다. 여기에는 모든 프로젝트에서 사용하는 공유 Tomcat 배치 Ant 라이브러리 작성이 포함되어 AHP에서 해당 프로젝트의 유지 관리가 간단 해졌습니다. 다음은 사이트 CDA 배포를위한 유사한 라이브러리를 만드는 것입니다.
개인적으로 시간을 절약 할 수는 없지만 개발자와 운영 직원의 시간을 절약 할 수 있습니다. 나는 다른 사람의 바퀴를위한 기름 통인 것을 즐긴다. :-)
자동화를위한 인프라 측면에서 도움을주기 위해 다음으로 Chef와 Puppet을 살펴보고 싶습니다.
아, 그리고 문서는 큰 도움입니다. 같은 질문에 20 번 대답하는 대신 잘 작성된 문서를 사람들에게 알려주는 데 많은 시간을 절약 할 수 있습니다.