내가 아는 한, 모든 운영 체제에는 EOL (End of Line) 문자를 표시하는 다른 방법이 있습니다. 상업용 운영 체제는 EOL에 캐리지 리턴을 사용합니다 (Windows에서는 캐리지 리턴 및 줄 바꿈, Mac에서만 캐리지 리턴). 반면에 Linux는 EOL에 줄 바꿈 만 사용합니다.
Linux가 EOL에 캐리지 리턴을 사용하지 않는 이유는 무엇입니까 (대신 줄 바꿈 만)?
내가 아는 한, 모든 운영 체제에는 EOL (End of Line) 문자를 표시하는 다른 방법이 있습니다. 상업용 운영 체제는 EOL에 캐리지 리턴을 사용합니다 (Windows에서는 캐리지 리턴 및 줄 바꿈, Mac에서만 캐리지 리턴). 반면에 Linux는 EOL에 줄 바꿈 만 사용합니다.
Linux가 EOL에 캐리지 리턴을 사용하지 않는 이유는 무엇입니까 (대신 줄 바꿈 만)?
답변:
Windows는 CRLFMS-DOS에서 상속했기 때문에 사용합니다 .
MS-DOS CRLF는 이미 사용중인 CP / M에서 영감을 얻었으므로 사용 CRLF합니다.
CRLF텔레타이프에 인쇄 된 줄을 끝내는 방법이기 때문에 CP / M과 80 년대 및 그 이전의 많은 운영 체제가 사용 되었습니다. 사전 처리가 적거나 필요하지 않기 때문에 파일 인쇄가 간단 해졌습니다. 단일 문자를 사용할 수 없도록하는 기계적 요구 사항도있었습니다. 캐리지가 돌아가고 인자 판이 돌아가는 데 약간의 시간 이 걸릴 수 있습니다 .
Gnu / Linux는 LF유닉스 클론 이기 때문에 사용합니다 . 1
Unix LF는 처음부터 공간을 절약하고 표준적인 끝까지 표준화하기 위해 단일 문자를 사용했습니다. 두 문자를 사용하면 비효율적이고 모호했습니다. 이 선택은 1964 년 초에 사용했던 Multics에서 상속되었습니다. 메모리, 스토리지, CPU 전력 및 대역폭은 매우 희박하므로 한 줄에 1 바이트를 절약하는 것이 좋습니다. 파일을 인쇄 할 때 드라이버가 줄 바꿈 (줄 바꾸기)을 대상 장치에 필요한 제어 문자로 변환했습니다.
LFCR후자는 여전히 특정 용도로 사용 되었기 때문에 선호되었습니다 . 인쇄 된 문자를 같은 줄의 시작 부분으로 재배치함으로써 이미 입력 된 문자를 과잉 공격 할 수있었습니다.
Apple은 처음에 단일 문자를 사용하기로 결정했지만 어떤 이유로 다른 문자를 선택했습니다 CR. BSD 인터페이스로 전환하면로 이동했습니다 LF.
이러한 선택은 OS가 상업적인지 아닌지와 관련이 없습니다.
1 이것은 귀하의 질문에 대한 답변입니다.
\n
특정 출력 장치와 독립적으로 단일로 표시됩니다 .
"Newline"에 관한 Wikipedia 기사는 1964 년에 MultiNL에 대한 줄 종결 자 (또는 구분자)로서 NL의 선택을 추적합니다. 불행히도 기사에는 출처에 대한 인용이 거의 없지만 이것이 옳다는 것을 의심 할 이유는 없습니다. CR-LF에 비해이 선택의 두 가지 분명한 이점은 공간 절약과 장치 독립성입니다.
주요 대안 인 CR-LF는 텔레타이프 머신에서 용지 캐리지를 물리적으로 이동시키는 데 사용되는 제어 코드에서 유래합니다. CR은 캐리지를 홈 위치로 되돌리고 LF는 용지 롤러를 회전시켜 인쇄 위치를 아래로 이동합니다 선. 두 제어 문자는 ITA2 코드에 나타나며 1924 년으로 거슬러 올라가 여전히 사용 중입니다 (위키 백과 참조). 분명히 ITA2는 1901 년의 Baudot 코드의 Murray 변형에서 가져온 것입니다.
젊은 독자에게는 메인 프레임 전통에 줄 바꿈 문자가 없었 음을 주목할 가치가 있습니다. 오히려 파일은 고정 길이 (펀칭 카드를 기준으로 80 자) 또는 가변 길이 인 일련의 레코드였습니다. 가변 길이 레코드는 일반적으로 각 레코드 시작시 문자 수와 함께 저장되었습니다. 각각 임의의 이진 컨텐츠를 포함하는 일련의 가변 길이 레코드로 구성된 메인 프레임 파일이있는 경우이를 손실없이 UNIX 스타일 파일로 변환하는 것은 까다로운 변환 일 수 있습니다.
물론 리눅스는 유닉스를 재 구현 한 것이었고, 유닉스는 많은 디자인 결정을 Multics에서 가져 왔기 때문에 1964 년에 결정이 내려진 것처럼 보인다.
다른 답변들은 상속 체인을 1960 년대와 텔레타이프로 거슬러 올라갑니다. 그러나 그들이 다루지 않은 한 가지 측면이 있습니다.
텔레타이프 시대에는 오버 스트라이킹 (overstriking)이라고 불리는 것이 바람직한 경우가있었습니다. 암호를 지우는 것은 불가능했기 때문에 과다 공격은 때때로 암호를 가리기 위해 사용되었습니다. 다른 경우에는 글꼴에없는 기호를 얻기 위해 과도하게 시도했습니다. 예를 들어, 문자 O와 슬래시는 새 심볼을 생성합니다.
백 스페이스 (backspace)가 사용 되기는했지만 줄 바꿈없이 캐리지 리턴 (carriage return)을 넣어 오버 스트리킹을 달성했습니다. 이러한 이유로 유닉스 사람들은 캐리지 리턴을 줄 구분 기호로 사용하지 않고 대신 줄 바꿈을 선택했습니다. 이것은 CRLF 규칙을 사용하여 작성된 텍스트를 읽는 데에도 효과적이었습니다. CR이 삼키고 LF가 분리기가됩니다.
당신은 C 언어, 리눅스 및 모든 POSIX-준수 또는 POSIX 틱 시스템이 이유에 대한 질문에 역사적 질문을 번역 할 수 있지만 있어야 사용 LF
(또는 C의 어떤 적어도 '\n'
문자가) 새로운 라인과 교차의 결과입니다 C 및 POSIX의 요구 사항. C는 "텍스트 파일"과 "바이너리 파일을"수 있지만 차이 (사실 텍스트 파일 기록을 기반뿐만 아니라, 라인 기록의 순서로 구성 할 수 있습니다와 같은 덜 이국적인 것들이 데 '\n'
번역에 /에서 CR
/ LF
DOS / Windows에서 같은 )에서 POSIX는 텍스트와 이진 모드가 동일하게 작동하도록 요구합니다. 이것은 주로 명령 행 도구가cat
강력하고 유용하다. 바이너리 만 사용하거나 텍스트 만 사용하지만 둘 다 사용하지 않는 경우에는 훨씬 적습니다.