EBCDIC 코드 골프 (생일, System / 360!)


11

IBM이 System / 360 컴퓨터 제품군을 발표 한 지 얼마되지 않아 곧 50 년 이 될 것이다 . 이들은 EBCDIC 문자 세트 를 사용한 최초의 회사 입니다.

기회를 표시하기 위해 "일반"텍스트를 EBCDIC 코드 페이지 037로 변환하거나 변환 할 수있는 가장 짧은 프로그램을 작성할 수있는 사람을 살펴 보겠습니다. CP037을 ISO-8859-1의 상위 집합에 매핑하는 Wikipedia변환 표를 사용합니다. :

EBCDIC037_to_Latin1 = [
    0x00,0x01,0x02,0x03,0x9c,0x09,0x86,0x7f,0x97,0x8d,0x8e,0x0b,0x0c,0x0d,0x0e,0x0f,
    0x10,0x11,0x12,0x13,0x9d,0x85,0x08,0x87,0x18,0x19,0x92,0x8f,0x1c,0x1d,0x1e,0x1f,
    0x80,0x81,0x82,0x83,0x84,0x0a,0x17,0x1b,0x88,0x89,0x8a,0x8b,0x8c,0x05,0x06,0x07,
    0x90,0x91,0x16,0x93,0x94,0x95,0x96,0x04,0x98,0x99,0x9a,0x9b,0x14,0x15,0x9e,0x1a,
    0x20,0xa0,0xe2,0xe4,0xe0,0xe1,0xe3,0xe5,0xe7,0xf1,0xa2,0x2e,0x3c,0x28,0x2b,0x7c,
    0x26,0xe9,0xea,0xeb,0xe8,0xed,0xee,0xef,0xec,0xdf,0x21,0x24,0x2a,0x29,0x3b,0xac,
    0x2d,0x2f,0xc2,0xc4,0xc0,0xc1,0xc3,0xc5,0xc7,0xd1,0xa6,0x2c,0x25,0x5f,0x3e,0x3f,
    0xf8,0xc9,0xca,0xcb,0xc8,0xcd,0xce,0xcf,0xcc,0x60,0x3a,0x23,0x40,0x27,0x3d,0x22,
    0xd8,0x61,0x62,0x63,0x64,0x65,0x66,0x67,0x68,0x69,0xab,0xbb,0xf0,0xfd,0xfe,0xb1,
    0xb0,0x6a,0x6b,0x6c,0x6d,0x6e,0x6f,0x70,0x71,0x72,0xaa,0xba,0xe6,0xb8,0xc6,0xa4,
    0xb5,0x7e,0x73,0x74,0x75,0x76,0x77,0x78,0x79,0x7a,0xa1,0xbf,0xd0,0xdd,0xde,0xae,
    0x5e,0xa3,0xa5,0xb7,0xa9,0xa7,0xb6,0xbc,0xbd,0xbe,0x5b,0x5d,0xaf,0xa8,0xb4,0xd7,
    0x7b,0x41,0x42,0x43,0x44,0x45,0x46,0x47,0x48,0x49,0xad,0xf4,0xf6,0xf2,0xf3,0xf5,
    0x7d,0x4a,0x4b,0x4c,0x4d,0x4e,0x4f,0x50,0x51,0x52,0xb9,0xfb,0xfc,0xf9,0xfa,0xff,
    0x5c,0xf7,0x53,0x54,0x55,0x56,0x57,0x58,0x59,0x5a,0xb2,0xd4,0xd6,0xd2,0xd3,0xd5,
    0x30,0x31,0x32,0x33,0x34,0x35,0x36,0x37,0x38,0x39,0xb3,0xdb,0xdc,0xd9,0xda,0x9f];

규칙 :

  1. 프로그램은 (a) 텍스트 문자열과 (b) 수행 할 작업을 나타내는 플래그를 입력해야합니다.

  2. 이 플래그를 기반으로 프로그램은 각 바이트의 텍스트를 해당 EBCDIC 문자로 변환하거나 그 반대로 변환해야합니다.

  3. 적절한 소스 (예 : 명령 행 인수, stdin, 키보드 입력)에서 입력을 얻을 수 있지만 프로그램에 하드 코딩되어서는 안됩니다.

  4. 출력은 화면에 표시 document.write되거나 (예 : stdout, ) 파일 / 파이프 라인에 기록되어야합니다.

  5. 내장 또는 외부 인코딩 변환 기능 ( iconv등)을 사용하지 마십시오 .

  6. 이것은 챌린지이므로 가장 짧은 답변 (최소 바이트)이 이길 것입니다.

예 :

(참고 :이 예제는 UTF-8 인코딩을 사용하도록 구성된 터미널에서 생성되었습니다. 시스템 구성 방법에 따라 다른 결과가 표시 될 수 있습니다. 16 진 동등 물은 참조 용으로 만 표시되며 코드에서 생성 할 필요는 없습니다. .)

Input: "HELLO WORLD", convert to EBCDIC
Output: "ÈÅÓÓÖ@æÖÙÓÄ" (0xc8c5d3d3d640e6d6d9d3c4)

Input: "ÈÅÓÓÖ@æÖÙÓÄ", convert from EBCDIC
Output: "HELLO WORLD"

Input: "lower case mostly ends up as gremlins", convert to EBCDIC
Output "" <-- unprintable in utf-8
(0x9396a68599408381a285409496a2a393a840859584a240a4974081a24087998594938995a2)

# 5는 예를 들어 base64로 인코딩 된 문자열을 가질 수 없으며 s.decode('base64')조회 테이블을 얻는 것을 의미 합니까?
Claudiu

"일반적인"텍스트 란 무엇입니까? ASCII? UTF-8? 네이티브 문자열 타입?
intx13

제어 코드도 변환하고 있습니까? 아니면 인쇄 가능한 문자입니까? 그렇다면 어떤 규칙으로?
intx13

@ intx13, 번역 테이블이 문제입니다.
Peter Taylor

@Claudiu 그것은 절대적으로 괜찮을 것입니다
r3mainer

답변:


7

배쉬 + tr, 240 바이트

육각 덤프

00000000  58 3d 27 9c 09 86 7f 97  8d 8e 0b 2d 13 9d 85 08  |X='........-....|
00000010  87 18 19 92 8f 1c 2d 1f  80 2d 84 0a 17 1b 88 2d  |......-..-.....-|
00000020  8c 05 06 07 90 91 16 93  2d 96 04 98 2d 9b 14 15  |........-...-...|
00000030  9e 1a 20 a0 e2 e4 e0 e1  e3 e5 e7 f1 a2 2e 3c 28  |.. ...........<(|
00000040  2b 7c 26 e9 ea eb e8 ed  ee ef ec df 21 24 2a 29  |+|&.........!$*)|
00000050  3b ac 5c 2d 2f c2 c4 c0  c1 c3 c5 c7 d1 a6 2c 25  |;.\-/.........,%|
00000060  5f 3e 3f f8 c9 ca cb c8  cd ce cf cc 60 3a 23 40  |_>?.........`:#@|
00000070  27 5c 27 27 3d 22 d8 61  2d 69 ab bb f0 fd fe b1  |'\''=".a-i......|
00000080  b0 6a 2d 72 aa ba e6 b8  c6 a4 b5 7e 73 2d 7a a1  |.j-r.......~s-z.|
00000090  bf d0 dd de ae 5e a3 a5  b7 a9 a7 b6 bc bd be 5b  |.....^.........[|
000000a0  5d af a8 b4 d7 7b 41 2d  49 ad f4 f6 f2 f3 f5 7d  |]....{A-I......}|
000000b0  4a 2d 52 b9 fb fc f9 fa  ff 5c 5c f7 53 2d 5a b2  |J-R......\\.S-Z.|
000000c0  d4 d6 d2 d3 d5 30 2d 39  b3 db dc d9 da 9f 27 3b  |.....0-9......';|
000000d0  5b 20 24 31 20 5d 26 26  74 72 20 04 2d ff 20 22  |[ $1 ]&&tr .-. "|
000000e0  24 58 22 7c 7c 74 72 20  22 24 58 22 20 04 2d ff  |$X"||tr "$X" .-.|

오히려 사소한 해결책. STDIN에서 읽고 STDOUT으로 인쇄합니다.

사용하는 방법

  • 스크립트를 저장하고 실행 가능하게하려면 다음 명령을 실행하십시오.

    base64 -d <<< WD0nnAmGf5eNjgstE52FCIcYGZKPHC0fgC2EChcbiC2MBQYHkJEWky2WBJgtmxQVnhogoOLk4OHj5efxoi48KCt8Junq6+jt7u/s3yEkKik7rFwtL8LEwMHDxcfRpiwlXz4/+MnKy8jNzs/MYDojQCdcJyc9IthhLWmru/D9/rGwai1yqrrmuMaktX5zLXqhv9Dd3q5eo6W3qae2vL2+W12vqLTXe0EtSa309vLz9X1KLVK5+/z5+v9cXPdTLVqy1NbS09UwLTmz29zZ2p8nO1sgJDEgXSYmdHIgBC3/ICIkWCJ8fHRyICIkWCIgBC3/ > ebcdic.sh
    chmod +x ebcdic.sh
    
  • EBCDIC (인코딩)으로 변환하려면 일반 명령을 실행하십시오.

    ./ebcdic.sh
    
  • EBCDIC (디코딩)에서 변환하려면 첫 번째 인수를 지정하십시오.

    ./ebcdic.sh -d
    

좋은 생각이지만 다윈이나 데비안에서는 작동하지 않습니다. 어떤 시스템에서 작동하고 있습니까?
r3mainer

인코딩과 디코딩을 혼합했습니다. 나는 실제로 첫 번째 버전 (룩업 테이블의 역을 사용함)에서 지시를 받았지만 어떻게 든 변수 주위의 큰 따옴표를 삭제할 수있었습니다. 결정된.
Dennis

지금 작업 :-)
r3mainer
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.