배경
바이트가 표현할 수있는 256 개의 가능한 문자 중 대부분은 대부분의 상황에서 사용됩니다. 우리는 어떻게 든 이것을 이용할 수 없으며, 거의 사용되지 않는 문자가 필요 없어서 텍스트 파일을 작게 만들 수 없습니까?
대부분의 문자는 대부분의 상황에서 가치를 추가하지 않으며보다 일반적인 문자로 대체 될 수 있습니다. 예를 들어, 소문자 "L", 대문자 "I"및 숫자 "1"은 대부분의 상황에서 거의 동일하게 보이므로 통합 될 수 있습니다.
대문자가 거의 필요하지 않으므로 생략 할 수 있습니다. 압축 해제 / 디스플레이 프로그램은 모든 문장의 첫 글자, 공통 이름 등을 자동으로 대문자로 표시 할 수도 있습니다.
규칙
출품작은 다음과 같이 심사됩니다 :
- 압축비
- 압축 해제 후 가독성
출품작은이 기사의 일반 텍스트 버전 인 http://en.wikipedia.org/wiki/Babbage 및 임의로 선택된 BBC 뉴스 기사 에 대해 테스트됩니다 .
추가 마크가 수여됩니다. 마크 업 유지, 압축 해제 후 미화 (예 : 대문자 표기 등).
언어
- 기본 * nix 상자에서 원하는대로 쉽게 컴파일 (또는 해석)해야합니다.
PowerShell이 종료 되었습니까? 버머.
—
Joey
Haskell :
—
Joey Adams
main = interact (\x -> take 90 x ++ " yada yada yada")
또한 "압축 해제 후 가독성"은 상당히 주관적인 기준입니다.
—
Joey
특히 Unix-Box에서는 대문자, 소문자가 필요합니다. :) 그리고 보낸 시작을 찾는 중입니다. u라면 사소하지 않습니다. abbrev를 사용합니다! :)
—
사용자가 알 수 없음
알파벳이나 텍스트를 압축하고 싶습니까? :) L = l = 1은 우리의 생각을 표현하는 데 필요한 문자를 압축합니다. 그러나 "one apple"= "1 apl"은 텍스트를 압축합니다.
—
anemgyenge