PI를 기반으로하는 압축 알고리즘이 있습니까?


11

우리가 알고있는 것은 π는 무한 꽤 가능성이 있다는 것이다 숫자의 가능한 모든 유한 한 문자열이 포함 ( 분리 연속을 ).

나는 최근에 πfs의 프로토 타입을 보았습니다. 이 프로토 타입은 당신이 생성 한 (또는 다른 사람) 모든 파일을 만들거나 이미 생성 할 것이라고 가정합니다. 이미 추출되어 있습니다. 파일을 pi 메타 데이터로 변환 할 수있는 piFile 도 있습니다.

우리가 n의 이진수를 pi 로 계산할 수있게하는 BBP 타입 공식 (실험 수학의 일부) 이 이미 있습니다 . 따라서 데이터의 시작 위치와 길이를 저장하면 이론적으로 원하는 데이터를 추출 할 수 있습니다. 메타 데이터 (예 : 데이터 오프셋)가 추출 된 데이터보다 클 수 있다는 몇 가지 주장 이 있습니다. 행렬 기호와 π는 더 효율적으로하기 위해 base-256으로 인코딩 될 수 있습니다 ( 농담 참조 ).

위의 내용을 토대로 제 주요 질문은 다음과 같습니다.

  • PI를 기반으로하는 압축 알고리즘이 있습니까?

그렇지 않다면 말이 되나요? 아니면 그 분야에 대한 연구가 있었습니까?

아니면 π가 맞지 않을 수도 있습니다. 따라서 오일러 상수 또는 타우 (τ)는 어떻습니까? 차이가 있습니까?


숫자로 된 더러운 단어를 찾아 보는 것은 사전에서 찾아 보는 것보다 더 재미 있습니다!  ASS : pi 위치 590,725 (아스키 인코딩).  엉덩이 : 위치 177,031,174.  가슴 : 32,355,500 위.  8 == D는 위치 158,907,339에 있습니다.  내가 말할 수 있을까 : 어떻게 에로틱 한가

이미지 크레디트 : Dinosaur Comics


또한보십시오:


15
친애하는 T-rex, 프레임 2의 결론은 프레임 1의 진술에서 절대로 나오지 않습니다. 당신,
데이비드 Richerby

2
실제로는 개방 및 / 또는 아마 결정 불가능한 문제는 숫자의 긴 문자열에 표시할지 여부를 결정하기 .... 일반적으로 공부를 제안 콜 모고 로프 복잡성 이론π
vzn

1
가능한 모든 비트 (데이터)에 대해 2 N 번째 위치 (메타 데이터) 내에서 pi의 인스턴스를 대부분 찾을 수 있습니까? "압축"이라고 불리어야합니다. 2
Константин Ван

답변:


17

여러 가지 이유로 귀하의 제안은 의미가 없습니다. 우선, 바이트 크기의 파일과 같은 큰 파일을 압축하려고 할 때 파일과 일치하는 π 의 이진 확장 위치를 ​​찾아야 합니다. 파일이기 때문에 128 비트 길이, 하나는이 곳은 주위 기대 2 128 번째 비트. 따라서 찾기가 다소 어려울 것입니다. 이것은 우리가 확장에 멀리 갈 필요하기 때문에뿐만 아니라, 또한 우리가 시도 할 것으로 예상하기 때문에 2 개 128 히트를 발견하기 전에 다른 위치를.16π12821282128

π

π


14

Yuval의 답변을 바탕으로 약간 다른 설명과 문제를 밝히는 데 도움이되는 예가 있습니다.

이론

16128

  1. π
  2. 128

2128

  • 비트 패턴에 대한 깊은 검색; 과
  • 2128

ππ

정보 엔트로피 참조 .

영형2(938933556)29.830

π597,507,393영형2(597507393)29.230

어쩌면 우리는 숫자를 청크 할 수 있습니까?

  • 1,124
  • 1,216
  • 11,727

36

  • 15,312,393
  • 8

2730


2

PI를 기반으로하는 압축 알고리즘이 있습니까?

예, https://github.com/divinity76/pi_compression

말이 되나요?

아니, 오프셋을 저장하는 것은 일반적으로 적어도 위의 구현을 통해 저장하는 것보다 더 많은 디스크 공간을 차지합니다 (하지만 개선 될 수있는 3 가지 주목할만한 것들, pi의 이진 표현의 첫 2 ^ 32 바이트 만 고려합니다. 테스트에서 과도한 비트 수를 사용하여 오프셋 당 일치하는 바이트 수, 즉 8 비트를 저장하면 테스트 중 3 비트가 최적이며 전체 바이트 일치 만 고려하므로 15 비트가 일치하면 어딘가에 8 비트 일치로만 간주됩니다. 또한 바이트의 마지막 4 비트는 비트 # 3과 일치하지만 비트 # 5는 일치하지 않지만 다음 바이트의 첫 4 비트는 일치하지만 비트 # 5는 일치하지 않는 것으로 간주됩니다. 모두)

아니면 그 분야에 대한 연구가 있었습니까?

흠, 그래서 내가 위의 구현을 작성한 이유이며, 결과는 pi의 첫 4GB 내에서 4 바이트의 일치하는 바이트를 찾을 가능성이있는 것 같습니다. 압축을 풀기 위해 적어도 실패했습니다. (그러나 위에서 설명한 것처럼 구현이 최적이 아닙니다.)-압축이 매우 느리지 만 구현이 단일 스레드이지만 누군가가 코드 작성을 주장 할 수있는 경우 알고리즘은 멀티 스레딩을 허용하므로 성능을 확장 할 수 있습니다 사용 가능한 코어 수

감압은 매우 빠릅니다.


0

PI를 기반으로하는 압축 알고리즘이 있습니까?

ππ

엑스π엑스

ππ

수학 상수가 "모든 문자열 포함"이라는 현저한 특성을 가지고 있음에도 불구하고 간단한 주장은 압축 알고리즘이 문자열의 위치를 ​​찾는 데 "너무 많은 시간을 소비"하고 위치를 설명하는 데 종종 long (er) 자릿수 문자열.

반면 / 화해하려고 / 참조 유사한 높은 투표 질문 파이는 숫자의 일부 순서가 포함되어 있는지 여부가 decidable 될 수있는 방법을 . (cs.se) (힌트 : 제목이 다소 오해의 소지가있는 것으로 간주 될 수 있음)

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.