«data-compression» 태그된 질문

5
0과 1의 문자열을 얼마나 많이 압축 할 수 있는지 알려진 최대 값이 있습니까?
오래 전에 저는 어떤 종류의 교수가 미래에 우리는 단지 2 비트 (또는 이와 유사한 것)로 데이터를 압축 할 수 있다고 신문 기사를 읽었습니다. 이것은 물론 정확하지 않습니다 (그리고 그가 정확히 말한 것에 대한 나의 기억이 올바르지 않을 수도 있습니다). (기술적으로 가능하더라도) 0과 1의 문자열을 단지 2 비트로 압축 하는 것은 …

7
PRNG를 사용하여 물건을 마술처럼 압축 할 수 있습니까?
이 아이디어는 프로그램을 배우고 처음 PRNG를 만난 어린 시절에 나에게 일어났다. 나는 아직도 그것이 얼마나 현실적인지 알지 못하지만 이제 스택 교환이 있습니다. 놀라운 압축 알고리즘을위한 14 살짜리 계획은 다음과 같습니다. PRNG s를 가져와 시드 로 시드 하여 긴 일련의 의사 난수 바이트를 얻습니다. 이 시퀀스를 다른 당사자에게 전송하려면 PRNG에 대한 …

6
무손실 압축 알고리즘이 엔트로피를 줄입니까?
Wikipedia 에 따르면 : Shannon의 엔트로피는 결정된 (또는 예측 가능한) 메시지 부분과 반대로 메시지에 포함 된 정보를 측정합니다. 후자의 예는 언어 구조의 중복성 또는 문자 또는 단어 쌍의 발생 빈도, 삼중 항 등과 관련된 통계적 속성을 포함합니다. 엔트로피는 메시지에 포함 된 정보의 양을 측정 한 것입니다. 엔트로피 코더는 그러한 메시지를이를 …

4
특정 크기의 모든 비 등방성 그래프 열거
크기가 nnn 인 모든 무 방향 그래프를 열거하고 싶지만 각 동 형사상 클래스의 인스턴스 하나만 필요합니다 . 다시 말해, nnn 개의 꼭짓점 에서 모든 비 동형 (비 방향) 그래프를 열거하고 싶습니다 . 어떻게해야합니까? 보다 구체적으로, I는 무향 그래프의 시퀀스 생성 알고리즘 원하는 G1,G2,…,GkG1,G2,…,GkG_1,G_2,\dots,G_k 다음과 같은 속성 : 모든 무향 그래프 …

6
간단한 이진 데이터의 효율적인 압축
에서 이진 숫자를 포함하는 파일이 있습니다 .0002n−12n−12^n - 1 0000000000 0000000001 0000000010 0000000011 0000000100 ... 1111111111 7z 는이 파일을 매우 효율적으로 압축하지 않았습니다 (n = 20의 경우 22MB 는 300kB 로 압축 됨). 매우 간단한 데이터 구조를 인식하고 파일을 몇 바이트로 압축 할 수있는 알고리즘이 있습니까? 또한 CS 또는 정보 …

11
본 인용문에서 폰 노이만의 무작위성은 더 이상 적용되지 않습니까?
일부 챕터는 다음과 같이 말했습니다. 결정 론적 수단으로 난수를 생성하려고 시도하는 사람은 물론 죄의 상태에 살고 있습니다. 그것은 항상 컴퓨터로 진정한 난수를 생성 할 수 없다는 것을 의미하기 위해 취해졌습니다. 그리고 그는 컴퓨터가 단일 Intel 8080 마이크로 프로세서 (~ 6000 밸브)와 동등한 크기 일 때 말했다. 컴퓨터가 더 복잡 해졌고 …

5
소수를 사용한 데이터 압축
필자는 최근 데이터의 유형과 형식에 관계없이 임의의 데이터 세트를 항상 50 % 이상 효율적으로 압축한다고 주장 하는 다음 흥미로운 기사 를 우연히 발견했습니다 . 기본적으로 모든 숫자가 고유 한 소수 인 경우 압축을 풀기 쉬운 4 바이트 데이터 청크의 표현을 고유하게 사용하기 위해 소수를 사용합니다. 이 시퀀스를 소수와 연관시키기 위해 …

3
Kolmogorov 복잡성 근사
나는 Kolmogorov Complexity 에 대해 무언가를 연구하고 Vitanyi와 Li의 기사와 책을 읽었으며 Normalized Compression Distance 의 개념을 사용하여 저자의 stilometry를 확인했습니다 (각 저자가 유사성으로 텍스트와 그룹 문서를 작성하는 방법을 식별). 이 경우 데이터 압축기는 튜링 기계로 사용될 수 있기 때문에 Kolmogorov의 복잡성을 근사하기 위해 데이터 압축기가 사용되었습니다. 데이터 압축 및 …

7
많은 유사한 PNG 이미지의 이러한 (무손실) 압축 방법이 효과가없는 이유는 무엇입니까?
방금 다음과 같은 일이 발생했습니다 .PNG 이미지의 동일한 사본을 폴더에 여러 개 넣고 다음 방법으로 해당 폴더를 압축하려고했습니다. tar czf folder.tar.gz folder/ tar cf folder.tar folder/ && xz --stdout folder.tar > folder.tar.xz (이것은 동일한 이미지에서는 잘 작동하지만 비슷한 이미지에서는 게인이 0입니다) zip -r folder.zip folder/ 나는의 크기를 선택하면 .tar.gz, .tar.xz, …

1
도메인 이름 압축
이 질문은 Computer Science Stack Exchange에서 답변을 얻을 수 있기 때문에 Stack Overflow에서 마이그레이션 되었습니다. 7 년 전에 이주했습니다 . 나는 사람이 수 방법에 대한 궁금 매우 컴팩트 임의의 도메인 압축 IDN의 (에 의해 정의 된 호스트 이름을 RFC5890 )과 흥미로운 도전이 될 수이 의심. 유니 코드 호스트 또는 도메인 …

4
순서를 무시하고 두 정수 압축
정렬 된 쌍 (x, y)을 정렬되지 않은 쌍 {x, y} (집합)과 비교하면 이론적으로 정보는 x가 먼저 오거나 y가 정확히 하나의 비트를 나타내는 지 여부에 따라 한 비트에 불과합니다. 따라서 x, y가 두 개의 서로 다른 32 비트 정수인 {x, y} 세트가 주어지면 63 비트 (64가 아닌)로 묶을 수 있습니까? 63 …

7
임의의 적합한 카드 데이터를 압축하여 엔트로피 인코딩 스토리지에 접근, 일치 또는 이길 수 있습니까? 그렇다면 어떻게?
시뮬레이션 카드 게임에 사용중인 실제 데이터가 있습니다. 나는 소송이 아닌 카드의 등급에만 관심이 있습니다. 그러나 표준 카드 덱이므로 덱에는 개의 등급 만 있습니다. 데크는 각 손에 대해 잘 섞은 다음 전체 데크를 파일로 출력합니다. 따라서 출력 파일에는 가능한 기호 만 있습니다 . ( = 10 등급). 물론 심볼 당 비트를 …

4
Shannon 데이터 압축 한계보다 작은 크기로 데이터를 압축 할 수 있습니까?
데이터 압축 알고리즘과 데이터 압축의 이론적 한계에 대해 읽었습니다. 최근에 "Combinatorial Entropy Encoding"이라는 압축 방법이 발생했습니다.이 방법의 주요 아이디어는 파일에 표시된 문자, 해당 빈도 및 파일이 나타내는 이러한 문자 순열의 색인으로 파일을 인코딩하는 것입니다. 이 문서는이 방법을 설명하는 데 도움이 될 수 있습니다. https://arxiv.org/pdf/1703.08127 http://www-video.eecs.berkeley.edu/papers/vdai/dcc2003.pdf https://www.thinkmind.org/download.php?articleid=ctrq_2014_2_10_70019 그러나 첫 번째 문서에서는이 …

1
일련의 "a"에 대해 압축 비율이 bzip2를 사용하는 이유는 무엇입니까?
library(ggplot2) compress <- function(str) { length(memCompress(paste(rep("a", str), collapse=""), type="bzip2")) / nchar(paste(rep("a", str), collapse="")) } cr <- data.frame(i = 1:10000, r = sapply(1:10000, compress)) ggplot(cr[cr$i>=5000 & cr$i<=10000,], aes(x=i, y=r)) + geom_line() 압축비는 "a"에 대해 37에서 시작하여 39 "a"에 손익분기 점에 도달합니다 (압축비 = 1). 차트는 매우 매끄럽게 시작하여 98 "a"에 대해 …

4
PI를 기반으로하는 압축 알고리즘이 있습니까?
우리가 알고있는 것은 π는 무한 꽤 가능성이 있다는 것이다 숫자의 가능한 모든 유한 한 문자열이 포함 ( 분리 연속을 ). 나는 최근에 πfs의 프로토 타입을 보았습니다. 이 프로토 타입은 당신이 생성 한 (또는 다른 사람) 모든 파일을 만들거나 이미 생성 할 것이라고 가정합니다. 이미 추출되어 있습니다. 파일을 pi 메타 데이터로 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.