4KB에 몇 개의 문자를 저장할 수 있습니까?


답변:


115

UTF-8에서 문자는 1 ~ 4 바이트가 필요합니다. 따라서 4KB의 UTF-8 문자를 각각 4096에서 1024까지 저장할 수 있습니다.

많은 사용 사례에서 대부분의 문자가 1 바이트에 들어가고 거의 모두 2 바이트에 들어갈 것으로 예상 할 수 있다고 가정합니다.


8
확장하기 위해 ASCII 문자는 1 바이트 만 차지하고 다른 문자는 더 많이 차지할 수 있습니다. 따라서 MForster가 제공하는 범위를 추정하는 한 가지 방법은 문자의 어떤 부분이 ASCII 일 가능성이 있는지 자문하는 것입니다. 기본적으로 악센트가있는 문자가있는 영어 텍스트 인 경우 4000 자에 더 가깝게 맞출 수 있습니다. 텍스트가 텔루구 어로되어있는 경우 일반적으로 문자 당 3 바이트이므로 1300 정도 정도에 맞출 수 있습니다.
Jacob Mattison

음, 키릴 문자와 영어를 사용하고 있지만 base64로 인코딩 된 다음 저장됩니다. 그래서 나는 base64가 순수한 영어라고 생각하고 그것은 바이트 당 e 문자를 올바르게 만들어 4096 문자를 올바르게 표현합니까?
Pockata 2010

3
맞습니다. (귀하의 질문은 원래 키릴 문자 수가 아니라 base64 인코딩 문자열의 문자 수에 해당한다고 가정합니다).
MForster 2010

예,이 질문을 작성한 후 코드에 base64를 추가했습니다
Pockata 2010

120

다음은 1024 또는 4096 이 얼마나 많은지 시각적 단서 입니다. 더 나은 이해를 위해 @Jon Snyder의 메시지를 읽으십시오.

1024 자 (문자가 4 바이트라고 가정) :

Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. 정수 tincidunt. Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus. Aenean leo ligula, porttitor eu, consequat vitae, eleifend ac, enim. Aliquam lorem ante, dapibus in, viverra quis, feugiat a, tellus. Phasellus viverra nulla ut metus varius laoreet. Quisque rutrum. Aenean imperdiet. Etiam ultricies nisi vel augue. Curabitur ullamcorper ultricies nisi. Nam eget dui. Etiam rhoncus. Maecenas tempus, tellus eget condimentum rhoncus, sem quam semper libero, sit amet adipiscing sem neque sed ipsum. Nam quam nunc, blandit ve

4096 자 (문자가 1 바이트라고 가정) :

Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. 정수 tincidunt. Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus. Aenean leo ligula, porttitor eu, consequat vitae, eleifend ac, enim. Aliquam lorem ante, dapibus in, viverra quis, feugiat a, tellus. Phasellus viverra nulla ut metus varius laoreet. Quisque rutrum. Aenean imperdiet. Etiam ultricies nisi vel augue. Curabitur ullamcorper ultricies nisi. Nam eget dui. Etiam rhoncus. Maecenas tempus, tellus eget condimentum rhoncus, sem quam semper libero, sit amet adipiscing sem neque sed ipsum. Nam quam nunc, blandit vel, luctus pulvinar, hendrerit id, lorem. Maecenas nec odio et ante tincidunt tempus. Donec vitae sapien ut libero venenatis faucibus. Nullam quis ante. Etiam sit amet orci eget eros faucibus tincidunt. 듀스 레오. Sed fringilla mauris는 amet nibh에 앉아 있습니다. Donec sodales sagittis magna. Sed consequat, leo eget bibendum sodales, augue velit cursus nunc, quis gravida magna mi a libero. Fusce vulputate eleifend sapien. Vestibulum purus quam, scelerisque ut, mollis sed, nonummy id, metus. Nullam accumsan lorem in dui. Cras ultricies mi eu turpis hendrerit fringilla. faucibus orci luctus et ultrices posuere cubilia Curae의 Vestibulum ante ipsum primis; ac dui quis mi consectetuer lacinia에서. Nam pretium turpis et arcu. Duis arcu tortor, suscipit eget, imperdiet nec, imperdiet iaculis, ipsum. Sed aliquam ultrices mauris. Integer ante arcu, accumsan a, consectetuer eget, posuere ut, mauris. Praesent adipiscing. Phasellus ullamcorper ipsum rutrum nunc. Nunc nonummy metus. Vestibulum volutpat pretium libero. Cras id dui. Aenean ut eros et nisl sagittis vestibulum. Nullam nulla eros, ultricies sit amet, nonummy id, imperdiet feugiat, pede. Sed lectus. Donec mollis hendrerit risus. pellentesque facilisis의 Phasellus nec sem. Etiam imperdiet imperdiet orci. Nunc nec neque. Phasellus leo dolor, tempus non, auctor et, hendrerit quis, nisi. Curabitur ligula sapien, tincidunt non, euismod vitae, posuere imperdiet, leo. Maecenas malesuada. Massa에서 칭찬 콩가 시대. Sed cursus turpis vitae tortor. Donec posuere vulputate arcu. Phasellus는 cursus velit을 축적합니다. faucibus orci luctus et ultrices posuere cubilia Curae의 Vestibulum ante ipsum primis; Sed aliquam, nisi quis porttitor congue, elit erat euismod orci, ac placerat dolor lectus quis orci. Phasellus consectetuer vestibulum elit. Aenean tellus metus, bibendum sed, posuere ac, mattis non, nunc. Vestibulum fringilla pede sit amet augue. Turpis에서. Pellentesque posuere. Praesent turpis. Aenean posuere, tortor sed cursus feugiat, nunc augue blandit nunc, eu sollicitudin urna dolor sagittis lacus. Donec elit libero, sodales nec, volutpat a, suscipit non, turpis. Nullam sagittis. Suspendisse pulvinar, augue ac venenatis condimentum, sem libero volutpat nibh, nec pellentesque velit pede quis nunc. faucibus orci luctus et ultrices posuere cubilia Curae의 Vestibulum ante ipsum primis; 푸스 이드 푸 루스. Ut varius tincidunt libero. Phasellus dolor. Maecenas vestibulum mollis diam. Pellentesque ut neque. Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. in dui magna, posuere eget, vestibulum et, tempor auctor, justo. ac felis quis tortor malesuada pretium에서. Pellentesque auctor neque nec urna. Proin sapien ipsum, porta a, auctor quis, euismod ut, mi. Aenean viverra rhoncus pede. Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. Ut non enim eleifend felis pretium feugiat. Vivamus quis mi. Phasellus a est. Phasellus magna. Hac habitasse platea dictumst. lacus ac velit ornare lobortis의 Curabitur. 큐라 Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. in dui magna, posuere eget, vestibulum et, tempor auctor, justo. ac felis quis tortor malesuada pretium에서. Pellentesque auctor neque nec urna. Proin sapien ipsum, porta a, auctor quis, euismod ut, mi. Aenean viverra rhoncus pede. Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. Ut non enim eleifend felis pretium feugiat. Vivamus quis mi. Phasellus a est. Phasellus magna. Hac habitasse platea dictumst. lacus ac velit ornare lobortis의 Curabitur. 큐라 Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. in dui magna, posuere eget, vestibulum et, tempor auctor, justo. ac felis quis tortor malesuada pretium에서. Pellentesque auctor neque nec urna. Proin sapien ipsum, porta a, auctor quis, euismod ut, mi. Aenean viverra rhoncus pede. Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. Ut non enim eleifend felis pretium feugiat. Vivamus quis mi. Phasellus a est. Phasellus magna. Hac habitasse platea dictumst. lacus ac velit ornare lobortis의 Curabitur. 큐라 Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. Ut non enim eleifend felis pretium feugiat. Vivamus quis mi. Phasellus a est. Phasellus magna. Hac habitasse platea dictumst. lacus ac velit ornare lobortis의 Curabitur. 큐라 Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. Ut non enim eleifend felis pretium feugiat. Vivamus quis mi. Phasellus a est. Phasellus magna. Hac habitasse platea dictumst. lacus ac velit ornare lobortis의 Curabitur. 큐라


2
이 대답의 넌센스를 이해하기 위해
Honey

18

UTF-8 문자는 1-4 바이트이므로 인코딩하는 문자에 따라 다릅니다. 대부분의 영어는 각 문자에 대해 1 바이트를 사용합니다. 다른 서양 언어는 2 바이트를 사용합니다. 아시아 문자는 4 바이트를 사용할 수 있습니다.

따라서 대답은 문자에 따라 1024에서 4096까지입니다. 또한 Windows 환경에서는 문서 시작 부분에 3 바이트 BOM이 필요하여 4Kb에 맞출 수있는 문자 수를 줄일 수 있습니다. UTF-8에 대한 wikipedia 기사를 참조하십시오 .

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.