문자열을 16 진 바이트로 인쇄 하시겠습니까?


155

이 문자열이 있습니다 : Hello world !!Python as를 사용하여 인쇄하고 싶습니다 48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21.

hex() 정수에만 작동합니다.

어떻게 할 수 있습니까?


아이디어가 2 자리 16 진수 값만 반환하는 것이라면이 질문 은 0 ~ 255의 정수로 문자를 분명히 변환하지 않기 때문에 바이트 문자열 (예 : Python 2 str또는 Python 3 bytestring) 의 사용을 의미합니다 . 따라서 문자열 (Python 2 unicode및 Python 3 str)은이 16 진수 형식으로 변환하기 전에 먼저 인코딩이 필요합니다. Aaron Hall의 답변이이를 보여줍니다.
Eric O Lebigot

답변:


227

문자열을 정수 생성기로 변환하고 각 요소에 16 진수 형식을 적용하고 구분 기호를 삽입 할 수 있습니다.

>>> s = "Hello world !!"
>>> ":".join("{:02x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21

3
python3에서 str16 진수 로 인쇄하는 개념은 실제로 의미가 없습니다. bytes객체를 16 진수 로 인쇄하고 싶을 것입니다 ( 을 호출 str하여 변환 ). bytes.encode()
mic_e

8
실제로 이것은 python3 : ":".join("{:02x}".format(ord(c)) for c in 'løl')returns 에서 잘못된 출력 '6c:f8:6c'":".join("{:02x}".format(c) for c in 'løl'.encode())생성하는 반면 올바른 utf-8 표현 을 생성합니다 '6c:c3:b8:6c'.
mic_e

2
이 질문과 대답은 입력에 ASCII가 아닌 문자가 포함되지 않는다고 가정합니다. 입력에 이모 지 또는 비 라틴 기반 필기 시스템과 같은 항목이 포함 된 경우, ":".join("{:04x}".format(ord(c)) for c in s)대신 02x04x각 숫자를 4 자리로 0으로 바꾸는 대신에
Boris

@mic_e 왜 이런가요? Scapy는 임베디드 인터프리터에서 시도 할 때이를 참조합니다. WARNING: Calling str(pkt) on Python 3 makes no sense!
sherrellbc

157
':'.join(x.encode('hex') for x in 'Hello World!')

3
python3에서 어떻게합니까?
h__

6
@hyh : 두 개의 16 진 숫자마다 h = binascii.hexlify(b"Hello world !!") to get hex string. b":".join(h[i:i+2] for i in range(0, len(h), 2))삽입 ':'합니다.
jfs

2
파이썬 3에서는 작동하지 않습니다.LookupError: 'hex' is not a text encoding; use codecs.encode() to handle arbitrary codecs
Boris

55

Python 2.x의 경우 :

':'.join(x.encode('hex') for x in 'Hello World!')

위의 코드는 Python 3.x 에서는 작동하지 않으며 3.x에서는 아래 코드가 작동합니다.

':'.join(hex(ord(x))[2:] for x in 'Hello World!')

1
또한 나중에
python2.x

1
그러나 후자는 선행 0을 채우지 않습니다. hex (ord ( "\ x00")) [2 :] is "0"및 "\ x00".encode ( "hex") == "00"
Will Daniels

3
다른 사용자가 두 솔루션을 모두 제공 한 후 몇 개월이 지난 후에 왜 이것을 새로운 답변으로 게시하기로 결정 했습니까? 요점은 버전 호환성을 명확히하려면 기존 답변에 대한 편집을 제안하는 것이 더 합리적 일 것입니다.
Air

2
다른 곳에서 언급 했듯이이 답변은 ASCII를 넘어 유니 코드를 고려하면 정확하지 않습니다. ':'. join ( 'løl'의 x에 대한 hex (ord (x)) [2 :])은 올바른 출력이 '6c : c3 : b8 : 6c'인 동안 '6c : f8 : 6c'를 잘못 인쇄합니다.
mcduffee

23

두 줄로 된 또 다른 대답은 읽기가 더 쉽고 문자열에서 줄 바꿈이나 다른 이상한 문자를 디버깅하는 데 도움이됩니다.

파이썬 2.7

for character in string:
    print character, character.encode('hex')

Python 3.7 (모든 릴리스 3에서 테스트되지는 않음)

for character in string:
    print(character, character.encode('utf-8').hex())

이것은 파이썬 3.6.8에서 작동하지 않습니다 (적어도) : "hex"는 문자열의 인코딩이 아닙니다. codecs.encode(<bytestring>, "hex")그래도 작동합니다.
Eric O Lebigot

2
아, 정보 주셔서 감사합니다 ... 예 이것은 확실히 Python 2.7 용으로 작성되었습니다. Python 3.7에 대한 방법을 포함하도록 답변을 업데이트합니다.
copeland3300

확인 됨, Python 3.7.6 : import sys; s="Déjà vu Besançon,Lupiñén,Šiauliai,Großräschen,Łódź,Аша,广东省,LA"; for c in s:; w=sys.stdout.write(c+":"+c.encode('utf-8').hex()+"||"); (out)D:44||é:c3a9||j:6a||à:c3a0|| :20||v:76||u:75|| :20||B:42||e:65||s:73||a:61||n:6e||ç:c3a7||o:6f||n:6e||,:2c||L:4c||u:75||p:70||i:69||ñ:c3b1||é:c3a9||n:6e||,:2c||Š:c5a0||i:69||a:61||u:75||l:6c||i:69||a:61||i:69||,:2c||G:47||r:72||o:6f||ß:c39f||r:72||ä:c3a4||s:73||c:63||h:68||e:65||n:6e||,:2c||Ł:c581||ó:c3b3||d:64||ź:c5ba||,:2c||А:d090||ш:d188||а:d0b0||,:2c||广:e5b9bf||东:e4b89c||省:e79c81||,:2c||L:4c||A:41||
bballdave025

20

Fedor Gogolev의 답변에 대한 일부 보완 사항 :

먼저 문자열에 'ASCII 코드'가 10 미만인 문자가 포함 된 경우 필요에 따라 표시되지 않습니다. 이 경우 올바른 형식은 다음 {:02x}과 같아야합니다 .

>>> s = "Hello unicode \u0005 !!"
>>> ":".join("{0:x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:75:6e:69:63:6f:64:65:20:5:20:21:21'
                                           ^

>>> ":".join("{:02x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:75:6e:69:63:6f:64:65:20:05:20:21:21'
                                           ^^

둘째, "문자열"이 실제로 "바이트 문자열"인 경우-파이썬 3의 차이점 때문에 다음을 선호 할 수 있습니다.

>>> s = b"Hello bytes \x05 !!"
>>> ":".join("{:02x}".format(c) for c in s)
'48:65:6c:6c:6f:20:62:79:74:65:73:20:05:20:21:21'

바이트 객체가 "0 <= x <256 범위의 불변의 정수 시퀀스"로 정의 되므로 위 코드에서 변환 할 필요가 없습니다 .


11

문자열을 16 진 바이트로 인쇄 하시겠습니까?

허용되는 답변은 다음과 같습니다.

s = "Hello world !!"
":".join("{:02x}".format(ord(c)) for c in s)

보고:

'48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21'

허용 된 답변은 바이트 (대부분 ASCII 문자)를 사용하는 경우에만 작동합니다. 그러나 유니 코드를 사용하는 경우 예를 들면 다음과 같습니다.

a_string = u"Привет мир!!" # "Prevyet mir", or "Hello World" in Russian.

어떻게 든 바이트로 변환해야합니다.

터미널에서 이러한 문자를 사용할 수없는 경우 UTF-8에서 디코딩하거나 이름을 사용할 수 있습니다 (따라서 코드를 붙여 넣어 실행할 수 있습니다).

a_string = (
    "\N{CYRILLIC CAPITAL LETTER PE}"
    "\N{CYRILLIC SMALL LETTER ER}"
    "\N{CYRILLIC SMALL LETTER I}"
    "\N{CYRILLIC SMALL LETTER VE}"
    "\N{CYRILLIC SMALL LETTER IE}"
    "\N{CYRILLIC SMALL LETTER TE}"
    "\N{SPACE}"
    "\N{CYRILLIC SMALL LETTER EM}"
    "\N{CYRILLIC SMALL LETTER I}"
    "\N{CYRILLIC SMALL LETTER ER}"
    "\N{EXCLAMATION MARK}"
    "\N{EXCLAMATION MARK}"
)

그래서 우리는 그것을 본다 :

":".join("{:02x}".format(ord(c)) for c in a_string)

보고

'41f:440:438:432:435:442:20:43c:438:440:21:21'

불충분 한 / 예기치 않은 결과- 유니 코드 컨소시엄에서 유니 코드로 볼 수있는 그래 핀 을 만들기 위해 결합 된 코드 포인트 로 전세계 언어를 나타냅니다. 그러나이 정보를 실제로 저장하는 방법 은 아니므 로 다른 출처에서 해석 할 수 있습니다.

다른 소스가이 데이터를 사용할 수있게하려면 일반적으로이 문자열을 바이트 단위로 디스크에 저장하거나 html에 게시하는 등의 UTF-8 인코딩으로 변환해야합니다. 따라서 파이썬 3에서는 정수를 반복 할 수 있기 때문에 코드 포인트를 UTF-8 의 코드 단위 로 변환하기위한 인코딩이 필요합니다 .ordbytes

>>> ":".join("{:02x}".format(c) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'

또는 새로운 f- 문자열을 사용하여 더 우아하게 (파이썬 3에서만 사용 가능) :

>>> ":".join(f'{c:02x}' for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'

파이썬 2에서, 패스 cord첫 번째, 즉 ord(c)- 더 많은 예제 :

>>> ":".join("{:02x}".format(ord(c)) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
>>> ":".join(format(ord(c), '02x') for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'

1
@ not2qubit이 예제를 다시 시도하십시오-파이썬 2와 3의 차이점을 해결하는 데 약간의 시간이 걸렸으며 분명히 원래는 파이썬 2에 대해서만 작성했습니다. 그리고 QA의 답변에 감사드립니다!
Aaron Hall

그렇습니다. 감사합니다!
not2qubit

8

당신이 사용할 수있는 hexdump'들

import hexdump
hexdump.dump("Hello World", sep=":")

( .lower()소문자가 필요한 경우 추가 ). 이것은 Python 2와 3 모두에서 작동합니다.


또한 hexdump 또는 다른 패키지를 설치하는 데 문제가있는 경우 프록시 설정으로 인해 일반적으로 pip를 실행하십시오. 프록시 옵션을 사용하여 pip를 실행하십시오. pip install -U hexdump --proxy http://proxy.address:port
Eduard Florinescu

사실은 내가 사용하는 실수를 만들어 sudo함께 pip엉망, pacman...
토비아스 Kienzler

6

map 및 lambda 함수를 사용하면 16 진수 값 목록을 생성 할 수 있습니다. 16 진수 값을 인쇄하거나 다른 용도로 사용할 수 있습니다.

>>> s = 'Hello 1 2 3 \x01\x02\x03 :)'

>>> map(lambda c: hex(ord(c)), s)
['0x48', '0x65', '0x6c', '0x6c', '0x6f', '0x20', '0x31', '0x20', '0x32', '0x20', '0x33', '0x20', '0x1', '0x2', '0x3', '0x20', '0x3a', '0x29']

[hex(ord(c)) for c in s]
Boris

2

다음과 같은 방법으로 수행 할 수 있습니다.

from __future__ import print_function
str = "Hello World !!"
for char in str:
    mm = int(char.encode('hex'), 16)
    print(hex(mm), sep=':', end=' ' )

이 결과는 다음과 같이 16 진수로 표시됩니다.

0x48 0x65 0x6c 0x6c 0x6f 0x20 0x57 0x6f 0x72 0x6c 0x64 0x20 0x21 0x21


미래를
있습니까?

나중에 참조 __future__할 수 있도록 최신 버전의 Python 2에서 사용할 수있는 표준 라이브러리로 , 이전 버전과 호환되는 Python 3에서만 기능을 정상적으로 사용할 수 있습니다. 이 답변에서는 Python 2 print(text)print text구문 을 대체하는 "인쇄 기능"기능 을 얻는 데 사용됩니다 . Python docs를 참조하십시오 .
에릭 리드

2

Python3 또는 콜론에 관심이없는 사람들에게는 좀 더 일반적입니다.

from codecs import encode

data = open('/dev/urandom', 'rb').read(20)
print(encode(data, 'hex'))      # data

print(encode(b"hello", 'hex'))  # string

0

python2base64.b16encode 에서 사용 (내장)

>>> s = 'Hello world !!'
>>> h = base64.b16encode(s)
>>> ':'.join([h[i:i+2] for i in xrange(0, len(h), 2)]
'48:65:6C:6C:6F:20:77:6F:72:6C:64:20:21:21'

작동하지 않습니다. 가져 오기에 무엇을 사용하고 있으며 왜 사용하지 .decode()않습니까?
not2qubit

0

편의상 아주 간단합니다.

def hexlify_byteString(byteString, delim="%"):
    ''' very simple way to hexlify a bytestring using delimiters '''
    retval = ""
    for intval in byteString:
        retval += ( '0123456789ABCDEF'[int(intval / 16)])
        retval += ( '0123456789ABCDEF'[int(intval % 16)])
        retval += delim
    return( retval[:-1])

hexlify_byteString(b'Hello World!', ":")
# Out[439]: '48:65:6C:6C:6F:20:57:6F:72:6C:64:21'

0

보다 더 많은 성능을 제공하는 무언가를 ''.format()위해 이것을 사용할 수 있습니다 :

>>> ':'.join( '%02x'%(v if type(v) is int else ord(v)) for v in 'Hello World !!' )
'48:65:6C:6C:6F:20:77:6F:72:6C:64:20:21:21'
>>> 
>>> ':'.join( '%02x'%(v if type(v) is int else ord(v)) for v in b'Hello World !!' )
'48:65:6C:6C:6F:20:77:6F:72:6C:64:20:21:21'
>>> 

죄송합니다.
단순히 할 수 있다면 멋지게 보일 수는 '%02x'%v있지만 int 만 걸립니다 ...
하지만 b''논리를 선택하지 않고 바이트 문자열이 붙어 있습니다 ord(v).

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.