ASCII 아트 테이블을 UTF-8 테이블로 변환


13

문서, 주석 등을 쓸 때 ASCII 테이블을 만드는 것이 좋습니다. 그것들은 보통 꽤 좋아 보이지만 결국 UTF-8 / Unicode에 박스 그리기 문자가 포함되어 있기 때문에 항상 더 좋아 보일 수 있다고 생각합니다 . 그러나 이러한 문자는 사용하기에 매우 부담이되므로 삽입하려면 몇 번의 키 누름이 필요합니다. 당신의 작업? ASCII 테이블을 UTF-8 / Unicode로 자동 변환 할 수있는 프로그램이나 함수를 작성하십시오.

이 도전은 샌드 박스 였다.

도전

ASCII 테이블을 입력 문자열로 제공하는 프로그램을 작성하면 테이블이 유니 코드 / UTF-8 상자 도면 문자로 다시 그려집니다. 특히, 테이블의 일부인 문자는 다음과 같이 변환되어야합니다.

(Unicode, 3 bytes each in UTF-8)
- to ─ (\u2500)
| to │ (\u2502)
= to ═ (\u2550)

and + to one of:
   ┌ (\u250C), ┐ (\u2510), └ (\u2514), ┘ (\u2518),
   ├ (\u251C), ┤ (\u2524), ┬ (\u252C), ┴ (\u2534),
   ┼ (\u253C)
or, if '=' on either side:
   ╒ (\u2552), ╕ (\u2555), ╘ (\u2558), ╛ (\u255D),
   ╞ (\u255E), ╡ (\u2561), ╤ (\u2564), ╧ (\u2567),
   ╪ (\u256A)

세부

I / O :

  • 기본 I / O 가 허용됩니다
  • 테이블을 문자열로 포함하거나 테이블이 포함 된 파일의 경로를 포함하여 합리적인 형식으로 입력 할 수 있습니다.
  • 파일로 출력하고 파일 이름을 추가 인수로 사용할 수 있습니다.
    • 그러나 입력 파일을 수정할 수 없습니다 . (나중에 쉽게 편집 할 수 있도록 유지해야합니다)

입력:

  • 입력의 모든 행이와 같은 길이로 채워 졌다고 가정 할 수 있습니다 .
  • 줄 바꿈 뒤의 첫 번째 문자는 공백 일 수 있으므로 테이블 경계의 일부라고 가정 할 수 없습니다.
  • 모든 문자 (테이블의 일부) -=|가 정확히 두 문자 +에 연결되고 하나 이상의 문자에 가로 및 세로로 연결된 경우 입력은 유효한 테이블로 간주됩니다 .
  • 프로그램이 유효한 입력으로 오류를 생성하지 않을 수 있습니다.
  • 입력이 유효하지 않은 경우 동작이 정의되지 않으며 출력을 생성 할 수 있습니다.
  • 입력은 상자 그리기 문자를 포함하여 UTF-8 문자를 포함 할 수 있습니다.

산출:

  • -=|+테이블의 일부가 아닌 문자 는 그대로 두어야합니다 .
  • 마찬가지로 다른 문자는 그대로 두어야합니다.
  • 단일 선행 및 / 또는 후행 줄 바꿈이 허용됩니다.

다른:

  • 표준 허점 은 평소와 같이 금지되어 있습니다.
  • 원하는 언어에이 문제를 해결하는 기본 제공 언어가있는 경우 사용하지 못할 수 있습니다.
    • 이는 프로그램, 기능, 서브 루틴 또는 추가없이이 과제에 대한 유효한 제출이 될 수있는 명령을 의미합니다.
  • 이 챌린지에 필요한 각 문자는 UTF-8로 인코딩 될 때 길이가 3 바이트입니다.

연결된 캐릭터 :

다음과 같은 경우 문자가 다른 문자에 연결됩니다.

  • 그것은 인 |직접 위나 아래 +또는 |;
  • 그것은이다 -과 이전 또는 이후에 바로 +-;
  • 그것은이다 =과 이전 또는 이후에 바로 +=;
  • 그것은 인 +직접 위나 아래 |또는 +또는 또는 후 바로 전에 -, =또는 +.

문자가 테이블의 일부인 문자에 연결된 경우 문자는 테이블의 일부로 간주됩니다. 정의 +에 따르면 입력 의 첫 번째 는 테이블의 일부입니다.

복사 가능 버전으로 여기에 사용 가능한 예제가 있습니다 .

 Input:                    Output:
+------------------+      ┌──────────────────┐
|   Hello+World!   |      │   Hello+World!   │
+==================+      ╞══════════════════╡
| This is+my first |  ->  │ This is+my first │
|+-+ code|golf  +-+|      │+-+ code|golf  +-+│
|+-+chall|enge! +-+|      │+-+chall|enge! +-+│
+------------------+      └──────────────────┘

     +===+===+===+             ╒═══╤═══╤═══╕
     | 1 | 2 | 3 |             │ 1 │ 2 │ 3 │
 +---+===+===+===+         ┌───╪═══╪═══╪═══╡
 | 1 | 1 | 2 | 3 |         │ 1 │ 1 │ 2 │ 3 │
 +---+---+---+---+    ->   ├───┼───┼───┼───┤
 | 2 | 2 | 4 | 6 |         │ 2 │ 2 │ 4 │ 6 │
 +---+---+---+---+         ├───┼───┼───┼───┤
 |-3 |-3 |-6 |-9 |         │-3 │-3 │-6 │-9 │
 +===+---+---+---+         ╘═══╧───┴───┴───┘

      +-----+         ->      <Undefined>

      +-----+         ->      ┌─────┐
      +-----+                 └─────┘

+-----------------+
|  Hello, World!  |
| This is invalid |   ->      <Undefined>
|      input      |
 -----------------+

       ++++                      ┌┬┬┐
       ++++           ->         ├┼┼┤
       ++++                      └┴┴┘

       +--+
       ++++           ->      <Undefined>
       +--+

드디어...

이것은 이므로 가장 적은 양의 바이트가 이깁니다. 행복한 골프!


첫 번째 예에서 연속 +-+발췌가 연결된 테이블을 구성하지 않는 이유는 무엇입니까?
재귀 적

16 비트 함수가 단일 바이트를 사용하여 ╡을 나타내는 경우 바이트 수는 어떻습니까?
l4m2

@recursive 첫 번째 Hello World테이블 을 의미하는 경우 테이블 내부의 텍스트는 변경되지 않고 내부 테이블은 테이블에 연결되지 않으므로 외부 테이블 경계의 일부로 간주되지 않기 때문에 내부 테이블은 테이블을 구성하는 것으로 간주되지 않습니다.

첫 번째 +----+예 를 의미한다면 모서리의 방향이 모호하기 때문입니다.

1
오, "가장 바깥쪽에있는 테이블을 확장하기 위해 연결하지 않는 한 테이블 내에 테이블이 없어야합니다"요구 사항은이 작업을 훨씬 더 어렵게 만듭니다.
Jonathan Allan

답변:


2

파이썬 3, 392 281 바이트

꽤 많이 골퍼하고 반복적 인 솔루션 대신 재귀 솔루션으로 변환했습니다.

def h(a):
 def g(i):
  k=-3;d=a[i]=='=';z[i]=''
  for p,j,r in zip((1,2,4,8),(i+1,i+w,i-1,i-w),('+-=','+|')*2):
   if 0<=j<len(a)and{a[i],a[j]}<={*r}:k+=p;d|=a[j]=='=';z[j]and g(j)
  z[i]="┌╒!!─═┐╕┬╤@@└╘││├╞┘╛┴╧┤╡┼╪"[2*k+d]
 w=a.find('\n')+1;z=[*a];g(a.find('+'))
 return''.join(z)

줄 바꿈으로 구분 된 길이가 같은 행의 문자열을 가져와 같은 형식으로 문자열을 반환합니다. 유효하지 않은 입력에서 예외가 발생할 수 있습니다.

이전 솔루션 :

def h(a):
 i=a.find('+');q=[i];w=a.find('\n')+1;z=[*a]
 while q:
  i=q.pop();c=a[i];k=-5
  for p,j in enumerate((i+1,i-1,i+w,i-w)):
   r='++-|='[p>1::2]
   if 0<=j<len(a)and a[i]in r and a[j]in r:
    k+=1<<p;q+=[j][:z[j]<'─']
  z[i]='│'if c>'='else'─═'[a[i]>'-']if c>'+'else"┌╒┐╕┬╤@@└╘┘╛┴╧##├╞┤╡┼╪$$"['='in a[abs(i-1):i+2]::2][k]
 return''.join(z)

언 골프 버전 :

def h(a):
    i = a.find('+')         # find index of first '+'. It is first node
    q = [i]                 # in the queue of indexes to convert to unicode
    w = a.find('\n')+1      # width of the table
    z = [*a]                # strings are immutable, so copy it to a list

    while q:                # while the queue isn't empty
        i=q.pop()           # get the next index to process
        c=a[i]              # and the associated character

        k=-5                # 'k' is the index into the unicode string, U.  The way they
                            # are encoded, the first unicode value is at index 5. 

                 # directions  E   W   S   N
        for p,j in enumerate((i+1,i-1,i+w,i-w)):  # j is the index of an adjacent cell

            # r='++-|='[p>1::2] is equivalent to:
            if p > 1:
                r = '+|'    # compatible symbols for vertical connections
            else:
                r = '+-='   # compatible symbols for horizontal connections

            # if adjacent cell index is valid and the characters are compatible
            if 0 <= j < len(a) and a[i] in r and a[j] in r:
                k += 1<<p                 # update the unicode symbol index

                # q += [j][:z[j]<'─'] is equivalent to:
                if z[j] < '-':            # if the adjacent cell hasn't been converted already
                    q.append(j)           #  append it's index to the queue

            if c > '=':
                z[i] = '│'                # replace a '|' with a '│'

            elif c > '+':
                z[i] = '─═'[a[i]>'-']     # replace a '-' or '=' with '─' or '═' respectively 

            else:                                      # it's a '+'
                U = "┌╒┐╕┬╤@@└╘┘╛┴╧##├╞┤╡┼╪$$"         # even indexes are single horizontal line, 
                                                       # double horizontal lines are at odd indexes

                z[i] = U['='in a[abs(i-1):i+2]::2][k]  # '='in a[abs(i-1):i+2] is true if there is an '=' to the left or right
                                                       # so this selects the odd chars from U
                                                       #  then [k] selects the correct char

 return''.join(z)

3

파이썬 3 , 914 898 827 823 594 587 569 540 469 바이트

편집 : 전략을 크게 변경하여 이제 이웃의 비트 필드를 만들었습니다 (죽은 주머니의 대답과 유사). 아래에 이전 버전을 남겼습니다.

H='─│═-|=└╘++++┌╒├╞++┘╛++┴╧┐╕┤╡┬╤┼╪'
def n(l):
 def j(r,c,t=0):O=(0,r-1,c),(1,r,c+1),(2,r+1,c),(3,r,c-1);v=f(r,c);b=t|any(f(Y,X)=='='for i,Y,X in O);l[r][c]={'+':H[b+2*sum((f(Y,X)in H)<<x for x,Y,X in O)],**dict(zip(H[3:6],H))}.get(v,v);[f(Y,X)!=';'and v in'+++-|='[i%2::2]and j(Y,X,v=='=')for i,Y,X in O]
 for i,I in enumerate(l):
  if'+'in I:f=lambda r,c:l[r][c]if len(l)>r>=0and 0<=c<len(l[r])else';';j(i,I.index('+'));break

온라인으로 사용해보십시오!

입력은 문자 목록의 형태로되어 있으며 수정됩니다. 찾은 첫 번째 +에서 되풀이됩니다.

x=range
C='┌┐└┘','╒╕╘╛'
D='┬┤┴├','╤╡╧╞'
A='┼╪'
H,V,T='─│═'
J={'-':H,'|':V,'=':T}
K=C[1]+D[1]+A[1]+'='+T
E=('+|','+-=')*2
F=['+|'+V,'+-='+H+T]*2
O=(0,-1,0),(1,0,1),(2,1,0),(3,0,-1)
for i in x(4):
 for j in{0,1,2,3}-{i}:F[i+2&3]+=D[0][j]+D[1][j]
 h=C[0][i]+C[1][i];F[i&2]+=h;F[3-2*(i&1)]+=h
def n(l):
 for i,I in enumerate(l):
  if'+'in I:r=i;c=I.index('+');break
 else:return l
 def f(r,c):
  try:assert c>=0 and r>=0;return l[r][c]
  except:return'\0'
 def j(r,c):
  v=f(r,c)
  l[r][c]=J.get(v,v)
  if v=='+':
   X=[f(r+Y,c+X)for i,Y,X in O];B=any(x in K for x in X);X=[X[x]in F[x]for x in x(4)];L=sum(X)
   if L in(2,3,4):l[r][c]=D[B][X.index(False)]if L==3 else C[B][X[0]*2+X[3]]if L==2 else A[B]
  for i,Y,X in O:
   if v in E[i]and f(r+Y,c+X)in E[i]:j(r+Y,c+X)
 j(r,c);return l

온라인으로 사용해보십시오!

ungolfed 버전에 가장 가까운 것은 다음과 같습니다.

def tr(s):
    t='┌┐└┘','╒╕╘╛'
    t2='┬┤┴├','╤╡╧╞'
    A = '┼','╪'
    H,V,T = '─│═'
    Th = ''.join(x[1]for x in (t,t2,A))+'='+T
    ps = ['+|'+V, '+-='+H+T, '+|'+V, '+-='+H+T]
    ps2 = ('+|', '+-=')*2
    for i in range(4):
        for j in {0,1,2,3}-{i}:
            ps[(i+2)%4] += t2[0][j]+t2[1][j]
        h=t[0][i] + t[1][i]
        ps[i & 2] += h
        ps[3 - 2 * (i & 1)] += h

    l = [list(x) for x in s.split('\n')]
    r = 0
    for i,I in enumerate(l):
        if'+'in I:
            r=i;c=I.index('+')
            break
    def g(r,c): return l[r][c]
    def G(r,c):
        if r >= 0 and r < len(l) and c >= 0 and c < len(l[r]):
            return g(r,c)
        return '\0'
    def process(r,c):
        v = g(r,c)
        if v == '-': l[r][c] = H
        elif v == '|': l[r][c] = V
        elif v == '=': l[r][c] = T
        elif v == '+':
            all=[G(r-1,c),G(r,c+1),G(r+1,c),G(r,c-1)]
            bold=any(x in Th for x in all)
            for i in range(4):all[i] = all[i] in ps[i]
            N,E,S,W=all
            tt=sum(all)
            if tt == 3:
                l[r][c]=t2[bold][all.index(False)]
            elif tt == 2:
                l[r][c]=t[bold][N*2+W]
            elif tt == 4:
                l[r][c]=A[bold]
            else: return
        for i,(dy,dx) in enumerate(((-1,0),(0,1),(1,0),(0,-1))):
            if v in ps2[i] and G(r+dy,c+dx) in ps2[i]:
                process(r+dy,c+dx)
    process(r,c)
    return l

9 바이트 (814까지)를 절약하기위한 약간의 개선 bit.ly/2NOu7HF
mypetlion

또 다른 9 바이트 (지금은 805 바이트)에 대한 몇 가지 더 bit.ly/2pYom0x
mypetlion

763까지 : bit.ly/2OxErsJ
mypetlion

1

자바 스크립트, 311 307 바이트

X=>(O=[...X],P=(I,j=0,_=0)=>!P[I]&&(P[I]=1,['-─1','|│','=═1'].map(([a,b,n=X.indexOf('\n')+1])=>[-n,+n].map(n=>{for(i=I;X[i+=n]==a;)O[i]=b
if(X[i]=='+')j|=[1,2,4,8,I-i>1&&17,i-I>1&&18][_],P(i)
_++})),O[I]='┘└┴ ┐┌┬ ┤├┼     ╛╘╧ ╕╒╤ ╡╞╪'[j-5]),P(X.indexOf`+`),O.join``)

설명

발견 된 첫 번째 +정션 에서 시작 하여 프로그램은 모든 방향으로 다른 정션에 대한 경로를 찾으려고 시도하며 교체를 수행합니다. 찾은 방향과 "이중 경계"상태를 비트 맵에 저장 한 다음 적절한 접점 문자를 결정합니다.

// Take an input string X
f = X => {
    // Copy the input string into an array so characters can be overwritten and eventually output
    O = [...X]

    // Define a function that processes a junction ("+" symbol) at index I in the input string X:
    P = I => {
        // Make a bitmap to keep track of the direction coming out of the junction and double borders
        // Bits from right to left: west, east, north, south, double border
        // E.g. a double-bordered south/east junction corresponds to the binary number 11010 ("╒")
        let j = 0

        // A counter
        let _ = 0

        // Ensure this junction hasn't already been processed
        if(!P[I]){
            P[I] = 1,

            // We'll walk away from the junction in each of the four directions, then west and east again to check for double borders
            // i.e. walk along `a`, replace with `b`, move index `i` by `n`
            // 1st pass: walk along "-", replace with "─", move index by 1
            // 2nd pass: walk along "|", replace with "│", move index by the width of the input (plus 1 for the newline) to traverse vertically
            // 3rd pass: walk along "=", replace with "═", move index by 1
            ['-─1','|│','=═1'].map(([a, b, n = X.indexOf('\n') + 1])=>
                // We'll walk in the negative and positive directions for each pass
                [-n,+n].map(n=>{
                    // Start the walk
                    i=I
                    // Keep walking (incrementing by n) as long as we're on a "path" character, "a"
                    while(i += n, X[i] == a)
                        // Replace the corresponding character in the output with "b"
                        O[i] = b

                    // Upon reaching another junction at index i:
                    if(X[i] == '+'){
                        // OR the bitmap according to the direction we walked
                        j |= [
                            // Pass 1: Horizontal
                            1, // west
                            2, // east

                            // Pass 2: Vertical
                            4, // north
                            8, // south

                            // Pass 3: Double Horizontal (only if we've walked more than 1 step)
                            I-i > 1 && 17, // west, double border
                            i-I > 1 && 18 // east, double border
                        ][_]

                        // Process the junction we walked to
                        P(i)
                    }
                    _++
                })
            )

            // Finally, replace the "+" with a proper junction character based on the bitmap value
            O[I] = '     ┘└┴ ┐┌┬ ┤├┼     ╛╘╧ ╕╒╤ ╡╞╪'[j]
        }
    }

    // Process the first junction to kick off the recursion
    P(X.indexOf`+`)

    // Return our modified character array as a joined string
    return O.join``
}

고정-바이트 수가 아닌 문자 수를 보았어야합니다.
darrylyeo 8

1

파이썬 3 , 599 바이트

나는 파이썬 3에서 골프를 잘하지 않지만 파이썬 2에서는 UTF-8 문자의 정상적인 출력을 얻을 수 없었습니다.

여기서 흥미로운 재미있는 트릭은 +변형을 결정하는 것입니다 .
가능한 모든 변형을 4 비트 주소로 인코딩했습니다. 각 주소는 neightbour cell과의 연결과 유사합니다. 따라서 0-연결 없음 및 1-연결.
1111is
0011is
etc
일부 연결 구성이 유효하지 않고 더미 값으로 대체되었습니다.'012┐45┌┬8┘0┤└┴├┼'

neightbour 셀에을 포함 =하면 두 번째 목록이 두 줄로 사용됩니다.

['012┐45┌┬8┘0┤└┴├┼','012╕45╒╤8╛0╡╘╧╞╪']['='in r]

여기에 주소가 결합됩니다.

r=''.join([str(int(V(y,x)))+W(y,x)for y,x in[(Y-1,X),(Y,X+1),(Y+1,X),(Y,X-1)]])

r문자열 길이 8을 포함합니다. 여기서 두 문자는 모두 1/0이고 실제는 neightbour char입니다.
예를 들면 다음과 같습니다 1+0y1-1|..
이전에 표시된대로 대체 목록을 선택하는 데 사용됩니다. 그리고 나서 계약을 맺었습니다.int(r[0::2],2)

이 람다는 셀 좌표가 유효하고 셀의 문자가 '+-| ='중 하나인지 확인하는 데 사용됩니다.

V=lambda y,x:~0<x<len(I[0])and~0<y<len(I)and I[y][x]in'+-|='

이 람다는 셀에서 문자를 수신하는 데 사용되었습니다. ' '좌표가 유효하지 않은 경우를 리턴 합니다. (확실히 골프를 치를 수 있습니다)

W=lambda y,x:V(y,x)and I[y][x]or' '

재귀 조건. 골프도 할 수 있습니다.

if Z in'+-=':F(Y,X+1);F(Y,X-1)
if Z in'+|':F(Y-1,X);F(Y+1,X)

I=eval(input())
J=[i[:]for i in I]
V=lambda y,x:~0<x<len(I[0])and~0<y<len(I)and I[y][x]in'+-|='
W=lambda y,x:V(y,x)and I[y][x]or' '
def F(Y,X):
 if V(Y,X)and I[Y][X]==J[Y][X]:
  Z=I[Y][X]
  if','>Z:
   r=''.join([str(int(V(y,x)))+W(y,x)for y,x in[(Y-1,X),(Y,X+1),(Y+1,X),(Y,X-1)]])
   J[Y][X]=['012┐45┌┬8┘0┤└┴├┼','012╕45╒╤8╛0╡╘╧╞╪']['='in r][int(r[0::2],2)]
  else:J[Y][X]=dict(zip('|-=','│─═'))[Z]
  if Z in'+-=':F(Y,X+1);F(Y,X-1)
  if Z in'+|':F(Y-1,X);F(Y+1,X)
e=enumerate
F(*[(y,x)for y,r in e(I)for x,c in e(r)if'+'==c][0])
for r in J:print(''.join(r))

온라인으로 사용해보십시오!

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.