단일 숫자의 가장 긴 반복 서브 시퀀스



양의 정수가 주어지면 적어도 두 번 발생하는 가장 긴 한 자리 수의 하위 시퀀스를 출력하고 다른 숫자의 경계 (또는 정수의 시작 / 끝)를 갖습니다.

예를 들면 :

입력 : 7888885466662716666
한 자릿수의 가장 긴 하위 시퀀스 는 길이가 5 인 88888( 7[88888]5466662716666)입니다. 그러나이 하위 시퀀스는 정수에서 한 번만 발생합니다.
대신 입력 결과 는 (적어도) 두 번 발생하므로 ( ) 7888885466662716666이어야합니다 .666678888854[6666]271[6666]

도전 규칙 :

  • 서브 시퀀스 길이는 발생 횟수보다 우선합니다. (즉, input을 사용 8888858888866656665666하면 88888( [88888]5[88888]66656665666; length 5, 두 번 발생)가 아닌 666( 88888588888[666]5[666]5[666]; length 3, 세 번 발생) 출력합니다.
  • 여러 하위 시퀀스의 길이가 같으면 발생 횟수가 가장 큰 시퀀스를 출력합니다. 즉, input을 사용 3331113331119111하면 111( 333[111]333[111]9[111]; length 3, 세 번 발생) 출력 하지 않고 333( [333]111[333]1119111; length 3도 두 번 발생)
  • 여러 서브 시퀀스의 발생 횟수와 길이가 같으면 그 중 하나 또는 전부 (순서대로)를 출력 할 수 있습니다. 즉, input 777333777333을 사용하면 가능한 출력은 다음과 같습니다 777.; 333; [777, 333]; 또는 [333, 777].
  • 하위 시퀀스에는 다른 숫자의 경계 (또는 정수의 시작 / 끝)가 있어야합니다. 즉, 입력 122222233433결과는 33( 1222222[33]4[33]; 길이 2, 두 번 발생 함)이 아닌 222( 1[222][222]33433길이 3은 둘 다 유효하지 않은 경우 두 번 발생 함).
    • 이것은 발생 카운터로 계산되는 모든 숫자에 적용됩니다. 즉, 입력 811774177781382결과는 8( [8]117741777[8]13[8]2; 길이 1, 세 번 발생)이며 77( 811[77]41[77]781382/ 811[77]417[77]81382; 길이 2, 하나의 무효로 두 번 발생) 또는 1( 8[1][1]774[1]7778[1]382; 길이 1, 두 번의 무효로 네 번 발생)입니다.
  • 입력에 숫자가 포함되지 않는다고 가정 할 수 있습니다 0(와 일치 [1-9]+). (이것은 대부분의 언어가 기본적으로 출력 되는 10002000output 과 같은 테스트 사례를 처리하지 않아도됩니다 .)0000
  • 입력에 항상 하나 이상의 유효한 출력이 포함되어 있다고 가정 할 수 있습니다.
  • I / O는 유연합니다. 숫자 / 바이트 / 문자의 목록 / 배열 / 스트림이거나 단일 정수 대신 문자열 일 수 있습니다.

일반 규칙:

  • 이것은 이므로 바이트 단위의 최단 답변이 이깁니다.
    코드 골프 언어가 코드 골프 언어 이외의 언어로 답변을 게시하지 못하게하지 마십시오. '모든'프로그래밍 언어에 대한 가능한 한 짧은 대답을 생각해보십시오.
  • 표준 규칙이 답변에 적용 되므로 STDIN / STDOUT, 적절한 매개 변수 및 리턴 유형의 전체 프로그램과 함께 함수 / 방법을 사용할 수 있습니다. 당신의 전화.
  • 기본 허점 은 금지되어 있습니다.
  • 가능하면 코드 테스트 링크를 추가하십시오.
  • 또한 답변에 대한 설명을 추가하는 것이 좋습니다.

테스트 사례 :

Input:  7888885466662716666 / [7,8,8,8,8,8,5,4,6,6,6,6,2,7,1,6,6,6,6]
Output: 6666                / [6,6,6,6]

Input:  3331113331119111 / [3,3,3,1,1,1,3,3,3,1,1,1,9,1,1,1]
Output: 111              / [1,1,1]

Input:            777333777333                   / [7,7,7,3,3,3,7,7,7,3,3,3]
Possible outputs: 777; 333; [777,333]; [333;777] / [7,7,7]; [3,3,3]; [[7,7,7],[3,3,3]]; [[3,3,3],[7,7,7]]

Input:  122222233433 / [1,2,2,2,2,2,2,3,3,4,3,3]
Output: 33           / [3,3]

Input:  811774177781382 / [8,1,1,7,7,4,1,7,7,7,8,1,3,8,2] 
Output: 8               / [8]

Input:  555153333551 / [5,5,5,1,5,3,3,3,3,5,5,1] 
Output: 1            / [1]

Input:            12321              / [1,2,3,2,1]
Possible outputs: 1; 2; [1,2]; [2,1] / [1]; [2]; [[1],[2]]; [[2],[1]]

Input:  944949949494999494 / [9,4,4,9,4,9,9,4,9,4,9,4,9,9,9,4,9,4]
Output: 4                  / [4]

Input:  8888858888866656665666 / [8,8,8,8,8,5,8,8,8,8,8,6,6,6,5,6,6,6,5,6,6,6]
Output: 88888                  / [8,8,8,8,8]

Input:  1112221112221111               / [1,1,1,2,2,2,1,1,1,2,2,2,1,1,1,1]
Output: 111; 222; [111,222]; [222,111] / [1,1,1]; [2,2,2]; [[1,1,1],[2,2,2]]; [[2,2,2],[1,1,1]]

Input:  911133111339339339339339 / [9,1,1,1,3,3,1,1,1,3,3,9,3,3,9,3,3,9,3,3,9,3,3,9]
Output: 111                      / [1,1,1]

권장 테스트 사례 : 8888858888866656665666. 문제를 올바르게 해석하면 Brachylog 및 05AB1E 솔루션이 모두 실패합니다.
Mr. Xcoder

@ Mr.Xcoder 감사합니다.
Kevin Cruijssen

@ Arnauld 흠, 그것은 222다른 정수에 묶여있을 때만 큼 여러 번 발생하기 때문에 어쨌든 내 의견으로는 승자 중 하나 일 것입니다 . 우리는의 하위 문자열 인 발생을 계산해서는 안된다고 생각합니다 1111. 실제로 OP를 기다리는 것이 좋습니다.
Mr. Xcoder

@Arnauld 1112221112221111하위 시퀀스와 개수는 다음과 같습니다 1111 (1). 111 (2),, 222 (2). 우리는 단지 두번 이상에서 발생하는 시퀀스를 출력하기 때문에, 출력 중 하나 일 수있다 : 111, 222, [111,222], [222,111]. 기본적으로 (. 좀 더 자세한 내용은 네 번째 규칙 참조) 1111오직 같은 계산합니다 1111, 그리고 같은 1111또는 1111. 테스트 사례를 추가하지만 출력은 111및 중 하나 또는 둘 다입니다 222.
Kevin Cruijssen



05AB1E , 14 바이트


온라인으로 사용해보십시오!


γ                # group consecutive equal elements
 Т              # count the occurrence of each group among the list of groups
   1›Ï           # keep only groups with a count greater than 1
      D€gZQÏ     # keep only those with a length equal to the greatest length
            .M   # get the most common item

@ Riley : 불행히도 그것은 가장 일반적인 요소가 아닌 첫 번째 요소를 얻습니다.

죄송합니다. 그 총알을 놓쳤습니다.


젤리 , 12 바이트


온라인으로 사용해보십시오!

이전 버전 – 14 바이트


온라인으로 사용해보십시오!

어떻게 작동합니까?

Œgœ-Q$LÐṀÆṃ' – Full program. Receives a list of digits as input.
Œg           – Group equal adjacent values.
  œ-Q$       – Multiset difference with itself deduplicate.
      LÐṀ    – Keep those that are maximal by length.
         Æṃ' – Mode. Returns the most common element(s).
ŒgŒQ¬TịƲLÐṀÆṃ' – Full program. Receives a list of digits as input.
Œg             – Group equal adjacent values.
  ŒQ           – Distinct sieve. Replace the first occurrences of each value by 1.
                 and the rest by 0. [1,2,3,2,3,2,5]ŒQ -> [1,1,1,0,0,0,1]       
    ¬T         – Negate and find the truthy indices.
      ịƲ       – Then index in the initial list of groups.
               – This discards the groups that only occur once.
        LÐṀ    – Find all those which are maximal by length.
           Æṃ' – And take the mode.


자바 스크립트 (ES6), 79 73 68 바이트

입력을 문자열로받습니다. 정수를 반환합니다.


온라인으로 사용해보십시오!


s =>                      // s = input string, also used as the current digit
  [ ...s,                 // split s into a list of digit characters
    r =                   // r is the final result
    q =                   // q is the current digit sequence
    0                     // append a final dummy entry to force the processing of the last
  ]                       // sequence
  .map(o =                // o is an object used to keep track of encountered sequences
       d =>               // for each digit d in the array defined above:
    q =                   //   update q:
      s ^ d ?             //     if d is not equal to the current digit:
        o[                //       this statement will ultimately update o[q]
          !o[q] |         //         if q has not been previously seen
          r[q.length] ?   //         or the best result is longer than q:
            q             //           leave r unchanged
          :               //         else:
            r = q         //           set r to q
        ] = s = d         //       reset q to d, set the current digit to d
                          //       and mark q as encountered by setting o[q]
      :                   //     else:
        q + d             //       append d to q
  ) | r                   // end of map(); return r, coerced to an integer

어쩌면 나는 여기에 잘못된 것을 말하고 있지만 ...s입력을 숫자 문자 목록으로 변환하기 때문에 문자열 대신 입력을 숫자 문자 목록으로 가져가는 것이 더 짧지 않습니까? 유연한 I / O를 허용했습니다. (하지만 코드의 다른 부분을 방해한다고 가정합니다.)
Kevin Cruijssen

@KevinCruijssen 문제는 마지막 시퀀스를 처리하기 위해 추가 반복이 필요하다는 것입니다. 따라서 이미 목록 인 [...s,0]경우에도 수행해야 s합니다.


레티 나 , 56 바이트



온라인으로 사용해보십시오! 링크에는 테스트 사례가 포함됩니다. 설명:


최대 반복되는 숫자 서브 시퀀스를 모두 나열하십시오.


목록을 순서대로 정렬하십시오.


모든 여러 하위 시퀀스를 "count"와 함께 나열합니다.


개수의 오름차순으로 정렬하십시오.


카운트를 삭제하십시오.


길이의 오름차순으로 정렬하십시오. 길이가 동일한 경우 개수로 인한 이전 순서가 유지됩니다.


가장 긴 값을 유지하십시오.


R , 102 바이트


온라인으로 사용해보십시오!

아직 R 답변이 없었기 때문에 시도해보기로 결정했지만 쉽지 않았습니다. 나는 그것이 좋은 접근 방법인지 잘 모르겠지만 여기에 간다.

문자 벡터를 입력 및 출력합니다.

이 도전을 통해 R에 100 바이트에 가까운 것이 좋습니다.


Powershell, 101 바이트

($args|sls '(.)\1*'-a|%{$_.Matches}|group|?{$_.Count-1}|sort @{e={$_.Name.Length,$_.Count}})[-1].Name

설명 된 테스트 스크립트 :

$f = {

    $args|          # for each argument (stings)
    sls '(.)\1*'-a| # searches all
    %{$_.Matches}|  # regex matches
    group|          # group it (Note: Count of each group > 0 by design)
    ?{$_.Count-1}|  # passthru groups with Count not equal 1
    sort @{         # sort all groups by 2 values
)[-1].Name          # returns name of last group (group with max values)


    ,('7888885466662716666', '6666')
    ,('3331113331119111', '111')
    ,('777333777333', '777','333')
    ,('122222233433', '33')
    ,('811774177781382', '8')
    ,('12321', '1','2')
) | % {
    $s,$e = $_
    $r = &$f $s
    "$($r-in$e): $r"


True: 6666
True: 111
True: 777
True: 33
True: 8
True: 1
True: 1
True: 4
True: 88888
True: 111


하스켈, 72 바이트

import Data.Lists
g!x|y<-countElem x g=(y>1,1<$x,y)

작동 원리

(argmax=<<(!)).group       -- expands to: f i = argmax (group i !) (group i)
    group                  -- split the input list into subsequences of equal digits
                           -- e.g. "1112211" -> ["111","22","11"]

                           -- find the element of this list where the function !
                           -- returns the maximum value. First parameter to !
                           -- is the grouped input list, second parameter the
                           -- the element to look at 

    y<-countElem x g       -- let y be the number of occurrences of x in g
  = (  ,   ,  )            -- return a triple of
     y>1                   -- a boolean y>1  (remember: True > False)  
        1<$x               -- length of x (to be exact: all elements in x
                           -- replaced by 1. This sorts the same way as the
                           -- length of x)
             y             -- y
                           -- a triples sorts lexicographical

Data.Lists는 기본이 아니므로 Haskell + 목록 을 언어 로 사용할 필요가 없습니까?

@BWO : 모르겠다. 이국적인 라이브러리 (예 : Gloss그래픽 출력 또는 Matrix) 를 가져온 경우에도 항상 일반 "Haskell"을 사용했습니다 . 가져 오기에 바이트 수를 포함하지 않으려면 "Haskell + something"을 사용합니다. 메타에 대해이 주제를 가지고 있다고 생각하지만 더 이상 찾을 수 없습니다. 올바르게 기억한다면 "표준 라이브러리"에 대한 일반적인 정의가 없었습니다. Haskell에 대한 참조는 무엇입니까? 하스켈 보고서, GHC의 기지, 하스켈 플랫폼, 다른 것?

IMO는 C / JavaScript /.와 마찬가지로 구현이 PPCG에 언어를 지정하기 때문에 Haskell (GHC) 또는 Haskell (Hugs) 등을 사용해야합니다. 따라서 GHC 답변에 대한 기본 정보와 내가 알지 못하는 다른 모든 정보에 대해서는 : D

테스트 할 수 있도록 TIO 링크가 있습니까? 아니면 Data.ListsTIO 또는 다른 온라인 Haskell 컴파일러 에서 라이브러리를 사용할 수 없습니까?
Kevin Cruijssen

@KevinCruijssen : 예가 Data.ListsTIO에서 누락되었습니다. 이 버전으로 테스트 할 수 있습니다 .


R , 85 바이트


온라인으로 사용해보십시오!

  • 입력 : 분리 된 정수로 구성된 벡터c(1,8,8...)

  • 출력 : 분리 된 정수 자릿수로 구성된 벡터

설명과 함께 풀린 코드 :

function(x){                # x is a vector of digits : e.g. c(1,1,8,8,1,1)

R = rle(x)                  # Get the sequences of consecutive repeating digits
                            # doing run length encoding on x, i.e. : R is a list
                            # with the digits (R$values) and the number of their
                            # consecutive occurrencies (R$lengths)
                            # N.B. you can use R$v for R$values and R$l for R$lenghts

a=ave(R$v,R,FUN=length)     # Group R$v by R$l AND R$v, count the occurrencies 
                            # for each group and "unroll" the value of each 
                            # group to the original R$v length.
                            # Here basically we count the occurrencies of the same 
                            # sequence.

o<-order(a<2,-R$l,-a)[1]    # Get the indexes used to order by a < 2 then by -R$l and
                            # finally by -a; store the first index in "o".
                            # Here basically we use order to select the first sequence 
                            # repeated at least twice, in case of ties the sequence 
                            # with the greatest length and in case of ties the most 
                            # repeated sequence.

rep(R$v[o],R$v[o])          # Using the index "o", we reconstruct the sequence repeating
                            # R$l[o] times R$v[o]

정수 또는 문자 숫자의 벡터를 허용하는 대체 버전 :

R , 88 바이트


온라인으로 사용해보십시오!

  • 입력 : 분리 문자의 벡터 또는 숫자 예를 들어 c("1","8","8"...)c(1,8,8...)

  • 출력 : 입력이 문자 벡터 인 경우 분리 문자로 구성된 벡터, 입력이 숫자 벡터 인 경우 숫자로 구성된 벡터

설명을 추가 할 수 있습니까? 작동 방식을 이해하지 못합니다.

@JayCe : 완료! (R이 아닌 사용자를 위해 잘 알고있는 세부 정보를 추가했습니다.)

타이! 이제 말이 되네요.


빨강 , 256250 바이트

func[s][p: func[b][sort parse b[collect[any keep[copy a skip thru any a]]]]first
last sort/compare collect[foreach d p p s[if 1 < k: length? to-block d[keep/only
reduce[form unique d k]]]]func[x y][(reduce[length? x/1 x/2])< reduce[length? y/1 y/2]]]

온라인으로 사용해보십시오!

정말 이번에는 정말 긴 해결책 ... (한숨)

입력을 문자열로 사용합니다.


f: func [ s ] [
    p: func [ b ] [                        ; groups and sorts the adjacent repeating items
        sort parse b [ 
            collect [                      
                any keep[
                    copy a skip thru any a ; gather any item, optionally followed by itself  
    t: copy []
    foreach d p p s [                     ; p p s transforms the input string into a block of sorted blocks of repeating digits
        if 1 < k: length? to-block d [    ; filters only the blocks that occur more than once
            insert/only t reduce [ form unique d k ] ; stores the digits and the number of occurences
                                          ; "8888858888866656665666" -> [["5" 3] ["666" 3] ["88888" 2]]
    first last sort/compare t func [ x y ] ; takes the first element (the digits) of the last block of the sorted block of items
        [ (reduce [ length? x/1 x/2 ]) < reduce [ length? y/1 y/2 ] ] ; direct comparison of the blocks


자바 (JDK 10) , 213 바이트

s->{int l=99,X[][]=new int[10][l],d,D=0,m=0,M=0;for(var x:s.split("(?<=(.))(?!\\1)"))X[x.charAt(0)-48][x.length()]++;for(;M<1&&l-->1;)for(d=0;d++<9;)if((m=X[d][l])>1&m>M){M=m;D=d;}for(;l-->0;)System.out.print(D);}

온라인으로 사용해보십시오!

설명 (오래됨)

s->{                                    // Lambda for Consumer<String>
 int l=99,                              //  Length of token, max is 99.
     X[][]=new int[10][l],              //  Array containing the occurrences per token
     d,                                 //  digit value
     D=0,                               //  digit holder for best sequence candidate
     m=0,                               //  holder of the current candidate
     M=0;                               //  best candidate for the current length of token.
 for(var x:s.split("(?<=(.))(?!\\1)"))  //  Tokenize the string into digit-repeating sequences
  X[x.charAt(0)-48][x.length()]++;      //   Add one occurrence for the token
 for(;M<1&&l-->1;)                      //  While no value has been found and for each length, descending. Do not decrease length if a value has been found.
  for(d=0;d++<9;)                       //   for each digit
   if((m=X[d][l])>1&m>M){               //    if the current occurrence count is at least 2 and that count is the current greatest for the length
    M=m;D=d;                            //     mark it as the current best
   }                                    //
 for(;l-->0;)System.out.print(D);       //  Output the best-fitting subsequence.
}                                       // 


j*o>M수표에 작은 결함이있는 것 같습니다 . 내가 올바르게 이해하면 최대 걸립니다 length * occurrence-count. 그러나 1113311133933933933933예를 들어 같은 테스트 사례의 경우 111는 (3 * 2 = 6)이고 33(2 * 6 = 12)입니다. 따라서 최소 두 번 이상 발생하는 것이 33아니라 가장 높은 발생을 출력 합니다 111. 또한 Java 10에서 var r="";for(;O-->0;)r+=D;return r;골프를 타 for(;O-->0;)System.out.print(D);거나 Java 11에서 더 짧아 질 수 있습니다 return(D+"").repeat(O);.
Kevin Cruijssen

@KevinCruijssen 나는 그것을 고쳤다 고 생각한다.
Olivier Grégoire

그것은 실제로 더 좋고, 동시에 바이트를 골프 질하는 좋은 방법으로 보입니다. 설명을 업데이트하는 것을 잊었습니다. 그리고 1 바이트를 더 변경 int X[][]=new int[10][99],d,l=99,하여로 변경할 수 int l=99,X[][]=new int[10][l],d,있습니다.
Kevin Cruijssen

@KevinCruijssen 감사합니다! 나 d++<9대신 쓰기로 1 바이트 더 골프를 쳤다 ++d<10. 나머지는 죄송합니다 : 오늘 피곤합니다 = _ =
Olivier Grégoire


루비 , 68 67 바이트

->a{(b=a.chunk &:+@).max_by{|x|[(c=b.count x)<2?0:x[1].size,c]}[1]}

온라인으로 사용해보십시오!

문자 배열을 입력 및 출력합니다.

이 접근 방식은 매우 간단합니다. 연속 숫자의 런을 식별하고 ( chunk단항 +을 항등 함수로 사용) 런의 크기를 기준으로 최대 값을 취합니다 (발생 횟수가 <2 인 경우 0으로 재설정). .


PCRE, 152 바이트


https://regex101.com/r/0U0dEp/1 에서 실제로 확인하십시오 (각 테스트 사례에서 첫 번째 일치 항목 만보십시오).

정규식은 그 자체로는 실제 프로그래밍 언어가 아니며 솔루션은 제한되어 있기 때문에 이것은 재미 있습니다 .P

폭이 0 인 그룹 (?:)+은 한 번만 일치하고 무한정 반복되지 않으며 PCRE가 내부적으로 그룹의 사본을 한계로 수량화하기 때문에 거기에 마법 번호 ( "{1,592}")를 사용해야했습니다. 즉, 현재 검사중인 것보다 더 긴 경쟁 세트를 찾기 위해 최대 592 개의 연속 된 자릿수 세트 만 미리 볼 수 있습니다. 이 개념에 대한 자세한 내용은 여기를 참조하십시오 .


펄 5 , 88 바이트

my($m,%s);++$i%2*$s{$_}++&&($n=$s{$_}/9+length)>$m&&($a=$_,$m=$n)for pop=~/((.)\2*)/g;$a

온라인으로 사용해보십시오!

다음과 같은 테스트를 통해 약간 풀리지 않습니다.

sub f {
  my($i,$n,$a);           #not needed in golfed version
  ++$i % 2  *  $s{$_}++
  && ($n=$s{$_}/9+length) > $m
  && ($a=$_, $m=$n)
    for pop=~/((.)\2*)/g; #i.e. 7888885466662716666 => 7 88888 5 4 6666 2 7 1 6666
for(map[/\d+/g],split/\n/,join"",<DATA>){ #tests
  printf "%-6s   input %-24s   expected %-10s   got %s\n",
    (grep f($i) eq $_, @e) ? "Ok" : "Not ok", $i, join('|',@e), f($i);
Input:  7888885466662716666     Output: 6666
Input:  3331113331119111        Output: 111
Input:  777333777333            Output: 777|333
Input:  122222233433            Output: 33
Input:  811774177781382         Output: 8
Input:  555153333551            Output: 1
Input:  12321                   Output: 1|2
Input:  944949949494999494      Output: 4
Input:  8888858888866656665666  Output: 88888
Input:  1112221112221111        Output: 111|222


Wolfram Language (Mathematica) , 67 바이트


순수한 기능. 숫자 목록을 입력으로 취하고 하위 순서 목록 (특정 순서는 아님)을 출력으로 리턴합니다. "적어도 두 번 나타나야합니다"절을보다 명확하게 처리 할 수 ​​있는지 확실하지 않습니다. 온라인으로 사용해보십시오!

TIO 링크를 추가 할 수 있습니까?
Kevin Cruijssen

정말로 고집한다면 ...

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.