소개
RNA는 덜 유명한 DNA의 사촌입니다. 그것의 주요 목적은 번역 이라는 과정을 통해 세포에서 단백질의 생산을 제어하는 것입니다 . 이 과제에서, 당신의 임무는 RNA가 코돈 으로 분리되는이 과정의 일부를 구현하는 것 입니다.
이 과제 는 주제별로 관련되어 있지만 번역 프로세스의 다른 부분에 중점을 둡니다.
코돈
우리는 RNA를 기본 쌍의 알파벳보다 긴 문자열로 생각할 것입니다 AUCG
. 번역에서, RNA는 코돈이라고 불리는 3 개의 염기쌍의 겹치지 않는 덩어리로 나뉩니다. 이 과정은에서 시작 개시 코돈 , AUG
(A)에서, 그리고 끝 정지 코돈 중 하나 UAA
, UAG
또는 UGA
. 각각의 코돈 (정지 코돈을 제외하고)은 아미노산에 상응하고, 결과적인 아미노산 스트링은 단백질을 형성한다.
입력
입력은 비어 있지 않은 RNA 문자열입니다.
산출
결과는 RNA가 합리적인 형식으로 분할 된 코돈 목록입니다. 이 단순화 된 모델에서 프로세스는 출력에 포함 된 가장 왼쪽의 시작 코돈 AUG
에서 시작 합니다. 정지 코돈이 발생하거나 RNA가 부족할 때 종료됩니다. 입력에 시작 코돈이 없으면 출력은 빈 목록이어야합니다.
예
입력 순서를 고려하십시오
ACAUGGAUGGACUGUAACCCCAUGC
구문 분석은의 가장 왼쪽 AUG
에있는 인덱스 2에서 시작 합니다. 다음과 같이 계속됩니다.
AC AUG GAU GGA CUG UAA CCCCAUGC
* ^ ^ ^ +
로 표시된 코돈 *
은 시작 코돈이며로 표시된 코돈 ^
도 출력의 일부입니다. 정지 코돈은로 표시되어 +
있습니다. 올바른 출력은
AUG,GAU,GGA,CUG
짧은 입력
ACAUGGAUGGACUGU
과정은 간다
AC AUG GAU GGA CUG U
* ^ ^ ^
이번에는 중지 코돈이 발생하지 않으므로 기본 쌍이 부족하면 프로세스가 중지됩니다. 출력은 위와 동일합니다.
규칙과 득점
함수의 전체 프로그램을 작성할 수 있습니다. 가장 낮은 바이트 수가 이기고 표준 허점은 허용되지 않습니다.
테스트 사례
GGUACGGAUU ->
GGCGAAAUCGAUGCC -> AUG
ACAUGGAUGGACUGU -> AUG,GAU,GGA,CUG
AUGACGUGAUGCUUGA -> AUG,ACG
UGGUUAGAAUAAUGAGCUAG -> AUG,AGC
ACAUGGAUGGACUGUAACCCCAUGC -> AUG,GAU,GGA,CUG
CUAAGAUGGCAUGAGUAAUGAAUGGAG -> AUG,GCA
AAUGGUUUAAUAAAUGUGAUAUGAUGAUA -> AUG,GUU
UGUCACCAUGUAAGGCAUGCCCAAAAUCAG -> AUG
UAUAGAUGGUGAUGAUGCCAUGAGAUGCAUGUUAAU -> AUG,GUG,AUG,AUG,CCA
AUGCUUAUGAAUGGCAUGUACUAAUAGACUCACUUAAGCGGUGAUGAA -> AUG,CUU,AUG,AAU,GGC,AUG,UAC
UGAUAGAUGUAUGGAUGGGAUGCUCAUAGCUAUAAAUGUUAAAGUUAGUCUAAUGAUGAGUAGCCGAUGGCCUAUGAUGCUGAC -> AUG,UAU,GGA,UGG,GAU,GCU,CAU,AGC,UAU,AAA,UGU