«string-matching» 태그된 질문

1
라빈-카르 프 및 카르 프-라빈
Wikipedia의 현명한 다른 편집자들은 Rabin–Karp 알고리즘 의 Wikipedia 기사를 Rabin–Karp 이름이 더 자주 사용된다는 이유로 Karp–Rabin 알고리즘이라고하는 생각 으로 옮기라 는 요청을 거부 했습니다. 구글 학자의 숫자로 가거나 거짓으로 들린다면 (거의?) 원래 출판 이름 순서는 Karp and Rabin으로, 알파벳 순으로 이론 논문에서와 같이 알파벳 순서로 이동을 요청했습니다. Rabin–Karp 이름 순서의 …

8
레 벤슈 테인 거리를 빠르게 계산
허용되는 단어 (알파벳순으로 정렬 된)와 단어로 구성된 거대한 데이터베이스가 제공되면 Levenshtein 거리 측면에서 주어진 단어와 가장 가까운 데이터베이스에서 단어를 찾으십시오. 물론 순진한 접근 방식은 주어진 단어와 사전의 모든 단어 사이의 레 벤슈 테인 거리를 간단히 계산하는 것입니다 (실제로 거리를 계산하기 전에 데이터베이스에서 이진 검색을 수행 할 수 있음). 이 문제에 …

2
n 차원 패턴 매칭
n 차원 배열 내에서 정확한 n 차원 하위 ​​배열을 찾는 알려진 결과는 무엇입니까? 1D에서는 문자열 일치 문제 일 뿐이며 KMP는 선형 시간으로 처리합니다. 2D 에서이 논문 은 여분의 공간이 거의없는 선형 시간에 수행 될 수 있음을 보여주었습니다. 고정 치수에 대해 선형 시간 최악의 경우에이 문제를 해결할 수 있습니까?

2
이동 조작으로 거리 편집
동기 부여 : 공동 저자가 원고를 편집하고 편집 내용을 명확하게 요약하고 싶습니다. 도구 -like 모든 "DIFF는"당신이 경우에 쓸모없는 경향이 모두 주위에 텍스트를 이동 (예를 들어, 다시 조직 구조) 및 지역 편집을하고. 제대로 이해하기가 정말 어렵습니까? 정의 : 허용되는 작업이 다음과 같은 최소 편집 거리를 찾고 싶습니다. "저렴한"작업 : 단일 문자 …

1
회문으로 덮는 끈
문자열이 주어 하는 회문 커버 서열이다 p_1p_2 \ cdots p_m 단어가 p_i 같은 그 p_1p_2 \ cdots p_m = w 각되도록 p_i가 회문이다.w=σ1σ2…σnw=σ1σ2…σnw=\sigma_1\sigma_2\ldots\sigma_np1p2⋯pmp1p2⋯pmp_1p_2\cdots p_mpipip_ip1p2⋯pm=wp1p2⋯pm=wp_1p_2\cdots p_m = wpipip_i 최소 회문 덮개 크기를 찾는 것이 얼마나 어렵습니까? (이것은 동적 프로그래밍으로 가능한 것으로 보이지만 작동하는지 확실하지 않습니다). 입력이 각각의 회문 길이에 바운드 b …

1
피보나치 단어
나는 오래된 체코 알고리즘 교과서에서 다음과 같은 문제를 겪었고 슬프게도 힌트 나 해결책이 없었습니다. "피보나치 단어를 , , . 여기서 와 는 일반적인 문자입니다. 문자열 (잠재적으로 큰 알파벳 이상) 선형 시간에서 가장 긴 피보나치의 하위 단어를 찾을 수 있습니까? "F0=aF0=aF_{0}=aF1=bF1=bF_{1}=bFn+2=FnFn+1Fn+2=FnFn+1F_{n+2}=F_{n}F_{n+1}aaabbb 나는 이차 시간에 대한 해결책을 알고 있지만 그것을 선형으로 줄일 …

2
문자열 균질화의 복잡성
동기 부여 : 데이터 버전 관리를위한 도구를 개발하는 동안 우리는 정수 세트를 다른 정수 세트로 가져 오는 일련의 변환을 통해 두 세트의 정수를 "확산"하는 알고리즘을 찾아 보았습니다. 우리는 거리를 편집 하고 , 스와핑으로 그룹화하고 , 최소 공통 문자열 파티션 을 연결하는 것으로 보이는 다음과 같은 매우 자연스러운 문제로 그 문제를 …

4
접미사 트리를 사용하여 모든 공통 하위 문자열을 찾을 수 있습니까?
문자열 시퀀스를 비교하기 위해 접미사 트리를 사용하려고합니다. 접미사 트리를 사용하여 가장 긴 공통 하위 문자열 문제에 대한 구현 / 이론을 발견했습니다. 그러나 내가 찾고있는 것은 관련 문제- "모든 공통 하위 문자열"에 대한 토론입니다. 특히, 나는 가장 긴 공통 부분 문자열을 먼저 찾은 다음 이미 찾은 lcs 색인을 포함하지 않는 다음으로 …

3
문자열에서 순열 패턴 일치
느슨하게 말해서 순열 패턴 일치는 다음과 같은 종류의 문제를 처리합니다. 감안 순열 의 S , N 및 σ 에 S의 m 과 m ≤ N , 않는 π 함유 서브 시퀀스 τ 길이의 m 요소에 따라 정렬 σ를 ?ππ\piSnSnS_nσσ\sigmaSmSmS_mm≤nm≤nm\leq nππ\pi ττ\taummmσσ\sigma 예를 들어, 및 σ = ⟨ 2 1 3 …

1
상관없는 패턴 매칭 : 다중 패턴
Kalai의 2 페이지 SODA 논문 은 상관 없음 (한 문자와 일치하는 와일드 카드) 과 패턴 일치를위한 간단하고 효율적인 알고리즘을 제공합니다 . 본질적으로 컨볼 루션만큼 쉽습니다. 그러나 신경 쓰지 않는 여러 패턴을 검색하면 어떻게됩니까 ? 예를 들어 FFT 기반 기술로 어떻게 든 해결할 수 있습니까?

1
와일드 카드 문자열이 세트의 다른 와일드 카드 문자열과 완전히 일치하는지 판별
잠시 동안 나를 괴롭힌 문제가 있습니다. 문자열 이 1과 0 의 시퀀스이고 와일드 카드 문자열 이 1, 0 및? s 의 시퀀스 라고 가정하겠습니다 . 모든 문자열과 와일드 카드 문자열의 길이는 같습니다. 이들은 표준 UNIX 와일드 카드입니다. 10 ?? 1은 10011, 10111 등과 일치합니다. 해당 위치에서 1 또는 0과 일치합니다. …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.