«strings» 태그된 질문

일련의 기호, 그 집합 및 속성 및 용도에 대한 질문.

2
빠른 맞춤법 검사기를 구축하기위한 효율적인 데이터 구조
꽤 큰 사전에서 작동하는 맞춤법 검사기를 작성하려고합니다. 철자가 틀린 단어에 가장 가까운 단어를 결정하기 위해 Damerau-Levenshtein 거리를 사용하여 사전 데이터를 효율적으로 색인화하는 효율적인 방법을 원합니다 . 공간 복잡성과 런타임 복잡성 사이에서 최상의 절충안을 제공하는 데이터 구조를 찾고 있습니다. 인터넷에서 찾은 내용에 따라 사용할 데이터 구조 유형에 대한 몇 가지 리드가 …

5
재미있는 아나그램 찾기
말 그 및 같은 길이의 두 개의 문자열입니다. anagramming 개의 스트링은 전단 사 사상이다 되도록 각각 .b 1 b 2 … b na1a2…an에이1에이2…에이엔a_1a_2\ldots a_nb1b2…bn비1비2…비엔b_1b_2\ldots b_na i = b p ( i ) ip:[1…n]→[1…n]피:[1…엔]→[1…엔]p:[1\ldots n]\to[1\ldots n]ai=bp(i)에이나는=비피(나는)a_i = b_{p(i)}i나는i 동일한 문자열 쌍에 대해 둘 이상의 분석이있을 수 있습니다. 예를 들어, 'abcab` 및 …

1
이러한 문자열 연산을 지원하는 '문자열 스택'데이터 구조가 있습니까?
다음 작업을 수행 할 수 있는 문자 집합 위에 문자열 집합을 저장하는 데이터 구조를 찾고 있습니다. 우리 나타내고 문자열 집합 데이터 저장 구조로서 .ΣΣ\SigmaD(S)D(S)\mathcal{D}(S)SSS Add-Prefix-Set에 : 일부 설정 주어진 크기 상수에 의해 제한되고, 그 문자열의 길이 상수에 의해 제한되는 문자열 (비어)의, 반환 . 이 경계 상수는 모두 전역입니다. 모든 입력 …

1
문자열에서 가장 긴 반복 (산란) 서브 시퀀스
비공식 문제 설명 : 과 같은 문자열이 주어지면, 왼쪽에서 오른쪽으로 빨간색 글자 만 읽으면 파란색 글자 만 읽는 것과 같은 결과를 얻을 수 있도록 일부 글자는 빨간색으로, 일부 글자는 파란색으로 칠하고 (일부는 전혀 아님) 색을 지정하려고합니다.ACCABBABACCABBABACCABBAB 이 예에서는ACCABBABACCABBABA\color{blue}{C}\color{red}{CAB}B\color{blue}{AB} 따라서 는 의 반복되는 하위 시퀀스입니다 . 또한 가장 긴 반복 하위 …

2
대략적인 조회를 지원하는 효율적인 맵 데이터 구조
필자는 효율적인 근사 키 조회 (예 : 문자열의 레 벤슈 테인 거리)를 지원하여 입력 키에 가장 근접한 일치를 반환하는 데이터 구조를 찾고 있습니다. 지금까지 내가 찾은 가장 적합한 데이터 구조는 Burkhard-Keller 나무 이지만이 목적을 위해 다른 / 더 나은 데이터 구조가 있는지 궁금합니다. 편집 : 내 특정 사례에 대한 자세한 …

1
도메인 이름 압축
이 질문은 Computer Science Stack Exchange에서 답변을 얻을 수 있기 때문에 Stack Overflow에서 마이그레이션 되었습니다. 7 년 전에 이주했습니다 . 나는 사람이 수 방법에 대한 궁금 매우 컴팩트 임의의 도메인 압축 IDN의 (에 의해 정의 된 호스트 이름을 RFC5890 )과 흥미로운 도전이 될 수이 의심. 유니 코드 호스트 또는 도메인 …

1
충분히 큰 문자열이 반복됩니까?
하자 고정 된 크기의 일부 문자 유한 집합합니다. α 를 Σ에 대한 문자열로 하자 . 우리는 비어 있지 않은 문자열 말 β 의 α는 A는 반복 경우 β = γ γ 일부 문자열에 대한 γ .ΣΣ\Sigmaαα\alphaΣΣ\Sigmaββ\betaαα\alphaβ=γγβ=γγ\beta = \gamma \gammaγγ\gamma 이제 내 질문은 다음과 같은 내용입니다. 모든 들어 일부가 존재 N …

1
Ukkonen 알고리즘의 런타임은 알파벳 크기에 어떻게 의존합니까?
나는 Ukkonen 알고리즘의 점근 적 실행 시간에 대한 문제에 관심이 있습니다. 아마도 선형 (?) 시간에 접미사 트리 를 구성하는 가장 인기있는 알고리즘 일 것 입니다. Dan Gusfield (섹션 6.5.1)의 "문자열, 나무 및 시퀀스에 대한 알고리즘"책에서 인용 한 내용은 다음과 같습니다. "... Aho-Corasick, Weiner, Ukkonen 및 McCreight 알고리즘은 모두 공간이 필요하거나 …

3
스트링 절단에 대한 동적 프로그래밍 연습
나는이 책 에서 다음과 같은 문제를 연구하고 있다 . 특정 문자열 처리 언어는 문자열을 두 조각으로 나누는 기본 연산을 제공합니다. 이 작업에는 원본 문자열을 복사하는 작업이 포함되므로 절단 위치에 관계없이 길이가 n 인 문자열에 n 시간이 걸립니다. 이제 문자열을 여러 조각으로 나누고 싶다고 가정하십시오. 나누기 순서는 총 실행 시간에 영향을 …


1
고유 한 요소로 목록 거리 편집
리스트 사이의 레 벤슈 테인-거리 편집 거리는 잘 연구 된 문제입니다. 그러나 각 목록에서 요소가 두 번 이상 발생하지 않는 것으로 알려진 경우 가능한 개선 사항을 많이 찾을 수 없습니다 . 또한 요소가 비교 가능하고 정렬 가능한 것으로 가정합니다 (그러나 비교할 목록은 처음부터 정렬되지 않습니다). O ( 분 ( S …

2
Aho-Corasick 알고리즘과 Rabin-Karp 알고리즘의 비교
여러 패턴 검색을 지원하는 문자열 검색 알고리즘을 연구 중입니다. 실행 시간 측면에서 가장 강력한 후보 인 Aho-Corasick 및 Rabin-Karp 두 알고리즘을 발견했습니다 . 그러나 두 알고리즘 사이의 포괄적 인 비교를 찾을 수 없었습니다. 어떤 알고리즘이 더 효율적입니까? 또한 병렬 컴퓨팅 및 다중 패턴 검색에 더 적합한 것은 무엇입니까? 마지막으로 어떤 …

5
O (n) 복잡성의 순서를 갖는 단어 빈도
Java 개발자 입장 인터뷰에서 다음과 같은 질문을 받았습니다. 두 가지 매개 변수를 취하는 함수를 작성하십시오. 텍스트 문서를 나타내는 String 반환 할 항목 수를 제공하는 정수 가장 자주 발생하는 단어 인 단어 빈도별로 정렬 된 문자열 목록을 반환하도록 함수를 구현하십시오. 솔루션은 시간에 실행되어야합니다. 여기서 은 문서의 문자 수입니다.O(n)O(n)O(n)nnn 다음은 내가 의사 …

1
가장 긴 피보나치 부분 문자열을 찾기위한 순진한 알고리즘의 복잡성
두 개의 기호 와 b가 주어지면 k 번째 피보나치 문자열을 다음과 같이 정의합시다 .aa\text{a}bb\text{b}kkk F(k)=⎧⎩⎨baF(k−1)⋆F(k−2)if k=0if k=1elseF(k)={bif k=0aif k=1F(k−1)⋆F(k−2)else F(k) = \begin{cases} \text{b} &\mbox{if } k = 0 \\ \text{a} &\mbox{if } k = 1 \\ F(k-1) \star F(k-2) &\mbox{else} \end{cases} 와 문자열 연결을 나타내는.⋆⋆\star 따라서 우리는 : F(0)=bF(0)=bF(0) = …

2
빠른 k 불일치 문자열 매칭 알고리즘
빠른 k- 미스 매치 문자열 일치 알고리즘을 찾고 있습니다. 길이가 m 인 패턴 문자열 P와 길이가 n 인 텍스트 문자열 T가 주어지면 P가 최대 k 개의 일치하지 않는 T의 하위 문자열과 일치하는 모든 위치를 찾으려면 빠른 (선형 시간) 알고리즘이 필요합니다. 이것은 k- 차이 문제 (편집 거리)와 다릅니다. 불일치는 하위 문자열을 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.