단어 목록에 대한 PostgreSQL 와일드 카드 LIKE


156

~ 25 단어의 간단한 목록이 있습니다. PostgreSQL에 varchar 필드가 ['foo', 'bar', 'baz']있습니다. list가이라고 가정 해 봅시다 . 내 테이블에서 해당 단어가있는 행을 찾고 싶습니다. 이것은 효과가 있지만 더 우아한 것을 원합니다.

select *
from table
where (lower(value) like '%foo%' or lower(value) like '%bar%' or lower(value) like '%baz%')

답변:


165

SIMILAR TO교체를 지원 하는 Postgres 연산자를 사용할 수 있습니다.

select * from table where lower(value) similar to '%(foo|bar|baz)%';

1
정규식은 이것을 조금 더 빠르게 할 수있다 : dba.stackexchange.com/questions/10694/…
대략적인

당신은 그것을 어떻게 압니까? 내가 읽은 대부분의 문서에 따르면 정규 표현식이 느리고 %가
비슷하다고합니다

5
에 따르면 dba.stackexchange.com/a/10696/27757 SIMILAR TO 내부적으로 정규식 검색에 번역
마크 K 코완

내가 사용하는 생각 lower()이 먼저 각 단지 대소 문자를 구별 경기보다 더 많은 비용이 많이 드는 소문자 문자열로 변환하기 (위해) 때문에, 효과가
길 라드 mayani

228

PostgreSQL은 전체 POSIX 정규 표현식 도 지원합니다 .

select * from table where value ~* 'foo|bar|baz';

~*소문자를 구분하지 일치를 들면, ~대소 문자를 구분합니다.

또 다른 옵션은 ANY 를 사용하는 것입니다 .

select * from table where value  like any (array['%foo%', '%bar%', '%baz%']);
select * from table where value ilike any (array['%foo%', '%bar%', '%baz%']);

부울을 생성하는 모든 연산자와 함께 ANY를 사용할 수 있습니다. 정규식 옵션이 더 빠를 것이라고 생각하지만 ANY는 도구 상자에 유용한 도구입니다.


흥미롭게도,이 두 가지 방법 모두 @chmullig 솔루션 (+ +)보다 우아하지만 적어도 3 개의 옵션을 검사 할 때 큰 테이블 (제 경우 9,150 만 레코드)에서 상당히 느리게 실행됩니다. 이들 중 하나를 사용할 때 시간이 약 2 배 증가하는 것을 보았습니다. 왜 그런지 아십니까?
sage88

@ sage88 머리 꼭대기를 모르지만 Erwin Brandstetter 가 도움 이 될 수 있고 trigram 색인을 추가하는 것이 도움이 될 수 있습니다.
mu는 너무 짧습니다

13

실제로 PostgreSQL에는 해당 연산자가 있습니다.

SELECT *
FROM table
WHERE lower(value) ~~ ANY('{%foo%,%bar%,%baz%}');

6
~~에 대한 또 다른 이름입니다 like: "운영자가 ~~에 해당 LIKE하고, ~~*대응에 ILIKE가도 있습니다. !~~그리고 !~~*대표 운영자 NOT LIKENOT ILIKE각각이 연산자의 모든 PostgreSQL을 특정합니다.." . 그리고 '{%foo%,%bar%,%baz%}'의 텍스트 형식입니다 array['%foo%', '%bar%', '%baz%'].
mu는 너무 짧습니다

그래서 수 ILIKE가 함께 사용할 수 있는 동일한 방법 및 배열? 멋진 정규식이 필요하지 않으면 깨끗해 보입니다. 아니면 어쨌든 내부적으로 정규식으로 변환됩니까?
mlt

@mlt 그것은 좋은 질문입니다. 문서를 읽는 것은 명확한 대답을 제공하지 않습니다. SIMILAR TO정규식으로 변환하는 ~연산자는 POSIX 정규식을 나타내지 만 명확하지는 않습니다 LIKE.
jlandercy

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.