SQL SELECT WHERE 필드에는 단어가 포함됩니다


562

다음과 같은 결과를 반환하는 선택이 필요합니다.

SELECT * FROM MyTable WHERE Column1 CONTAINS 'word1 word2 word3'

그리고 나는 모든 결과가 필요합니다. 즉, 'word2 word3 word1'또는 'word1 word3 word2'또는 다른 세 가지 조합을 가진 문자열을 포함합니다.

모든 단어가 결과에 있어야합니다.

답변:


843

다소 느리지 만 단어 를 포함 하는 효과적인 방법 :

SELECT * FROM mytable
WHERE column1 LIKE '%word1%'
   OR column1 LIKE '%word2%'
   OR column1 LIKE '%word3%'

모든 단어가 필요하면 다음을 사용하십시오.

SELECT * FROM mytable
WHERE column1 LIKE '%word1%'
  AND column1 LIKE '%word2%'
  AND column1 LIKE '%word3%'

더 빠른 것을 원하면 전체 텍스트 검색을 살펴 봐야하며 이는 각 데이터베이스 유형에 따라 매우 다릅니다.


3
+ 1 느리다는 데 동의하지만 인덱싱을
잘하면

12
와일드 카드로 시작하는 LIKE를 검색 할 때 @PreetSangha Indexing? 방법을 보여주세요!
Popnoodles

1
PostgreSQL 9.1 이상에서는 이러한 검색을 색인화 할 수있는 trigram 색인을 만들 수 있습니다 .
mvp

2
@AquaAlex : 텍스트에가 있으면 문이 실패합니다 word3 word2 word1.
mvp

3
이 접근법의 또 다른 단점은 '% word %'는 '단어', '크로스 워드 퍼즐'및 '소드'(예를 들어)를 찾는 것입니다. 정확한 단어 일치를 찾으려면 column1 LIKE 'word'또는 column1 LIKE 'word %'또는 column1 LIKE '% word'또는 column1 LIKE 'word'를 수행해야합니다. 단어가 일치하지 않는 항목에 대해서는 여전히 실패합니다. 공백으로 분리되었습니다.
BlaM

81

LIKE문자열이 다른 문자열의 하위 문자열인지 확인하는 데 사용 하는 경우 검색 문자열에서 패턴 일치 문자를 이스케이프해야합니다.

SQL 언어가을 지원 CHARINDEX하면 대신 사용하는 것이 훨씬 쉽습니다.

SELECT * FROM MyTable
WHERE CHARINDEX('word1', Column1) > 0
  AND CHARINDEX('word2', Column1) > 0
  AND CHARINDEX('word3', Column1) > 0

또한이 답변과 허용되는 답변의 방법은 단어 일치가 아닌 하위 문자열 일치에만 적용됩니다. 예를 들어 문자열 'word1word2word3'은 여전히 ​​일치합니다.


1
검색어가 검색 전에 '%'문자를 추가하지 않고 변수 인 경우 훨씬 쉬워 보입니다
ShaneBlake

4
Microsoft SQL Server 및 엔진에서는 InStr()대신 사용해야 합니다CHARINDEX
23W

6
@ 23W MS SQL에는 InStr이 없습니다
Romano Zumbé

19

함수

 CREATE FUNCTION [dbo].[fnSplit] ( @sep CHAR(1), @str VARCHAR(512) )
 RETURNS TABLE AS
 RETURN (
           WITH Pieces(pn, start, stop) AS (
           SELECT 1, 1, CHARINDEX(@sep, @str)
           UNION ALL
           SELECT pn + 1, stop + 1, CHARINDEX(@sep, @str, stop + 1)
           FROM Pieces
           WHERE stop > 0
      )

      SELECT
           pn AS Id,
           SUBSTRING(@str, start, CASE WHEN stop > 0 THEN stop - start ELSE 512 END) AS Data
      FROM
           Pieces
 )

질문

 DECLARE @FilterTable TABLE (Data VARCHAR(512))

 INSERT INTO @FilterTable (Data)
 SELECT DISTINCT S.Data
 FROM fnSplit(' ', 'word1 word2 word3') S -- Contains words

 SELECT DISTINCT
      T.*
 FROM
      MyTable T
      INNER JOIN @FilterTable F1 ON T.Column1 LIKE '%' + F1.Data + '%'
      LEFT JOIN @FilterTable F2 ON T.Column1 NOT LIKE '%' + F2.Data + '%'
 WHERE
      F2.Data IS NULL

2
우수! 이 기능에 대해 배우기 시작하는 방법, 선생님? 조각이란 무엇입니까? 이 줄에 대한 의사 코드를 알려주시겠습니까? SUBSTRING (@str, start, CASE WHEN stop> 0 THEN stop-start ELSE 512 END) AS Data
Khaneddy2013

2
이 움직임은 믿어지지 않았으며, 나는 정말 질투했습니다. + F2.Data + '%'
Ahmad Alkaraki

13

대신 SELECT * FROM MyTable WHERE Column1 CONTAINS 'word1 word2 word3'다음과 같은 단어 사이에 And를 추가하십시오.

SELECT * FROM MyTable WHERE Column1 CONTAINS 'word1 And word2 And word3'

자세한 내용은 여기 ( https://msdn.microsoft.com/en-us/library/ms187787.aspx )를 참조하십시오.

최신 정보

문구를 선택하려면 다음과 같이 큰 따옴표를 사용하십시오.

SELECT * FROM MyTable WHERE Column1 CONTAINS '"Phrase one" And word2 And "Phrase Two"'

ps 포함 키워드를 사용하기 전에 먼저 테이블에서 전체 텍스트 검색을 활성화해야합니다. 자세한 내용은 https://docs.microsoft.com/en-us/sql/relational-databases/search/get-started-with-full-text-search를 참조하십시오.


8
SELECT * FROM MyTable WHERE 
Column1 LIKE '%word1%'
AND Column1 LIKE '%word2%'
AND Column1 LIKE  '%word3%'

질문 편집 ORAND기준으로 변경 되었습니다 .


모든 단어를 조합하여 결과에 포함시켜야합니다.
Mario M

4

당신이 사용하는 경우 Oracle 데이터베이스 당신은 사용이 달성 할 수있는 포함 쿼리를. 쿼리가 쿼리보다 빠릅니다.

모든 단어가 필요한 경우

SELECT * FROM MyTable WHERE CONTAINS(Column1,'word1 and word2 and word3', 1) > 0

당신이 단어 중 하나가 필요한 경우

SELECT * FROM MyTable WHERE CONTAINS(Column1,'word1 or word2 or word3', 1) > 0

열에 CONTEXT 유형의 인덱스가 필요 합니다.

CREATE INDEX SEARCH_IDX ON MyTable(Column) INDEXTYPE IS CTXSYS.CONTEXT

1
@ downvoters 답변에 어떤 문제가 있는지 의견을 보내 주셔서 감사합니다. 이 같은 쿼리는 문제 :)없이, 우리의 엔터프라이즈 솔루션에 하루에 1000 개 이상의 배를 실행
mirmdasif

2
OP는 사용중인 데이터베이스를 지정하지 않으며 모든 사람이 Sql Server라고 가정했습니다. 그러나 귀하가 귀하의 답변에 Oracle을 명시했기 때문에 다운 보터를 이해하지 못합니다.
EAmez

4

당신은 단지 일치를 찾으려면.

SELECT * FROM MyTable WHERE INSTR('word1 word2 word3',Column1)<>0

SQL 서버 :

CHARINDEX(Column1, 'word1 word2 word3', 1)<>0

정확히 일치합니다. 예 (';a;ab;ac;',';b;')는 일치하지 않습니다.

SELECT * FROM MyTable WHERE INSTR(';word1;word2;word3;',';'||Column1||';')<>0

1
'INSTR'은 인식 된 내장 함수 이름이 아닙니다. 내 SQL Server에서.
Durgesh Pandey

0

MS SQL Server의 전체 텍스트 색인에서 "tesarus search"를 사용하십시오. 수백만 개의 레코드가있는 경우 검색에서 "%"를 사용하는 것보다 훨씬 좋습니다. tesarus는 다른 것보다 적은 양의 메모리를 사용합니다. 이 기능을 검색하십시오 :)


0

가장 좋은 방법은 테이블의 열에 전체 텍스트 인덱스를 만들고 LIKE 대신 포함을 사용하는 것입니다.

SELECT * FROM MyTable WHERE 
contains(Column1 , N'word1' )
AND contains(Column1 , N'word2' )
AND contains(Column1 , N'word3' )

0

대신 "in"을 사용하지 않는 이유는 무엇입니까?

Select *
from table
where columnname in (word1, word2, word3)

2
작동하지 않기 때문입니다. 실제로 사용해 보셨습니까?
mvp

2
나는 이것이 정확히 일치하는 것을 반환 할 것이라고 믿습니다.
Murray

1
나는 또한 원래의 질문을 오해했다 : 그들은 정확하게 일치하는 것을 찾고 싶지 않지만 단어는 (더 큰) 큰 문자열의 일부입니다. 보다 간단한 "정확한 일치"사례의 경우, 단어가 작은 따옴표 사이에있는 경우 (참조 : SQLfiddle )
sc28

0

질문에 언급 된 것을 달성하는 가장 쉬운 방법 중 하나는 CONTAINS 를 NEAR 또는 '~'와 함께 사용하는 것입니다 . 예를 들어 다음 쿼리는 특히 word1, word2 및 word3을 포함하는 모든 열을 제공합니다.

SELECT * FROM MyTable WHERE CONTAINS(Column1, 'word1 NEAR word2 NEAR word3')

SELECT * FROM MyTable WHERE CONTAINS(Column1, 'word1 ~ word2 ~ word3')

또한 CONTAINSTABLE은 "word1", "word2"및 "word3"의 근접성에 따라 각 문서의 순위를 반환합니다. 예를 들어, 문서에 "word1은 word2와 word3"이라는 문장이 포함되어 있으면 용어가 다른 문서보다 서로 더 가깝기 때문에 순위가 높습니다.

추가하고 싶은 또 다른 사항은 근접 단어를 사용하여 단어가 열 구 내부의 특정 거리 내에있는 열을 찾을 수 있다는 것입니다.


0

이것은 SQL Server 전체 텍스트 검색을 사용하는 것이 이상적입니다. 그러나 어떤 이유로 든 DB에서 작업 할 수없는 경우 다음과 같은 성능 집약적 솔루션이 있습니다.

-- table to search in
CREATE TABLE dbo.myTable
    (
    myTableId int NOT NULL IDENTITY (1, 1),
    code varchar(200) NOT NULL, 
    description varchar(200) NOT NULL -- this column contains the values we are going to search in 
    )  ON [PRIMARY]
GO

-- function to split space separated search string into individual words
CREATE FUNCTION [dbo].[fnSplit] (@StringInput nvarchar(max),
@Delimiter nvarchar(1))
RETURNS @OutputTable TABLE (
  id nvarchar(1000)
)
AS
BEGIN
  DECLARE @String nvarchar(100);

  WHILE LEN(@StringInput) > 0
  BEGIN
    SET @String = LEFT(@StringInput, ISNULL(NULLIF(CHARINDEX(@Delimiter, @StringInput) - 1, -1),
    LEN(@StringInput)));
    SET @StringInput = SUBSTRING(@StringInput, ISNULL(NULLIF(CHARINDEX
    (
    @Delimiter, @StringInput
    ),
    0
    ), LEN
    (
    @StringInput)
    )
    + 1, LEN(@StringInput));

    INSERT INTO @OutputTable (id)
      VALUES (@String);
  END;

  RETURN;
END;
GO

-- this is the search script which can be optionally converted to a stored procedure /function


declare @search varchar(max) = 'infection upper acute genito'; -- enter your search string here
-- the searched string above should give rows containing the following
-- infection in upper side with acute genitointestinal tract
-- acute infection in upper teeth
-- acute genitointestinal pain

if (len(trim(@search)) = 0) -- if search string is empty, just return records ordered alphabetically
begin
 select 1 as Priority ,myTableid, code, Description from myTable order by Description 
 return;
end

declare @splitTable Table(
wordRank int Identity(1,1), -- individual words are assinged priority order (in order of occurence/position)
word varchar(200)
)
declare @nonWordTable Table( -- table to trim out auxiliary verbs, prepositions etc. from the search
id varchar(200)
)

insert into @nonWordTable values
('of'),
('with'),
('at'),
('in'),
('for'),
('on'),
('by'),
('like'),
('up'),
('off'),
('near'),
('is'),
('are'),
(','),
(':'),
(';')

insert into @splitTable
select id from dbo.fnSplit(@search,' '); -- this function gives you a table with rows containing all the space separated words of the search like in this e.g., the output will be -
--  id
-------------
-- infection
-- upper
-- acute
-- genito

delete s from @splitTable s join @nonWordTable n  on s.word = n.id; -- trimming out non-words here
declare @countOfSearchStrings int = (select count(word) from @splitTable);  -- count of space separated words for search
declare @highestPriority int = POWER(@countOfSearchStrings,3);

with plainMatches as
(
select myTableid, @highestPriority as Priority from myTable where Description like @search  -- exact matches have highest priority
union                                      
select myTableid, @highestPriority-1 as Priority from myTable where Description like  @search + '%'  -- then with something at the end
union                                      
select myTableid, @highestPriority-2 as Priority from myTable where Description like '%' + @search -- then with something at the beginning
union                                      
select myTableid, @highestPriority-3 as Priority from myTable where Description like '%' + @search + '%' -- then if the word falls somewhere in between
),
splitWordMatches as( -- give each searched word a rank based on its position in the searched string
                     -- and calculate its char index in the field to search
select myTable.myTableid, (@countOfSearchStrings - s.wordRank) as Priority, s.word,
wordIndex = CHARINDEX(s.word, myTable.Description)  from myTable join @splitTable s on myTable.Description like '%'+ s.word + '%'
-- and not exists(select myTableid from plainMatches p where p.myTableId = myTable.myTableId) -- need not look into myTables that have already been found in plainmatches as they are highest ranked
                                                                              -- this one takes a long time though, so commenting it, will have no impact on the result
),
matchingRowsWithAllWords as (
 select myTableid, count(myTableid) as myTableCount from splitWordMatches group by(myTableid) having count(myTableid) = @countOfSearchStrings
)
, -- trim off the CTE here if you don't care about the ordering of words to be considered for priority
wordIndexRatings as( -- reverse the char indexes retrived above so that words occuring earlier have higher weightage
                     -- and then normalize them to sequential values
select s.myTableid, Priority, word, ROW_NUMBER() over (partition by s.myTableid order by wordindex desc) as comparativeWordIndex 
from splitWordMatches s join matchingRowsWithAllWords m on s.myTableId = m.myTableId
)
,
wordIndexSequenceRatings as ( -- need to do this to ensure that if the same set of words from search string is found in two rows,
                              -- their sequence in the field value is taken into account for higher priority
    select w.myTableid, w.word, (w.Priority + w.comparativeWordIndex + coalesce(sequncedPriority ,0)) as Priority
    from wordIndexRatings w left join 
    (
     select w1.myTableid, w1.priority, w1.word, w1.comparativeWordIndex, count(w1.myTableid) as sequncedPriority
     from wordIndexRatings w1 join wordIndexRatings w2 on w1.myTableId = w2.myTableId and w1.Priority > w2.Priority and w1.comparativeWordIndex>w2.comparativeWordIndex
     group by w1.myTableid, w1.priority,w1.word, w1.comparativeWordIndex
    ) 
    sequencedPriority on w.myTableId = sequencedPriority.myTableId and w.Priority = sequencedPriority.Priority
),
prioritizedSplitWordMatches as ( -- this calculates the cumulative priority for a field value
select  w1.myTableId, sum(w1.Priority) as OverallPriority from wordIndexSequenceRatings w1 join wordIndexSequenceRatings w2 on w1.myTableId =  w2.myTableId 
where w1.word <> w2.word group by w1.myTableid 
),
completeSet as (
select myTableid, priority from plainMatches -- get plain matches which should be highest ranked
union
select myTableid, OverallPriority as priority from prioritizedSplitWordMatches -- get ranked split word matches (which are ordered based on word rank in search string and sequence)
),
maximizedCompleteSet as( -- set the priority of a field value = maximum priority for that field value
select myTableid, max(priority) as Priority  from completeSet group by myTableId
)
select priority, myTable.myTableid , code, Description from maximizedCompleteSet m join myTable  on m.myTableId = myTable.myTableId 
order by Priority desc, Description -- order by priority desc to get highest rated items on top
--offset 0 rows fetch next 50 rows only -- optional paging

-2
SELECT * FROM MyTable WHERE Column1 Like "*word*"

column1부분 값이 포함 된 모든 레코드가 표시됩니다 word.


-2
DECLARE @SearchStr nvarchar(100)
SET @SearchStr = ' '



CREATE TABLE #Results (ColumnName nvarchar(370), ColumnValue nvarchar(3630))

SET NOCOUNT ON

DECLARE @TableName nvarchar(256), @ColumnName nvarchar(128), @SearchStr2 nvarchar(110)
SET  @TableName = ''
SET @SearchStr2 = QUOTENAME('%' + @SearchStr + '%','''')

WHILE @TableName IS NOT NULL

BEGIN
    SET @ColumnName = ''
    SET @TableName = 
    (
        SELECT MIN(QUOTENAME(TABLE_SCHEMA) + '.' + QUOTENAME(TABLE_NAME))
        FROM     INFORMATION_SCHEMA.TABLES
        WHERE         TABLE_TYPE = 'BASE TABLE'
            AND    QUOTENAME(TABLE_SCHEMA) + '.' + QUOTENAME(TABLE_NAME) > @TableName
            AND    OBJECTPROPERTY(
                    OBJECT_ID(
                        QUOTENAME(TABLE_SCHEMA) + '.' + QUOTENAME(TABLE_NAME)
                         ), 'IsMSShipped'
                           ) = 0
    )

    WHILE (@TableName IS NOT NULL) AND (@ColumnName IS NOT NULL)

    BEGIN
        SET @ColumnName =
        (
            SELECT MIN(QUOTENAME(COLUMN_NAME))
            FROM     INFORMATION_SCHEMA.COLUMNS
            WHERE         TABLE_SCHEMA    = PARSENAME(@TableName, 2)
                AND    TABLE_NAME    = PARSENAME(@TableName, 1)
                AND    DATA_TYPE IN ('char', 'varchar', 'nchar', 'nvarchar', 'int', 'decimal')
                AND    QUOTENAME(COLUMN_NAME) > @ColumnName
        )

        IF @ColumnName IS NOT NULL

        BEGIN
            INSERT INTO #Results
            EXEC
            (
                'SELECT ''' + @TableName + '.' + @ColumnName + ''', LEFT(' + @ColumnName + ', 3630) FROM ' + @TableName + ' (NOLOCK) ' +
                ' WHERE ' + @ColumnName + ' LIKE ' + @SearchStr2
            )
        END
    END   
END

SELECT ColumnName, ColumnValue FROM #Results

DROP TABLE #Results

2
이 코드 스 니펫은 제한적이고 즉각적인 도움이 될 수 있습니다. 적절한 설명은 크게 장기 가치를 향상 할 보여줌으로써 이 문제에 대한 좋은 해결책이고, 다른 유사한 질문을 미래의 독자들에게 더 유용 할 것입니다. 제발 편집 당신이 만든 가정 등 일부 설명을 추가 할 답변을.
Mogsdad

-5
select * from table where name regexp '^word[1-3]$'

또는

select * from table where name in ('word1','word2','word3')

3
"regexp"는 표준 SQL입니까?
Peter Mortensen

2
두 번째 쿼리의 경우 단어를 인용해서는 안됩니까?
Peter Mortensen

1
이 코드는 열 세 단어 중 하나 와 같은지 확인하는 것 같습니다 . 문제는 열에 세 단어 모두 포함되어 있는지 확인하는 것 입니다.
Sam

7
Hiya, 이것은 문제를 해결할 수 있지만 ... 답을 편집 하고 어떻게 그리고 왜 작동하는지에 대한 약간의 설명을 제공 할 수 있다면 좋을 것입니다 :) 잊지 마세요-스택 오버플로에 초보자가 많이 있습니다. 그리고 그들은 당신의 전문 지식에서 한두 가지를 배울 수 있습니다.
Taryn East
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.