pymongo로 mongodb를 정렬하는 방법


164

mongoDB를 쿼리 할 때 정렬 기능을 사용하려고하는데 실패합니다. 동일한 쿼리가 MongoDB 콘솔에서 작동하지만 여기서는 작동하지 않습니다. 코드는 다음과 같습니다.

import pymongo

from  pymongo import Connection
connection = Connection()
db = connection.myDB
print db.posts.count()
for post in db.posts.find({}, {'entities.user_mentions.screen_name':1}).sort({u'entities.user_mentions.screen_name':1}):
    print post

내가 얻는 오류는 다음과 같습니다.

Traceback (most recent call last):
  File "find_ow.py", line 7, in <module>
    for post in db.posts.find({}, {'entities.user_mentions.screen_name':1}).sort({'entities.user_mentions.screen_name':1},1):
  File "/Library/Python/2.6/site-packages/pymongo-2.0.1-py2.6-macosx-10.6-universal.egg/pymongo/cursor.py", line 430, in sort
  File "/Library/Python/2.6/site-packages/pymongo-2.0.1-py2.6-macosx-10.6-universal.egg/pymongo/helpers.py", line 67, in _index_document
TypeError: first item in each key pair must be a string

pymongo를 사용하는 경우 키 앞에 'u'를 배치해야한다고 말하는 다른 곳의 링크를 찾았지만 작동하지 않습니다. 다른 사람이 이것을 작동 시키거나 버그입니다.

답변:


302

.sort()pymongo에서 keydirection매개 변수로 사용합니다.

정렬 기준으로 사용할 경우 그래서, 말을하자 id당신이해야.sort("_id", 1)

여러 필드의 경우 :

.sort([("field1", pymongo.ASCENDING), ("field2", pymongo.DESCENDING)])

124
.sort([("field1",pymongo.ASCENDING), ("field2",pymongo.DESCENDING)])여러 필드를 정렬합니다.
richardr

4
자세한 내용을 찾고자하는 분들을 위해 다음은 pymongo api.mongodb.org/python/current/api/pymongo/
Shane Reustle

21
참고 : 오름차순 : 1, 내림차순 -1
Martlark

2
그들이 왜 그렇게 쉬운 { "field1": 1, "field2": 1} JSON 표기법을 도살했는지 아십니까?
Nico

2
@Nico-아래 romulomadu 답변 참조
Bajal

34

당신은 이것을 시도 할 수 있습니다 :

db.Account.find().sort("UserName")  
db.Account.find().sort("UserName",pymongo.ASCENDING)   
db.Account.find().sort("UserName",pymongo.DESCENDING)  

17

이것은 또한 작동합니다 :

db.Account.find().sort('UserName', -1)
db.Account.find().sort('UserName', 1)

내 코드에서 이것을 사용하고 있습니다. 여기서 뭔가 잘못하고 있다면 의견을 보내주십시오. 감사합니다.


당신은 사용해야 ASCENDINGDESCENDING에서 pymongo. :)
Sn0pY

7

파이썬이 대신 튜플 목록을 사용하는 이유는 무엇입니까?

파이썬에서는 사전이 선언 한 순서대로 해석 될 것이라고 보장 할 수 없습니다.

따라서 mongo shell .sort({'field1':1,'field2':1})에서 인터프리터는 field1을 첫 번째 레벨에서 필드 2를 두 번째 레벨에서 정렬해야합니다.

이 sintax가 파이썬에서 사용 되었다면, 첫 번째 레벨에서 field2를 정렬 할 기회가 있습니다. 튜플을 사용하면 위험이 없습니다.

.sort([("field1",pymongo.ASCENDING), ("field2",pymongo.DESCENDING)])

1
.sort([("field1",pymongo.ASCENDING), ("field2",pymongo.DESCENDING)])

파이썬은 키, 방향을 사용합니다. 위의 방법을 사용할 수 있습니다.

그래서 당신의 경우에는 이것을 할 수 있습니다

for post in db.posts.find().sort('entities.user_mentions.screen_name',pymongo.ASCENDING):
        print post

0

TLDR : 집계 파이프 라인이 기존의 파이프 라인에 비해 빠릅니다 .find().sort().

이제 실제 설명으로 이동합니다. MongoDB에서 정렬 작업을 수행하는 두 가지 방법이 있습니다.

  1. .find()및 사용 .sort().
  2. 또는 집계 파이프 라인을 사용합니다.

많은 .find (). sort ()에서 제안한 것처럼 정렬을 수행하는 가장 간단한 방법입니다.

.sort([("field1",pymongo.ASCENDING), ("field2",pymongo.DESCENDING)])

그러나 이는 집계 파이프 라인과 비교할 때 느린 프로세스입니다.

집계 파이프 라인 방법으로 왔습니다. 정렬을위한 간단한 집계 파이프 라인을 구현하는 단계는 다음과 같습니다.

  1. $ match (선택적 단계)
  2. $ 정렬

참고 : 내 경험에 따르면 집계 파이프 라인은 .find().sort()방법 보다 약간 빠르게 작동합니다 .

집계 파이프 라인의 예는 다음과 같습니다.

db.collection_name.aggregate([{
    "$match": {
        # your query - optional step
    }
},
{
    "$sort": {
        "field_1": pymongo.ASCENDING,
        "field_2": pymongo.DESCENDING,
        ....
    }
}])

이 방법을 직접 시도하고 속도를 비교하고 의견 에이 사실을 알려주십시오.

편집 : allowDiskUse=True여러 필드를 정렬 하는 동안 사용 하는 것을 잊지 마십시오. 그렇지 않으면 오류가 발생합니다.


0

'created_on'필드를 기준으로 정렬하려고하면 다음과 같이 할 수 있습니다.

.sort('{}'.format('created_on'), 1 if sort_type == 'asc' else -1)
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.