답변:
이 작업을 수행하는 가장 좋은 방법은 업데이트 문서와의 통합 파이프 라인의 사용 할 수 있습니다 버전 4.2 이상에 updateOne
, updateMany
또는 update
수집 방법. 후자는 모든 언어 드라이버가 아니라면 대부분 더 이상 사용되지 않습니다.
버전 4.2에는 $set
에 대한 별칭 인 파이프 라인 단계 연산자 도 도입 되었습니다 $addFields
. 나는 우리가 달성하려고하는 것과 매핑 될 때 $set
여기에서 사용할 것 입니다.
db.collection.<update method>(
{},
[
{"$set": {"name": { "$concat": ["$firstName", " ", "$lastName"]}}}
]
)
3.4+에서는 $addFields
및 $out
집계 파이프 라인 연산자를 사용할 수 있습니다 .
db.collection.aggregate(
[
{ "$addFields": {
"name": { "$concat": [ "$firstName", " ", "$lastName" ] }
}},
{ "$out": "collection" }
]
)
이렇게하면 컬렉션 이 업데이트되지 않고 기존 컬렉션을 교체하거나 새 컬렉션을 만듭니다. 또한 "유형 캐스팅" 이 필요한 업데이트 작업에는 클라이언트 쪽 처리가 필요 하며 작업에 따라 find()
메서드 대신 메서드 를 사용해야합니다 .aggreate()
.
이를 수행하는 방법은 $project
문서를 ing하고 $concat
문자열 집계 연산자를 사용 하여 연결된 문자열을 반환하는 것입니다. 거기에서 우리는, 당신은 다음 반복 커서를 하고 사용 $set
하여 문서에 새로운 필드를 추가하는 업데이트 연산자를 대량 작업을 최대 효율을 위해.
var cursor = db.collection.aggregate([
{ "$project": {
"name": { "$concat": [ "$firstName", " ", "$lastName" ] }
}}
])
이로부터 bulkWrite
메소드 를 사용해야합니다 .
var requests = [];
cursor.forEach(document => {
requests.push( {
'updateOne': {
'filter': { '_id': document._id },
'update': { '$set': { 'name': document.name } }
}
});
if (requests.length === 500) {
//Execute per 500 operations and re-init
db.collection.bulkWrite(requests);
requests = [];
}
});
if(requests.length > 0) {
db.collection.bulkWrite(requests);
}
이 버전에서는 더 이상 사용되지 않는 Bulk
API 및 관련 메소드 를 사용해야합니다 .
var bulk = db.collection.initializeUnorderedBulkOp();
var count = 0;
cursor.snapshot().forEach(function(document) {
bulk.find({ '_id': document._id }).updateOne( {
'$set': { 'name': document.name }
});
count++;
if(count%500 === 0) {
// Excecute per 500 operations and re-init
bulk.execute();
bulk = db.collection.initializeUnorderedBulkOp();
}
})
// clean up queues
if(count > 0) {
bulk.execute();
}
cursor["result"].forEach(function(document) {
db.collection.update(
{ "_id": document._id },
{ "$set": { "name": document.name } }
);
})
반복해야합니다. 구체적인 경우 :
db.person.find().snapshot().forEach(
function (elem) {
db.person.update(
{
_id: elem._id
},
{
$set: {
name: elem.firstname + ' ' + elem.lastname
}
}
);
}
);
save()
문서 를 완전히 대체 한다는 점에 유의 해야합니다. update()
대신 사용해야 합니다.
db.person.update( { _id: elem._id }, { $set: { name: elem.firstname + ' ' + elem.lastname } } );
create_guid
반복 할 때 문서마다 고유 한 guid 만 생성하는 함수를 만들었습니다 forEach
(즉 , 모든 문서에 대해 동일한 guid가 생성 된 명령문 create_guid
에서 간단히 사용 ). 이 대답은 나를 위해 완벽하게 작동했습니다. +1update
mutli=true
분명히 효율적으로 MongoDB를 3.4 이후, 참조 할 수있는 방법이 styvane의 답변을 .
아래의 구식 답변
업데이트에서 아직 문서 자체를 참조 할 수는 없습니다. 문서를 반복하고 함수를 사용하여 각 문서를 업데이트해야합니다. 참조 이 답변 예를 들어, 또는 이 하나의 서버 측을 eval()
.
update
작업 에서 현재 문서에 대한 참조를 언급하는 MongoDB 문서에서 아무것도 찾을 수 없었습니다 . 이 관련 기능 요청 도 여전히 해결되지 않았습니다.
활동량이 많은 데이터베이스의 경우 업데이트가 레코드 변경에 영향을 미치는 문제가 발생할 수 있으므로 snapshot ()을 사용하는 것이 좋습니다.
db.person.find().snapshot().forEach( function (hombre) {
hombre.name = hombre.firstName + ' ' + hombre.lastName;
db.person.save(hombre);
});
http://docs.mongodb.org/manual/reference/method/cursor.snapshot/
시작 Mongo 4.2
, db.collection.update()
마지막으로 다른 필드를 기준으로 필드의 업데이트 / 생성을 허용 집계 파이프 라인을 받아 들일 수 있습니다 :
// { firstName: "Hello", lastName: "World" }
db.collection.update(
{},
[{ $set: { name: { $concat: [ "$firstName", " ", "$lastName" ] } } }],
{ multi: true }
)
// { "firstName" : "Hello", "lastName" : "World", "name" : "Hello World" }
첫 번째 부분 {}
은 일치 쿼리이며 업데이트 할 문서 (이 경우 모든 문서)를 필터링합니다.
두 번째 부분 [{ $set: { name: { ... } }]
은 업데이트 집계 파이프 라인입니다 (집계 파이프 라인 사용을 나타내는 네모 괄호 참고). $set
은 새로운 집계 연산자이며의 별칭입니다 $addFields
.
잊지 마십시오 { multi: true }
. 그렇지 않으면 첫 번째 일치하는 문서 만 업데이트됩니다.
위의 솔루션을 시도했지만 대량의 데이터에 적합하지 않은 것으로 나타났습니다. 그런 다음 스트림 기능을 발견했습니다.
MongoClient.connect("...", function(err, db){
var c = db.collection('yourCollection');
var s = c.find({/* your query */}).stream();
s.on('data', function(doc){
c.update({_id: doc._id}, {$set: {name : doc.firstName + ' ' + doc.lastName}}, function(err, result) { /* result == true? */} }
});
s.on('end', function(){
// stream can end before all your updates do if you have a lot
})
})
다음은 ~ 150_000 개의 레코드를 위해 한 필드를 다른 필드로 복사하는 방법입니다. 약 6 분이 걸렸지 만 동일한 수의 루비 객체를 인스턴스화하고 반복하는 것보다 여전히 자원 집약적입니다.
js_query = %({
$or : [
{
'settings.mobile_notifications' : { $exists : false },
'settings.mobile_admin_notifications' : { $exists : false }
}
]
})
js_for_each = %(function(user) {
if (!user.settings.hasOwnProperty('mobile_notifications')) {
user.settings.mobile_notifications = user.settings.email_notifications;
}
if (!user.settings.hasOwnProperty('mobile_admin_notifications')) {
user.settings.mobile_admin_notifications = user.settings.email_admin_notifications;
}
db.users.save(user);
})
js = "db.users.find(#{js_query}).forEach(#{js_for_each});"
Mongoid::Sessions.default.command('$eval' => js)
로 MongoDB를 버전 4.2 업데이트는 자사의 통합 파이프 라인의 사용을 허용하는 더 유연하게 update
, updateOne
그리고 updateMany
. 이제 집계 연산자를 사용하여 문서를 변환 한 다음 $set
명령 을 명시 적으로 지정할 필요없이 업데이트 할 수 있습니다 (대신 사용 $replaceRoot: {newRoot: "$$ROOT"}
)
여기서는 집계 쿼리를 사용하여 MongoDB의 ObjectID "_id"필드에서 타임 스탬프를 추출하고 문서를 업데이트합니다 (SQL의 전문가는 아니지만 SQL에서 타임 스탬프가있는 자동 생성 된 ObjectID를 제공하지 않는다고 생각합니다. 해당 날짜를 자동으로 생성)
var collection = "person"
agg_query = [
{
"$addFields" : {
"_last_updated" : {
"$toDate" : "$_id"
}
}
},
{
$replaceRoot: {
newRoot: "$$ROOT"
}
}
]
db.getCollection(collection).updateMany({}, agg_query, {upsert: true})
{ $replaceRoot: { newRoot: "$$ROOT" } }
; 이는 문서 자체를 교체하는 것을 의미하며 이는 의미가 없습니다. 당신이 교체하는 경우 $addFields
그 별명에 의해 $set
과 updateMany
의 별칭 중 하나입니다 update
, 당신은 동일한 답변을 얻을 이 하나 이상.