需求
需要查詢統(tǒng)計提到某一品牌的時候 同時提到了哪些其他品牌
目前在MongoDB中是這樣保存品牌的
"brands" : [
"西門子",
"ABB",
"GE"
],
顯然這種結(jié)構(gòu)很難滿足上述查詢需求 需要使用下面的這種結(jié)構(gòu) 才能支持這種查詢需求
"brand_and_mentioned_brands":[
{
"main_brand": "西門子",
"mentioned_brands": ["ABB","GE"]
},
{
"main_brand": "ABB",
"mentioned_brands": ["西門子","GE"]
},
{
"main_brand": "GE",
"mentioned_brands": ["西門子","ABB"]
}
]
不知道 除了MongoDB外 其他數(shù)據(jù)庫 如ES等 對這種查詢需求情況的支持怎么樣?
我的理解這算是數(shù)據(jù)分析的需求了,OLAP的需求依賴一條數(shù)據(jù)庫查詢直接產(chǎn)出結(jié)果不是很容易,如果是SQL可能會考慮存儲過程,MongoDB可選的方法有Map/Reduce和Aggregation,優(yōu)先選擇后者。性能問題在這里先不討論,先看看是否能達到你想要的效果。第二種數(shù)據(jù)結(jié)構(gòu)應(yīng)該沒有問題,第一種結(jié)構(gòu)我的解決方案如下:
db.test.aggregate([
{$project: {brands: "$brands", brands2: "$brands"}},
{$unwind: "$brands"},
{$unwind: "$brands2"},
{$project: {pair: ["$brands", "$brands2"]}},
{$group: {_id: "$pair", count: {$sum: 1}}}
]);
這種方式先復(fù)制一個brands
出來,然后做$unwind
相當(dāng)于brands
集合自己與自己排列,而你需要的是組合。比如你的示例數(shù)據(jù):
{"brands" : [ "西門子", "ABB", "GE" ]}
出來的結(jié)果是:
{ "_id" : [ "GE", "GE" ], "count" : 1 }
{ "_id" : [ "GE", "ABB" ], "count" : 1 }
{ "_id" : [ "GE", "西門子" ], "count" : 1 }
{ "_id" : [ "ABB", "ABB" ], "count" : 1 }
{ "_id" : [ "ABB", "西門子" ], "count" : 1 }
{ "_id" : [ "ABB", "GE" ], "count" : 1 }
{ "_id" : [ "西門子", "GE" ], "count" : 1 }
{ "_id" : [ "西門子", "ABB" ], "count" : 1 }
{ "_id" : [ "西門子", "西門子" ], "count" : 1 }
有些額外的數(shù)據(jù),比如[ "ABB", "ABB" ]
,[ "西門子", "ABB" ]/[ "ABB", "西門子" ]
。我暫時還沒想到很好的辦法直接在aggregation pipeline中直接過濾掉這些數(shù)據(jù),不過應(yīng)該不影響你使用。如果有想到更徹底的辦法我再回來補充。
求助了一下場外觀眾,aggregation確實很強大。你可能需要查一下:$map, $reduce, $let, $range這些操作符的用法
db.test.aggregate({
$project: {
tuples: {
$reduce: {
initialValue: [],
input: {
$range: [0, {
$subtract: [{
$size: "$brands"
}, 1]
}]
},
in: {
$let: {
vars: {
i1: "$$this"
},
in: {
$concatArrays: ["$$value", {
$map: {
input: {
$range: [{
$add: [1, "$$i1"]
}, {
$size: "$brands"
}]
},
in: [{
$arrayElemAt: ["$brands", "$$i1"]
}, {
$arrayElemAt: ["$brands", "$$this"]
}]
}
}]
}
}
}
}
}
}
}, {
$unwind: "$tuples"
}, {
$sortByCount: {
$setUnion: "$tuples"
}
})
這個管道操作本質(zhì)上的意義就是:
for(var i = 0; i < array.length - 1; i++)
for(var j = i + 1; j < array.length - 1; j++) {...}
執(zhí)行結(jié)果:
{ "_id" : [ "GE", "西門子" ], "count" : 1 }
{ "_id" : [ "ABB", "GE" ], "count" : 1 }
{ "_id" : [ "ABB", "西門子" ], "count" : 1 }
北大青鳥APTECH成立于1999年。依托北京大學(xué)優(yōu)質(zhì)雄厚的教育資源和背景,秉承“教育改變生活”的發(fā)展理念,致力于培養(yǎng)中國IT技能型緊缺人才,是大數(shù)據(jù)專業(yè)的國家
北大青鳥中博軟件學(xué)院創(chuàng)立于2003年,作為華東區(qū)著名互聯(lián)網(wǎng)學(xué)院和江蘇省首批服務(wù)外包人才培訓(xùn)基地,中博成功培育了近30000名軟件工程師走向高薪崗位,合作企業(yè)超4
中公教育集團創(chuàng)建于1999年,經(jīng)過二十年潛心發(fā)展,已由一家北大畢業(yè)生自主創(chuàng)業(yè)的信息技術(shù)與教育服務(wù)機構(gòu),發(fā)展為教育服務(wù)業(yè)的綜合性企業(yè)集團,成為集合面授教學(xué)培訓(xùn)、網(wǎng)
達內(nèi)教育集團成立于2002年,是一家由留學(xué)海歸創(chuàng)辦的高端職業(yè)教育培訓(xùn)機構(gòu),是中國一站式人才培養(yǎng)平臺、一站式人才輸送平臺。2014年4月3日在美國成功上市,融資1
曾工作于聯(lián)想擔(dān)任系統(tǒng)開發(fā)工程師,曾在博彥科技股份有限公司擔(dān)任項目經(jīng)理從事移動互聯(lián)網(wǎng)管理及研發(fā)工作,曾創(chuàng)辦藍懿科技有限責(zé)任公司從事總經(jīng)理職務(wù)負責(zé)iOS教學(xué)及管理工作。
浪潮集團項目經(jīng)理。精通Java與.NET 技術(shù), 熟練的跨平臺面向?qū)ο箝_發(fā)經(jīng)驗,技術(shù)功底深厚。 授課風(fēng)格 授課風(fēng)格清新自然、條理清晰、主次分明、重點難點突出、引人入勝。
精通HTML5和CSS3;Javascript及主流js庫,具有快速界面開發(fā)的能力,對瀏覽器兼容性、前端性能優(yōu)化等有深入理解。精通網(wǎng)頁制作和網(wǎng)頁游戲開發(fā)。
具有10 年的Java 企業(yè)應(yīng)用開發(fā)經(jīng)驗。曾經(jīng)歷任德國Software AG 技術(shù)顧問,美國Dachieve 系統(tǒng)架構(gòu)師,美國AngelEngineers Inc. 系統(tǒng)架構(gòu)師。