【MongoDB】聚合
聚合(aggregate):將很多次的單一查詢結合成一次。透過平行分散式運算處理。在MongoDB內進行資料分組與統計,優點:不需要傳輸所有的原始資料。
mapReduce(MR):透過最少2個、最多3個的資料處理階段,將資料轉換成聚合的結果。需要自己寫javascript程式(查詢Query)。
- 篩選和排序
- 分組(對映map):自訂程式
- 計算(歸納reduce):自訂程式
- 吐出結果(設定輸出位置/定型finalize):自訂變數(欄位)
pipeline:以管線的概念來處理大量數據的內容。官方提供的管線操作:
- 篩選$match
- 分組$group
- 映射$project
- 輸出$out