【MongoDB详细使用教程】三、高级查询

【MongoDB详细使用教程】一、Mac安装MongoDB
【MongoDB详细使用教程】二、MongoDB基本操作
【MongoDB详细使用教程】三、高级查询
【MongoDB详细使用教程】四、python操作MongoDB
【MongoDB详细使用教程】五、MongoDB的数据库管理

目录

1、使用比较运算符查询

MongoDB 运算
$gt 大于
$lt 小于
$gte 大于等于
$lte 小于等于欧
$ne 不等于
db.集合名.find({"键名": {比较运算符1:值1, 比较运算符2:值2} })
> db.students.find()
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }
{ "_id" : ObjectId("5db653920f98841018f7696b"), "name" : "xu", "age" : 20, "grade" : "三年级" }
{ "_id" : ObjectId("5db654660f98841018f7696c"), "name" : "ma", "age" : 20, "grade" : "二年级" }

> db.students.find({"age": {$lt:19}})
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }

> db.students.find({"age": {$gte:18,$lt:20}})
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }

2、使用关键字查询

2.1、in/not in 关键字

db.集合名.find({"键名": {$in:[值1, 值2, 值3 ...]} })

db.集合名.find({"键名": {$nin:[值1, 值2, 值3 ...]} })
> db.students.find({"age":{$in:[19,18,17]}})
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }

> db.students.find({"age":{$nin:[19,18,17]}})
{ "_id" : ObjectId("5db653920f98841018f7696b"), "name" : "xu", "age" : 20, "grade" : "三年级" }
{ "_id" : ObjectId("5db654660f98841018f7696c"), "name" : "ma", "age" : 20, "grade" : "二年级" }

2.2、size 关键字

对于值为list的字段,可以对list的长度(即list当中值的个数)进行判断来查询。

db.集合名.find({"键名": {$size:n} })
> db.students.find()
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }
{ "_id" : ObjectId("5db653920f98841018f7696b"), "name" : "xu", "age" : 20, "grade" : "三年级", "text" : [ "女", "研究员" ] }
{ "_id" : ObjectId("5db654660f98841018f7696c"), "name" : "ma", "age" : 20, "grade" : "二年级", "text" : [ "女", "副教授", "副处长" ] }

# 查找text字段长度为3的数据
> db.students.find({"text":{$size:3}})
{ "_id" : ObjectId("5db654660f98841018f7696c"), "name" : "ma", "age" : 20, "grade" : "二年级", "text" : [ "女", "副教授", "副处长" ] }

2.3、exists 关键字

查询 包含/不包含 某个字段的数据

db.集合名.find({"键名": {$exist: true|fase} })   # t、f要小写
> db.students.find()
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }
{ "_id" : ObjectId("5db653920f98841018f7696b"), "name" : "xu", "age" : 20, "grade" : "三年级", "text" : [ "女", "研究员" ] }
{ "_id" : ObjectId("5db654660f98841018f7696c"), "name" : "ma", "age" : 20, "grade" : "二年级", "text" : [ "女", "副教授", "副处长" ] }

# 查询包含text字段的数据
> db.students.find({"text":{$exists:true}})
{ "_id" : ObjectId("5db653920f98841018f7696b"), "name" : "xu", "age" : 20, "grade" : "三年级", "text" : [ "女", "研究员" ] }
{ "_id" : ObjectId("5db654660f98841018f7696c"), "name" : "ma", "age" : 20, "grade" : "二年级", "text" : [ "女", "副教授", "副处长" ] }
# 查询不含text字段的数据
> db.students.find({"text":{$exists:false}})
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }

2.4、or 关键字

db.集合名.find({$or:[{条件1}, {条件2}, {条件3}...]})
> db.students.find()
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }
{ "_id" : ObjectId("5db653920f98841018f7696b"), "name" : "xu", "age" : 20, "grade" : "三年级", "text" : [ "女", "研究员" ] }
{ "_id" : ObjectId("5db654660f98841018f7696c"), "name" : "ma", "age" : 20, "grade" : "二年级", "text" : [ "女", "副教授", "副处长" ] }

# 查询包含text字段或者name=chen的数据
> db.students.find({$or:[{"text":{$exists:true}},{"name":"chen"}]})
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db653920f98841018f7696b"), "name" : "xu", "age" : 20, "grade" : "三年级", "text" : [ "女", "研究员" ] }
{ "_id" : ObjectId("5db654660f98841018f7696c"), "name" : "ma", "age" : 20, "grade" : "二年级", "text" : [ "女", "副教授", "副处长" ] }

3、模糊查询

db.集合名.find({"键名": js正则表达)
> db.students.find()
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }
{ "_id" : ObjectId("5db653920f98841018f7696b"), "name" : "xu", "age" : 20, "grade" : "三年级", "text" : [ "女", "研究员" ] }
{ "_id" : ObjectId("5db654660f98841018f7696c"), "name" : "ma", "age" : 20, "grade" : "二年级", "text" : [ "女", "副教授", "副处长" ] }
{ "_id" : ObjectId("5db68d190f98841018f76970"), "name" : "cheng", "age" : 21, "grade" : "四年级" }

# 查询name以che开头的数据
> db.students.find({"name":/che/})
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db68d190f98841018f76970"), "name" : "cheng", "age" : 21, "grade" : "四年级" }

4、查询结果排序

db.集合名.find().sort({"键名": 1|-1, "键名": 1|-1...})

 1 为升序  
-1 为降序
> db.students.find().sort({"name":1, "age":-1})
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db68f6c0f98841018f76971"), "name" : "cheng", "age" : 22, "grade" : "五年级" }
{ "_id" : ObjectId("5db68d190f98841018f76970"), "name" : "cheng", "age" : 21, "grade" : "四年级" }
{ "_id" : ObjectId("5db654660f98841018f7696c"), "name" : "ma", "age" : 20, "grade" : "二年级", "text" : [ "女", "副教授", "副处长" ] }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }
{ "_id" : ObjectId("5db653920f98841018f7696b"), "name" : "xu", "age" : 20, "grade" : "三年级", "text" : [ "女", "研究员" ] }

5、限定返回结果数量

db.集合名.find().limit(n)

db.集合名.find().skip(n)  # 跳过n条,返回从n+1k开始的数据

db.集合名.find().skip(n).limit(m)  # 跳过n条,返回后面的m条

.limit() 与 .sort()无先后顺序

# 按age正序排列,并返回前两行数据
> db.students.find().limit(2).sort({"age":1})
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }
> db.students.find().sort({"age":1}).limit(2)
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }

# 查询age第二小和第三小的数据
> db.students.find().skip(1).limit(2).sort({"age":1})
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }
{ "_id" : ObjectId("5db653920f98841018f7696b"), "name" : "xu", "age" : 20, "grade" : "三年级", "text" : [ "女", "研究员" ] }

6、查询返回结果数量

db.集合名.find().count()

db.集合名.find().skip(n).count(true)  # 与skip结合使用时,要加true
> db.students.find({"name":"cheng"}).count()
2
> db.students.find().count()
6

# 不加true就会统计全部数据条目
> db.students.find().skip(2).count()    
6
> db.students.find().skip(2).count(true)
4

7、聚合函数aggregate()

7.1、语法

db.集合名.aggregate([
                    { 管道1: {表达式1} },
                    { 管道1: {表达式1} },
                    { 管道1: {表达式1} },
                    ...
                    ])
                
                # 如果只有一个管道则去掉"[]"

在aggregate()函数中,数据会依次通过每个管道进行筛选过滤,因此称其为管道。

7.2、常用管道

管道 说明
$group 将集合中的文档分组,可用于统计结果
$match 过滤数据,只输出符合条件的文档
$project 修改输入文档的结构,如重命名、增加、删除字段、创建计算结果
$sort 将输入文档排序后输出
$limit 限制聚合管道返回的文档数
$skip 跳过指定数量的文档,并返回余下的文档
$unwind 将数组类型的字段进行拆分

7.3、常用聚合函数

只能在$group管道中使用。

分组函数 说明
$sum 计算总和,$sum:1同count表示计数
$avg 计算平均值
$min 获取最小值
$max 获取最大值
$push 在结果文档中插入值到一个数组中,相当于拼接字段
$first 根据资源文档的排序获取第一个文档数据
$last 根据资源文档的排序获取最后一个文档数据

7.4、实例

$group

db.集合名.aggregate(
    {$group:
        {
        _id:'$字段名', 别名:{$聚合函数:'$字段名'}
        }
    }

根据_id后的字段名进行分组,对聚合函数后的字段名进行聚合运算。

  • 如果分组后,要对全部数据进行聚合运算,则 $聚合函数:1,相当于sql中的 count(1)
# 统计男女生人数
db.singer.aggregate(
    {$group:
        {
            _id:'$sex',
            count_sex:{$sum:1}
        }
    }
);
___________________________________
{ "_id" : "女", "count_sex" : 4 }
{ "_id" : "男", "count_sex" : 11 }

$sum:1 的作用是统计数量
$sum:'$字段名' 则是字段值进行累加

  • 因为聚合函数只能在group管道中使用,如果要对全部数据进行聚合运算(即不分组),则 _id:null .
# 统计所有人平均年龄
db.singer.aggregate(
    {$group:
        {
            _id:null,
            总人数:{$sum:1},
            avg_age:{$avg:"$age"},
            min_age:{$min:"$age"},
            max_age:{$max:"$age"}
        }
    }
);
_______________________________________________________
{ "_id" : null, "总人数" : 15, "avg_age" : 42.666666666666664, "min_age" : 29, "max_age" : 55 }

这里直接使用中文进行重命名

  • 用$push输出分组后的全部值
# 统计男女生人数及男女生名单
db.singer.aggregate(
    {$group:
        {
            _id:"$sex",
            人数:{$sum:1},
            名单:{$push:"$name"}
        }
    }
);
________________________________________________________________________________
{ "_id" : "女", "人数" : 4, "名单" : [ "李宇春", "赵丽颖", "黄龄", "王菲" ] }
{ "_id" : "男", "人数" : 11, "名单" : [ "刘德华", "张学友", "黎明", "郭富城", "薛之谦", "周杰伦", "PSY", "杰克逊", "杨坤", "刘欢", "林志炫" ] }

++$push:"$字段名"++ 相当于mysql中的 ++group_concat(字段名)++ 和 oracle中的 ++wmsys.wm_concat(字段名)++

$match

db.集合名.aggregate(
    {$match:{"键名":{表达式}}},
);
# 查找age大于40的数据
db.singer.aggregate(
    {$match:
        {"age":{$gt:40}}
    }
);

$unwind

db.集合名.aggregate(
    {$unwind:"键名"}
);

$unwind会将值为数组(列表)的字段进行拆分,数组中的每个值都与该行数据的其他字段组成一行新的数据。

> db.singer.find({"name":"刘德华"})
————————————————————————————————
{ "_id" : ObjectId("5db78dcb25fcb93e108d6dcb"), "num" : "1", "name" : "刘德华", "country" : "中国", "sex" : "男", "age" : 55, "score" : 100, "works" : [ "爱你一万年", "忘情水", "来生缘", "我不够爱你" ], "description" : "1961年9月27日出生于中国香港,演员、歌手、作词人、制片人,影视歌多栖发展的代表艺人之一。" }


# 将刘德华的works字段拆分
db.singer.aggregate([
    {$match:{"name":"刘德华"}},
    {$unwind:"$works"}
]);
——————————————————————————————
{ "_id" : ObjectId("5db78dcb25fcb93e108d6dcb"), "num" : "1", "name" : "刘德华", "country" : "中国", "sex" : "男", "age" : 55, "score" : 100, "works" : "爱你一万年", "description" : "1961年9月27日出生于中国香港,演员、歌手、作词人、制片人,影视歌多栖发展的代表艺人之一。" }
{ "_id" : ObjectId("5db78dcb25fcb93e108d6dcb"), "num" : "1", "name" : "刘德华", "country" : "中国", "sex" : "男", "age" : 55, "score" : 100, "works" : "忘情水", "description" : "1961年9月27日出生于中国香港,演员、歌手、作词人、制片人,影视歌多栖发展的代表艺人之一。" }
{ "_id" : ObjectId("5db78dcb25fcb93e108d6dcb"), "num" : "1", "name" : "刘德华", "country" : "中国", "sex" : "男", "age" : 55, "score" : 100, "works" : "来生缘", "description" : "1961年9月27日出生于中国香港,演员、歌手、作词人、制片人,影视歌多栖发展的代表艺人之一。" }
{ "_id" : ObjectId("5db78dcb25fcb93e108d6dcb"), "num" : "1", "name" : "刘德华", "country" : "中国", "sex" : "男", "age" : 55, "score" : 100, "works" : "我不够爱你", "description" : "1961年9月27日出生于中国香港,演员、歌手、作词人、制片人,影视歌多栖发展的代表艺人之一。" }

管道组合应用

# 查询年龄大于30的男女生人数
db.singer.aggregate([
    {$match:{"age":{$gt:30}}},
    {$group:{_id:"$sex",人数:{$sum:1}}}
]);
————————————————————————————————
{ "_id" : "女", "人数" : 2 }
{ "_id" : "男", "人数" : 11 }
# 查询年龄在30岁以上,年龄第二小和第三小的人
db.singer.aggregate([
    {$match:{"age":{$gt:30}}},
    {$project:{_id:0,name:1,age:1}},
    {$sort:{"age":1}},
    {$skip:1},
    {$limit:2}
]);
——————————————————————
{ "name" : "薛之谦", "age" : 33 }
{ "name" : "周杰伦", "age" : 37 }

$project用来设定哪些字段显示,哪些不显示,并可以设置字段显示顺序。1为显示,0为不显示。
这里要注意,在$project后面_id字段默认显示,其他字段默认不显示。

8、创建索引

db.集合名.ensureIndex({"键名1":1|-1, "键名2":1|-1})
> db.students.ensureIndex({"name":1})
{
	"createdCollectionAutomatically" : false,
	"numIndexesBefore" : 1,
	"numIndexesAfter" : 2,
	"ok" : 1
}
上一篇:Mongodb 基础 之 初识


下一篇:MongoDB 聚合管道&关联处理