一、 简介(了解)
MongoDB 是一种 NOSQL 数据库,NOSQL 数据库不是这几年才有的,从数据库的初期发展就以及存在了 NOSQL 数据库。数据库之中支持的 SQL 语句是由 IBM 开发出来的,并且最早就应用在了 数据库,但是 SQL 语句的使用并不麻烦,就是几个简单的单词:SELECT、FROM、WHERE、GROUP BY、HAVING、ORDER BY,但是在这个时候有人开始反感于编写 SQL 操作。于是有一些人就开始提出一个理论 —— 不要去使用 SQL ,于是最早的 NOSQL 概念产生了。可是后来的发展产生了一点变化,在 90 年代到 2010 年之间,世界上最流行的数据库依然是关系型数据库,并且围绕着关系型数据库开发出了大量的程序应用。后来又随着移动技术(云计算、大数据)的发展,很多公司并不愿意去使用大型的厂商数据库 —— 、DB2,因为这些人已经习惯于使用 MYSQL 数据库了,这些人发现在大数据以及云计算的环境下,数据存储受到了很大的挑战,那么后来就开始重新进行了 NOSQL 数据库的开发,但是经过长期的开发,发现 NOSQL 数据库依然不可能离开传统的关系型数据库 (NOSQL = Not Only SQL)。
实际上在现实的开发之中一直存在一种神奇的问题:
数据表 → JDBC 读取 → POJO(VO、PO) → 控制层转化为 JSON 数据 → 客户端
可是这样的转换实在是太麻烦了,那么最好的做法是,直接有一个数据库就存放有要显示的 JSON 数据该有多好,那么就省略所有需要进行转换的过程。所以在实际的开发之中,往往除了关系型数据库之外还要提供有一个 NOSQL 数据库,其中 NOSQL 数据库负责数据的读取,因为直接保存的就是 JSON (前提:MongoDB 中的数据是排列好的组合数据)。
例如:现在要求显示出每个雇员的编号、姓名、职位、部门名称、部门位置、工资等级。传统的关系型数据库之中一定要存放大量的冗余数据,不合理。而有了 NOSQL 数据库之后,可以直接在业务层里面将数据交给 NOSQL 数据库保存,按照指定的结构进行存储。
在 MongoDB 数据库之中与 数据库有如下的概念对应:
MongoDB 和 的对比:
MongoDB 和 的操作命令对比:
在整个行业之中,MongoDB 数据库是发展最好的一个 NOSQL 数据库,因为它与 Node.JS 捆绑在一起了,也就是说如果你要从事 Node.JS 的开发,那么一定要使用 MongoDB,而 Node.JS (基于 JavaScript )在国内最成功的应用 —— taobao 。
MongoDB 之所以能够更好的发展也取决于:面向集合的存储过程、模式自由(无模式)、方便的进行数据存储扩充、支持索引、支持短暂数据保留、具备完整的数据库状态监控、基于 BSON (MongoDB 自己的JSON )应用。
MongoDB 支持现在各种主流的编程语言,如:Python、.NET、PHP 等。
二、MongoDB 的安装
如果想要得到 MongoDB 数据库只需要登录 (www.mongodb.org) 上就可以直接下载可用版本,最新的版本是 3.0.x ,但是这个版本变为了 Windows 安装版(只是把原来的解压缩版变为了安装拷贝)。
msi 格式文件是点击安装文件, zip 格式是压缩包文件,一般下载 msi 文件。
将下载下来的 MongoDB 数据库直接进行安装。安装的时候需要选择好对应的操作系统,本次使用的是64位的安装系统。
第一步:打开安装文件
第二步:接受协议
第三步:选择自定义安装
第四步:点击浏览
第五步:更改目录
安装路径一般放在一个盘的根目录下 D:MongoDB 。
第六步:点击安装
MongoDB 安装完成之后,严格来讲并不能够在 Windows 下使用,需要为它配置 path 环境属性,配置目录:“E:MongoDBbin” 。
计算机 - 属性 - 高级系统设置 - 环境变量 - 系统变量,在最前面加上:" E:MongoDBbin; "
如果要想正常启动 MongoDB 数据库,那么必须建立一个文件夹,这个文件夹将保存所有的数据库的信息,现在将在 MongoDB 文件夹之中建立一个 db 的目录(E:MongoDBdb),并且在此目录下保存所有的数据文件。
MongoDB 数据库的启动需要使用 mongod.exe 命令完成,启动的时候可以设置端口号,也可以不设置端口号。
如果日后需要通过程序访问数据库的话,那么一定要设置端口号。
当 MongoDB 服务启动之后,可以使用 mongo 命令连接数据库。
范例:查询所有的数据库
此时只存在有一个 local 的本地数据库,不过这个数据库不使用。
虽然以上的代码实现了数据库的启动与连接操作,但是从严格意义上来讲,以上的代码没有任何的用处,因为从实际的开发来讲,在 MongoDB 启动的时候需要设置一些相应参数:端口号、是否启用用户验证、数据文件的位置等等。
范例:在 E:MongoDB 目录下建立一个文件 "mongodb.conf"
范例:连接数据库
此时服务器已经存在有指定的端口号了。
使用端口号启动在日后的程序开发部分是非常有用处的。
三、MongoDB 的基础操作
在 MongoDB 数据库里面是存在有数据库的概念,但是没有模式(所有的信息都是按照文档保存的),保存数据的结构就是 JSON 结构,只不过在进行一些数据处理的时候才会使用到 MongoDB 自己的一些操作符。
3.1、使用 mldn 数据库:
实际上这个时候并不会创建数据库,只有在数据库里面保存集合数据之后才能够真正创建数据库。
查看数据库信息
3.2、创建一个集合 —— 创建一个 emp 集合
这个时候 mldn 数据库才会真正的存在。
3.3、创建一个集合 —— 创建一个 dept 集合
但是很多的时候如果按照以上的代码形式进行会觉得你不正常,因为正常人使用 MongoDB 数据库集合操作的时候都是直接向里面保存一个数据。
3.4、查看所有集合
发现 dept 集合自动创建了。
3.5、查看 dept 表的数据
从传统的数据表来看(集合就相当于表的结构),表的结构一旦定义就必须按照其定义的要求进行内容的编写,但是 MongoDB 不一样,它可以自己随意扩充数据。
3.6、增加不规则数据
此时 dept 集合的内容可以由用户随便去定义,完全不用考虑其他的结构,那么实际上就必须明确一点了,在 MongoDB 数据库之中是绝对不可能存在有查看集合结构的操作。
3.7、关于 ID 的问题
在 MongoDB 集合中的每一行记录都会自动的生成一个 “"_id" : ObjectId("5d0493c2db2a129b")” 数据,这个数据的组成是:“时间戳 + 机器码 + 进程 PID + 计数器“,这个 ID 的信息是 MongoDB 数据库自己为用户生成的。
8、查看单独的一个文档信息
3.9、删除数据
发现财务部的信息就被删除了
3.10、更新数据(是最麻烦的)
现在更新也完成了,但这个更新意义不大,因为对于更新的操作在整个集合里面是非常麻烦的,而对于整个 MongoDB 而言,能够使用的数据类型基本上也是我们熟悉的几种数据类型,比如: int 、string 、date 等。
3.11、删除集合
只有 emp 表了
3.12、删除数据库(删除当前所在的数据库)
需要注意的是,当前在哪个数据库下,执行语句后就删除哪个数据库,所有必须先切换到数据库后才可以删除。
四、数据操作(重点)
只要是数据库那么就绝对离不开最为核心的功能: CRUD ,所以在 MongoDB 里面对于数据的操作也是有支持的,但是需要提醒的是,除了增加之外,其它的都很麻烦。
4.1、数据增加
使用 “db.集合.insert()” 可以实现数据的增加操作。
范例:增加一个简单数据
范例:保存数组
如果要保存多个数据,那么就使用数组。
范例:保存 10000 个数据
如果数据保存很多的情况下,列表时不会全部列出,它只会列出部分的内容。
4.2、数据查询
任何的数据库之中,数据的查询操作都是最为麻烦的,而在 MongoDB 数据库里面,对于查询的支持非常到位,包含有关系运算、逻辑运算、数组运算、正则运算等等。
首先对于数据的查询操作核心的语法:“db.集合名称.find({查询条件}[,{设置显示的字段}])”
范例:最简单的用法就是直接使用 find() 函数完成查询
范例:希望查询出 url 为 “www.mldn.cn” 的数据
发现在进行数据查询的时候也是按照 JSON 的形式设置的相等关系。它的整个开发之中都不可能离开 JSON 数据。
对于设置的显示字段严格来讲就称为数据的投影操作,如果不需要显示的字段设置 “ 0 ”,而需要显示的字段设置 “ 1 ”。
范例:不想显示 "_id"
大部分的情况下,这种投影操作的意义不大。同时对于数据的查询也可以使用 “pretty()” 函数进行漂亮显示。
范例:漂亮显示
数据列多的时候一定可以看出华丽的显示效果。
范例:查询单个数据
利用以上的查询可以实现格式化的输出效果,前提:列的内容必须多。
4.2.1 关系查询
在 MongoDB 里面支持的关系查询操作:大于(gt)、小于(lt)、大于等于(gte)、小于等于(lte)、不等于(ne)、等于(key:value,eq)。但是要想让这些操作可以正常使用,那么需要准备出一个数据集合。
范例:定义一个学生集合
范例:查询姓名是张三的学生信息
范例:查询性别是男的学生信息
范例:查询年龄大于19岁的学生信息
范例:查询成绩大于等于60分的学生信息
范例:查询姓名不是王五的学生信息
此时与之前最大的区别就在于,在一个 JSON 结构里面需要定义其它的 JSON 结构,并且这种风格在日后通过程序操作的时候依然如此。
4.2.2 逻辑运算
逻辑运算主要就是三种类型:与(and)、或(or)、非(not、nor)。
范例:查询年龄在 19 ~ 20 岁的学生信息
在进行逻辑运算的时候,“and” 的连接是最容易的,因为只需要理由 “,”分隔若干个条件就可以了。
范例:查询年龄不是19岁的学生
范例:查询年龄大于 19 岁,或者成绩大于 90 分的学生信息
范例:也可以进行或的求反操作
针对于或的操作可以实现一个求反的功能。
在这几个逻辑运算之中,与的连接最简单,而或的连接需要为数据设置数组的过滤条件。
4.2.3 求模
模的运算使用 “$mod” 来完成,语法 “ {$mod:[数字 , 余数]} ”
利用求模计算可以编写一些数学的计算公式。
4.2.4 范围查询
只要是数据库,必须存在有 “ in ”(在范围之中)、“ nin ”(不在范围之中)。
范例:查询姓名是 “张三”、“李四”、“王五”的学生信息。
范例:不在范围
在实际的工作之中,范围的查询很重要。
4.2.5 数组查询
首先在 MongoDB 里面是支持数组保存的,一旦支持了数组保存,就需要针对于数组的数据进行匹配。
范例:保存一部分数组内容
此时的数据包含有数组内容,而后需要针对于数组数据进行判断,可以使用几个运算符: all、size、slice、elemMatch 。
范例:先查看全部信息
范例:查询同时参加语文和数学课程的学生
现在所有显示的学生信息里面包含语文和数学的内容,而如果差一个内容的不会显示。
虽然 “$all” 计算可以用于数组上,但是也可以用于一个数据的匹配上。
范例:查询学生地址是 “海淀区” 的学生信息
既然在集合里面现在保存的是数组信息,那么数组就可以利用索引操作,使用 “key.index” 的方式来定义索引。
范例:查询数组中第二个内容(index = 1,索引下标从0)为数学的信息
范例:要求查询出只参加两门课程的学生
范例:返回年龄为 19 岁所有的学生信息,但是要求只显示两门参加课程
现在只取得了前两门的信息,那么也可以设置负数表示取出后两门的信息。
或者只是取出中间部分的信息
在此时设置的两个数据里面第一个数据表示跳过的数据量,而第二个数据表示返回的数量。
4.2.6 嵌套集合运算
在 MongoDB 数据库里面每一个集合数据可以继续保存其它的集合数据,例如:有些学生需要保存家长信息。
范例:增加信息
此时给出的内容是嵌套的集合,而这种集合的数据的判断只能够通过 “ $elemMatch ” 来完成。
范例:查询出父母有人是局长的学生信息
由于这种查询的时候条件比较麻烦,所以如果可能,尽量别搞这么复杂的数据结构组成。
4.2.7 判断某个字段是否存在
使用 “ $exists ” 可以判断某个字段是否存在,如果设置为 true 表示存在,如果设置为 false 就表示不存在。
范例:查询具有 parents 成员的数据
范例:查询不具有 course 成员的数据
可以利用此类查询来进行一些不需要的数据的过滤。
4.2.8 条件过滤
实际上习惯于传统关系型数据库开发的我们对于数据的筛选,可能首先想到的一定是 where 子句,所以在 MongoDB 里面也提供有 “ $where ” 。
范例:使用 where 进行数据查询
对于 “ $where ” 是可以简化的,但是这类的操作是属于进行每一行的信息判断,实际上对于数据量较大的情况并不方便使用。
实际上以上的代码严格来讲是属于编写一个操作的函数,如下所示:
以上只是查询了一个判断,如果要想实现多个条件的判断,那么就需要使用 and 连接。
虽然这种形式的操作可以实现数据查询,但是最大的缺点是将在 MongoDB 里面保存的 BSON 数据变为了 JavaScript 的语法结构,这样的方式不方便使用数据库的索引机制,所以不建议使用。
面试题:请说明 MongoDB 中 where 的过滤有什么使用限制。
回答:where 能够利用 JavaScript 查询,但是,它会把 BSON 重新变为 JavaScript 进行循环验证,这样索引是不能起作用的。
4.2.9 正则运算
如果要想实现模糊查询,那么必须使用正则表达式,而且正则表达式使用的是语言 Perl 兼容的正则表达式的形式。如果要想实现正则使用,则按照如下的定义格式:
范例:查询以 “谷” 开头的姓名
范例:查询以字母 A 开头的姓名
如果要执行模糊查询的操作,严格来讲只需要编写一个关键字就够了。
正则操作之中除了可以查询出单个字段的内容之外,也可以进行数组数据的查询。
MongoDB 中的正则符号和之前 Java 正则是有一些小小差别,不建议使用以前的一些标记,正则就将其应用在模糊数据查询上。
4.2.10 数据排序
在 MongoDB 里面数据的排序操作使用 “ sort() ” 函数,在进行排序的时候可以有两个顺序:升序(1)、降序(-1)。
范例:数据排序
但是在进行排序的过程里面有一种方式称为自然排序,就是按照数据保存的先后顺序排序,使用 “ $natural ” 表示。
范例:自然排序
在 MongoDB 数据库里面排序的操作相比较传统关系型数据库的设置要简单。
4.2.11 数据分页显示
在 MongoDB 里面的数据分页显示也是符合于大数据要求的操作函数:
范例:分页显示(第一页,skip(0)、limit(5))
范例:分页显示(第二页,skip(5)、limit(5))
这两个分页的控制操作,就是在以后只要是存在有大数据的信息情况下都会使用它。
4.3 数据更新操作
对于 MongoDB 而言,数据的更新基本上是一件很麻烦的事情,如果在实际的工作之中,真的具有此类的操作支持,那么最好的做法,在 MongoDB 里面对于数据的更新操作提供了两类函数:save()、update() 。
4.3.1 函数的基本使用
如果要修改数据最直接的使用函数就是 update() 函数,但是这个函数的语法要求很麻烦。
范例:更新存在的数据 —— 将年龄是 19 岁的人的成绩都更新为 100 分(此时会返回多条数据)
"$set" 在 MongoDB 中叫修改器,现在只是修改数据用,但是严格来讲,不光内容可以修改,连集合结构也可以修改,因为它是无模式的。
范例:更新不存在的数据
由于没有年龄是 30 岁的学生信息,所以此时相当于进行了数据的创建。
那么除了 update() 函数之外,还提供有一个 save() 函数,这个函数的功能与更新不存在的内容相似。
范例:使用 save() 操作(尽量不用)
由于此时对应的 id 数据存在了,所以就变为了更新操作,但是如果要保存的数据不存在(不能保存有 “ _id ” 的内容),那么就变为了增加操作。
4.3.2 修改器
对 MongoDB 数据库而言,数据的修改会牵扯到内容的变更、结构的变更(包含有数组),所以在进行 MOngoDB 设计的时候就提供有一系列的修改器的应用,那么像之前使用的 “ $set ” 就是一个修改器。
1、$inc:主要针对于一个数字字段,增加某个数字字段的数据内容:
范例:将所有年龄为 19 岁的学生成绩一律减少 30 分,年龄增加 1 岁。
2、$set:进行内容的重新设置:
范例:将年龄是 20 岁的人的成绩修改为 89 分
3、$unset:删除某个成员的内容:
范例:删除 “张三” 的年龄与成绩信息
执行之后指定的成员的内容就消失了。
4、$push:相当于将内容追加到指定的成员之中(基本上是数组)
范例:向 “李四” 添加课程信息
范例:向 “张三” 添加课程信息(此时张三信息下��有 course 信息)
范例:向 "谷大神 - E" 里面的课程追加一个 “美术”
查询结果显示添加成功,所以,"$push" 就是进行数组数据的添加操作使用的,如果没有数组则进行一个新的数组的创建,如果有则进行内容的追加。
5、pushAll :与 “push” 是类似的,可以一次追加多个内容到数组里面
范例:向 “王五” 是信息里面添加多个课程内容
6、$addToSet :向数组里面增加一个新的内容,只有在这个内容不存在的时候才会增加
范例:向 王五 的信息增加新的内容
此时会判断要增加的内容在数组里面是否已经存在了,如果不存在则向数组之中追加内容,如果存在则不做任何的修改操作。
7、$pop:删除数组内的数据
范例:删除王五的第一个课程
范例:删除王五的最后一个课程
结果显示就把最后一个数组给删掉了。
8、$pull:从数组内删除一个指定内容的数据
范例:删除王五的美术(不存在的)课程
范例:删除王五的音乐(存在的)课程
9、$pullAll:一次性删除多个内容
范例:删除 "谷大神 - A" 中三门课程
10、$rename:为成员名称重命名
范例:将 “张三” 的 name 成员名称修改为 “姓名”
在整个 MongoDB 数据库里面,提供的修改器的支持很到位。
4.4、删除操作
在 MOngoDB 里面数据的删除实际上并不复杂,只需要使用 “remove()” 函数就可以了。
但是在这个函数中有两个可选项:
1、删除条件:满足条件的数据被删除;
2、是否只删除一个数据,如果设置为 true 或者是 1 表示只删除一个。
范例:清空 infos 集合中的内容
范例:删除所有姓名里面带有 “谷” 的信息,默认情况下全部删除。
范例:删除姓名带有 “高” 的信息,要求只删除一个
删除操作里面依然需要使用限定查询的相关操作内容。
4.5、游标(重点)
所谓的游标就是指的数据可以一行行的进行操作,非常类似于 ResultSet 数据处理。在 MongoDB 数据库里面对游标的控制非常的简单,只需要使用 find() 函数就可以返回游标了。对于返回的游标如果要想进行操作,使用两个函数:
以上是游标的操作形式,但是实际上不可能这么去用,因为必须利用循环才能够输出内容。
范例:编写具体的操作代码
相当于每一个数据都单独拿出来进行逐行的控制。
当游标数据取出来之后,实际上每行数据返回的都是一个 Object 型的内容,那么如果需要将数据按照 json 的形式出现,则可以使用 printjson() 函数完成。
在所有已知的数据库里,只有 MongoDB 的游标操作是最简单、最直观的。
4.6、索引(重点)
在任何的数据库之中,索引都是一种提升数据库检索性能的手段,这一点在 MOngoDB 数据库之中是同样存在的,在 MongoDB 数据库里面依然会存在有两种索引创建:一种是自动创建,另外一种是手工创建。
范例:重新准备一个新的简单集合
此时在 students 集合上并没有去设置任何的索引,那么下面通过 getIndexes() 函数来观察在 students 集合里面已经存在的索引内容。
范例:查询默认状态下的 students 集合的索引内容
现在发现会存在有一个 “_id” 列的索引内容。但是如果要想创建自己的索引,则可以使用下面的语法完成:
范例:创建一个索引,在 age 字段上设置一个降序索引
此时并没有设置索引的名字,所以名字是自动命名的。命名规范:“字段名称_索引的排序模式”,如:"age_-1"。
范例:针对于当前的 age 字段上的索引做一个分析
此时的查询使用了索引的技术,但是下面再来观察一个查询,不使用索引字段。
范例:针对于 score 字段上设置查询
此时在 score 字段上并没有设置索引,所以当前的索引形式就变成了全集合扫描的模式。
但是如果说,现在换一种形式,年龄和成绩一起执行判断查询会出现什么样的结果?
这个时候虽然 age 字段上存在有索引,但是一个明显的问题是,由于 score 字段上没有索引,所以依然是使用的是全表扫描操作,那么为了解决此时的问题,可以使用一个复合索引。
范例:默认使用索引
但是如果换到了条件之中:
现在发现并没有使用索引,所以这个时候看能否强制使用一次索引。hint() 函数为强制使用索引操作。
范例:强制使用索引
如果正常来讲,这个代码根本就不可能调用默认的索引执行,但是我们觉得不好,所以需要使用 hint() 函数来强制 MongoDB ,告诉你必须使用一次索引,由于此时在 age 和 score 两个字段上已经设置了复合索引,那么现在使用的就是默认的复合索引。
但是如果在一个集合里面设置了过多的索引,实际上会导致性能下降,那么就可以删除索引。
范例:删除一个索引
可是如果只是一个一个删除索引也会很麻烦,所以提供有删除全部索引的操作。
范例:删除全部索引
所谓的删除全部索引指的就是非 “_id” 的索引,也就是所有的自定义索引。
索引不应该太多,而且不应该在频繁更新的数据上设置索引,这样反而会降低性能。所以索引的操作一般要经过测试和分析之后才能决定是否去使用索引。
数据量大概在几万几十万条使用意义不大,在几百万几千万条数据中使用索引意义更明显。
4.6.1 唯一索引
唯一索引的主要目的是用在某一个字段上,使该字段的内容不重复。
范例:创建唯一索引
表示在 name 字段上的内容绝对不允许重复。
添加只有 name 一样的数据:
此时除了 name 字段上的内容之外,发现所有的数据都不一样,但是由于在 name 字段上设置了唯一索引,所以整个的程序里面如果增加了重复内容,那么会出现以下的错误提示信息:
唯一索引能够保证指定字段上的数据不重复。
4.6.2 过期索引
在一些程序站点会出现若干秒之后信息被删除的情况,例如:手机信息验证码,那么在 MongoDB 里面就可以轻松的实现过期索引,但是这个时间往往不怎么准确。
范例:设置过期索引
设置索引在10秒后过期
范例:在一个 phones 集合里面设置过期索引
如果要想实现过期索引,需要保存一个时间信息:
等到10秒以后(永远不会那么准确)所保存的数据就会消失。这样的特性在进行一些临时数据保存的时候非常有帮助,最早如果没有 MongoDB 这种特性,而只是使用最简单的关系型数据库开发,那么是非常麻烦的。
4.6.3 全文索引
在一些信息管理平台上经常需要进行信息模糊查询,最早的时候是利用了某个字段上实现的模糊查询,但是这个时候返回的信息并不会很准确,因为只能够查 A 字段或者是 B 字段,而在 MongoDB 里面实现了非常简单的全文检索。
范例:定义一个新的集合
范例:设置全文检索
范例:实现数据的模糊查询
如果要想表示出全文检索,则使用 “text” 判断符,而要想进行数据的查询则使用 “search” 运算符:
|- 查询指定关键字:{"$search" : "查询关键字"};
|- 查询多个关键字(或关系):{"$search" : "查询关键字 查询关键字 查询关键字 ..."}
|- 查询多个关键字(与关系):{"$search" : ""查询关键字 "" 查询关键字 "..."}
|- 查询多个关键字(排除某一个):{"$search" : "查询关键字 查询关键字 查询关键字 ... -排除关键字"}
范例:查询单个内容
范例:查询包含有 “gry” 和 “sfq” 的信息
范例:查询同时包含有 “mldn” 与 “lxh” 的内容
范例:查询包含有 “mldn” 但是没有 “gyh” 的内容
但是在进行全文检索操作的时候还可以使用相似度的打分来判断检索成果。
范例:为结果打分
按照打分的成绩进行排列,实际上就可以实现更加准确的信息检索。
但是在这里面还有一个小问题,如果一个集合的字段太多了,那么每一个字段都分别设置全文检索麻烦点,简单一些,可以为所有的字段设置全文检索。
范例:为所有字段设置全文检索
这是一种最简单的设置全文索引的方式,但是尽可能别用,一个字:慢!
4.6.4 地理信息索引
地理信息索引分为两类:2D 平面索引,另外就是 2DSphere 球面索引。在 2D 索引里面基本上能够保存的信息都是坐标,而且坐标保存的就是经纬度坐标。
范例:定义一个商铺的集合
范例:为 shop 集合定义 2D 索引
这个时候 shop 集合就可以实现坐标位置的查询了,而要进行查询有两种方式:
范例:假设我的现在的坐标是:[11,11]
但是如果执行了以上的查询,实际上会将数据集合里面的前 100 个点的信息都都返回来了,可是太远了,设置一个距离范围 —— 5 个点内的。
范例:设置查询距离范围
但是需要注意一点,在 2D 索引里面虽然支持最大距离,但是不支持最小距离。
但是也可以设置一个查询的范围,使用 “$geoWithin” 查询,而可以设置的范围:
范例:查询矩形
范例:查询圆形
在 MongoDB 数据库里面,除了一些支持的操作函数之外,还有一个重要的命令:runCommand(),这个函数可以执行所有的特定的 MongoDB 命令。
范例:利用 runCommand() 实现信息查询
这类的命令可以说是 MongoDB 之中最为基础的命令。
4.7、聚合(重点)
MongoDB 的产生背景是在大数据环境,所谓的大数据实际上也就是进行的信息收集汇总。那么就必须存在有信息的统计操作,而这样的统计操作就称为聚合(直白:分组统计就是一种聚合操作)。
4.7.1 取得集合的数据量
对于集合的数据量而言,在 MongoDB 里面直接使用 count() 函数就可以完成。
范例:统计 students 表中的数据量
范例:模糊查询
在进行信息查询的时候,不设置条件永远要比设置条件的查询快很多,也就是说在之前的代码编写里面不管是查询全部还是模糊查询,实际上最终都使用的是模糊查询一种(没有关键字)
4.7.2 消除重复数据
在学习 SQL 的时候对于重复的数据可以使用 “DISTINCT” ,那么这一操作在 MongoDB 之中依然支持。
范例:查询所有 name 的信息
此时实现了对于 name 数据的重复值的筛选。
4.7.3 group 操作
使用 “group” 操作可以实现数据的分组操作,在 MongoDB 里面会将集合依据指定的 key 的不同进行分组操作,并且每一个组都会产生一个处理的文档结果。
范例:查询所有年龄大于等于 19 岁的学生信息,并且按照年龄分组
以上的操作代码里面实现的就属于一种 MapReduce ,但是这样只是根据传统的数据库的设计思路,实现了一个所谓的分组操作,但是这个分组的最终结果是有限的。
4.7.4 MapReduce
MapReduce 是整个大数据的精髓所在(实际中别用),所谓的 MapReduce 就是分为两步处理数据:
范例:建立一组雇员数据
使用 MapReduce 操作最终会将处理结果保存在一个单独的集合里面,而最终的处理效果如下:
范例:按照职位分组,取得每个职位的人名
第一组:{key:"CLERK",values:[姓名,姓名,...]}
显示错误信息,表示缺少 “out”,“out” 指的是最终的保存结果的集合。
现在执行之后,所有的处理结果都保存在了 “ t_job_emp ” 集合里面。
范例:统计出各性别的人数、平均工资、最低工资、雇员姓名
虽然大数据的时代提供有最强悍的 MapReduce 支持,但是从现实的开发来讲,真的不可能使用起来。
4.7.5 聚合框架(核心)
MapReduce 功能强大,但是它的复杂度和功能一样强大,那么很多时候我们需要 MapReduce 的功能,可是又不想把代码写的太复杂,所以从 Mongo 2.x 版本之后开始引入了聚合框架并且提供了聚合函数:aggregate() 。
4.7.5.1、 $group
“ $group ” 主要进行分组的数据操作。
范例:实现聚合查询的功能 —— 求出每个职位的雇员人数
这样的操作更加符合于传统的 group by 子句的操作使用。
范例:求出每个职位的总工资
在整个聚合框架里面如果要引用每行的数据使用:“ $字段名称 ” 。
范例:继续计算出每个职位的平均工资
范例:求出最高与最低工资
以上的几个与 SQL 类似的操作计算就成功实现了。
范例:计算出每个职位的工资数据(数组显示)
范例:求出每个职位的人员
使用 “ $push ” 的确可以将数据变为数组进行保存,但是有一个问题出现了,重复的内容也会进行保存,那么在 MongoDB 里面提供有取消重复的设置。
范例:取消重复的数据
默认情况下是将所有数据都保存进去了,但是现在只希望可以保留第一个或者是最后一个。
范例:保存第一个内容(无序的)
范例:保存最后一个内容
虽然可以方便的实现分组处理,但是有一点需要注意,所有的分组数据是无序的,并且都是在内存之中完成的,所以不可能支持大数据量。
4.7.5.2、 $project
可以利用 “ $project ” 来控制数据列的显示规则,那么可以执行的规则如下:
|- 普通列({成员 : 1 | true}):表示要显示的内容
|- “ _id ” 列({"_id" : 0 | false}):表示 “ _id ” 列是否显示
|-条件过滤列({成员 : 表达式}):满足表达式之后的数据可以进行显示
范例:只显示 name 列,不显示 “ _id ” 列
此时只有设置进去的列才可以被显示出来,而其它的列不能够被显示出来。实际上这就属于数据库的投影机制。
实际上在进行数据投影的过程里面也支持四则运算:加法(“add”)、减法(“subtract”)、乘法(“multiply”)、除法(“divide”)、求模(“
范例:观察四则运算
除了四则运算之外也支持如下的各种运算符:
范例:找出所有工资大于等于 2000 的雇员姓名、年龄、工资。
范例:查询职位是 manager 的信息
MongoDB 中的数据是区分大小写的,如果上面的 “MANAGER” 改为 “manager” 查到的数据就会都返回 false ,使用 "$toUpper" 转大写后显示正确信息了。
还可以不区分大小写
范例:使用字符串截取
利用 “$project” 实现的投影操作功能相当强大,所有可以出现的操作几乎都能够使用。
更多聚合操作可以查看文档:https://docs.mongodb.com/manual/aggregation/
4.7.5.3、 $match
“ $match ” 是一个过滤操作,就是进行 WHERE 的过滤。
范例:查询工资在 2000~5000 的雇员
这个时候实现的代码严格来讲只是相当于 “ SELECT * FROM 表 WHERE 条件 ”
范例:控制投影操作
此时相当于实现了 “ SELECT 字段 FROM ... WHERE ... ” 语句结构。
范例:继续分组
通过一系列的演示可以总结一点:
4.7.5.4、 $sort
使用 “ $sort ” 可以实现排序,设置 1 表示升序,设置 -1 表示降序
范例:实现排序
范例:将所有的操作一起使用
此时实现了降序排序,使用的是生成定义的别名。
4.7.5.5、 分页处理:$limit、$skip
“$limit”:负责数据的取出个数
“$skip”:数据的跨过个数
范例:使用 “$limit” 设置取出的个数
范例:跨过三行数据
范例:综合应用
只能够说现在的查询可以在实际的开发之中使用了。
4.7.5.6、 $unwind
在查询数据的时候经常会返回数组信息,但是数组并不方便信息的浏览,所以提供有 “ $unwind” 可以将数组数据变为独立的字符串内容。
范例 :添加一些信息
范例 :将信息进行转化
此时相当于将数组中的数据变为单行的数据
4.7.5.7、$geoNear
使用 “$geoNear” 可以得到附件的坐标点。
范例 :准备测试数据
范例 :设置查询
4.7.5.8、$out
“$out”:利用此操作可以将查询结果输出到指定的集合里面。
范例 :将投影的结果输出到集合里
这类的操作就相当于实现了最早的数据库的复制工作
4.8、深入操作
4.8.1 固定集合
所谓的固定集合指的是规定集合大小,如果要保存的内容已经超过了集合的长度,那么会采用 LRU 的算法(最近最少使用原则)将最早的数据移除,从而保存新的数据。
默认情况下一个集合可以使用 createCollection() 函数创建,或者使用增加数据后自动创建,但是如果想使用固定的集合,就必须明确的创建一个空集合。
范例 :创建一个空集合(固定集合)
其中,“capped:true” 表示为一个固定的集合,而 “size:1024” 指的是集合所占的空间容量(字节),“max:5” 表示最多只能够有 5 条记录。
范例 :向集合里保存5条数据
此时已经达到了集合的上限,那么继续保存新的内容。
此时最早保留的数据已经消失了,实际上这种操作跟缓存机制是非常相似的,例如:在百度上经常会出现一些搜索的关键词(热门),这些词都是会被不断替换的。
4.8.2 GridFS
在 MOngoDB 里面支持大数据的存储(例如:图片、音乐、各种二进制数据),但是这个做法需要用户自己进行处理了,就是使用 “mongofiles” 命令完成。
1、利用命令行进入到所在的路径下;
2、将文件保存到文件库之中;
此时会向数据库里面写入要保存的二进制数据
3、查看保存的文件
4、在 MongoDB 里面有一个 fs 系统集合,这个 集合默认保存在了 test 数据库下
5、删除文件
等于在 MongoDB 里面支持二进制数据的保存,但是存在的意义不大。
4.9、用户管理
在 MongoDB 里面默认情况下只要是进行连接都可以不使用用户名与密码,因为要想让其起作用,则必须具备以下两个条件:
据库的用户,那么就必须先切换到 mldn 数据库上。
范例 :执行用户的创建( hello 、java)、
任何的用户都必须具备有一个自己的操作角色,对于角色最基础的角色:read 、readWrite
那么现在就表示成功的创建了 hello 用户。那么如果要想让此用户名起作用,则必须以授权的方式打开 MongoDB 的服务,修改 MongoDB 的启动文件。
范例 :新的启动配置文件
此时增加了一个验证的启动模式,发现依然可以在不输入用户名和密码的前提下进行登录,并且也可以直接进行数据库的切换操作,但是在使用数据库集合的时候出现了错误提示。
范例 :登录数据库的时候使用用户名与密码
此时就表示成功的实现了用户的登录操作。
范例 :修改密码
如果要修改密码,那么请关闭授权登录。
4.10、Java 执行 Mongo 操作
既然已经强调了 Mongo 作为辅助数据库,那么就必须清楚如何利用程序来进行 MongoDB 的操作。
4.10.1、Mongo-Java-2.x
下面通过几个程序代码来演示 Mongo 的数据库操作。
范例 :连接数据库
此时数据库已经可以正常的进行连接操作了,当取得了 MongoDB 数据库的连接之后,那么就意味着可以进行集合操作了,例如:现在要保存一个 deptcol 的集合信息。
范例 :保存数据
此时已经可以向集合里面成功的进行了数据的保存操作。
范例:读取数据
以上列出的操作有一些遗憾,就是要进行全部数据的显示,这样的做法明显是不好的,可以使用分页。
范例:使用分页处理
但是针对于查询,往往都需要设置一些查询条件,所有的查询条件可以通过 BasicDBObject 类设置。
范例:设置查询条件
范例:设置范围查询 —— in
范例:执行模糊查询
到此为止已经实现了数据的增加、查询等操作功能。
范例:数据一行修改
范例:修改多行数据
范例:删除数据
这个时候基本的 CRUD 就完成了,强烈要求记住:只做这些功能。
4.10.2、Mongo-Java-3.x
Mongo 2.x 的操作基本上流程都是固定的,但是在 Mongo 3.x 里面这个类几乎就跟重写没什么区别。
在 Mongo 2.x 开发包里面只需要使用 MongoClient 就可以定义连接地址与端口号。
范例:连接数据库
范例:数据增加
范例:查询全部数据
范例:设置范围查询
范例:模糊查询
范例:分页显示
范例:数据修改
范例:删除数据
范例:统计查询
综述:
MongoDB 实际上是作为一个附属数据库存在,只有 Node.JS 把它作为正室,但是除了 Node.JS 之外,MongoDB 就是一个不能够单独使用的数据库,都需要与传统的关系型数据库匹配在一起使用。
说明:本资料根据 《李兴华 Java 培训 - MongoDB 数据库》整理,不足之处欢迎各位大神评论或给出建议!
到此这篇mongodb数据库怎么用(mongodb数据库基本操作)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!版权声明:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符,请将相关资料发送至xkadmin@xkablog.com进行投诉反馈,一经查实,立即处理!
转载请注明出处,原文链接:https://www.xkablog.com/sjkxydsj/75126.html