博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
数据库设计之选择合适的表引擎
阅读量:6247 次
发布时间:2019-06-22

本文共 2145 字,大约阅读时间需要 7 分钟。

hot3.png

什么是表引擎

我们看到的表结构,它的本质是数据在硬盘中的存储。根据不同的特性,数据的存储方式不同。比如:对于每一条数据,在硬盘中它是怎么存储的,怎么压缩的,怎么建立索引和优化的,它的读取和写入是怎么实现的。这些完整的一条路径,我们称之为表引擎。
选择的依据
选择的依据,是我们的需求,我们的需求很大程度上决定我们的选择。有的时候,我们的习惯决策着这个过程。这里,我们关注一下方面:

  • 并发性,同一时间支持的写入和读取特性;

  • 安全性,物理存储结构,异常发生时数据的是否可靠;

  • 事务性,数据执行的颗粒,以及提供的定义原子操作的特性;

  • 查询优化,这里我们指查询缓存和索引;

在开发上,我们主要关注:(1,3,4),在运维层面,我们关注(2)。

在表的选择上,最常用的是如下:

  • MyIsam

  • Innodb

  • Memory(Heap)

从案例开始

现在我们要做一个留言板,我们发现这个留言板可能有几种情况:

  • 有很多人同时留言,同时,查看留言的人也很多;

  • 留言的人很少,每天查看留言的人非常多;

  • 我们的功能有留言奖励,每天前10个留言的,会有积分奖励;

  • 我们的留言板有点像实时聊天器,对性能要求和实时性要求非常高;

MYSIAM

在5.0的时代,这个表是使用得非常普遍的,我了解的Discuz就是使用这种表。它的优势:查询速度,被很多人看重。我们看看它的一些特点:

  • 理论上存储无限制(与操作系统的文件系统有关)

  • 存在text/blob全文索引

  • 索引缓存

  • 数据压缩

  • 低存储空间和低内存占用

  • 高速写入

  • 查询缓存

  • 串行写入时,全表锁(读和写)

  • 不支持事务

  • 集群支持

  • B-Tree索引

create table a_myisam (.....) ENGINE = MYISAM;

以上特性,我们看到MyIsam主要是为查询而设计的,也是最初大家做数据存储时考虑的东西。

InnoDB 从5.1开始,InnoDB慢慢发展起来,并且成为重要数据的存储引擎。它的特点如下:

  • 有限制的存储

  • 索引缓存

  • 支持事务

  • 查询缓存

  • 写入行锁

  • B-Tree索引

create table a_myisam (.....) ENGINE = InnoDB;

InnoDB更加稳定和成熟,也为更多需求提供解决方案。

Memory

  • 查询速度快

  • mysql重启后丢失

  • B-Tree和HASH索引

仅仅是为了快,小量数据。

A:很多人同时留言,看留言的人也很多
这意味着什么?我们的写入速度要够快且写入不影响读取。或者,我们可以并行写入。这种情况,如果我们选择MyIsam,写入量的增加会导致全表上锁,以至于读取时,要等待锁的释放;那么,显然,MyIsam会造成表性能瓶颈。这种情况,我们选择Innodb。理由如下:

  • Innodb写入时,锁为行锁;不影响其它写入,影响少量读(有可能大量);

  • Innodb的查询性能理论上比Myisam稍差,但是非常小,可忽略;

B:留言的人很少,每天查看留言的人非常多

这个时候,选择MyIsam,没有什么问题。(读/写比较高)
C:我们的功能有留言奖励,每天前10个留言的,会有积分奖励
我们需要一些原子级别的操作,也就是在判断某条留言是前10名的时候,就将它标记,而这个标记需要原子级的:标记的过程中不允许别人查询和写入(全表锁)。这是什么意思?由于我们的操作是没有严格的前后顺序的,计算机的CPU运算分片本质是串行的。假设这个时候你有两条命令:

  • 查询是否前10个

  • 增加积分

假设现在已经有9个条留言了,那么这个时候来了两个请求,都查询自己是否是前10个。第一个用户查到自己是第10个,然后在它要执行第二步的时候,第11个用户来了,他也查询自己是第10个,如果没有保护机制,那么第11个也被认为是满足条件,他也会被加分。

如何实现?
一般情况下我们会增加一个字段来做标记,这个字段假设为:lock,那么更新的时候保证这个中间是没有其它操作的。我们称之为事务。

start
select ... from table where lock = 0 for update;
update table set lock = 1;
commit

D:我们的留言板有点像实时聊天器,对性能要求和实时性要求非常高

呵呵,这个不用说了,使用innodb和memory都可以。一般我们使用内存存储,会把它当做K-V来使用,根据设计的情况来选择。(不过,业内很少时候,内存的存储一般都会选择Memcache和Redis)。
总结一下

  • 如果读/写 比很大的话,假设这个尺度为10,那么,就使用myisam(写入并发小的情况)

  • 如果需要事务的支持,使用innodb

  • 如果需要对并发性(写入)有要求的话,使用innodb

  • 其它情况,可以根据实际场景选择

问答

  • 主从库可以使用不同的引擎么?

    答:这个我没有做过,还不了解;大家可以自己查一下(mysql手册)

  • 我想多问一点,使用memory或者Memcache和Redis,是不是相比myisam或innodb引擎对服务器内存的要求或占用高很多?

    答:对的,有专门的内存服务器来干这件事;

转载于:https://my.oschina.net/u/998304/blog/363224

你可能感兴趣的文章
Python:pandas之DataFrame常用操作
查看>>
Appium移动自动化测试之—基于java的iOS环境搭建
查看>>
NOIP前的刷题记录
查看>>
洛谷P1973 [NOI2011]Noi嘉年华(决策单调性)
查看>>
书签(Bookmarks)
查看>>
Java 信号量 Semaphore 介绍
查看>>
Ubuntu常用软件安装与使用
查看>>
Anroid开发中常用快捷键
查看>>
RecyclerView分隔线定制
查看>>
文本处理(CSS,JS)
查看>>
VBScript 函数
查看>>
shell编程学习
查看>>
java.lang.NoSuchMethodError: antlr.collections.AST.getLine()I错误解决
查看>>
apache源码安装
查看>>
使用TensorFlow遇到的若干问题
查看>>
poj2187
查看>>
Linux下使用 xrandr 命令设置屏幕分辨率
查看>>
Bzoj4766: 文艺计算姬(Matrix-tree/prufer)
查看>>
swift - 移除界面上的所有元素
查看>>
Linux常用函数
查看>>