2025-03-25-01

This commit is contained in:
2025-03-25 17:57:51 +08:00
parent 6536fc0460
commit ffb1da1215
6 changed files with 360 additions and 9 deletions

View File

@@ -8,6 +8,40 @@
| **扩展性** | 通常采用垂直扩展(增加硬件性能),扩展性有限 。 | 支持水平扩展(增加节点),适合大规模分布式系统,扩展性更强 。 |
| **查询语言** | 使用SQL结构化查询语言通用性强且易于理解 。 | 通常使用特定API或查询语言灵活性更高但学习成本较大 。 |
| **适用场景** | 适合需要复杂查询、事务处理和强一致性的场景如银行系统、ERP等 。 | 适合大数据、高并发、实时性要求高的场景,如社交网络、物联网等 。 |
## 数据库设计三大范式
数据库设计的三大范式是关系型数据库设计中用于减少数据冗余、提高数据一致性和可维护性的基本原则。以下是三大范式的具体定义和要求:
### 1. **第一范式1NF**
第一范式要求确保表中的每列都具有原子性,即字段值不可再分解。换句话说,每一列的值必须是单一的、不可分割的基本数据项,不能包含多个值或复杂结构。
- **目标**:消除重复组或多值字段。
- **示例**:在一个学生信息表中,如果“联系方式”列存储了多个电话号码,则违反了第一范式。应该将其拆分为单独的行或表以满足原子性。
---
### 2. **第二范式2NF**
第二范式建立在第一范式的基础上,要求表中的每一列都必须完全依赖于主键,而不能仅仅依赖于主键的一部分(即消除部分依赖)。这意味着当表的主键是由多个列组成的复合主键时,非主键列必须与整个主键相关联。
- **目标**:消除部分依赖。
- **示例**假设有一个订单明细表主键由“订单ID”和“商品ID”组成。如果表中还存在“客户姓名”这样的列它只依赖于“订单ID”而不依赖于“商品ID”这就违反了第二范式。应将“客户姓名”移到另一个表中。
---
### 3. **第三范式3NF**
第三范式建立在第二范式的基础上,要求表中的每一列都必须直接依赖于主键,而不能通过其他非主键列间接依赖于主键(即消除传递依赖)。
- **目标**:消除间接依赖。
- **示例**在一个员工信息表中如果存在“部门ID”和“部门名称”两列“部门名称”依赖于“部门ID”而不是直接依赖于主键如“员工ID”这就违反了第三范式。应将“部门名称”移到一个独立的部门表中。
---
### 总结
- **第一范式1NF**:确保每列保持原子性,字段值不可再分。
- **第二范式2NF**:确保每列完全依赖于主键,消除部分依赖。
- **第三范式3NF**:确保每列直接依赖于主键,消除传递依赖。
遵循这三大范式可以有效地减少数据冗余,提高数据库的规范性和一致性。不过,在实际应用中,有时为了性能或其他需求,可能会对范式进行适当的反规范化处理。
## 2. 为什么我们需要索引
@@ -46,17 +80,23 @@
## Mysql有哪些日志简单概括有什么用
MySQL 中有多种日志,每种日志的作用各不相同,以下是它们的简单概括:
1. **Binlog二进制日志**
1. **Binlog二进制日志** 保证
- **作用**记录所有对数据库的修改操作DDL 和 DML 语句),但不包括查询语句(如 SELECT、SHOW。主要用于数据恢复、主从复制和审计 。
- **特点**:以二进制格式存储,支持 STATEMENT、ROW 和 MIXED 三种模式记录 。
2. **Redo Log重做日志**
- **作用**:保证事务的持久性。记录的是数据页的物理修改,用于在 MySQL 崩溃后恢复未写入磁盘的数据(即“崩溃恢复”)。
- **作用**:保证事务的**持久性**。记录的是数据页的物理修改,用于在 MySQL 崩溃后恢复未写入磁盘的数据(即“崩溃恢复”)。
- **特点**:循环写入,固定大小,保存未刷入磁盘的脏页日志 。
3. **Undo Log回滚日志**
- **作用**:保证事务的原子性。记录的是事务执行前的数据状态,用于回滚操作或实现 MVCC多版本并发控制
- **特点**:与 Redo Log 配合使用,确保事务的一致性隔离性。
- **作用**:保证事务的**原子性**。记录的是事务执行前的数据状态,用于回滚操作或实现 MVCC多版本并发控制
- **特点**:与 Redo Log 配合使用,确保事务的**一致性**和**隔离性**
原子性--> Undo Log
一致性--> 其他几项同时保证
持久性--> Redo Log
隔离性--> MVCC LBCC
## 执行一条语句操作日志的完整过程
@@ -118,4 +158,71 @@ Read View 有四个重要的字段:
- 如果记录的 trx_id **在** m_ids 列表中,表示生成该版本记录的活跃事务依然活跃着(还没提交事务),所以该版本的记录对当前事务**不可见**。
- 如果记录的 trx_id **不在** m_ids列表中表示生成该版本记录的活跃事务已经被提交所以该版本的记录对当前事务**可见**。
**这种通过「版本链」来控制并发事务访问同一个记录时的行为就叫 MVCC多版本并发控制**
**这种通过「版本链」来控制并发事务访问同一个记录时的行为就叫 MVCC多版本并发控制**
## Mysql数据类型
以下是MySQL中常用的数据类型分类及其说明的表格按照类别进行了整理方便查阅
---
### **数值类型**
| 数据类型 | 存储大小 | 范围 (有符号) | 范围 (无符号) | 描述 |
|----------------|---------------|-----------------------------------------|---------------------------------|----------------------------------------|
| `TINYINT` | 1 字节 | -128 到 127 | 0 到 255 | 非常小的整数 |
| `SMALLINT` | 2 字节 | -32,768 到 32,767 | 0 到 65,535 | 小整数 |
| `MEDIUMINT` | 3 字节 | -8,388,608 到 8,388,607 | 0 到 16,777,215 | 中等大小的整数 |
| `INT``INTEGER` | 4 字节 | -2,147,483,648 到 2,147,483,647 | 0 到 4,294,967,295 | 标准整数 |
| `BIGINT` | 8 字节 | -9,223,372,036,854,775,808 到 9,223,372,036,854,775,807 | 0 到 18,446,744,073,709,551,615 | 大整数 |
| `FLOAT` | 4 字节 | -3.402823466E+38 到 -1.175494351E-38 和 1.175494351E-38 到 3.402823466E+38 | 0 和 1.175494351E-38 到 3.402823466E+38 | 单精度浮点数 |
| `DOUBLE` | 8 字节 | -1.7976931348623157E+308 到 -2.2250738585072014E-308 和 2.2250738585072014E-308 到 1.7976931348623157E+308 | 0 和 2.2250738585072014E-308 到 1.7976931348623157E+308 | 双精度浮点数 |
| `DECIMAL(M,D)`| 可变 | 依赖于 M 和 D 的值 | 依赖于 M 和 D 的值 | 精确的小数值M 是总位数D 是小数位数 |
### **日期和时间类型**
| 数据类型 | 存储大小 | 范围 | 格式 | 描述 |
|----------------|---------------|-----------------------------------------|--------------------|----------------------------------------|
| `DATE` | 3 字节 | '1000-01-01' 到 '9999-12-31' | YYYY-MM-DD | 仅存储日期 |
| `TIME` | 3 字节 | '-838:59:59' 到 '838:59:59' | HH:MM:SS | 仅存储时间 |
| `DATETIME` | 8 字节 | '1000-01-01 00:00:00' 到 '9999-12-31 23:59:59' | YYYY-MM-DD HH:MM:SS | 日期和时间的组合 |
| `TIMESTAMP` | 4 字节 | '1970-01-01 00:00:01' UTC 到 '2038-01-19 03:14:07' UTC | YYYY-MM-DD HH:MM:SS | 时间戳,通常用于记录时间戳 |
| `YEAR` | 1 字节 | '1901' 到 '2155' | YYYY | 仅存储年份 |
### **字符串类型**
| 数据类型 | 最大长度 | 存储需求 | 描述 |
|----------------|----------------|---------------------------------------|----------------------------------------|
| `CHAR(M)` | 0-255 字符 | M × 字符集字节数 | 固定长度字符串,不足补空格 |
| `VARCHAR(M)` | 0-65,535 字节 | 实际长度 + 1 或 2 字节 | 可变长度字符串 |
| `TEXT` | 0-65,535 字节 | L + 2 字节 | 长文本数据 |
| `TINYTEXT` | 0-255 字节 | L + 1 字节 | 小型文本数据 |
| `MEDIUMTEXT` | 0-16,777,215 字节 | L + 3 字节 | 中型文本数据 |
| `LONGTEXT` | 0-4,294,967,295 字节 | L + 4 字节 | 超长文本数据 |
| `BLOB` | 0-65,535 字节 | L + 2 字节 | 二进制大对象 |
| `TINYBLOB` | 0-255 字节 | L + 1 字节 | 小型二进制对象 |
| `MEDIUMBLOB` | 0-16,777,215 字节 | L + 3 字节 | 中型二进制对象 |
| `LONGBLOB` | 0-4,294,967,295 字节 | L + 4 字节 | 超长二进制对象 |
| `ENUM` | 1 或 2 字节 | 最多 65,535 个值 | 枚举类型,只能从预定义列表中选择一个值 |
| `SET` | 1、2、3、4 或 8 字节 | 最多 64 个成员 | 集合类型,可以选择多个值 |
### **空间类型**
| 数据类型 | 描述 |
|----------------|----------------------------------------|
| `GEOMETRY` | 几何类型的基类 |
| `POINT` | 表示一个点 |
| `LINESTRING` | 表示一条线 |
| `POLYGON` | 表示一个多边形 |
| `MULTIPOINT` | 表示多个点 |
| `MULTILINESTRING` | 表示多条线 |
| `MULTIPOLYGON`| 表示多个多边形 |
| `GEOMETRYCOLLECTION` | 表示几何对象的集合 |
### **JSON 类型**
| 数据类型 | 描述 |
|----------------|----------------------------------------|
| `JSON` | 用于存储 JSON 文档 |
---
### **注意事项**
1. **字符集影响**:对于字符串类型(如 `CHAR``VARCHAR`),实际存储大小会受到字符集的影响。例如,使用 UTF-8 编码时,每个字符可能占用 1 到 4 个字节。
2. **存储效率**:选择合适的数据类型可以显著提高存储效率和查询性能。例如,如果只需要存储小范围的整数,优先选择 `TINYINT` 而非 `INT`
3. **时间戳与 DATETIME**`TIMESTAMP` 类型受时区影响,而 `DATETIME` 不受时区影响。