字符集概念

字符集定义了字符与数字编码的映射关系。选择正确的字符集对于正确存储和显示多语言内容至关重要。

常用字符集

字符集特点适用场景
UTF-8变长编码,兼容ASCII国际化应用
UTF8MB4完整UTF-8,支持emoji现代应用推荐
GBK中文双字节编码纯中文系统
Latin1单字节西欧编码英文系统

常见问题

  • 乱码:字符集不匹配
  • 问号显示:字符无法映射
  • 数据截断:编码长度不足

解决方案

  1. 数据库、表、字段统一使用UTF8MB4
  2. 连接时指定字符集:SET NAMES utf8mb4
  3. 应用程序使用相同编码
  4. 导入导出指定编码

MySQL字符集设置

ALTER DATABASE 数据库名 CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;