如何设置mysql字符集为utf8mb4_mysql字符集配置指南

MySQL默认字符集是utf8mb3而非utf8mb4,需手动配置my.cnf/my.ini的client[mysqld]段落,设default-character-set和character-set-server为utf8mb4,并重启服务;再对已有库表字段执行ALTER转换;客户端连接也须显式指定utf8mb4。

MySQL 默认字符集不是 utf8mb4,要支持完整 Unicode(比如 emoji、生僻汉字),必须手动配置为 utf8mb4,并确保 collation 使用 utf8mb4_unicode_ciutf8mb4_0900_ai_ci(MySQL 8.0+ 推荐)。

修改 MySQL 配置文件(my.cnf 或 my.ini)

这是全局生效的关键步骤。找到 MySQL 的配置文件(Linux 通常在 /etc/my.cnf/etc/mysql/my.cnf,Windows 在 MySQL 安装目录下的 my.ini),在对应段落下添加或修改以下内容:

  • [client] 下添加:
    default-character-set = utf8mb4
  • [mysql] 下添加:
    default-character-set = utf8mb4
  • [mysqld] 下添加:
    character-set-server = utf8mb4
    collation-server = utf8mb4_unicode_ci(或 utf8mb4_0900_ai_ci

⚠️ 注意:不要只写 utf8 —— MySQL 的 utf8 实际是 utf8mb3,最多只支持 3 字节字符,无法存储 emoji 等 4 字节 Unicode 字符。

重启 MySQL 服务并验证配置

保存配置后,必须重启 MySQL 才能生效:

  • Linux:sudo systemctl restart mysqlsudo service mysqld restart
  • Windows:通过服务管理器重启 “MySQL” 服务

登录 MySQL 后执行以下命令确认是否生效:

SHOW VARIABLES LIKE 'character_set%';
SHOW VARIABLES LIKE 'collation%';

重点检查:
character_set_servercollation_servercharacter_set_database 应全为 utf8mb4 和对应 collation。

对已有数据库、表和字段单独转换

配置文件修改只影响新建库/表。已有对象需显式转换:

  • 修改数据库默认字符集:
    ALTER DATABASE db_name CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci;
  • 修改某张表:
    ALTER TABLE table_name CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
  • 仅修改某个字段(如 TEXT 类型字段):
    ALTER TABLE table_name MODIFY column_name VARCHAR(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

? 提示:执行前建议备份;若字段含索引且长度超限制(如 VARCHAR(255) + utf8mb4 可能超 InnoDB 行限制),可适当减小长度或改用 TEXT。

客户端连接时也需指定 utf8mb4

即使服务端设好了,应用连接时未声明字符集,仍可能乱码。常见做法:

  • MySQL 命令行连接加参数:
    mysql -u user -p --default-character-set=utf8mb4 db_name
  • PHP PDO 连接 DSN 中添加:
    charset=utf8mb4(如 mysql:host=localhost;dbname=test;charset=utf8mb4
  • Java JDBC URL 添加:
    ?characterEncoding=utf8mb4&serverTimezone=UTC
  • Python PyMySQL / MySQLdb:在 connect() 参数中指定 charset='utf8mb4'

不设置连接层字符集,即便表是 utf8mb4,插入/查询也可能退化为 latin1 或 utf8mb3 行为。