公众号二次开发,在处理用户昵称的时候发现有的时候一些emoji是4字节的表情无法保存入库,经过查找资料发现是因为字段的编码问题造成的, utf-8是3字节的 ,解决本问题的前提条件:
mysql版本为5.5.3以前(版本为5.5.3以前将不能使用utf-8mb4编码),需要重装更高版本的mysql,然后获得该编码。
1,检查自己当前数据库版本:
select version();
2,备份当前数据库中的数据
这里我使用的数据库可视化软件是navicat,在数据库下右键对应的数据库,然后选择“转储SQL文件”选择“数据和结构”导出后缀为.sql 的数据库文件保存硬盘里,当安装好新的数据库版本后,再选定数据库,右键“运行SQL文件”这样数据就不会丢失
3,彻底删除当前数据库
数据库的删除很繁琐,有时候删不干净,我这里参考了一些方法,亲测可用。
3.1 删除Mysql的服务
控制面板——》所有控制面板项——》程序和功能,卸载mysql server!
3.2 删除mysql目录下所有文件
删除mysql文件夹下的my.ini文件及所有文件
一般的安装目录在:C:\Program Files\MySQL
3.3 删除注册表信息
同时按下“win”+ R 然后输入regedit进入注册表管理器
删除:
1 | HKEY_LOCAL_MACHINE\SYSTEM\ControlSet001\Services\Eventlog\Application\MySQL文件夹 |
删除:
1 | HKEY_LOCAL_MACHINE\SYSTEM\ControlSet002\Services\Eventlog\Application\MySQL文件夹。 |
删除:
1 | HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Eventlog\Application\MySQL的文件夹 |
如果没有或者不存在以上文件夹就不用管了
3.4 删除隐藏的mysql文件夹
一般以隐藏的形式存在,在C盘下搜索该目录应该可以查到C:\ProgramData\MySQL\MySQL Server 5.7
4 安装数据库mysql5.7
首先下载mysql5.7,我使用的是msi版本,安装过程就不详细叙述了,总之最后安装到默认路径也就是C盘下了,安装好之后,为了调出小黑窗,我配置了系统环境变量
在系统变量那一块儿选择path,在path下输入数据库的安装路径就可以了,具体到bin文件夹的路径就好,这时调出小黑窗查看自己的编码格式
语句是: SHOW VARIABLES LIKE ‘character_set%’;
显示的应该都是utf-8,因为安装默认就是utf-8
5 修改编码格式
首先要在配置文件里(my.ini)下修改配置,但是我们发现安装目录里并没有该文件
这个就是令我一下午懊恼的地方,后来通过查阅资料,发现该文件隐藏在c盘里的隐藏文件夹,还是在c盘下搜索 C:\ProgramData\MySQL\MySQL Server 5.7
找到了该文件:
在该my.ini文件下进行配置修改
[client]
default-character-set = utf8mb4
[mysql]
default-character-set = utf8mb4
[mysqld]
character-set-client-handshake = FALSE
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci
init_connect='SET NAMES utf8mb4'
SHOW VARIABLES LIKE ‘character_set%’;
数据库的字符集已经被修改过来了
SHOW VARIABLES LIKE ‘collation%’;
数据表的字符集也都被修改了
值得注意的是,utf8mb4兼容utf-8,所以不用担心原来的数据出现乱码情况。
扩展知识:
如果已经有表有数据的可以执行如下语句进行转换
更改数据库编码(字符集):
ALTER DATABASE 【DATABASE_NAME 】 DEFAULT CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;
更改表编码(字符集)(注意:这里修改的是表的字符集,表里面字段的字符集并没有被修改):
ALTER TABLE 【TABLE_NAME】 DEFAULT CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;
更改表编码(字符集)和表中所有字段的编码(字符集):
ALTER TABLE 【TABLE_NAME】CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;
扩展2:那都不该,过滤掉垃圾数据字符
在存入数据库或者其他操作的时候往往会报错,在这个问题上我们可以采用过滤的方式,采用ASCII编码过滤
/*
*过滤存在的乱码
*/
public static String dofilter(String str){
String str_Result = “”, str_OneStr = “”;
for (int z = 0; z < str.length(); z++) {
str_OneStr = str.substring(z, z + 1);
if (str_OneStr.matches(“[\u4e00-\u9fa5]+”)||str_OneStr.matches(“[\\x00-\\x7F]+”))
{
str_Result = str_Result + str_OneStr;
}
}
return str_Result;
}
很简单的一个方法可以实现
扩展3:
<?php
return array(
//’配置项’=>’配置值’
‘DB_TYPE’ => ‘mysql’, // 数据库类型
‘DB_HOST’ => ‘101.201.209.135’, // 服务器地址
‘DB_NAME’ => ‘*****’, // 数据库名
‘DB_USER’ => ‘*****’, // 用户名
‘DB_PWD’ => ‘****’, // 密码
‘DB_PORT’ => ‘3306’, // 端口
‘DB_CHARSET’ => ‘utf8mb4’ //主要是这句增加指明数据库编码
);
2.会员表member 的nickname字段
字符集:utf8mb4
排序规则:utf8mb4_general_ci
评论
评论已关闭!