谈谈php中的unicode和utf8编码
本文给大家深入讨论了unicode和utf8这两种编码的关系,理解好了会发现网上一些旧的东西,是严重多余兼过期的,因为从utf-8流行开始到现在,早已经由原来六字节可变编码到实际完全居于unicode(UCS-2)的稳定阶段。
重新认识unicode和utf8编码
直到今天,准确的说是刚才,我才知道UTF-8编码和Unicode编码是不一样的,是有区别的囧
他们之间是有一定的联系的,看看他们的区别:
UTF-8的长度是不一定的,有可能是1、2、3字节
Unicode长度一定,2个字节(USC-2)
UTF-8可以和Unicode互相转换
unicode和utf8的关系
Unicode(16进制)
UTF-8(二进制)
0000 - 007F 0xxxxxxx
0080 - 07FF 110xxxxx 10xxxxxx
0800 - FFFF 1110xxxx 10xxxxxx 10xxxxxx
上面的表格有2个意思,第一个显而易见就是说Unicode和UTF-8字符范围的对应,还有一个可以看出Unicode怎么和UTF-8互相转换:
先说UTF-8到Unicode的转换
UTF-8编码的二进制和上面的3种格式进行匹配,匹配到之后去掉固定位(表格中的非x位置),然后从右到左每8位一组,不够8位左边不领,凑够2个字节16 bits,这16 bits所表示的就是UTF-8对应的Unicode编码,看看下面几个例子:
上面图片中的文字编码格式为UTF-8,可以用WinHex看到其16进制表示
复制代码 代码如下:
字符 => UTF-8 => UTF-8二进制=> 去掉固定位置凑够16位的二进制 => 16进制
汉 => E6B189 => 11100110 10110001 10001001 => 01101100 01001001 => 6C49
字 => E5AD97 => 11100101 10101101 10010111 => 01011011 01010111 => 5B57
#下面是在chrome命令行下面运行的结果
'u6C49'
"汉"
'u5B57'
"字"
#到这里的'话,从UTF-8转换到Unicode已经是一件非常容易的事了,看看转换的伪代码
读取一个字节,11100110
判断该UTF-8字符的格式,属于第三种,3个字节
继续读取2个字节得到 11100101 10101101 10010111
按照格式去掉固定位 1011011 01010111
不够16位,左边补零 01011011 01010111 => 5B57
再看看从Unicode到UTF-8的转换
复制代码 代码如下:
5B57
获取5B57所在的Unicode范围,0800 <= 5B57 <= FFFF,得知5B57的UTF-8有三个字节,形式为1110xxxx 10xxxxxx 10xxxxxx
获取5B57的二进制编码 101101101010111
用上一步骤的二进制编码从右至左拼接UTF-8编码 11100101 10101101 10010111
说说问题
再说说今天这个问题的起因,从前端输入很多单词,UTF-8格式每个词最多30个字节,因此会在前端和后台分别做验证,javascript用的是Unicode编码,后端程序用的是UTF-8编码,现在的解决办法是这样
前端
?
1
2
3
4
-
作为程序员必知的16个最佳PHP库
PHP是一种功能强大的web站点脚本语言,通过PHP,web网站开发者可以更容易地创建动态的引人入胜的web页面。开发人员可以使用PHP代码与一些网站模板和框架来提升功能和特性。然而,编写PHP代码是一个繁琐又耗时的过程。为了缩短开发时间,开发人员可以用PHP库替代编写代...
-
PHP代码如何规范
对于PHP入门学习的童鞋来说,基础是很重的,一定要打好基础。那么大家知道PHP代码如何规范呢?下面一起来看看!了解PHP开发规范可以少走很多弯路,网上各种PHP开发规范也很多,我结合自身使用PHP的情况,来说说我所理解的PHP开发规范,涉及多个方面,比如PHP代码规范、PHP文件...
-
MySQL 入门基础知识
MySQL最流行的关系型数据库管理系统,在WEB应用方面MySQL是最好的RDBMS(RelationalDatabaseManagementSystem,关系数据库管理系统)应用软件之一。以下是小编为大家搜索整理的MySQL入门基础知识,希望能给大家带来帮助!更多精彩内容请及时关注我们应届毕业生考试网!...
-
PHP程序员基本要求和必备技能
PHP程序员有什么必备知识呢?以下是本站小编精心为大家整理的PHP程序员基本要求和必备技能,希望对大家成为程序员有所帮助!更多内容请关注应届毕业生网!一名PHP程序员的基本要求:1、精通html、CSS、JS等网站前端技术。2、掌握PHP编程技术。3、了解Linux及Apache、...
相关文章
- 浅析PHP中的UNICODE编码与解码
- php实现utf-8转unicode函数分享
- Efforts Urged to Improve Womens Reproductive Health英语阅读
- PHP如何实现Unicode和Utf-8编码相互转换
- 高中英语作文:My approach to difficulties in learning
- 浅谈php中curl和fsockopen的应用
- Zend studio for eclipse中使php可以调用mysql相关函数的设置方
- 八年级《unit8 Why don’t you get her a scarf? Period1》评课稿
- 九年级《unit 6 I like music that I can dance to. Period2》评课稿
- PEP六年级上册《Unit1Howdoyougotoschool》知识点归纳