新闻动态
网站建设中的字符编码
https://www.sytm.net 发布日期:2013/11/21 13:55:54

当提到“文字”的时候,或许你想到的是“我在我的电脑屏幕上所看到的字母和字符。”但其实电脑所处理的并不是字母和符号,而是位和字节。每个你能在电脑屏幕上看到的文字本质上是以某种字符编码存储着。字符编码有很多种,有些专门面向特定语言,比如俄文、中文或英文,有些则可用于多种语言。粗略地讲,字符编码为你在屏幕上所看到的东西,以及电脑实际存储在内存和磁盘上的东西之间提供了一种映射。

在实际中,这要复杂得多。有些字符在多种编码中都很常见,但是每种编码却可能使用不同的字节序列来实际存储这些字符。所以,你可以将字符编码看做某种给文字解密的密钥。当有人给你一段字节序列并声称它是一段“文字”,你就需要知道他所用的字符编码,这样才能将字节编码成字符并显示出来。

那么,浏览器是如何实际确定WEB服务器发来的节流的编码呢?如果熟悉HTTP头信息,你可能见过:

Content-Type:text/html;charset=”utf-8”

简单地说,这表示WEB服务器认为它在向你发送一个HTML文件,并且认为这个文件使用的是UTF-8字符编码。不幸的是,在整个宏伟的万维网世界,没有几个开发者能够有HTTP服务器的控制权。考虑一下Blogger的情况:文章内容是由个人用户提供的,到那时服务器由Google运营。因此,HTML4 中提供了一个方法来指定在HTML文件本身的字符编码。你可能也见过这个:

<meta http-equiv=”Content-Type” content=”text/html;charset=utf-8”>

简单地说,这表示网页开发者认为她的页面使用的是UTF-8的字符编码。

以上两种方法在HTML5中仍然有效。使用HTTP头信息是首选,并且它会覆盖<meta>标签的作用。但并不是每个人都可以设置HTML头信息,因此<meta>标记仍然有用。事实上,在HTML5中这个变得稍微更容易了一点。现在看来就是这样:

<meta charset=”utf-8”/>

这适用于所有浏览器。而该缩略语法从何而来呢?以下是我能找到的最佳解释:

<META  HTTP-EQUIV=Content-Type CONTENT=text/html;charset=ISO-8859-1>

如果你不相信浏览器已经这么做了的话,甚至还有一些<mate charset>的测试用例可以说明。


更多阅读
  • 线上订货系统让全渠道销售触手可及 近年来,中国电商平台发展迅速,以淘宝、京东等电商为代表的新兴商业模式被越来越多的客户所推崇,中国网民...
  • 添美订货系统十月更新日志 添美订货系统是东北开发订货软件的厂商,该订货软件实现了全渠道全客户端的覆盖。拥有南方的易订货、订货宝...
  • 三好街的渠道订货系统 现如今,人们对电子数码产品的需求与日俱增,但是不少电子数码产品企业的生意却未见起色,为什么?以三好街...
返回列表
© 2010 TianMei Technology All rights reserved. ICP:辽B2-20150138辽公网安备 21010202000010号  目录概览