utf8

  • php下检测字符串是否是utf8编码的代码

    php下检测字符串是否是utf8编码的代码 2015-05-02

    给一个字符串,怎么判断它是什么编码呢?php有一个函数:mb_detect_encoding.不过这个东西需要有mb_string库,不是到处都能用的. function is_utf8($string) { return preg_match('%^(?: [\x09\x0A\x0D\x20-\x7E] # ASCII | [\xC2-\xDF][\x80-\xBF] # non-overlong 2-byte | \xE0[\xA0-\xBF][\x80-\xBF] # excluding

    关键词: utf8, PHP, 检测字符串
  • UTF8编码内的繁简转换的PHP类

    UTF8编码内的繁简转换的PHP类 2015-04-29

    在网上找了很久都没有找到UTF8字符集内的繁简转换,或许网上已经有人写过这样的代码. 曾找过一个JS版的,但是到了UTF8编码里不能用,于是就产生了自已写一个的念头.其实我这个代码的实现原理很简单的,只是一个替换字符集的过程,相信大部份人都可以写得出来.以下是代码,不知道有没有bug,大家如果在使用上有问题,可以提出来 <?php //<meta charset=utf-8"> class utf8_chinese { private $utf8_gb2312; private

    关键词: utf8, 繁简转换
  • UTF-8 GBK UTF8 GB2312 之间的区别和关系介绍

    UTF-8 GBK UTF8 GB2312 之间的区别和关系介绍 2015-03-25

    UTF-8:Unicode TransformationFormat-8bit,允许含BOM,但通常不含BOM.是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码 UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强.UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示.如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包. GBK是国家标准GB2312基础上扩容后兼容GB2312的

    关键词: utf 8, utf8, gb2312, gbk
  • centos6和centos7数据库配置默认编码

    centos6和centos7数据库配置默认编码 2015-03-25

    数据库都使用yum安装 centos6 一般使用:default-character-set = utf8mb4 centos7 就需要改变为: default_character_set = utf8mb4 或 character_set_server = utf8mb4

    关键词: utf8, MySQL, 编码
  • PHP检测字符串是否为UTF8编码的常用方法

    PHP检测字符串是否为UTF8编码的常用方法 2015-03-25

    这篇文章主要介绍了PHP检测字符串是否为UTF8编码的常用方法,列举了四个实例从不同的角度来实现这一功能,是非常实用的技巧,具有一定的学习借鉴价值,需要的朋友可以参考下 本文实例总结了PHP检测字符串是否为UTF8编码的常用方法.分享给大家供大家参考.具体实现方法如下: 检测字符串编码可以有很多种方法,如利用ord获得字符的进制然后进入判断,或利用mb_detect_encoding函数来处理,下面整理了四种常用方法供大家参考. 例子1 /** * 检测字符串是否为UTF8编码 * @param

    关键词: utf8, PHP, 字符串, 检测
  • 真正根据utf8编码的规律来进行截取字符串的函数(utf8版sub_str )

    真正根据utf8编码的规律来进行截取字符串的函数(utf8版sub_str ) 2015-03-15

    真正根据utf8编码的规律来进行截取的字符的函数,utf8版sub_str 支持1~6个字节的字符的截取,而非只针对中文,比网上的全 /* * 功能: 作用跟substr一样,除了它不会造成乱码 * 参数: * 返回: */ function utf8_substr( $str , $start , $length=null ){ // 先正常截取一遍. $res = substr( $str , $start , $length ); $strlen = strlen( $str ); /*

    关键词: utf8, 截取字符串
  • js 编码转换 gb2312 和 utf8 互转的2种方法

    js 编码转换 gb2312 和 utf8 互转的2种方法 2015-03-04

    这篇文章介绍了gb2312 和 utf8 互转的JS方法,有需要的朋友可以参考一下 方法一: function gb2utf8(data){ var glbEncode = []; gb2utf8_data = data; execScript("gb2utf8_data = MidB(gb2utf8_data, 1)", "VBScript"); var t=escape(gb2utf8_data).replace(/%u/g,"").repl

    关键词: utf8, gb2312, 编码
  • utf8编码检测方法分享

    utf8编码检测方法分享 2015-02-01

    这篇文章主要介绍了utf8编码检测方法示例,需要的朋友可以参考下 public bool isUtf8(byte[] rawText) { bool result = true; if (rawText == null) { return !result; } int pos = 0; while (pos < rawText.Length && result) { if ((rawText[pos] & 0x7F) == rawText[pos]) { pos++; } e

    关键词: utf8, 编码
  • javascript中的Base64.UTF8编码与解码详解

    javascript中的Base64.UTF8编码与解码详解 2015-01-20

    本文给大家介绍的是javascript中的Base64.UTF8编码与解码的函数源码分享以及使用范例,十分实用,推荐给小伙伴们,希望大家能够喜欢. Base64编码说明 Base64编码要求把3个8位字节(3*8=24)转化为4个6位的字节(4*6=24),之后在6位的前面补两个0,形成8位一个字节的形式. 如果剩下的字符不足3个字节,则用0填充,输出字符使用'=',因此编码后输出的文本末尾可能会出现1或2个'='. base64编码库:(已验证可用) var base64 = (functio

    关键词: utf8, base64, JavaScript
  • C++字符编码问题探究和中文乱码的产生

    C++字符编码问题探究和中文乱码的产生 2015-01-02

    引言 一直以来,C/C++对中文字符的处理时常让人摸不着头脑. 主要有下面几个原因: 文件编码方式的差异 系统环境对中文的解释有差异 不同编译器对标准库的实现有差异 而这三者往往又相互影响,暗藏玄机,让人抓狂. 在写本文之前我查阅了很多博客,关于中文的输入输出,cout,wcout,fstream,wfstream,乱码解决方案等等问题都有了十分详细的解答,但是,很多博文具有片面性. 许多博主仅仅是针对自己所使用的环境做阐述,而又没有明确指明使用了何种IDE,何种编译器,何种系统.结果就是,博主

    关键词: utf8, ansi, 乱码, 编码, wcout
  • php 判断网页是否是utf8编码的方法

    php 判断网页是否是utf8编码的方法 2015-01-01

    这篇文章主要介绍了php 判断网页是否是utf8编码的方法,需要的朋友可以参考下 //判断编码 $encode = mb_detect_encoding($q, array('GB2312','GBK','UTF-8')); echo $encode."<br/>"; if($encode=="GB2312") { $q = iconv("GBK","UTF-8",$q); } else if($encode==&

    关键词: utf8, 网页, mb detect encoding
  • PHP通过iconv将字符串从GBK转换为UTF8字符集

    PHP通过iconv将字符串从GBK转换为UTF8字符集 2014-12-29

    PHP通过iconv将字符串从GBK转换为UTF8字符集的方法,需要的朋友可以参考下. 1. iconv()介绍 iconv函数可以将一种已知的字符集文件转换成另一种已知的字符集文件.例如:从GB2312转换为UTF-8. iconv函数在php5中内置,GB字符集默认打开. 2. iconv()错误 iconv在转换字符"-"到gb2312时会出错,解决方法是在需要转成的编码后加 "//IGNORE",也就是iconv函数第二个参数后.如下: iconv(&quo

    关键词: utf8, gbk, iconv
  • svn中import 从本地编码转换到UTF8失败

    svn中import 从本地编码转换到UTF8失败 2014-12-27

    svn :xx目录 中的条目从本地编码转换到UTF 8失败 svn:有效UTF-8数据 (16进制) 后面是无效UTF-8序列 (16进制:b8 b4 bc fe) 1:导入的文件中不能包含有中文,包含中文就会导致

    关键词: utf8, svn, 编码
  • MySQL的中文UTF8乱码问题

    MySQL的中文UTF8乱码问题 2014-12-11

    MySQL从4.x版本开始支持Unicode,3.x只有latin1编码.刚工作的时候就开始用MySQL了,用的php存取,网页xxx.php是gb2312的编码,存进去的数据用php取出来是中文,用phpMyAdmin执行select.update.dump都是中文,没有乱码问题. 从MySQL支持Unicode后,为了与时俱进,我们的web程序也开始考虑用UTF8了.其实UTF8也用了好几年了,程序基本能跑,没什么大问题,但是数据倒换的时候,总是遇到不爽的事情. [问题现象] 网页xxx.p

    关键词: utf8, MySQL, 中文, 乱码
  • C++ ORM ODB mysql 中文问题

    C++ ORM ODB mysql 中文问题 2014-11-27

    系统必须统一字符编码,建议均为utf8 1) 在mysql的服务器配置 my.cnf 中的配置,必须把服务器的默认编码设置为 utf8 2)在创建表格的时候,必须指定表格的编码为utf8,(ODB自动生成的DDL语句,默认是UTF8),这点从 show create table table_name可以得到确认. 3)最关键的地方就是客户端需要设置编码,由于编译ODB时,使用的mysql c api的版本默认的编码可能是不是UTF8编码,所以必须在 odb::mysql::database的构造

    关键词: utf8, odb, 中文
  • CentOS6.5安装mysql中文乱码问题解决

    CentOS6.5安装mysql中文乱码问题解决 2014-10-28

    1.首先安装mysql,我很怕麻烦..所以全给安装了一下,不管那么多依赖关系了,省心. yum install -y mysql-server mysql mysql-devel 2.安装好了之后,启动看下是什么情况 service mysqld start 3.没啥问题,设置一下root密码,一开始root是没有密码的,所以我直接设置密码为123456 mysqladmin -u root password '123456' 4.登录进mysql看看是个什么情况. mysql -u root

    关键词: utf8, linux, centos, MySQL, 中文乱码
  • MySql修改数据库编码为UTF8避免造成乱码问题

    MySql修改数据库编码为UTF8避免造成乱码问题 2014-10-26

    mysql 创建数据库时指定编码很重要,很多开发者都使用了默认编码,乱码问题可是防不胜防,下面与大家分享下通过修改数据库默认编码方式为UTF8来减少数据库创建时的设置,避免因粗心造成的乱码问题 mysql 创建数据库时指定编码很重要,很多开发者都使用了默认编码,乱码问题可是防不胜防.制定数据库的编码可以很大程度上避免倒入导出带来的乱码问题. 网页数据一般采用UTF8编码,而数据库默认为latin .我们可以通过修改数据库默认编码方式为UTF8来减少数据库创建时的设置,也能最大限度的避免因粗心造成

    关键词: utf8, 乱码, 数据库编码
  • asp中utf8不会出现乱码的写法

    asp中utf8不会出现乱码的写法 2014-10-22

    有时候我们在asp编写中需要声明好页面的编码否则容易出现乱码,这里是utf-8格式的 <%@ CODEPAGE=65001 %> <% Response.CodePage=65001%> <% Response.Charset="UTF-8" %> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR

    关键词: utf8, 乱码
  • Lua中获取utf8字符串长度的方法和自定义函数

    Lua中获取utf8字符串长度的方法和自定义函数 2014-09-20

    这篇文章主要介绍了Lua中获取utf8字符串长度的方法和自定义函数,本文给出了代码实例并讲解了UTF8的编码规则,需要的朋友可以参考下 --- 获取utf8编码字符串正确长度的方法 -- @param str -- @return number function utfstrlen(str) local len = #str; local left = len; local cnt = 0; local arr={0,0xc0,0xe0,0xf0,0xf8,0xfc}; while left ~

    关键词: utf8, lua, 方法, 字符串长度, 自定义函数
  • 对于SQL Server数据迁移至PostgreSQL出错的解释以及解决建议

    对于SQL Server数据迁移至PostgreSQL出错的解释以及解决建议 2014-09-09

    最近对SQL Server到PostgreSQL的数据迁移时出现了问题,返回的错误为:invalid byte sequence for encoding "UTF8": 0x00. 经查证pg源代码,该问题引起的原因是sql server的字符类型字段中含有空字符,该字符在pg中不支持. 问题重现: 1.PG客户端: postgres=# create table text_test (id int,info text); CREATE TABLE postgres=# insert

    关键词: sql, utf8, postgresql, Server, 迁移, 0x00
  • php UTF8 文件的签名问题

    php UTF8 文件的签名问题 2014-09-04

    在我们保存UTF8文本文件的时候,可以选择带签名,或者不带签名. 也就是 有BOM 格式编码,或者 无BOM格式编码. 如果看文件的内容,是看不出任何差别的,以下列文件(schema.sqlite.sql)内容为例: schema.sqlite.sql CREATE TABLE guestbook ( id INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT, email VARCHAR(32) NOT NULL DEFAULT '[email protecte

    关键词: utf8, PHP
  • PHP截断标题且兼容utf8和gb2312编码

    PHP截断标题且兼容utf8和gb2312编码 2014-08-31

    PHP截断标题的方法有很多,但同时可以兼容utf8和gb2312却不多了,下面有个不错的方法,可以参考下,或许对大家有所帮助 <?php if(strlen($r[title])>45){$str=utf8Substr($r[title],0,15)."...";}else{$str=$r[title];}echo $str; ?> //截取utf8字符串 function utf8Substr($str, $from, $len) { return preg_rep

    关键词: utf8, gb2312, PHP截断标题
  • PHP UTF8中文字符截断函数代码

    PHP UTF8中文字符截断函数代码 2014-08-31

    今天需要用一个UTF-8的字符串截断函数,网上找了几个代码片段发现都有问题,于是查了一下原理自己写了一个函数,代码片段如下 php中英文混合字符截断不乱码函数(utf8) //utf8格式下的中文字符截断 //$sourcestr 是要处理的字符串 //$cutlength 为截取的长度(即字数) //$addstr 超过长度时在尾处加上的字符 function cut_str($sourcestr, $cutlength, $addstr='...'){ $returnstr=''; $i=0

    关键词: utf8, PHP, 中文字符截断
  • UTF8转成GB2312乱码问题解决方案

    UTF8转成GB2312乱码问题解决方案 2014-08-01

    审核完的信息要生成XML类型的文件,并且XML要采用GB2312编码,因为采集的新闻网站,有很多网站采用的是UTF8编码,这样在转化的过程中又出现乱码 最近做了一个小项目,遇到此类问题,记录一下,也算是一个总结. 此项目分为两部分,一个是新闻数据采集,一个是采集信息的审核,最后生成XML文件. 数据采集后的数据经过用户编辑完之后,要导出一个ACCESS文件,然后把这个文件导入到信息审核系统.在ACCESS库中存储新闻信息的字段类型是ntext类型,而审核系统库中对应的是varchar(max)类

    关键词: utf8, gb2312
  • 为SQLite3提供一个ANSI到UTF8的互转函数

    为SQLite3提供一个ANSI到UTF8的互转函数 2014-07-14

    这篇文章主要为大家分享下ANSI与UTF8的互转函数,需要的朋友可以收藏下 在使用Sqlite3时必须要用到的 使用方法: char* src = "...";//待转换的ANSI或UTF8字符串 char* dst = NULL;//保存由函数内部分配的内存指针, 不需要传入内存缓冲区的 转换为UTF-8:to_utf8(src, &dst); 转换为ANSI:to_gb(src, &dst); 返回值:零 - 失败, 非零 - 成功. 注意:如果操作成功, 需要手动

    关键词: utf8, ansi
  • PHP生成UTF8文件的方法

    PHP生成UTF8文件的方法 2014-06-17

    先用函数utf8_encode将所需写入的数据变成UTF编码格式. <?php $f=fopen("test.txt", "wb"); $text=utf8_encode("a!"); //先用函数utf8_encode将所需写入的数据变成UTF编码格式. $text="\\xEF\\xBB\\xBF".$text; //"\\xEF\\xBB\\xBF",这串字符不可缺少,生成的文件将成为UTF-8

    关键词: utf8, PHP
  • php截取字符串之截取utf8或gbk编码的中英文字符串示例

    php截取字符串之截取utf8或gbk编码的中英文字符串示例 2014-06-15

    php中自带strlen是返回的字节数,对于utf8编码的中文返回时3个,不满足需求,下面给大家提供一个方法来完成这样的功能 微博的发言有字数限制,其计数方式是,中文算2个,英文算1个,全角字符算2个,半角字符算1个. php中自带strlen是返回的字节数,对于utf8编码的中文返回时3个,不满足需求. mb_strlen 可以根据字符集计算长度,比如utf8的中文计数为1,但这不符合微博字数限制需求,中文必须计算为2才可以. google了下,找到一个discuz中截取各种编码字符的类,改造

    关键词: utf8, gbk, PHP, 字符串, 中英文
  • ASCII,Unicode和UTF-8

    ASCII,Unicode和UTF-8 2014-04-11

    ASCII码 在计算机内部,所有的信息最终都表示为一个二进制的字符串. 每一个二进制位有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节. 一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从0000000到11111111. 上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定. 这被称为ASCII码,一直沿用至今. ASCII码一共规定了128个字符的编码. 这128个符号,只占用了一个字节的后面

    关键词: utf8, ascii, Encoding
  • JavaScript: 详解Base64编码和解码

    JavaScript: 详解Base64编码和解码 2014-02-19

    Base64是最常用的编码之一,比如开发中用于传递参数.现代浏览器中的<img />标签直接通过Base64字符串来渲染图片以及用于邮件中等等.Base64编码在RFC2045中定义,它被定义为:Base64内容传送编码被设计用来把任意序列的8位字节描述为一种不易被人直接识别的形式. 我们知道,任何数据在计算机中都是以二进制的方式存储的.一个字节为8位,一个字符在计算机中存储为一个或多个字节,比如英文字母.数字以及英文标点符号就是用一个 字节来存储的,通常称为ASCII码.而简体中文.繁体中文

    关键词: utf8, unicode, base64, JavaScript, 编码, UTF16
  • 中文编码杂谈(转)

    中文编码杂谈(转) 2014-02-13

    编码问题的例子 在windows自带的notepad(记事本)程序中输入"联通"两个字,保存后再次打开,会发现"联通"不见了,代之以"��ͨ"的乱码.这是windows平台上典型的中文编码问题.即文件保存的时候是按照ANSI编码(其实就是GB2312,后面会详细介绍)保存,打开的时候程序按照UTF-8方式对内容解释,于是就出现了乱码.避免乱码的方式很简单,在"文件"菜单中选择"打开"命令,选择保存的文件,然

    关键词: utf8, 编码, UTF16, utf32
  • php 汉语转拼音 utf8 gbk

    php 汉语转拼音 utf8 gbk 2013-11-22

    function Pinyins($_String, $_Code='UTF8'){ //GBK页面可改为gb2312,其他随意填写为UTF8 $_DataKey = "a|ai|an|ang|ao|ba|bai|ban|bang|bao|bei|ben|beng|bi|bian|biao|bie|bin|bing|bo|bu|ca|cai|can|cang|cao|ce|ceng|cha". "|chai|chan|chang|chao|che|chen|cheng|chi

    关键词: utf8, PHP, 拼音
  • 字符集问题(Linux.oracle.终端等,导入导出数据)

    字符集问题(Linux.oracle.终端等,导入导出数据) 2013-11-01

    locale的设定及其LANG.LC_ALL.LANGUAGE环境变量的区别 (转自:http://hi.baidu.com/edeed/item/c23752f36abdd916ce9f3289) 例如zh_CN.GB2312.zh_CN.GB18030或者zh_CN.UTF-8.很多人都不明白这些古里古怪的表达方式.这个外星表达式规定了什么东西呢?这个问题稍后详述,现在只需要知道,这是locale的表达方式就可以了. locale这个单词中文翻译成地区或者地域,其实这个单词包含的意义要宽泛很

    关键词: utf8, gbk, linux, gb18030, 字符集, 、unicode
  • UTF8\ASCII\UNICODE转换

    UTF8\ASCII\UNICODE转换 2013-08-20

    wchar_t * ANSIToUnicode( const char* str ) { int textlen ; wchar_t * result; textlen = MultiByteToWideChar( CP_ACP, 0, str,-1, NULL,0 ); result = (wchar_t *)malloc((textlen+1)*sizeof(wchar_t)); memset(result,0,(textlen+1)*sizeof(wchar_t)); MultiByteT

    关键词: utf8, unicode, ascii, 转换
  • DataInputStream,DataOutputStream读写UTF8原理

    DataInputStream,DataOutputStream读写UTF8原理 2013-07-29

    今晚上写代码玩,用到java.io.RandomAccessFile.writeUTF(String)函数,而文件默认保存为gbk,显然是乱码.突然想起来去看看存储编码规则,就去找了些文章了解writeUTF(String)的原理,在此记录. 首先需要弄明白unicode与utf8的表示规则,搜到@Feng哥的一篇文章<字符编码笔记:ASCII,Unicode和UTF-8>,写的很明白,在此招录一段: | Unicode符号范围 | UTF-8编码方式 | 0000 0000-0000 007

    关键词: utf8, randomaccessfile, Java, writeUTF
  • 今天遇到Mysql 插入数据里有中文字符出现 Incorrect string value 的错误

    今天遇到Mysql 插入数据里有中文字符出现 Incorrect string value 的错误 2013-07-03

    背景:CMD里直接敲代码插入数据 提示的部分截取为:ERROR 1366 (HY000): Incorrect string value 百度了一下,说是编码问题,show variables like 'character%' 查看后,发现所有编码都为UTF8,并没有错 继续查原因,网上有人说是mysql的编码集的问题以下为原文: "原来问题出在mysql上,mysql如果设置编码集为utf8那么它最多只能支持到3个字节的UTF-8编码,而4个字节的UTF-8字符还是存在的,这样一来如果你建表

    关键词: utf8, MySQL, 中文编码
  • 关于PHP通过PDO用中文条件查询MySQL的问题.

    关于PHP通过PDO用中文条件查询MySQL的问题. 2013-06-21

    好久没有用PHP了,基本上忘的差不多了,项目刚开始就遇到了一个问题,用中文条件查询不显示结果.代码如下: $pdo = new PDO("mysql:host=127.0.0.1;dbname=", "", ""); $rs = $pdo->query("SELECT * FROM TextT WHERE MsgType=(SELECT MsgType FROM KeyWord WHERE KeyWord='优惠')")

    关键词: utf8, pdo, PHP
  • 利用java判断文件的编码方法

    利用java判断文件的编码方法 2013-05-19

    在程序中,文本文件经常用来存储标准的ASCII码文本,比如英文.加减乘除等号这些运算符号.文本文件也可能用于存储一些其他非ASCII字符,如基于 GBK的简体中文,基于BIG5的繁体中文等等.在存储这些字符时需要正确指定文件的编码格式:而在读取这些文本文件时,有时候就需要自动判定文件的编码格式. 按照给定的字符集存储文本文件时,在文件的最开头的三个字节中就有可能存储着编码信息,所以,基本的原理就是只要读出文件前三个字节,判定这些字节的值,就可以得知其编码的格式.其实,如果项目运行的平台就是中文操

    关键词: utf8, gbk, Java, 文件, 编码
  • utf8的问题

    utf8的问题 2013-05-15

    在控制台上输入show variables like 'character%';发现已经是使用utf8了,但是还是显示不出来,你需要: 查询时,先输入set names gb2312(对于控制台) 或mysqli_query($dbc,'set names utf8');对于php

    关键词: utf8, MySQL, 中文
  • 大话字符集和编码

    大话字符集和编码 2013-05-08

    很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物.他们看到8个开关状态是好的,于是他们把这称为"字节". 再后来,他们又做了一些可以处理这些字节的机器,机器开动了,可以用字节来组合出很多状态,状态开始变来变去.他们看到这样是好的,于是它们就这机器称为"计算机". 开始计算机只在美国用.八位的字节一共可以组合出256(2的8次方)种不同的状态. 他们把其中的编号从0开始的32种状态分别规定了特殊的用途,一但终端.打印机遇上约

    关键词: utf8, ascii, ansi, 编码, 字符集
  • [转]字符集和编码

    [转]字符集和编码 2013-04-22

    很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物.他们看到8个开关状态是好的,于是他们把这称为"字节". 再后来,他们又做了一些可以处理这些字节的机器,机器开动了,可以用字节来组合出很多状态,状态开始变来变去.他们看到这样是好的,于是它们就这机器称为"计算机". 开始计算机只在美国用.八位的字节一共可以组合出256(2的8次方)种不同的状态. 他们把其中的编号从0开始的32种状态分别规定了特殊的用途,一但终端.打印机遇上约

    关键词: utf8, ascii, ansi, unicod, UTF16
  • VC2010下Qt5的中文乱码问题

    VC2010下Qt5的中文乱码问题 2013-04-04

    要搞清楚这个问题,先要弄明白编码.但是编码问题实在太复杂,这里肯定讲不开. 我先找一个例子,比如:"中文" 的 Unicode 码点/UTF8编码/GBK 分别是多少. 先去这个网站,输入 "中文" 查询对应的 Unicode 码点/UTF8编码: http://www.mytju.com/classcode/tools/encode_utf8.asp Unicode的码点分别是(十进制):中(20013),文(25991). 对应的UTF8编码分别(16进制):

    关键词: utf8, VS2010, Qt5, execution_character_set
  • 让Windows命令行显示UTF-8字符

    让Windows命令行显示UTF-8字符 2013-03-08

    一直苦恼于如何在Windows终端中显示UTF-8字符的问题.比如,在MySQL命令行下,如果数据库的编码是UTF-8,那么,在查询数据库的时候,里面的中文都会变成乱码. 今天半无意的搜索了一下,结果发现解决方案非常简单: 1. 修改终端的代码页. 在终端中输入: chcp 65001 2. 右键点击任务栏上的终端(也可以单击窗口左上角的图标),在快捷菜单中选择属性,在里面选择字体--如 Lucida Console,不要选择"点阵字体": 确定之后,再次测试UTF-8输出,你看到了什

    关键词: utf8, shell, Windows
  • iconv实现编码转换与中文点阵字库HZK16

    iconv实现编码转换与中文点阵字库HZK16 2013-02-28

    嵌入式开发中中文的识别.显示一直是一个比较让人头疼的问题,这是由于嵌入式系统的精简要求所导致的.我在前一个项目中用Qt做终端的显示界面时,就被中文字符的显示搞得焦头烂额,最后还是在网上下了一个文泉驿的中文字体库才解决问题,不过并不令人满意,主要是字体库太大了,影响了性能.今天在项目中又遇到了中文字符的编码转换和显示问题,趁机学习总结一下. 中文编码与点阵字库 国际标准有UTF-8.UTF-16等,国家标准有GB2312.GB18030.GBK等,至于这些标准的编码实现就不在这里介绍了.编码标准实

    关键词: utf8, gb2312, iconv, 中文编码, HZK16
  • 关于wxWidgets控件出现乱码

    关于wxWidgets控件出现乱码 2012-10-12

    这两天在用wxWidgets做一个小程序,突然遇到了一个控件显示出现乱码的问题. 首先声明:我用的编译器是Visual Studio 2005,wxWidgets版本是2.8.12,下面的解决方法不一定对所有的平台都有效. 我们知道,wxWidgets中控件显示字符串一般都是用wxString,例如下面的一小段代码创建并显示一个按钮: // 创建一个按钮,显示名称就是"按钮" wxButton* oneButton = new wxButton( itemFrame1, ID_BUTT

    关键词: utf8, wxwidgets, 乱码, 控件, wxString
  • MySQL5.x处理中文全解

    MySQL5.x处理中文全解 2012-08-24

    我这边用 Java 连接 MySQL 数据库,通过 JDBC 写入数据.在 Java 中直接生成的中文字符串,写入数据库变成半角问号"?".以下是我解决此问题的记录. 首先,我用 Putty 这个工具连接 MySQL 以检查中文写入情况.这里有一个设置.此设置如果不对,则会导致乱码. 然后,MySQL 提供了关于字符集的很多变量.可以通过 MySQL 命令来查看. 输入命令:mysql> SHOW VARIABLES LIKE '%char%'; 会看到如下内容: 相信大家这些变

    关键词: utf8, charset, MySQL, 中文, 乱码
  • [转]eclipse默认编码为GBK,修改为UTF8的方法

    [转]eclipse默认编码为GBK,修改为UTF8的方法 2012-07-24

    eclipse 默认编码居然是GBK,js文件默认编码是ISO-.... 怎么可以这样呢? 都修改成UTF8的方法: 1.windows->Preferences...打开"首选项"对话框,左侧导航树,导航到general->Workspace,右侧 Text file encoding,选择Other,改变为UTF-8,以后新建立工程其属性对话框中的Text file encoding即为UTF-8. 2.windows->Preferences...打开"

    关键词: utf8, eclipse工程默认编码
  • Reading UTF-8 with C++ streams

    Reading UTF-8 with C++ streams 2012-04-26

    Introduction This article is about reading and writing Unicode to character streams in UTF-8 encoding. And as a consequence is about an often mis-known aspect of the C++ STL / Iostream library: locales. The documentation that come with the STL itself

    关键词: utf 8, utf8
  • 两种可行的Latex中文生成方式(GBK/UTF8)

    两种可行的Latex中文生成方式(GBK/UTF8) 2012-03-15

    本来想总结一下Latex里各种中文排版支持,但是发现太乱了,CCT,CJK,CTEX神马的,还有GBK和UTF8下的不同编码方式,再加上XeLatex这样来搅局的--所以最后决定只给出一种可行的排版方式,测试环境是Windows+CTex2.8. ps:每天忍辱负重的在Windows下用Vim和Latex-- 第一种是gbk编码下的编译方式 REM taskkill /im AcroRd32.exe pdflatex %1 bibtex %1 pdflatex %1 gbk2uni %1.out

    关键词: utf8, gbk, latex, 中文, beamer, ctex
  • 关于Linux终端编码的一些记录:参考转载

    关于Linux终端编码的一些记录:参考转载 2011-04-01

    UTF8的环境设置为 1.putty的设置:Windows->translation->font->UTF-8, 登陆上去linux后系统的设置:(如果你系统默认的环境是UTF-8,则无须这一步) 2.系统编码设置 vi /etc/sysconfig/i18n LANG="zh_CN.UTF-8" 3.如果出现方框乱码,是缺少字体造成的,在安装光盘里,安装相应字体 4.VMware自动安装可能,导致没有相应中文字体 http://yuzeying.blog.51cto

    关键词: utf8, 编码
  • 字符集和字符编码

    字符集和字符编码 2011-01-07

    字符集和字符编码[订正] 这个主题已经被N多人讨论过了,这里仅仅是个人总结,不是教程. 字符集和字符编码 潘孙友 2010-12-31 于遵义 目录 一.字符集 二.字符编码 三.Windows平台 3.1 Codepage代码页 3.2 编码转换(API) 3.3 编码转换(CRT) [感谢@loop指出错误] 四.Linux/unix平台 4.1 iconv 4.2 ICU 一.字符集 字符集是一个集合,描述并定义了这个集合中可以出现哪些字符,常见的字符有GB2312.GBK.GB18030

    关键词: utf8, unicode, UTF16

iOS 开发

Android 开发

Python 开发

JAVA 开发

开发语言

PHP 开发

Ruby 开发

搜索

前端开发

数据库

开发工具

开放平台

Javascript 开发

.NET 开发

云计算

服务器

Copyright (C) codeweblog.com, All Rights Reserved.

CodeWeblog.com 版权所有 黔ICP备15002463号-1

processed in 0.697 (s). 10 q(s)