IDEA的乱码与file.encoding = UTF-8
创始人
2024-03-01 20:24:13
0

file.encoding = UTF-8的作用其实就是使用UTF-8作为文件encoding和decoding时的默认方案。

我们知道存储文本文件时,文本变为二进制时要对文件进行encoding,这是一个字节转字符的过程,转换的具体工作由JAVA的API完成(例如:getBytes(编码方案)方法),但是如果你不提供编码方案,那么JAVA会使用一个默认编码方案完成这个任务。这个默认的编码方案就是JVM的file.encoding设置所规定的编码方案,如果JVM没有设置file.encoding,那么JAVA就使用UTF-8编码方案。

当显示文本时,有一个从二进制“还原”到文本的decoding,也就是字节到字符转换的过程。原则上,encoding时用的编码方案就是decoding时用的编码方案。转换的具体工作由JAVA的API完成(例如:new String(bytes,编码方案)),但是如果你不提供编码方案,那么JAVA会使用一个默认编码方案完成这个任务。这个默认的编码方案就是JVM的file.encoding设置所规定的编码方案,如果JVM没有设置file.encoding,那么JAVA就使用UTF-8编码方案。

最后,文本要在一个“平台”显示,这个平台可能是IDEA的控制台,可能是Windows的CMD窗口,也可能是打印机或者某个文本编辑器中。

好了,以上三个步骤中,任何一个步骤出现了不正确的编码方案,都可能产生乱码。

1. 使用文本编辑器编辑文本文件时,文本文件的编码就是文本编辑器的编码。不同的编辑器使用的默认编码方案是不一样的。Windows记事本是GBK,IDEA、VSCODE默认的是UTF8。那么,一个用GBK编码方案编写的.java文件使用UTF-8编译成.class文件,那么从一开始就错了。

2. 如果是同一个人做的encoding,那当然知道decoding该用什么编码方案。但如果不知道encoding的编码集,那你decoding使用的编码方案就无从选择了。如果不指定就会使用默认的编码方案,不匹配就会出现乱码。

3.呈现文本内容的平台也有自己默认的编码集,比如CMD窗口默认是936(GBK)显示方式,那么一个正确的UTF8字符串在GBK容器中也是无法正确显示的。

接下来,我们就看几个实际的例子体会一下:

1. IDEA中创建一个项目TestCoding.java,在IDEA中设置项目的字符集:

可以看到,IDEA的文本编码编码是UTF-8,file.encoding通过project encoding设置为了UTF-8。

public class TestCoding {public static void main(String[] args) throws UnsupportedEncodingException {System.out.println("file encoding:"+System.getProperty("file.encoding"));String s="AC米兰";byte[] bytes = s.getBytes();System.out.println(new String(bytes));}
}

 下面我运行这个程序,看一看它在IDEA的控制台上输出情况:

 首先控制台上是正确的输出,而且在控制台的右下角我们看到,作为输出内容的容器,控制台使用的是UTF-8。

那么同样的程序,我们看看在控制台编译和输出的效果:

 我们发现,同样的程序,这里出现了乱码。那么根据输出和上面的分析问题出在了哪里?那其实三个步骤都可能出了问题!

1. 可以看到,终端环境下的file encoding居然是GBK。我们的TestCoding.java是UTF8,那么encoding是使用的GBK,这样得到的编码文件TestCoding.class其实是“错误”的。

2.为什么“错误”打了引号,是因为我们decoding时也用了GBK,结果错错得正,又得到了一个GBK的源文件。(其实这是一种幸运,毕竟我是在同一台机器上连续使用默认的方式encoding和decoding)

3.那么被幸运还原的文本内容依然是乱码的终极原因是,容器采用了不同的编码集。

 修正的方式就是将code page从936更正为65001即可。

 

现在修改一下代码和IDEA的配置:

 这个修改实际是将IDEA使用的默认编码方案改为了GBK。

修改代码:

import java.io.UnsupportedEncodingException;public class TestCoding {public static void main(String[] args) throws UnsupportedEncodingException {System.out.println("file encoding:"+System.getProperty("file.encoding"));String s="AC米兰";byte[] bytes = s.getBytes();System.out.println(new String(bytes,"UTF-8"));}
}

再次运行代码,这一次就出现了乱码:

 那么错误的原因也不用赘述了。

1. 用默认的GBK编码方案encoding用UTF8写出来的TestCoding.java,错误

2.用指定的UTF编码方案,decodingGBK编码的TestCoding.class,错上加错

3.用UTF-8容器显示一个错上加错的文本,当然只能是????

 

相关内容

热门资讯

常用商务英语口语   商务英语是以适应职场生活的语言要求为目的,内容涉及到商务活动的方方面面。下面是小编收集的常用商务...
六年级上册英语第一单元练习题   一、根据要求写单词。  1.dry(反义词)__________________  2.writ...
复活节英文怎么说 复活节英文怎么说?复活节的英语翻译是什么?复活节:Easter;"Easter,anniversar...
2008年北京奥运会主题曲 2008年北京奥运会(第29届夏季奥林匹克运动会),2008年8月8日到2008年8月24日在中华人...
英语道歉信 英语道歉信15篇  在日常生活中,道歉信的使用频率越来越高,通过道歉信,我们可以更好地解释事情发生的...
六年级英语专题训练(连词成句... 六年级英语专题训练(连词成句30题)  1. have,playhouse,many,I,toy,i...
上班迟到情况说明英语   每个人都或多或少的迟到过那么几次,因为各种原因,可能生病,可能因为交通堵车,可能是因为天气冷,有...
小学英语教学论文 小学英语教学论文范文  引导语:英语教育一直都是每个家长所器重的,那么有关小学英语教学论文要怎么写呢...
英语口语学习必看的方法技巧 英语口语学习必看的方法技巧如何才能说流利的英语? 说外语时,我们主要应做到四件事:理解、回答、提问、...
四级英语作文选:Birth ... 四级英语作文范文选:Birth controlSince the Chinese Governmen...
金融专业英语面试自我介绍 金融专业英语面试自我介绍3篇  金融专业的学生面试时,面试官要求用英语做自我介绍该怎么说。下面是小编...
我的李老师走了四年级英语日记... 我的李老师走了四年级英语日记带翻译  我上了五个学期的小学却换了六任老师,李老师是带我们班最长的语文...
小学三年级英语日记带翻译捡玉... 小学三年级英语日记带翻译捡玉米  今天,我和妈妈去外婆家,外婆家有刚剥的`玉米棒上带有玉米籽,好大的...
七年级英语优秀教学设计 七年级英语优秀教学设计  作为一位兢兢业业的人民教师,常常要写一份优秀的教学设计,教学设计是把教学原...
我的英语老师作文 我的英语老师作文(通用21篇)  在日常生活或是工作学习中,大家都有写作文的经历,对作文很是熟悉吧,...
英语老师教学经验总结 英语老师教学经验总结(通用19篇)  总结是指社会团体、企业单位和个人对某一阶段的学习、工作或其完成...
初一英语暑假作业答案 初一英语暑假作业答案  英语练习一(基础训练)第一题1.D2.H3.E4.F5.I6.A7.J8.C...
大学生的英语演讲稿 大学生的英语演讲稿范文(精选10篇)  使用正确的写作思路书写演讲稿会更加事半功倍。在现实社会中,越...
VOA美国之音英语学习网址 VOA美国之音英语学习推荐网址 美国之音网站已经成为语言学习最重要的资源站点,在互联网上还有若干网站...
商务英语期末试卷 Part I Term Translation (20%)Section A: Translate ...