SiteMap

2014年3月20日木曜日

Detect Doc Encoding

BOM: Byte Order Mark

UTF-8
-17, -68, -65
 EF, BB, BF


Java 讀取Big5編碼轉換成UTF8


String s="政府會好好把關,輕輕檢查";
new String(s.getBytes("BIG5"),"UTF8");
###Java 中我們可以使用String.getBytes("指定編碼")讀取出字串編碼byte,在使用new String(bytes,"新編碼")來轉換成需要的編碼字串。使用BIG5來獨區依然會造成部份自無法轉成UTF8正常顯示。
解決方法: 使用MS950或CP950來解碼
s=new String(s.getBytes("MS950"),"UTF8");

但是要讀取文件的話, 必須要先知道文件的編碼方式是用了甚麼來編碼

在java中常常遇到文件讀寫的問題,有時候需控制讀寫文件的編碼格式
方法如下:

讀取文件

假設你要讀取的文件是用 UTF-8 來編碼
FileInputStream fis = new FileInputStream(path);
InputStreamReader isr = new InputStreamReader(fis,"UTF-8"); //UTF-8 可以小寫
BufferedReader br=new BufferedReader(isr);

寫入文件

使用 UTF-8 的編碼來寫入檔案
FileOutputStream stream;// provides file access
OutputStreamWriter writer;// writes to the file 
 
stream = new FileOutputStream(filename);
writer = new OutputStreamWriter(stream,"UTF-8");   



Ref.
cpdetector
http://cpdetector.sourceforge.net/index.shtml
Java判斷文件編碼格式
http://fecbob.pixnet.net/blog/post/39393899-java%E5%88%A4%E6%96%B7%E6%96%87%E4%BB%B6%E7%B7%A8%E7%A2%BC%E6%A0%BC%E5%BC%8F-
判定文件编码或文本流编码的方法http://www.iteye.com/topic/108540
java读文件和写文件编码方式的控制
http://my.oschina.net/haquanwen/blog/158952
Jota Text Editor
https://play.google.com/store/apps/details?id=jp.sblo.pandora.jota
Java プログラミング(基礎と応用) 
http://antlers.cis.ibaraki.ac.jp/
ファイル処理(2)文字ストリーム(入力:ファイル、出力:画面)
http://antlers.cis.ibaraki.ac.jp/PROGRAM/JAVA/FILE/j621b.htm
ファイル処理(2)文字ストリーム(入力:ファイル、出力:画面)
http://antlers.cis.ibaraki.ac.jp/PROGRAM/JAVA/FILE/j621a.htm
[ Java常見問題 ] 判斷文件編碼是否為UTF-8
http://puremonkey2010.blogspot.tw/2010/10/java-utf-8.html?m=0
http://antlers.cis.ibaraki.ac.jp/PROGRAM/JAVA/FILE/j621a.htm
Java指定编码读写文件(UTF-8)
http://gaofeihang.blog.163.com/blog/static/8450828520098241202798/
[Charset]UTF-8, UTF-16, UTF-16LE, UTF-16BE的区别
http://mocha-c-163-com.iteye.com/blog/583064
【转】File,FileInputStream,FileReader,InputStreamReader,BufferedReader 的使用和区别
http://hi.baidu.com/yumin87/item/78dbb21a20d62709e75c36a3
[分享] 編碼轉換的程式碼 
http://www.javaworld.com.tw/jute/post/view?bid=35&id=184801&sty=3
JAVA判断输入流字符编码的困惑
http://blog.csdn.net/gaolu/article/details/6170518
java字符编码转换研究(转) 第二部分收藏                 
http://zdsfwy.blog.51cto.com/2400848/1174272

0 件のコメント: