native2ascii的用法
Sun也太吝嗇了,也不多給點(diǎn)使用例子.
它的幫助只有:用法:native2ascii [-reverse] [-encoding 編碼] [輸入文件 [輸出文件]]
下邊是網(wǎng)上找的說(shuō)明,說(shuō)的不是很清楚:
----------------------------------------------------------------------------------
說(shuō)明
Java 編譯器和其它 Java 工具只能處理含有 Latin-1 和/或 Unicode 編碼(\?
記號(hào))字符的文件,。native2ascii 將含有其它字符編碼的文件轉(zhuǎn)換成含 Latin-1 和/或
Unicode 編碼字符的文件,。
若省略 outputfile,,則使用標(biāo)準(zhǔn)輸出設(shè)備輸出,。此外,,如果也省略
inputfile,,則使用標(biāo)準(zhǔn)輸入設(shè)備輸入。
選項(xiàng)
-reverse 執(zhí)行相反的操作:將含 Latin-1 和/或 Unicode
編碼字符的文件轉(zhuǎn)換成含本地編碼字符的文件:
-encoding encoding_name 指定轉(zhuǎn)換程序使用的編碼名稱,。預(yù)設(shè)的編碼從系統(tǒng)屬性
file.encoding 中得到,。encoding_name 字符串必須是下表第一欄所示的字符串。
-------------------------------------------------------------------------------------
--以下是我實(shí)踐后總結(jié)的--
native2ascii命令的用法:
只有一種類型編碼,可以說(shuō)文本文件編碼和文本內(nèi)容編碼指的是同一個(gè)意思,。
建議理解成文本文件編碼(看第四).
結(jié)論:
1.這里說(shuō)的16進(jìn)制的字符是本地編碼的字符的16進(jìn)制字符表示,。
2.utf-8編碼(有本地字符)和ANSI編碼(有本地字符)的文件轉(zhuǎn)成ANSI編碼的本地字符的16進(jìn)制字符表示是一樣的。
3.utf-8編碼(有本地字符)的文件要轉(zhuǎn)成ANSI編碼的(本地字符)的文件,要先轉(zhuǎn)成ANSI編碼的16進(jìn)制字符文件,之后再轉(zhuǎn)成ANSI編碼的本地字符的文件,。
4.前提是這個(gè)16進(jìn)制的字符必須代表一個(gè)本地字符.
疑問:難道沒有轉(zhuǎn)換utf-8編碼的本地字符文件轉(zhuǎn)為utf-8編碼的16進(jìn)制字符表示的方法?!它和ANSI編碼表示的
16進(jìn)制一樣嗎?
一,、把ANSI編碼的本地字符文件轉(zhuǎn)成ANSI編碼的16進(jìn)制文件再轉(zhuǎn)回來(lái)。
兩步走:
1.native2ascii -encoding gbk [ANSI編碼文件,顯示ANSI本地字符] [ANSI編碼文件,即顯示ANSI本地編碼字符的十六進(jìn)制字符]
2.native2ascii -reverse [ANSI編碼文件,即顯示ANSI本地編碼字符的十六進(jìn)制字符] [ANSI編碼文件,即ANSI本地字符]
二,、把ANSI編碼的本地字符(或16進(jìn)制字符)文件轉(zhuǎn)成utf-8編碼的本地字符文件,。
>native2ascii -reverse -encoding utf-8 [ANSI編碼文件,即ANSI本地字符] [UTF-8編碼文件]
>native2ascii -reverse -encoding utf-8 [ANSI編碼文件,即顯示ANSI本地編碼字符的十六進(jìn)制字符] [UTF-8編碼文件]
三、把utf編碼的文件(顯示本地字符),轉(zhuǎn)成ANSI編碼的文件,。
兩步走:
1.先轉(zhuǎn)成ANSI編碼的十六進(jìn)制字符文件
native2ascii -encoding utf-8 [UTF-8編碼文件] [ANSI編碼文件,即顯示ANSI本地編碼字符的十六進(jìn)制字符]
2.再轉(zhuǎn)成ANSI編碼的本地字符文件,。
native2ascii -reverse [ANSI編碼文件,即顯示ANSI本地編碼字符的十六進(jìn)制字符] [ANSI編碼文件,即ANSI本地字符]
四、如果是utf編碼的文件,有本地字符的16進(jìn)制的話,,想轉(zhuǎn)成ANSI編碼的本地字符表示,。
用native2ascii的話是不行的.
只能用記事本把文件編碼類型另存為ANSI編碼的16進(jìn)制的文件,之后執(zhí)行第一步.
有時(shí)間弄個(gè)gbk轉(zhuǎn)utf的批處理,。
本文來(lái)自CSDN博客,,轉(zhuǎn)載請(qǐng)標(biāo)明出處:http://blog.csdn.net/rainv/archive/2007/04/28/1588096.aspx 1、native2ascii簡(jiǎn)介:native2ascii是sun java sdk提供的一個(gè)工具,。用來(lái)將別的文本類文件(比如*.txt,*.ini,*.properties,*.java等等)編碼轉(zhuǎn)為Unicode編碼,。為什么要進(jìn)行轉(zhuǎn)碼,原因在于程序的國(guó)際化,。Unicode編碼的定義:Unicode(統(tǒng)一碼,、萬(wàn)國(guó)碼、單一碼)是一種在計(jì)算機(jī)上使用的字符編碼,。它為每種語(yǔ)言中的每個(gè)字符設(shè)定了統(tǒng)一并且唯一的二進(jìn)制編碼,,以滿足跨語(yǔ)言、跨平臺(tái)進(jìn)行文本轉(zhuǎn)換、處理的要求,。1990年開始研發(fā),,1994年正式公布。隨著計(jì)算機(jī)工作能力的增強(qiáng),,Unicode也在面世以來(lái)的十多年里得到普及,。(聲明:Unicode編碼定義來(lái)自互聯(lián)網(wǎng))。
2,、獲取native2ascii:安裝了jdk后,,假如你是在windows上安裝,那么在jdk的安裝目錄下,,會(huì)有一個(gè)bin目錄,,其中native2ascii.exe正是。
3,、native2ascii的命令行的命名格式:
native2ascii -[options] [inputfile [outputfile]] 說(shuō)明:
-[options]:表示命令開關(guān),,有兩個(gè)選項(xiàng)可供選擇
-reverse:將Unicode編碼轉(zhuǎn)為本地或者指定編碼,不指定編碼情況下,,將轉(zhuǎn)為本地編碼,。 -encoding encoding_name:轉(zhuǎn)換為指定編碼,encoding_name為編碼名稱,。 [inputfile [outputfile]] inputfile:表示輸入文件全名,。 outputfile:輸出文件名。如果缺少此參數(shù),,將輸出到控制臺(tái),。 4、最佳實(shí)踐:首先將JDK的bin目錄加入系統(tǒng)變量path,。在盤下建立一個(gè)test目錄,,在test目錄里建立一個(gè)zh.txt文件,文件內(nèi)容為:“熔巖”,,打開“命令行提示符”,,并進(jìn)入C:\test目錄下。下面就可以按照說(shuō)明一步一步來(lái)操作,,注意觀察其中編碼的變化,。
A:將zh.txt轉(zhuǎn)換為Unicode編碼,輸出文件到u.txt
native2ascii zh.txt u.txt 打開u.txt,,內(nèi)容為“\u7194\u5ca9”,。 B:將zh.txt轉(zhuǎn)換為Unicode編碼,輸出到控制臺(tái)
C:\test>native2ascii zh.txt
\u7194\u5ca9 可以看到,,控制臺(tái)輸出了“\u7194\u5ca9”,。 C:將zh.txt轉(zhuǎn)換為ISO8859-1編碼,輸出文件到i.txt
native2ascii -encoding ISO8859-1 zh.txt i.txt 打開i.txt文件,內(nèi)容為“\u00c8\u00db\u00d1\u00d2”,。 D:將u.txt轉(zhuǎn)換為本地編碼,,輸出到文件u_nv.txt
native2ascii -reverse u.txt u_nv.txt 打開u_nv.txt文件,內(nèi)容為“熔巖”,。 E:將u.txt轉(zhuǎn)換為本地編碼,,輸出到控制臺(tái)
C:\test>native2ascii -reverse u.txt 熔巖 可以看到,控制臺(tái)輸出了“熔巖”,。 F:將i.txt轉(zhuǎn)換為本地編碼,輸出到i_nv.txt
native2ascii -reverse i.txt i_nv.txt 打開i_nv.txt文件,,內(nèi)容為“\u00c8\u00db\u00d1\u00d2”,。發(fā)現(xiàn)轉(zhuǎn)碼前后完全一樣的。也就是說(shuō),,等于沒有轉(zhuǎn),,或者說(shuō)思想糊涂,對(duì)命名沒有理解,。,。 G:將i.txt轉(zhuǎn)換為GBK編碼,輸出到i_gbk.txt
native2ascii -reverse -encoding GBK i.txt i_gbk.txt 打開i_gbk.txt文件,,內(nèi)容為“\u00c8\u00db\u00d1\u00d2”,。發(fā)現(xiàn)轉(zhuǎn)碼前后完全一樣的。也就是說(shuō),,等于沒有轉(zhuǎn),,或者說(shuō)思想糊涂,對(duì)命名沒有理解,。 H:將u_nv.txt轉(zhuǎn)碼到本地編碼GBK,,輸出到控制臺(tái)
C:\test>native2ascii -reverse -encoding ISO8859-1 i.txt 熔巖 從這個(gè)結(jié)果看,目標(biāo)達(dá)到到了,,編碼i.txt為ISO8859-1,,轉(zhuǎn)為本地編碼后內(nèi)容為“熔巖”。從這里應(yīng)該意識(shí)到,,native2ascii -reverse命令中-encoding指定的編碼為源文件的編碼格式,。而在native2ascii 命令中-encoding指定的編碼為(生成的)目標(biāo)文件的編碼格式。這一點(diǎn)非常的重要,!切記?。?BR> 繼續(xù)探索,,新建文件12a.txt,,內(nèi)容“12axyz”。看看純字母數(shù)字的編碼又如何,。
I:將純字母數(shù)字的文本文件12a.txt轉(zhuǎn)換為Unicode編碼 native2ascii 12a.txt 12a_nv.txt 打開12a_nv.txt文件,,內(nèi)容為“12axyz”。 繼續(xù)測(cè)試,,轉(zhuǎn)為ISO8859-1編碼看看 C:\test>native2ascii -encoding ISO8859-1 12a.txt 12axyz 結(jié)果還是沒有轉(zhuǎn)碼,。 |
|
來(lái)自: wwwijhyt圖書館 > 《程序設(shè)計(jì)》