`
xumingrencai
  • 浏览: 1172744 次
文章分类
社区版块
存档分类
最新评论

Java中将数据由UTF8转换成GB2312格式

 
阅读更多

转自:http://club.it.sohu.com/r-javalang-10425-0-7-10.html

UTF8转换成GB2312当我们在基于HTTP协议的JSP或Servlet的应用中获取数据或发送请求时,JVM会把输送的数据编码成UTF8格式。如果我们直接从HTTP流中提取中文数据,提取的结果为“????”(可能更多问号),为转换成我们能够理解的中文字符,我们需要把UTF8转换成GB2312,借助ISO-8859-1标准编码能够轻易的实现,下面的代码实现了这一功能:

byte[]b;
Stringutf8_value;
utf8_value=request.getParameter("NAME");//从HTTP流中取"NAME"的UTF8数据
b=utf8_value.getBytes("8859_1");//中间用ISO-8859-1过渡
Stringname=newString(b,"GB2312");//转换成GB2312字符

  在知道流长度的情况下将输入流转换成字节数组Java中的输入流抽象类InputStream有intread(byte[]b,intoff,intlen)方法,参数中byte[]b是用来存放从InputStream中读取的数据,intoff指定数组b的偏移地址,也就是数组b的起始下标,intlen指定需要读取的长度,方法返回实际读取的字节数。

  刚学Java的朋友可能要说:先定义一个与流长度等长的字节数组,调用read方法,指定起始下标为0,指定读取长度与数组长度等长,不是一下子可以读出来了吗?说的没错,笔者曾经也试着这样读取数据,但后来发现在读取网络数据时很不安全,我们想想在网络上获取数据可能并没那么流畅,数据流的传送可能会断断续续,所以并不能保证一次就能读取全部数据,特别是在读取大容量数据时更是如此,所以我们必须在读取数据时检测实际读降某ざ龋绻挥卸镣暌阎ざ鹊氖菥陀Ω迷俅味寥。源搜芳觳猓钡绞导识寥〉某ざ壤奂佑胍阎某ざ认嗟龋旅娴拇胧迪至苏庖还δ埽?

ServletInputStreaminStream=request.getInputStream();//取HTTP请求流
intsize=request.getContentLength();//取HTTP请求流长度
byte[]buffer=newbyte[size];//用于缓存每次读取的数据
byte[]in_b=newbyte[size];//用于存放结果的数组
intcount=0;
intrbyte=0;
while(count<size){
 //循环读取
 rbyte=inStream.read(buffer);//每次实际读取长度存于rbyte中
 for(inti=0;i  in_b[count+i]=buffer[i];
 }
 count+=rbyte;
}


  在不知道流长度的情况下将输入流转换成字节数组前面介绍了已知流长度的情况下的转换方法,那么当我们不知道流有多长时,也就是说不能确定转换后的字节数组有多大时,该怎么处理呢?笔者查看了JDK文档之后发现ByteArrayOutputStream有一个byte[]toByteArray()方法,该方法会自动创建一个字节数组,然后返回。于是就巧妙的用ByteArrayOutputStream来作中间过渡实现转换,其它处理跟上面所介绍已知长度的情况差不多。假设需要被转换的流已经放在inStream里了,我们可以用如下的代码实现这一功能:

ByteArrayOutputStreamswapStream=newByteArrayOutputStream();
byte[]buff=newbyte[100];//buff用于存放循环读取的临时数据
intrc=0;

while((rc=inStream.read(buff,0,100))>0){
 swapStream.write(buff,0,rc);
}
byte[]in_b=swapStream.toByteArray();//in_b为转换之后的结果

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics