过滤Excel表中特定的字符串

类别:Java 点击:0 评论:0 推荐:

  最近经常统计报表,数据量奇大,这些数据是从全国很多分公司统计来的,以前我也要求他们按照特定的格式写字符串,方便我统计,结果一看,虽然每个记录都包含了我要的关键字,也就是唯一的产品编号,但是这个关键字的位置很随意,且一条记录可能含多个关键字,让我很难将它们提取出来,一条条地copy出来,累死我啊。
  以前用过Apache的POI项目,其中的HSSF正好可以解决这样的问题,然后再用String的一些函数就可以了,这非常简单。
  Eclipse用得不多,以前主要用Swing,SWT也在熟悉中。做这个小程序时遇到的问题如下:

1.    Eclipse出现中文乱码
        代码中有中文,编写的时候都没有问题,但是今天打开就看到一部分中文变成了小实心方块,把它们copy再paste到notepad上,是正常显示的,看来要设设Eclipse的Java字体了:Windows->Preference


将原来的Courier New改成宋体或仿宋体,虽然问题解决了,不过个人觉得没有原来的好看,字体太方方正正了,还是想用原来的字体,怎么办呢?
        进入Eclipse官方下载页面,进入更高版本的3.1M4页面,下载3.1M4版的SWT


        然后解压覆盖原来的文件,再重启Eclipse就可以了。

2.    HSSF对中文的支持
    在取得一个Cell:
    POIFSFileSystem fs = new POIFSFileSystem(new FileInputStream("workbook.xls"));
    HSSFWorkbook wb = new HSSFWorkbook(fs);
    HSSFSheet sheet = wb.getSheetAt(0);
    HSSFRow row = sheet.getRow(2);
    HSSFCell cell = row.getCell((short)3);
 再将带中文的string写入这个Cell,HSSF默让不支持中文,例如:
 cell.setCellValue("你好");

 这时如果你打开workbook.xls会发现中文是数字,也就是被切取了高位的中文字符。所以要在上一句前加上
 cell.setEncoding(HSSFCell.ENCODING_UTF_16);

3. Java中路径的表示方法
 在J2SE API中说明Unix下为/,windows下为//,也就是Excel文件的路径比如为“c:\aaa\workbook.xls”,那在Java中就要写成“C:\\aaa\\workbook.xls”(如果是网络路径,“\\home\tmp\workbook.xls”要写成“\\\\home\\tmp\\workbook.xls”),这个问题以前我在用JBuilder写的生成PDF程序中已经知道,但这次我用SWT提供的FileDialog来弹出一个对话框,然后选择要读入的Excel,用变量path保存路径,如下:
 FileDialog fdlg = new FileDialog(sShell,SWT.OPEN);
    fdlg.setText("选择Excel文档");
    path = fdlg.open();
 System.out.println(path);

 运行程序的时候,在对话框中选择了文件,系统打印出的path为“c:\aaa\workbook.xls”,我就觉得奇怪,系统应该表示为\\啊。然后我在Debug Perspective中查看path变量的值时却看到的是c:\\aaa\\workbook.xls,就不管了,但是后来问题出现了。
 程序从Excel读入的数据,提取出了字段后,将字段再写入Excel中的另一列,语句如下:
    FileOutputStream fout = null;
    try{
3       fout = new FileOutputStream(path);                               //Exception,系统说找不到文件。
         wb.write(fout);
         fout.close();
    }catch(IOException ex2){
         ex2.printStackTrace();
    }
 然后我把第3行改为“fout=new FileOutputStream("c:\\aaa\\workbook.xls");就可以找到文件写了。
 看如下的图,这是我在Debug Perspective中看到的Path变量的矛盾问题:


    为什么在上半的窗口中显示为\\,而在下面的窗口中却表示为\,这就造成了FileOutputStream()找不到路径。我又把上面的代码加上几句,让保存文件的时候不使用打开文件时用的path变量,而是再次打开窗口,让我选择同样的文件:
    try{
         FileDialog fdlg = new FileDialog(sShell,SWT.SAVE);
         fdlg.setText("保存Excel文档");
         path = fdlg.open();
         fout = new FileOutputStream(path);
         wb.write(fout);
         fout.close();
    }catch(IOException ex2){
         ex2.printStackTrace();
    }
 这次FileOutputStream()就找到了路径,真是太奇怪了。同样的path,都是FileDialog()找开的,只是一个早些时候打开,一个在FileOutputStream()的前面打开。唉,没天理啊。我也一直觉得奇怪,为什么Java中表示文件路径对于windows平台要表示为\\呢?
 

本文地址:http://com.8s8s.com/it/it11866.htm