怎样在Android中解析doc、docx、xls、xlsx格式文件

http://www.open-open.com/home/space-37924-do-blog-id-5872.html

解析doc，要tm-extractors-0.4.jar这个包

解析xls，要jxl.jar这个包

01

public static String readDOC(String path) { 

02

                // 创建输入流读取doc文件 

03

                FileInputStream in; 

04

                String text = null; 

05
//                Environment.getExternalStorageDirectory().getAbsolutePath()+ "/aa.doc") 

06

                try { 

07

                        in = new FileInputStream(new File(path)); 

08

                        int a= in.available(); 

09

                        WordExtractor extractor = null; 

10

                        // 创建WordExtractor 

11

                        extractor = new WordExtractor(); 

12

                        // 对doc文件进行提取 

13

                        text = extractor.extractText(in); 

14

                        System.out.println("解析得到的东西"+text); 

15

                } catch (FileNotFoundException e) { 

16

                        e.printStackTrace(); 

17

                } catch (Exception e) { 

18

                        e.printStackTrace(); 

19

                } 

20

                if (text == null) { 

21

                        text = "解析文件出现问题"; 

22

                } 

23

                return text; 

24

        }

解析xls

01

public static String readXLS(String path) { 

02

                String str = ""; 

03

                try { 

04

                        Workbook workbook = null; 

05

                        workbook = Workbook.getWorkbook(new File(path)); 

06

                        Sheet sheet = workbook.getSheet(0); 

07

                        Cell cell = null; 

08

                        int columnCount = sheet.getColumns(); 

09

                        int rowCount = sheet.getRows(); 

10

                        for (int i = 0; i < rowCount; i++) { 

11

                                for (int j = 0; j < columnCount; j++) { 

12

                                        cell = sheet.getCell(j, i); 

13

                                        String temp2 = ""; 

14

                                        if (cell.getType() == CellType.NUMBER) { 

15

                                                temp2 = ((NumberCell) cell).getValue() + ""; 

16

                                        } else if (cell.getType() == CellType.DATE) { 

17

                                                temp2 = "" + ((DateCell) cell).getDate(); 

18

                                        } else { 

19

                                                temp2 = "" + cell.getContents(); 

20

                                        } 

21

                                        str = str + "  " + temp2; 

22

                                } 

23

                                str += "\n"; 

24

                        } 

25

                        workbook.close(); 

26

                } catch (Exception e) { 

27

                } 

28

                if (str == null) { 

29

                        str = "解析文件出现问题"; 

30

                } 

31

                return str; 

32
 
33

        }

解析docx

01

public static String readDOCX(String path) { 

02

                String river = ""; 

03

                try { 

04

                        ZipFile xlsxFile = new ZipFile(new File(path)); 

05

                        ZipEntry sharedStringXML = xlsxFile.getEntry("word/document.xml"); 

06

                        InputStream inputStream = xlsxFile.getInputStream(sharedStringXML); 

07

                        XmlPullParser xmlParser = Xml.newPullParser(); 

08

                        xmlParser.setInput(inputStream, "utf-8"); 

09

                        int evtType = xmlParser.getEventType(); 

10

                        while (evtType != XmlPullParser.END_DOCUMENT) { 

11

                                switch (evtType) { 

12

                                case XmlPullParser.START_TAG: 

13

                                        String tag = xmlParser.getName(); 

14

                                        System.out.println(tag); 

15

                                        if (tag.equalsIgnoreCase("t")) { 

16

                                                river += xmlParser.nextText() + "\n"; 

17

                                        } 

18

                                        break; 

19

                                case XmlPullParser.END_TAG: 

20

                                        break; 

21

                                default: 

22

                                        break; 

23

                                } 

24

                                evtType = xmlParser.next(); 

25

                        } 

26

                } catch (ZipException e) { 

27

                        e.printStackTrace(); 

28

                } catch (IOException e) { 

29

                        e.printStackTrace(); 

30

                } catch (XmlPullParserException e) { 

31

                        e.printStackTrace(); 

32

                } 

33

                if (river == null) { 

34

                        river = "解析文件出现问题"; 

35

                } 

36
 
37

                return river; 

38

        }

解析xlsx

01

public static String readXLSX(String path) { 

02

                String str = ""; 

03

                String v = null; 

04

                boolean flat = false; 

05

                List<String> ls = new ArrayList<String>(); 

06

                try { 

07

                        ZipFile xlsxFile = new ZipFile(new File(path)); 

08

                        ZipEntry sharedStringXML = xlsxFile 

09

                                        .getEntry("xl/sharedStrings.xml"); 

10

                        InputStream inputStream = xlsxFile.getInputStream(sharedStringXML); 

11

                        XmlPullParser xmlParser = Xml.newPullParser(); 

12

                        xmlParser.setInput(inputStream, "utf-8"); 

13

                        int evtType = xmlParser.getEventType(); 

14

                        while (evtType != XmlPullParser.END_DOCUMENT) { 

15

                                switch (evtType) { 

16

                                case XmlPullParser.START_TAG: 

17

                                        String tag = xmlParser.getName(); 

18

                                        if (tag.equalsIgnoreCase("t")) { 

19

                                                ls.add(xmlParser.nextText()); 

20

                                        } 

21

                                        break; 

22

                                case XmlPullParser.END_TAG: 

23

                                        break; 

24

                                default: 

25

                                        break; 

26

                                } 

27

                                evtType = xmlParser.next(); 

28

                        } 

29

                        ZipEntry sheetXML = xlsxFile.getEntry("xl/worksheets/sheet1.xml"); 

30

                        InputStream inputStreamsheet = xlsxFile.getInputStream(sheetXML); 

31

                        XmlPullParser xmlParsersheet = Xml.newPullParser(); 

32

                        xmlParsersheet.setInput(inputStreamsheet, "utf-8"); 

33

                        int evtTypesheet = xmlParsersheet.getEventType(); 

34

                        while (evtTypesheet != XmlPullParser.END_DOCUMENT) { 

35

                                switch (evtTypesheet) { 

36

                                case XmlPullParser.START_TAG: 

37

                                        String tag = xmlParsersheet.getName(); 

38

                                        if (tag.equalsIgnoreCase("row")) { 

39

                                        } else if (tag.equalsIgnoreCase("c")) { 

40

                                                String t = xmlParsersheet.getAttributeValue(null, "t"); 

41

                                                if (t != null) { 

42

                                                        flat = true; 

43

                                                        System.out.println(flat + "有"); 

44

                                                } else { 

45

                                                        System.out.println(flat + "没有"); 

46

                                                        flat = false; 

47

                                                } 

48

                                        } else if (tag.equalsIgnoreCase("v")) { 

49

                                                v = xmlParsersheet.nextText(); 

50

                                                if (v != null) { 

51

                                                        if (flat) { 

52

                                                                str += ls.get(Integer.parseInt(v)) + "  "; 

53

                                                        } else { 

54

                                                                str += v + "  "; 

55

                                                        } 

56

                                                } 

57

                                        } 

58

                                        break; 

59

                                case XmlPullParser.END_TAG: 

60

                                        if (xmlParsersheet.getName().equalsIgnoreCase("row") 

61

                                                        && v != null) { 

62

                                                str += "\n"; 

63

                                        } 

64

                                        break; 

65

                                } 

66

                                evtTypesheet = xmlParsersheet.next(); 

67

                        } 

68

                        System.out.println(str); 

69

                } catch (ZipException e) { 

70

                        e.printStackTrace(); 

71

                } catch (IOException e) { 

72

                        e.printStackTrace(); 

73

                } catch (XmlPullParserException e) { 

74

                        e.printStackTrace(); 

75

                } 

76

                if (str == null) { 

77

                        str = "解析文件出现问题"; 

78

                } 

79
 
80

                return str;