首先,我要承認我很土。
這段時間OOXML因為是否接受為標準的問題,大家討論的沸沸揚揚,在cnBeta上,不時看到倪光南老先生 出來balabala...,最近因為要做Excel相關的東西,也開始對這個新的文檔格式感興趣,可是好長一段時間我都不知道OOXML是個什么東東? (我很土,我想在Excel 2007的另存格式列表中找到OOXML格式,表笑我啊)
Google之,ft,Wikipedia無法訪問。百度之,在百度百科找到這樣的解釋:
OOXML全稱是office Open XML,OOXML是由微軟公司為Office 2007產品開發(fā)的技術規(guī)范,現已成為國際文檔格式標準,兼容前國際標準ODF(Open Document Format)和中國文檔標準UOF(Unified Office document Format)。
O M G!這也太官方了,看得我云里霧里。于是繼續(xù)換到Google,Search,皇天不負有心人啊,終于找到這篇文章,The New Excel 2007 File Format,終于是撥開云霧見月明。
現在按照我土人的理解,用土話來解釋OOXML就是:所 有的Office 2007的默認文檔格式(docx, xlsm等)的文件,都是一個zip壓縮文件(不再是之前的二進制文件),其中包含的是多個xml文件和媒體資源文件等(比如word中插入的圖片)。而 所謂的OOXML標準,我的理解,就是定義如何用這些xml文件來表示Office文件。
下面,我們就來一步步地揭開Office新文件格式OOXML的真面目:
新建一個Word文檔,添加一些內容,稍后我們將通過修改XML文件修改這些內容:

將新建的文檔保存為docx格式:

修改docx文件的后綴為zip(這一步揭示了docx文件的本質,實際上它是一個zip壓縮文件)
