博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
.net中Word转Html的方法(可以不装微软Word组件)
阅读量:7118 次
发布时间:2019-06-28

本文共 889 字,大约阅读时间需要 2 分钟。

最近碰到一个需求,在文本编辑器中实现“Word导入”功能 发现了几种方法,只是作为总结使用

 

基本思路:

把Word文件上传到服务器,读取其内容存储为Html,然后加载Html内容

 

1:使用Microsoft.Office.Interop.Word组件

     这是比较常用的一种方式,代码就不贴出了,网上大把的例子

     缺点:服务器需要装Word的组件,并且需要在服务器上设置Docm+对象的权限,如果一台服务器还好,如果项目应用到多台不同服务器,就比较繁琐了

2:  

     可以将.docx(word 97-2003 不适用)转化为XML,有了XML,想转成HTML或是其他格式都不再是问题了,此Api需要 .net FreamWork3.5+ Office2007+

3:第三方:例如(已测试,推荐)

   Aspose提供了各种格式的转换方案,有兴趣的可以进去仔细看一下,.NET Java方向的都有,采用其中Aspose.Words这个Dll,无需安装微软Office组件 即可转换Word(Converting DOC,DOCX to HTML without MS Office Word in .Net)

 

Aspose.Words.Document d = 
new Aspose.Words.Document(wordPhysicalPath);
            d.Save(
"
d:\\1.html
", SaveFormat.Html);

即可存为HTML文档(注意Word里面的图片存储在和Html同级目录下,读取Html内容时需要替换<img src=' 为 <img src='+图片虚拟路径)

优点:不需要安装微软Office组件,只需要一个差不多2M的DLL 就可以完成此功能

缺点:Aspose并不是一个开源的组件,国内虽然有破解版,也可反编译后自己进行更改,但是版权问题确实是要考虑的因素

 

还有一些第三方的其他的项目,大部分是收费的,在此就不一一列举了

转载于:https://www.cnblogs.com/CWolf/archive/2011/09/30/2196536.html

你可能感兴趣的文章
第十六章:SpringCloud Config 配置自动刷新
查看>>
iOS APP内弹窗推送版本更新信息(实现跳转、强制更新等)
查看>>
Flutter 系列文章:Flutter Text 控件介绍
查看>>
二、SpringBoot配置文件讲解
查看>>
HTML基础:web前端建站流程
查看>>
http
查看>>
导航栏与scrollerview(或scrollerview的子类)
查看>>
建立个人Maven仓库
查看>>
阿里架构师手写Tomcat——Session源码解析
查看>>
世界杯来了!小程序赛事操作来一波~
查看>>
一个维护版本日志整洁的Git提交规范
查看>>
单例模式总结
查看>>
bootstrapSwitch bootstrap 的开关组件扩展
查看>>
冒泡排序
查看>>
阿里云 OSS 如何设置防盗链, 上个月图床流量耗费50G+,请求次数10W+,什么鬼?
查看>>
Node.js折腾记一(改进):文件夹目录树获取
查看>>
【机器学习】深度学习开发环境搭建
查看>>
Spring核心技术原理-(1)-通过Web开发演进过程了解一下为什么要有Spring?
查看>>
聊聊Elasticsearch RestClient的RequestLogger
查看>>
iOS视频采集实战(AVCaptureSession)
查看>>