LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 1300|回复: 6

请问linux下将html转换为txt的软件

[复制链接]
发表于 2008-4-22 11:02:04 | 显示全部楼层 |阅读模式
求在linux下将html转换为txt的软件
发表于 2008-4-22 12:06:29 | 显示全部楼层
我想sed应该可以实现

网上有一个简单的示例
sed -e :a -e ‘s/<[^>]*>//g;/</N;//ba’ your.html
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-4-22 14:44:07 | 显示全部楼层
sed不是很熟悉,我想我先需要知道的是在linux下分析html转换为txt的软件有那些?
回复 支持 反对

使用道具 举报

发表于 2008-4-22 14:53:53 | 显示全部楼层
$ eix  html2text
app-text/html2text
     Available versions:  1.3.2
     Installed versions:  1.3.2(19时52分18秒 2008年03月28日)
     Homepage:            http://www.mbayer.de/html2text/index.shtml
     Description:         A HTML to text converter
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-4-22 15:54:42 | 显示全部楼层
html2text is a command line utility, written in C++, that converts HTML documents into plain text

这个是用c++写的,我想找用C写的,难道在linux下就只有这一个选择吗?
回复 支持 反对

使用道具 举报

发表于 2008-4-23 13:15:46 | 显示全部楼层
w3m -dump
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-4-24 09:27:34 | 显示全部楼层
w3m 应该和lynx一样都是控制台下的文本浏览器了吧,还有其他的吗?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表