LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 1282|回复: 2

请教perl如何取出网页中特定格式的文本

[复制链接]
发表于 2006-12-7 16:57:34 | 显示全部楼层 |阅读模式
我写了一个脚本来模拟post提交表单,得到html格式返回的结果,现在我希望能够把网页中红色字体的文本选取出来,请问如何实现?
我查看了一些组件如HTML::TreeBuilder,HTML:arser,HTML::Toke:arser等。可是因为perl基础太差,没能够实现功能。请指点一下。
谢谢!!
发表于 2006-12-9 11:11:28 | 显示全部楼层
使用功能强大正则表达式
回复 支持 反对

使用道具 举报

发表于 2006-12-9 14:16:31 | 显示全部楼层
临时写的,你将就着用吧。假设你需要分析的文档是index.htm。
#!/usr/bin/perl -w
#
#
use FileHandle;
$htmlfh = new FileHandle("index.htm") || die "can not open index.htm because of $!\n";
local($/) = undef;
$html = <$htmlfh>;
#print $html;
while($html =~ m/<font color=red>(.*?)<\/font>/gs)
{
        print $1,"\n";
}
close($htmlfh);
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表