|
网页的表格源码像如下:
............
<tr>
<td ....>111111</td>
<td ....>222222</td>
.....
<td ....>999999</td>
</tr>
<tr>
<td ....>111111</td>
<td ....>222222</td>
.....
</tr>
.
.
.
<tr>
<td ....>212323</td>
<td ....>324343</td>
.
.
.
<td ....>213ldfd</td>
</tr>
我该如何写提取<td ...></td>之间的数据,并且一对<tr>...</tr>之间的数据为一组,我尝试用这样的正则表达式:/<tr>\s*<td.*>(.*)<\/td>\s*<td.*>(.*)<\/td><\/>/g.结果却是只有最后一对<tr></tr>之间的数据被提取出来了,不知为何?这些<tr></tr>已被我保存到一标量中.请高手指教!谢谢!! |
|