找回密码
 立即注册
查看: 7154|回复: 5
打印 上一主题 下一主题

使用文本处理命令获取链接批量下载的方法教程

[复制链接]

421

主题

453

帖子

453

积分

牛皮县令

Rank: 25Rank: 25Rank: 25Rank: 25Rank: 25Rank: 25Rank: 25

UID
73
精华
0
兔币
1090
牛币
641
贡献
50
在线时间
73 小时
注册时间
2015-5-17
跳转到指定楼层
楼主
发表于 2016-5-23 14:37:50 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式


      前几天看到一个不错的方法,现在分享给大家,希望有帮助

      比如我看到Nmap的资源很想把他全部下载到本地怎么办呐?右键一个个点?用工具镜像整个站点?

      以前我用的方法是左边打开浏览器,右边打开Notepad++ 一个个链接拖到Notepad++里,最后就有了一个完整的下载列表

      现在有更好的方法,利用Linux的文本处理工具提取完整的下载链接,文本处理工具我很早就学过了,但是平常不用,学了就忘

      打开你要处理网站的页面
游客,如果您要查看本帖隐藏内容请回复
右键保存网页

   

    用编辑器打开删除HTML文件顶部的代码和底部代码留下链接部分

   

    使用文本处理命令剔除多余文本,留下完整链接

  1  awk '{print $7}' index-of.html | cut -d '"' -f2 > output.txt

1  awk '{print $7}'           // 打印出第7列文本,按空格或者制表符(Tab)
    index-of.html              // 要处理的文件
    | cut -d '"' -f2           // 通过管道传递给 cut -d 指定分隔符为" -f2 指定输出地2列文本
    > output.txt           // 重定向标准输出到output.txt

  

然后就可以使用获取到的链接列表自动批量下载了

1 wget -i output.txt

估算了一下,使用这个方法给我节约了5倍的时间可以干其他事情

回复

使用道具 举报

0

主题

21

帖子

21

积分

牛皮草民

Rank: 10Rank: 10Rank: 10

UID
1031
精华
0
兔币
621
牛币
126
贡献
0
在线时间
10 小时
注册时间
2016-1-20
沙发
发表于 2016-5-23 20:24:54 | 只看该作者
感谢分享共同进步
回复 支持 反对

使用道具 举报

0

主题

117

帖子

117

积分

牛皮村长

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

UID
2074
精华
0
兔币
12
牛币
109
贡献
0
在线时间
2 小时
注册时间
2016-4-9
板凳
发表于 2016-6-6 12:12:17 | 只看该作者
文本处理命令
回复 支持 反对

使用道具 举报

0

主题

379

帖子

379

积分

牛皮县令

Rank: 25Rank: 25Rank: 25Rank: 25Rank: 25Rank: 25Rank: 25

UID
127
精华
0
兔币
-33
牛币
5
贡献
0
在线时间
0 小时
注册时间
2015-11-6
地板
发表于 2017-8-30 02:16:34 | 只看该作者
注册这么久都没升级,压力山大啊!
回复 支持 反对

使用道具 举报

0

主题

563

帖子

563

积分

牛皮知州

Rank: 30Rank: 30Rank: 30Rank: 30Rank: 30Rank: 30Rank: 30Rank: 30

UID
105
精华
0
兔币
-41
牛币
16
贡献
0
在线时间
0 小时
注册时间
2015-9-26
5#
发表于 2017-9-5 12:55:46 | 只看该作者
坚持回帖!
回复 支持 反对

使用道具 举报

0

主题

433

帖子

433

积分

牛皮县令

Rank: 25Rank: 25Rank: 25Rank: 25Rank: 25Rank: 25Rank: 25

UID
167
精华
0
兔币
-37
牛币
6
贡献
0
在线时间
0 小时
注册时间
2015-11-9
6#
发表于 2017-9-5 22:25:44 | 只看该作者
信楼主,考试不挂科!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表