Web Links Gatherer dengan Python

program sederhana ini digunakan untuk mengumpulkan link-link yang ada pada sebuah halaman web, bisa juga di kembangkan menjadi sebuah crawler.. 😀

#info: program untuk mendapatkan info link-link
#      yang terdapat dalam sebuah halaman web
# otoy(http://otoyrood.wordpress.com)
# 0x102010

from urllib import urlopen
import re,sys

peng = '''Penggunaan: python %s http://<alamat web> (jangan lupa http:// atau https://)
Contoh    : python %s http://otoyrood.wordpress.com''' %(sys.argv[0],sys.argv[0])

def main():
 if len(sys.argv) <=1:
 print peng

 pat = re.compile('href="([http:|https:].*?)"')

 urlscn = urlopen(sys.argv[1]).read()
 except IOError:
 print peng
 print "[+]Gathering links from the web"

 for url in pat.findall(urlscn):

fl = open("haslscan.txt","w")

for url in sorted(urls):
 hsl = '%s' % url,"n"

 print "[+]Gathering links done"

if __name__ == "__main__" :

