login about faq

Vreau sa fac un crawler in Perl. M-am impotmolit la crearea listei de URL-uri verificate. Cum pot face sa verific daca un URL exista intr-un array?

Am facut o subrutina care compara URL-ul cu fiecare element al array-ului dar cand ajung sa am cateva mii de elemente in array merge foarte greu verificarea. Imi ia mai multe de o secunda la fiecare verificare si cum siteurile pentru care am facut crawlerul au zeci de mii de pagini rularea ar dura zile intregi.

asked Oct 15 '11 at 04:54

Yuri%20B's gravatar image

Yuri B
251161926


Salut,

Daca zici ca e vorba de un crawler presupun ca parsezi pagina cu pagina.

Adauga toate linkurile in array-ul cu linkuri si apoi extragi elementele unice.

Am facut si eu un mic crawler odata, dar am salvat linkurile intr-un fisier local ca sa nu fie probleme cu memoria. O alta varianta la care m-am gandit atunci era folosirea unei baze de date, eventual un SQLite :-)

answered Oct 16 '11 at 10:25

Sergiu%20Tot's gravatar image

Sergiu Tot ♦♦
1.1k293753

Merge. Mersi! Nu e tocmai ce cautam, dar functioneaza.

(Oct 19 '11 at 12:36) Yuri B Yuri%20B's gravatar image
Your answer
toggle preview

Follow this question

By Email:

Once you sign in you will be able to subscribe for any updates here

By RSS:

Answers

Answers and Comments

Sharing is caring:

Markdown Basics

  • *italic* or __italic__
  • **bold** or __bold__
  • link:[text](http://url.com/ "title")
  • image?![alt text](/path/img.jpg "title")
  • numbered list: 1. Foo 2. Bar
  • to add a line break simply add two spaces to where you would like the new line to be.
  • basic HTML tags are also supported

Reclamă

Ne urmăresc

Tags:

×4
×4
×2
×2

Asked: Oct 15 '11 at 04:54

Seen: 603 times

Last updated: Oct 19 '11 at 12:36

powered by OSQA © 2011 NetHelp.ro, toate drepturile asupra continutului rezervate.