FTP Search

Περιγραφές για τις υπηρεσίες που προσφέρει το δίκτυο και οι χρήστες του
trv
486
Posts: 291
Joined: Mon Mar 12, 2007 2:47 pm
PWMN Wind Node ID: 0

FTP Search

Post by trv »

Στο
http://zion.pwn/ffsearch ή
http://zion.pwn.gr/ffsearch ή
http://10.143.4.1/ffsearch

λειτουργει το πρωην FTP Search του PWN, και πλεον του PWMN.

Μπορει ο καθενας να βάλει το FTP του έτσι ωστε ο crawler να το ψαχνει και αυτο!
Αντε να μπουν ολα τα TerraBytes!

ΠΡΟΣΟΧΗ:

Τα μεγαλα ftp καλό ειναι να βρουν ενα τροπο να βγαζουν το filelist σε καποιο dir του ftp server και να το δηλωσουν αυτο στο ffsearch, ετσι ωστε ο crawler να μη ψαχνει ωρες το ftp σπαταλοντας αδικα πορους και ισχυ απο το zion και το δικτυο.
Παράδειγμα:

Στον ftp server στο pc μου (linux) εχω το παρακατω cron job
* */3 * * * root cd /jail/glftpd/site ; ls -lR | gzip -9 > ls-lR.gz

Το οποιο καθε 3 ωρες κανει ενα ls -lR στον καταλογο του ftp και το συμπιεζει με gzip.

Στη συνεχεια στο interface του ffsearch δηλώνουμε εκει που λεει List of Files: /ls-lR.gz οποτε ο crawler απλα μπαινει οταν ειναι να μπει και περνει μονο αυτο και βγαινει :)


USE IT!



====================
Αναλυτικότερα η λειτουργεια του FFSearch:

Υπαρχουν 3 τροποι να παρει ο crawler (το robot του ffsearch) τη λιστα με τα αρχεια:

1ος τροπος
O κατοχος του ftp server να φροντισει να εχει σε καποια θεση μεσα στο ftp το listing των αρχειων. To listing αυτο μπορει να ειναι σε μορφη ασυμπιεστη ή μετα απο εφαρμογή Gzip, Bzip2 ή compress.
To listing αυτο θα πρεπει απαραιτητα να ειναι σε μορφη unix, δηλαδη να εχει παραχθει χρησιμοποιώντας την εντολη
"ls -lR >file" ή "ls -alR >file" ή "ls -alLR >file"
Για συστηματα με windows προσπαθω να βρω λυση για δημιουργια του αρχειου ακομα.
===> Υπαρχουν καποιοι FTP Servers για win και linux οι οποιοι δημιουργουν αυτοματα αυτο το αρχειο με καποιο τροπο, μπορουμε να ψαξουμε προς αυτη την κατευθυνση.

Γενικα ο τροπος αυτος ειναι απο πολλες αποψεις ο ιδανικοτερος για ολους.
Πρωτον ο crawler χρειαζεται ελαχιστο χρονο, απλα μπαινει, περνει ενα αρχειο και βγαινει και το αρχειο αυτο ειναι μικρό σχετικα οχι πανω απο 3-4 mb ακομα και για τεραστια ftp.

2ος τροπος
O FTP server να υποστηρίζει την εντολη ls -lR. Αυτο μπορει να δοκιμαστει πολυ ευκολα. Σε ενα παραθυρο dos δινεται ftp IPtouServer, login username, δινεται password, και ειστε μεσα στον server.
Τωρα αν τρεξετε ls -lR και αρχισει να βγαζει τη λιστα για ολους τους φακελους του ftp, ειστε ενταξει, δουλευει. Αν βγαλει λαθος πεταχτε τον ftp server ειναι gtp :lol:
Πως μας χρησιμευει αυτο? O 2ος τροπος να παρει το listing ο crawler ειναι να μπει απλα και να τρεξει αυτη την εντολη, και να παρει το αποτελεσμα και να το επεξεργαστει.
Ο τροπος αυτος ειναι λιγο χειροτερος απο τον πρωτο, με την εννοια οτι τελικα αυτο που περνει ο crawler ειναι αρκετα μεγαλυτερο σε μεγεθος για μεγαλα ftp, και αυτο επειδη δεν ειναι συμπιεσμενο, ειναι σε μορφη text.

3ος τροπος
Ο 3ος τροπος ειναι ο κλασσικός, μπαινει ο crawler και γυριζει ολα τα directories του ftp ενα ενα, και σε καθε ενα μεσα τρεχει ενα ls για να παρει το αποτελεσμα και να το αποθηκευση στη βαση του.
Δραματικά αργός τροπος, ο οποιος φορτώνει πολυ τοσο το δικτυο οσο και τον ftp, αλλα και το zion στο οποιο τρεχει το ffsearch.
Αποφυγετε τον!!
============================================



Οταν βαζουμε εναν ftp server στο ffsearch, υπαρχει η επιλογη να δηλωσουμε το listing αρχειο.
Αν ειναι στο κεντρικο (root) φακελο του ftp, το δινουμε ως εξης:
/onomaArxeiou

ΠΡΟΣΟΧΗ: Αν δηλωσουμε οτι εχουμε listing αρχειο, τοτε ο crawler το μονο που θα κανει ειναι να προσπαθησει να το παρει. Αν για καποιο λογο δεν υπαρχει είτε δεν ειναι συμβατο είτε υπαρχει καποιο αλλο προβλημα, ο crawler ΔΕΝ θα κανει κατι αλλο, απλα δε θα το παρει και θα βγει απο το ftp.

Επισης υπαρχει η επιλογη use recursive ls -lR.
Αυτο ειναι για να προσπαθησει ο crawler να εφαρμοσει τον 2ο τροπο που περιεγραψα παραπανω.
ΠΡΟΣΟΧH: Αν δε τα καταφερει θα συνεχισει με κανονικο crawl αυτη τη φορα.


=======================================

Καθε ποτε γινεται crawl?

Ολοκληρωμενο (complete) crawl (ψαξιμο) ΟΛΩΝ των ftp στη λιστα, γινεται ΚΑΘΕ ΜΕΡΑ νωρις το πρωι. Αν σε καποιο ftp εμφανιστει προβλημα και δεν ολοκληρωθει το crawl, τοτε αυτο σημειώνεται με ενα flag.

Incremental Crawl, γινεται ανα 5-6 ωρες καθε μερα. Σε αυτο το crawl το ffsearch προσπαθει απλα να ψαξει οσα ftp εχουν μαρκαριστει με το flag, δηλαδη δε μπορεσε να μπει οταν εκανε το complete crawl.

==> Ο κατοχος του ftp, μπορει να προσδιορισει καποιες παραμετρους. Πχ βαζοντας period = 10, τοτε λεει στο ffsearch να μπει να ψαξει μια φορα ανα 10 complete crawls, δηλαδη μια φορα τις 10 μερες.

==========================================

Αυτααααα
Last edited by trv on Wed Jul 04, 2007 12:48 pm, edited 2 times in total.

User avatar
Hwoarang
Pentium
Posts: 520
Joined: Fri Mar 09, 2007 11:31 am
PWMN Wind Node ID: 48
Location: /home/hwoarang
Contact:

Post by Hwoarang »

Πείτε με χαζό
πειτε με ηλίθιο αλλα εγω δεν μπορω να κάνω search σε αυτο

Δεν καταλαβαίνω την λογική του :oops: :oops:
Image
Blog :)

Comming soon . . .

User avatar
sf1n4k1
Pentium IV
Posts: 2046
Joined: Thu Mar 08, 2007 9:11 am
PWMN Wind Node ID: 95
Location: Rio

Post by sf1n4k1 »

Πανέυκολο είναι..μπράβο ρε trv..

trv
486
Posts: 291
Joined: Mon Mar 12, 2007 2:47 pm
PWMN Wind Node ID: 0

Post by trv »

Hwoarang wrote:Πείτε με χαζό
πειτε με ηλίθιο αλλα εγω δεν μπορω να κάνω search σε αυτο

Δεν καταλαβαίνω την λογική του :oops: :oops:
Εισαι χαζος.
Εισαι ηλιθιος.

Εχει 2-3 τροπους να ψαξεις ρε
πχ
Η θα διαλεξεις Files(wildcard) και θα γραψεις *cocksucking* ή θα διαλεξεις Files(substring) και θα γραψεις cocksucing σκετο.

Αν θες να εχει και κενα μεσα αυτο που ψαχνεις το βαζεις σε quotes πχ "cock sucking"

trv
486
Posts: 291
Joined: Mon Mar 12, 2007 2:47 pm
PWMN Wind Node ID: 0

Post by trv »

6139 GB TOTAL SHARES

ΒΑΛΤΕ ΤΑ FTP ΟΛΟΙ ΑΝΤΕΕΕΕΕΕ

mp
AMD Athlon
Posts: 813
Joined: Sat Mar 10, 2007 12:51 pm
PWMN Wind Node ID: 320

Post by mp »

Είμαι στην κορυφή ...

mp

User avatar
panoulix
Pentium IV
Posts: 1044
Joined: Thu May 17, 2007 2:53 am
PWMN Wind Node ID: 137
Location: Patra (most of the time)
Contact:

Post by panoulix »

kala, se liges meres 8a tragoudas :lol:
Your mind is twisted. How can I resist it?

trv
486
Posts: 291
Joined: Mon Mar 12, 2007 2:47 pm
PWMN Wind Node ID: 0

Post by trv »

Το πρωτο ποστ ανανεωθηκε με καποιες οδηγιες χρησης..

mp
AMD Athlon
Posts: 813
Joined: Sat Mar 10, 2007 12:51 pm
PWMN Wind Node ID: 320

Post by mp »

panoulix wrote:kala, se liges meres 8a tragoudas :lol:
Θα βάλω ftp mount το ftp σου και θα φαίνονται όλα όσα έχεις σαν δικά μου ρε!!!! LINUX POWER!!!!! :-)

Και η δεύτερη θέση δεν είναι άσχημη πάντως ... ;-)

mp

User avatar
asi_the_king
Motorola 6502
Posts: 73
Joined: Fri Mar 09, 2007 12:23 pm
PWMN Wind Node ID: 0
Location: NEKROTAFEIO

Post by asi_the_king »

POLY KALO

User avatar
sf1n4k1
Pentium IV
Posts: 2046
Joined: Thu Mar 08, 2007 9:11 am
PWMN Wind Node ID: 95
Location: Rio

Post by sf1n4k1 »

{Έχετε 18ΤΒ ελέυθερα στο δίσκο}

..για τον επόμενο μήνα το δίκτυο θα έχει traffic..στα πλαίσια δοκιμών που θα κάνω..

User avatar
TheKeyMaster
486
Posts: 356
Joined: Thu Mar 08, 2007 2:18 pm
PWMN Wind Node ID: 2
Location: Ougk_city

Post by TheKeyMaster »

Μπορώ να προσπαθήσω να φτιάξω ένα προγραμματάκι για τους windows users, που να βγάζει το listing όπως το θέλει το site. Θα χρειαστώ όμως ένα listing από linux user για να δω πως είναι γραμμένο.

trv
486
Posts: 291
Joined: Mon Mar 12, 2007 2:47 pm
PWMN Wind Node ID: 0

Post by trv »

6218 GB

trv
486
Posts: 291
Joined: Mon Mar 12, 2007 2:47 pm
PWMN Wind Node ID: 0

Post by trv »

6224 GB

User avatar
panoulix
Pentium IV
Posts: 1044
Joined: Thu May 17, 2007 2:53 am
PWMN Wind Node ID: 137
Location: Patra (most of the time)
Contact:

Post by panoulix »

Θα βάλω ftp mount το ftp σου και θα φαίνονται όλα όσα έχεις σαν δικά μου ρε!!!! LINUX POWER!!!!! Smile

Και η δεύτερη θέση δεν είναι άσχημη πάντως ... Wink
Ennoeitai pws den einai asxhmh h deyterh 8esh pou 8a exeis. Ema8es kana tragoudi telika?
Your mind is twisted. How can I resist it?

Post Reply