द्वारा कार्यक्रम pydocrawl.sf.net
-
pydocrawl मुफ्त
पाइडोक्रॉल स्वचालित रूप से वेब साइटों से पीडीएफ-, पीएस और डॉक्टर-फाइल डाउनलोड करता है। एक प्रारंभिक यूआरएल और एक वर्डलिस्ट दिया जाना चाहिए। मल्टीथरीड इंफॉर्मेशन माइनिंग (हार्वेस्टिंग) टूल पूरी तरह से पायथन में लिखा गया है। सं