pydocrawl 20040925

लाइसेंस: मुफ्त ‎फ़ाइल आकार: N/A
‎उपयोगकर्ताओं की रेटिंग: 3.0/5 - ‎1 ‎वोट

करीबन pydocrawl

पाइडोक्रॉल स्वचालित रूप से वेब साइटों से पीडीएफ-, पीएस और डॉक्टर-फाइल डाउनलोड करता है। एक प्रारंभिक यूआरएल और एक वर्डलिस्ट दिया जाना चाहिए। मल्टीथरीड इंफॉर्मेशन माइनिंग (हार्वेस्टिंग) टूल पूरी तरह से पायथन में लिखा गया है। संस्करण 0.1 सफलतापूर्वक लिनक्स और सिग्विन पर चलता है।