wikipedia2XML 0.1

लाइसेंस: मुफ्त ‎फ़ाइल आकार: N/A
‎उपयोगकर्ताओं की रेटिंग: 3.0/5 - ‎1 ‎वोट

करीबन wikipedia2XML

एक मूल विकिपीडिया डेटाबेस बैकअप डंप से एक्सएमएल कॉर्पस (भाषाई उद्देश्य के लिए पाठ का एक बड़ा संग्रह) बनाने और संभालने के लिए अजगर लिपियों का संग्रह। इसमें मीडियाविकी मार्कअप भाषा के लिए नियमित अभिव्यक्ति आधारित पार्सर शामिल है।