Speechz Text to speech 1.0

लाइसेंस: मुफ्त ‎फ़ाइल आकार: N/A
‎उपयोगकर्ताओं की रेटिंग: 0.0/5 - ‎0 ‎वोट

भाषण के लिए भाषण पाठ

भाषण संश्लेषण मानव भाषण का कृत्रिम उत्पादन है। इस उद्देश्य के लिए उपयोग की जाने वाली कंप्यूटर प्रणाली को भाषण सिंथेसाइज़र कहा जाता है, और इसे सॉफ्टवेयर या हार्डवेयर उत्पादों में लागू किया जा सकता है। एक टेक्स्ट-टू-स्पीच (टीटीएस) सिस्टम सामान्य भाषा पाठ को भाषण में परिवर्तित करता है; अन्य प्रणालियां भाषण में ध्वंयात्मक प्रतिलेखन जैसे प्रतीकात्मक भाषाई अभ्यावेदन प्रदान करती हैं। [1] संश्लेषित भाषण रिकॉर्ड किए गए भाषण के टुकड़ों को जोड़कर बनाया जा सकता है जो डेटाबेस में संग्रहीत होते हैं। सिस्टम संग्रहीत भाषण इकाइयों के आकार में भिन्न होते हैं; एक प्रणाली है कि स्टोर फोन या diphones सबसे बड़ा उत्पादन रेंज प्रदान करता है, लेकिन स्पष्टता की कमी हो सकती है । विशिष्ट उपयोग डोमेन के लिए, पूरे शब्दों या वाक्यों का भंडारण उच्च गुणवत्ता वाले आउटपुट के लिए अनुमति देता है। वैकल्पिक रूप से, एक सिंथेसाइज़र पूरी तरह से "सिंथेटिक" आवाज उत्पादन बनाने के लिए मुखर पथ और अन्य मानव आवाज विशेषताओं के एक मॉडल को शामिल कर सकता है। [2] एक भाषण सिंथेसाइज़र की गुणवत्ता मानव आवाज के लिए अपनी समानता और समझने की क्षमता से आंका जाता है । एक सुगम पाठ से भाषण कार्यक्रम दृश्य हानि या पढ़ने विकलांग लोगों को एक घर कंप्यूटर पर लिखित काम करता है सुनने के लिए अनुमति देता है । कई कंप्यूटर ऑपरेटिंग सिस्टम 1990 के दशक के बाद से भाषण सिंथेसाइज़र शामिल हैं ।

एक ठेठ टीटीएस सिस्टम का अवलोकन

स्वचालित घोषणा मेनू0:00 एक सिंथेटिक आवाज स्वीडन में एक आ ट्रेन की घोषणा की । इस फ़ाइल को खेलने में समस्याएं? मीडिया की मदद देखें।

माइक्रोसॉफ्ट सैम का नमूना मेनू0:00 माइक्रोसॉफ्ट विंडोज XP के डिफ़ॉल्ट भाषण सिंथेसाइज़र आवाज कह "जल्दी भूरे रंग की लोमड़ी आलसी कुत्ते पर कूदता है १,२३४,५६७,८९० बार । सोई" इस फ़ाइल को खेलने में समस्याएं? मीडिया की मदद देखें। एक टेक्स्ट-टू-स्पीच सिस्टम (या "इंजन") दो भागों से बना है: [3] एक फ्रंट-एंड और एक बैक-एंड। फ्रंट-एंड में दो प्रमुख कार्य हैं । सबसे पहले, यह संख्या और संक्षिप्त शब्दों जैसे प्रतीकों वाले कच्चे पाठ को लिखित शब्दों के बराबर में परिवर्तित करता है। इस प्रक्रिया को अक्सर टेक्स्ट सामान्यीकरण, प्री-प्रोसेसिंग या टोकनीकरण कहा जाता है। फ्रंट-एंड तब प्रत्येक शब्द को ध्वंयात्मक प्रतिलेखन प्रदान करता है, और वाक्यांशों, खंडों और वाक्यों की तरह प्रोसोडिक इकाइयों में पाठ को विभाजित और चिह्नित करता है। शब्दों को ध्वंयात्मक प्रतिलेखन असाइन करने की प्रक्रिया को टेक्स्ट-टू-फोनमे या ग्राफीमे-टू-फोनमे रूपांतरण कहा जाता है। ध्वंयात्मक प्रतिलेखन और प्रोसोडी जानकारी एक साथ प्रतीकात्मक भाषाई प्रतिनिधित्व है कि सामने अंत से उत्पादन है बनाते हैं । बैक-एंड एंड और मडैश; जिसे अक्सर सिंथेसाइज़र और mdash के रूप में जाना जाता है; फिर प्रतीकात्मक भाषाई प्रतिनिधित्व को ध्वनि में परिवर्तित करता है। कुछ प्रणालियों में, इस भाग में लक्ष्य प्रोसोडी (पिच समोच्च, फोनमे अवधि), [4] की गणना शामिल है जो तब आउटपुट स्पीच पर लगाया जाता है।

संस्करण इतिहास

  • विवरण 1.0 पर तैनात 2013-10-06

कार्यक्रम विवरण