फ्रांस की एक कंपनी द्वारा विकसित किया गया AI वॉयस असिस्टेंट Moshi, आपकी आवाज़ के tone को समझ सकता है और आपके सवालों का वास्तविक समय में उत्तर दे सकता है।
संक्षेप में
- ChatGPT को मिला नया प्रतिद्वंद्वी।
- Moshi एक AI वॉयस असिस्टेंट है।
- यह वास्तविक समय में आपसे बात कर सकता है।
कुछ दिन पहले ही, OpenAI ने बहुप्रतीक्षित ChatGPT वॉयस मोड में देरी करने की घोषणा की थी। कंपनी ने कहा था कि उन्हें तकनीकी मुद्दों को सुलझाना है और उच्च गुणवत्ता सुनिश्चित करनी है। यह उन लोगों के लिए निराशाजनक था जो AI चैटबॉट से बात करने के लिए उत्सुक थे। लेकिन अब, हम आपको बता दें कि एक नया चैटबॉट आया है जो न केवल आपसे बात कर सकता है, बल्कि आपकी आवाज़ के टोन को भी समझ सकता है। इस नए चैटबॉट का नाम Moshi है, जिसे फ्रांस की AI कंपनी Kyutai ने विकसित किया है।
Moshi से मिलिए
Moshi एक AI वॉयस असिस्टेंट है जो अमेज़न के Alexa या गूगल असिस्टेंट की तरह जीवन्त बातचीत प्रदान करता है, और यह Helium 7B भाषा मॉडल पर आधारित है। यह नया चैटबॉट विभिन्न लहजे में बात कर सकता है और इसमें 70 विभिन्न भावनात्मक और बोलने की शैलियाँ हैं। Moshi आपकी आवाज़ के टोन को भी समझ सकता है और एक साथ दो ऑडियो स्ट्रीम को संभाल सकता है, जिससे यह सुनने और जवाब देने का काम एक साथ कर सकता है। हाल ही में इसके लॉन्च को लाइव स्ट्रीम किया गया और तब से यह सुर्खियों में है।
Tech Radar की एक रिपोर्ट के अनुसार, Moshi के विकास में 100,000 से अधिक सिंथेटिक डायलॉग का उपयोग किया गया, जो टेक्स्ट-टू-स्पीच (TTS) तकनीक के माध्यम से बनाए गए थे। Moshi की आवाज़ की गुणवत्ता को बेहतर बनाने के लिए, Kyutai ने एक पेशेवर वॉयस आर्टिस्ट के साथ सहयोग किया, जिससे Moshi के उत्तर प्राकृतिक और आकर्षक लगें।
Toms Guide के अनुसार, कंपनी ने एक बयान में कहा, "यह नई तकनीक पहली बार AI के साथ एक सहज, प्राकृतिक और अभिव्यक्तिपूर्ण तरीके से संवाद करने की संभावना प्रदान करती है।"
अब उपलब्ध है
आप Moshi का डेमो संस्करण अभी आज़मा सकते हैं। इसके लिए आपको us.moshi.chat पर जाना होगा और निर्देशों का पालन करना होगा। फिलहाल, आप AI वॉयस असिस्टेंट से अधिकतम 5 मिनट तक बात कर सकते हैं। Moshi से बातचीत शुरू करने से पहले, आपको एक संदेश मिलेगा जिसमें लिखा होगा, "Moshi एक प्रयोगात्मक वार्तालाप AI है। इसके कहे गए हर बात को सावधानी से लें। बातचीत 5 मिनट तक सीमित है। Moshi एक साथ सोचता और बोलता है। Moshi हर समय सुन सकता और बात कर सकता है: आपके और Moshi के बीच अधिकतम प्रवाह। इसे कुछ समुद्री डाकू भूमिका निभाने, लसग्ना बनाने का तरीका पूछें, या यह पूछें कि उसने आखिरी फिल्म कौन सी देखी। हम सभी ब्राउज़रों का समर्थन करने का प्रयास करते हैं, Chrome सबसे अच्छा काम करता है। <3 के साथ Kyutai द्वारा बेक किया गया। आप US डेमो पर हैं। आपकी स्थिति के अनुसार, हो सकता है EU डेमो बेहतर विलंबता प्रदान करे।"
आगे क्या?
Kyutai Moshi को एक ओपन-सोर्स प्रोजेक्ट बनाने के लिए प्रतिबद्ध है। मॉडल के कोड और फ्रेमवर्क को साझा करके, कंपनी नवाचार को प्रोत्साहित करना और AI विकास से संबंधित नैतिक चिंताओं को संबोधित करना चाहती है। इस ओपन-सोर्स रणनीति का समर्थन फ्रांस के अरबपति Xavier Niel जैसे प्रमुख समर्थकों द्वारा किया गया है।
आगे देखते हुए, Kyutai Moshi में उन्नत विशेषताओं को एकीकृत करने की योजना बना रहा है, जैसे कि AI ऑडियो पहचान, वॉटरमार्किंग, और सिग्नेचर ट्रैकिंग सिस्टम। ये जोड़ AI-जनित ऑडियो के लिए जवाबदेही और ट्रैसेबिलिटी सुनिश्चित करने में मदद करेंगे, जिससे AI तकनीक में पारदर्शिता को बढ़ावा मिलेगा।
यदि Moshi को लोकप्रियता मिलती है, तो यह अन्य virus enabled AI असिस्टेंट्स के लिए उत्प्रेरक के रूप में कार्य कर सकता है और Alexa जैसी मौजूदा प्रणालियों में बड़े भाषा मॉडलों के अपनाने को तेज कर सकता है। Moshi द्वारा दिखाए गए प्रभावशाली क्षमताओं से वॉयस AI तकनीक के लिए एक आशाजनक भविष्य का संकेत मिलता है।
0 टिप्पणियाँ