Delhi News: टेक दिग्गज गूगल ने बुधवार को दुनिया के सामने अपना सबसे नया और एडवांस स्पीच-टू-स्पीच ट्रांसलेशन मॉडल पेश कर दिया है। इस नए मॉडल को Gemini 3.5 Live Translate नाम दिया गया है। कंपनी का दावा है कि इसे भाषाओं के बीच नेचुरल बातचीत के लिए बनाया गया है।
बिना रुके नियर रियल-टाइम में करेगा वॉयस ट्रांसलेशन
गूगल के मुताबिक यह नया एआई मॉडल एक साथ 70 से ज्यादा भाषाओं को आसानी से डिटेक्ट कर सकता है। यह तुरंत उनका ट्रांसलेटेड स्पीच भी जनरेट कर देता है। यह मॉडल लगातार नियर रियल-टाइम ट्रांसलेशन डिलीवर करते हुए भी बोलने वाले के टोन और रफ्तार को पूरी तरह सुरक्षित रखता है।
इस शानदार तकनीक को Google Translate, Google Meet, Google AI Studio और डेवलपर्स के लिए Gemini Live API पर रोलआउट किया जा रहा है। गूगल ने एक ब्लॉग पोस्ट में बताया कि यह मॉडल मल्टीलिंग्वल मीटिंग्स, लाइव ब्रॉडकास्ट, कस्टमर सपोर्ट और रियल-टाइम इंटरप्रिटेशन के लिए बिल्कुल परफेक्ट है।
खत्म हुआ इंतजार और खत्म हुई पॉज की बड़ी झंझट
यह नया मॉडल बेहद कम डिले के साथ लाइव ट्रांसलेशन को बहुत आसानी से संभालता है। यह ऑडियो को उसी समय प्रोसेस करता है जब वह रियल-टाइम में स्ट्रीम हो रहा होता है। इससे ओरिजनल स्पीकर के बोलने के महज कुछ ही सेकेंड्स के अंदर ट्रांसलेटेड ऑडियो आ जाता है।
यह उन लंबे पॉज से भी बचाता है जो आमतौर पर पुराने ट्रांसलेशन सिस्टम्स में देखने को मिलती थीं। यह नया मॉडल 70 से ज्यादा भाषाओं की पहचान कर उनके बीच खुद ही स्विच कर सकता है। यह लैंग्वेज सेटिंग्स को मैनुअली बदलने की जरूरत को भी खत्म करता है।
शोर-शराबे वाले माहौल में भी पूरी तरह असरदार
कंपनी का कहना है कि यह ट्रांसलेशन मॉडल शोर-शराबे वाले और अनप्रेडिक्टेबल माहौल में भी पूरी तरह से असरदार रहता है। यह अपग्रेड की गई ट्रांसलेशन कैपेबिलिटी अब Google Meet एप में भी आ रही है, जो मीटिंग्स को बहुत आसान और काफी मजेदार बना देगी।
यह एप भी 70 से ज्यादा भाषाओं में ट्रांसलेशन को सपोर्ट करेगा। यह इसके पिछले सिर्फ 5 भाषाओं के लिमिटेड सपोर्ट से एक बहुत बड़ी छलांग है। इसके अलावा गूगल इस खास मॉडल को Android और iOS पर Google Translate एप में भी तेजी से ला रहा है।
हेडफोन और ईयरपीस से सीधे सुन सकेंगे ट्रांसलेशन
यह एप में Live Translate के जरिए उपलब्ध होगा। इसमें ट्रांसलेटेड स्पीच को किसी भी पेयर्ड कंपैटिबल हेडफोन के जरिए आसानी से सुना जा सकेगा। Android पर गूगल एक नया ‘लिसनिंग मोड’ रोलआउट कर रहा है, जो ट्रांसलेटेड ऑडियो को सीधे स्मार्टफोन के ईयरपीस में प्ले करेगा।
एआई-जनरेटेड कंटेंट से जुड़ी गंभीर चिंताओं से निपटते हुए कंपनी ने एक बड़ा कदम उठाया है। इस मॉडल द्वारा जनरेट किए गए सभी ऑडियो में कंपनी की वाटरमार्किंग टेक्नोलॉजी ‘SynthID’ एम्बेडेड होगी। इसे सीधे ऑडियो में इंटीग्रेट किया गया है ताकि इसकी सही पहचान हो सके।
डेवलपर्स के लिए भी खुला तरक्की का नया रास्ता
डेवलपर्स अब Gemini Live API और Google AI Studio के जरिए पब्लिक प्रिव्यू में इसे एक्सेस कर सकते हैं। गूगल ने Agora, Fishjam, LiveKit और Pipecat समेत कई बड़े प्लेटफॉर्म्स के साथ इसके शानदार इंटीग्रेशन को भी पूरी दुनिया के सामने हाइलाइट किया है।
इस इंटीग्रेशन से डेवलपर्स को वॉयस ट्रांसलेशन एप्लिकेशन्स को ज्यादा आसानी से बनाने और उन्हें डिप्लॉय करने में बहुत मदद मिलेगी। यह आधुनिक और शक्तिशाली एआई मॉडल आज से सभी सपोर्टेड गूगल प्रोडक्ट्स में वैश्विक स्तर पर पूरी तरह रोलआउट होना शुरू हो गया है।
Mohit


