एन. रघुरामन यांचा कॉलम:लवकरच आपण ‘टायपिंग’ऐवजी‘टॉकिंग’ तंत्रज्ञानाचा वापर करू

आतापर्यंत आपण सर्वजण ही तक्रार करत होतो की, आपल्यापैकी बहुतेक लोक रस्ते, ट्रेन किंवा सार्वजनिक ठिकाणी मोबाइल स्क्रीनमध्ये मान घालून काही ना काही टाइप करत असतात, पण काळजी करू नका, एआयने (AI) तुमची ही तक्रार ऐकली आहे. लोक आता डोळ्यात डोळे घालून तुमच्याकडे पाहतील आणि बोलत राहतील. अहो, घाबरू नका! ते तुमच्याशी नाही, तर त्यांच्या फोनशीच ‘टॉकिंग’ करत असतील. आता लोक फोनवर दुसऱ्या कोणाशी बोलत नसून आपल्या मोबाइलला ‘डिक्टेशन’ देत आहेत—जो एखाद्या सेक्रेटरीप्रमाणे नोट्स घेत आहे आणि त्या हव्या त्या लोकांपर्यंत पोहोचवत आहे. आता कल्पना करा की, तुम्ही मुंबईच्या गच्च भरलेल्या लोकल ट्रेनमधून प्रवास करत आहात आणि प्रत्येक जण आपल्या मोबाइलशी बोलतोय. मोबाइल त्यांचा आवाज ओळखून त्याचे रूपांतर मेसेजमध्ये करत आहे. विचार करा, या गाड्या किती गोंगाटाच्या होतील? हो, जग हळूहळू सॅन फ्रान्सिस्कोमधील एका स्टार्टअपद्वारे तयार केलेल्या ‘विस्पर फ्लो’सारख्या एआय डिक्टेशन ॲप्सच्या आहारी जाईल. हे एआय तुमच्या विस्कळीत मजकुरात योग्य ठिकाणी विरामचिन्हे लावेल आणि त्याचे फॉरमॅटिंग करेल. याद्वारे तुम्ही सरासरी ११० ते १२५ शब्द प्रतिमिनिट बोलू शकता, जो वेग सरासरी टायपिंग स्पीडच्या किमान दुप्पट आणि कधी कधी तिप्पट असू शकतो. आजच्या काळात प्रत्येक काम टायपिंगने होऊ शकते, परंतु सॉफ्टवेअर एजन्सी ‘व्हाय नॉट अस’चे संस्थापक गेविन मॅकनमारा ७७ ॲप्स वापरत आहेत आणि गेल्या पाच महिन्यांत त्यांनी ३ लाख शब्द बोलले आहेत. हे तीन कादंबऱ्या लिहिण्यासारखे आहे. भविष्यातील जगात तुमचे स्वागत आहे. येथे टेक दिग्गज कंपन्यांची अशी इच्छा आहे की, आपण एआय आणि लार्ज लँग्वेज मॉडेल्सच्या वापरामध्ये ‘टायपिंग’ऐवजी ‘टॉकिंग’द्वारे तंत्रज्ञानाशी संवाद साधावा. व्हॉइस-टू-टेक्स्ट डिक्टेशन ॲप्स हा एक नवीन ट्रेंड बनत आहे. कारण त्यांचा वापर टायपिंगपेक्षा कितीतरी पटीने वेगवान आहे. तंत्रज्ञान उद्योगातील नामवंत व्यक्ती देखील एआय वापरण्याच्या नवीन पद्धती विकसित करत आहेत. मेटाचे नवीन स्मार्ट ग्लासेस पूर्णपणे आवाजावर अवलंबून आहेत. ओपनएआय आणि मेटाने त्यांच्या बॉट्सशी व्हॉइस चॅट करण्यासाठी वेगवेगळ्या व्यक्तिमत्त्वांचे (पर्सनॅलिटी) डिझाइन तयार केले आहे. ॲमेझॉनची अलेक्सा आणि ॲपलच्या सिरीजमध्येही एआय अपग्रेड्स होत आहेत. २०२६ च्या एमी अवॉर्ड््सची तयारी देखील अशाच तंत्रज्ञानाने करण्यात आली. हे सर्व बदल हे सुनिश्चित करतील की, या वर्षाच्या अखेरीस आपण बोटांच्या वापरापेक्षा तंत्रज्ञानाशी गप्पा मारताना जास्त दिसू. हे नवीन डिक्टेशन ॲप्स ‘विस्पर’ या एआय मॉडेलवर आधारित आहेत. चॅटजीपीटी बनवणाऱ्या कंपनीने २०२२ च्या शेवटी हे मूलभूत तंत्रज्ञान म्हणून लाँच केले आणि लाइव्ह डिक्टेशन सुविधा देण्यासाठी त्यावर काम केले. जरी याचे काही विनामूल्य पर्याय उपलब्ध असले, तरी भारतात याचे पेड सबस्क्रिप्शन दरमहा सुमारे ५०० रुपयांपर्यंत असू शकते. विकसित देशांमध्ये याची किंमत सुमारे १० डॉलर्स असू शकते. तुम्ही आजही पाहू शकता की, एका विशिष्ट वयोगटातील टेक युजर्स ई-मेल आणि एसएमएससाठी आपल्या कॉम्प्युटरशी ‘टॉकिंग’ करत आहेत. यामुळे काम वेगाने पूर्ण होते आणि म्हणूनच लोक पेड व्हर्जन घेण्यास तयार आहेत. वेगवेगळ्या कंपन्यांचे कोडर्स देखील मोठ्या संख्येने या तंत्रज्ञानाचा वापर करू लागले आहेत, जेणेकरून कॉफी पिण्यासाठी थोडा वेळ वाचवता येईल. ते आधी आपले सर्व विचार बोलून मोकळे होतात, मग एआयला कोडिंग करू देतात आणि फायनल एडिटिंगसाठी स्वतः की-बोर्डचा वापर करतात. लवकरच तुम्हाला ऑफिसमध्ये असे बोलणे ऐकू येईल की, ‘हे बघा, तुमचा आवाज चांगला आहे, पण ऑफिससाठी नाही. कारमध्ये जा आणि मनसोक्त ओरडा.’ समजूतदार लोक हेडफोन वापरत आहेत, जेणेकरून लोकांना वाटावे की ते कॉलवर आहेत. थोडक्यात, ते सोशल हॅकिंग करत आहेत. फंडा हा आहे की, की-बोर्ड आता कालबाह्य होणार आहे आणि आपल्या आसपासच्या जगात पूर्वीपेक्षा कितीतरी जास्त गोंगाट असेल. आपल्याला लवकरच ध्वनी प्रदूषणाविरुद्धच्या युद्धासाठी तयार राहावे लागेल.

This post was originally published on this site.



विडियो गॅलेरी

Leave a Reply

Your email address will not be published. Required fields are marked *