स्मृति के बिना बुद्धिमत्ता अधूरी होती है।
यदि कोई एआई प्रणाली यह याद नहीं रख पाती कि आपने पिछले सप्ताह किससे बात की थी, आपने कौन-सी भाषा का उपयोग किया था, या तीन महीने पहले किसी बैठक में क्या निर्णय लिया गया था, तो वह प्रणाली हमेशा सतही ही बनी रहेगी।
यह एक ऐसी चुनौती है, जिस पर दुनिया भर में काम किया जा रहा है। इसी विषय पर यह कहानी केंद्रित है, जिसमें अमेरिका में रह रहे दो भारतीय उद्यमियों की चर्चा की गई है, जो इस क्षेत्र में सक्रिय हैं। ये दोनों मिलकर ऐसे नए एआई उत्पाद विकसित कर रहे हैं, जिनकी पहचान केवल तकनीक से नहीं, बल्कि उनकी स्मरण-शक्ति और संदर्भ समझने की क्षमता से तय होती है।
किसी व्यक्ति की बुद्धिमत्ता केवल इस बात से नहीं मापी जाती कि वह कितना तर्क कर सकता है, बल्कि इस बात से भी आँकी जाती है कि वह रोज़मर्रा की उन असंख्य बातचीतों को कितनी कुशलता से संजोता, व्यवस्थित करता और समय पर याद रख पाता है, जो हमारे पेशेवर जीवन को दिशा देती हैं।
ऐसे ही एक उदाहरण हैं डैनियल जॉर्ज, जो IIT बॉम्बे के पूर्व छात्र हैं। उनका बचपन कोच्चि में बीता और वर्ष 2015 में वे खगोल भौतिकी (Astrophysics) में पीएचडी करने के लिए अमेरिका चले गए। सनी टैंग और माही करीम के साथ मिलकर डैनियल ने TwinMind नाम की एक कंपनी की शुरुआत की।
डैनियल का शैक्षणिक सफर तेज़ी और गहनता से भरा रहा। वे उन शुरुआती वैज्ञानिकों में शामिल रहे जिन्होंने गुरुत्वीय तरंग खगोल भौतिकी में आर्टिफिशियल इंटेलिजेंस का उपयोग किया। उन्होंने मशीन लर्निंग की मदद से ब्लैक होल की पहचान पर काम किया, जिसका योगदान आगे चलकर उनके शोध समूह को मिले नोबेल पुरस्कार से भी जुड़ा।
अपने अनुभव को याद करते हुए वे सहजता से कहते हैं, “मैंने सिर्फ एक साल में अपनी पीएचडी पूरी कर ली थी। यह एक रिकॉर्ड था।”

गूगल X (कंपनी की मूनशॉट फैक्ट्री) में काम करने के बाद डेनियल को एक अलग ही पहचान मिली। यहाँ उन्होंने ऐसे प्रोजेक्ट्स पर काम किया, जो साइंस फिक्शन और आम उपभोक्ता तकनीक के बीच की दूरी को मिटाते थे—जैसे AI आधारित हियरिंग डिवाइस, जो शोरगुल भरे माहौल में केवल ज़रूरी आवाज़ों को अलग कर सकते थे, और मोटराइज्ड एक्सोस्केलेटन पैंट्स, जिनकी मदद से बुज़ुर्ग लोग दोबारा सीढ़ियाँ चढ़ने में सक्षम हो सके। लेकिन आखिरकार TwinMind को आकार देने वाली चीज़ ये भविष्य की तकनीकें नहीं थीं, बल्कि एक साधारण-सी समस्या थी—लगातार मीटिंग्स, अंतहीन बातचीत और हमेशा जुड़े रहने वाली कार्यशैली में इंसानी याददाश्त का धीरे-धीरे कमजोर होना।
जेपी मॉर्गन में एप्लाइड AI के वाइस प्रेसिडेंट के तौर पर काम करते हुए, डेनियल ने एक आंतरिक टूल पर प्रयोग शुरू किया। यह टूल मीटिंग्स को सुन सकता था, उन्हें लिखित रूप में बदल सकता था, फैसलों का सार निकाल सकता था और यहाँ तक कि आगे क्या कहना चाहिए, इसका सुझाव भी दे सकता था। डेनियल के अनुसार, “यह हमारी मीटिंग्स को सुनता, सारी जानकारी को संक्षेप में बदल देता और फिर कोड तक लिख देता था। अगर मुझे आउटपुट पसंद आता, तो मैं उसे मंज़ूरी दे देता। इससे हमारा बहुत समय बचता था।”
जब उनके दोस्तों ने भी इस टूल का इस्तेमाल करना शुरू किया, तो उनमें से एक ने इसके बारे में रेडिट और ब्लाइंड पर गुमनाम रूप से लिखा। प्रतिक्रिया तुरंत आई—सैकड़ों लोगों ने कहा कि वे इसके लिए पैसे देने को तैयार हैं। एक व्यक्ति ने तो यह तक बताया कि उसे प्रमोशन मिल गया, क्योंकि उसके मैनेजर को लगा कि वह अचानक पहले से कहीं ज़्यादा समझदार हो गया है।
Google X (कंपनी की मूनशॉट लैब) में मिली विश्वसनीयता ने डैनियल के लिए नए अवसर खोल दिए। यहां उन्होंने ऐसे प्रोजेक्ट्स पर काम किया जो विज्ञान कल्पना और उपभोक्ता तकनीक के बीच की दूरी को कम करते थे—जैसे AI आधारित सुनने वाले उपकरण, जो शोरगुल वाले माहौल में भी आवाज़ों को अलग-अलग पहचान सकते थे, और मोटर चालित एक्सोस्केलेटन पैंट, जिनकी मदद से बुजुर्ग लोग दोबारा सीढ़ियां चढ़ पाने लगे। लेकिन TwinMind को आकार देने में असली भूमिका इन भविष्यवादी प्रयोगों की नहीं थी, बल्कि एक आम-सी परेशानी की थी—लगातार होने वाली मीटिंग्स, बातचीत, और हमेशा काम में डूबी ज़िंदगी में इंसानी याददाश्त का धीरे-धीरे कमजोर होना।
JP Morgan में एप्लाइड AI के वाइस प्रेसिडेंट के तौर पर काम करते हुए डैनियल ने एक आंतरिक टूल पर प्रयोग शुरू किया। यह टूल मीटिंग्स को सुन सकता था, उनका ट्रांसक्रिप्शन बना सकता था, फैसलों का सार निकाल सकता था और यहां तक कि अगला जवाब क्या होना चाहिए, इसका सुझाव भी दे सकता था। डैनियल बताते हैं, “यह हमारी मीटिंग्स सुनता, सारी जानकारी को संक्षेप में बदल देता और फिर कोड भी लिख देता था। अगर मुझे पसंद आता, तो मैं उसे मंज़ूरी दे देता। इससे हमारा काफी समय बच जाता था।”
जब उनके दोस्तों ने भी इस टूल का इस्तेमाल शुरू किया, तो उनमें से एक ने Reddit और Blind पर इसके बारे में गुमनाम रूप से लिखा। प्रतिक्रिया तुरंत देखने को मिली। “सैकड़ों लोगों ने कहा कि वे इसके लिए पैसे देने को तैयार हैं। एक व्यक्ति ने बताया कि उसे प्रमोशन मिल गया, क्योंकि उसके मैनेजर को लगा कि वह अचानक पहले से कहीं ज़्यादा समझदार हो गया है।”

इसी प्रतिक्रिया के बाद डैनियल ने सनी और माही से संपर्क किया, जिनसे उनकी मुलाकात पहले गूगल में हो चुकी थी, और फिर उन्होंने मिलकर TwinMind की शुरुआत की। यह एक पूरी तरह सॉफ्टवेयर-आधारित प्रोडक्ट है, जिसमें स्मार्टफोन ऐप और ब्राउज़र एक्सटेंशन शामिल हैं। यह तकनीक दिनभर सुन सकती है, जेब में रखे फोन से भी बातचीत रिकॉर्ड कर सकती है और उपयोगकर्ता जो कुछ देखता, सुनता या बोलता है, उसकी एक स्थायी डिजिटल मेमोरी तैयार करती है। डैनियल बताते हैं कि वे पिछले आठ महीनों से इसका इस्तेमाल कर रहे हैं। उनके अनुसार निवेशकों, माता-पिता, पत्नी और सह-संस्थापकों के साथ हुई हर बातचीत इसमें दर्ज हो चुकी है।
TwinMind को खास बनाने वाली बात सिर्फ बातचीत को टेक्स्ट में बदलना नहीं है, क्योंकि यह क्षेत्र पहले से ही काफी भीड़भाड़ वाला और औसत स्तर का है। इसकी असली ताकत इस बात में है कि यह जानकारी को किस तरह संरचित करता है और दोबारा इस्तेमाल करता है। डैनियल के मुताबिक, हर सुबह यह सिस्टम उनकी पुरानी बातचीत, मीटिंग्स और संदर्भों के आधार पर ई-मेल का मसौदा तैयार करता है। यह कॉल्स के लिए तैयारी कराता है, पिच डेक बनाता है, इंटर्नशिप आवेदनों को छांटता है और बिना पूछे अगला कदम सुझाता है। डैनियल इसे आयरन मैन के जार्विस जैसा बताते हैं।
तकनीकी स्तर पर यह चुनौती काफी कठिन थी। TwinMind 140 भाषाओं को सपोर्ट करता है, जिनमें मलयालम, तमिल, मराठी और कई अन्य भारतीय भाषाएं शामिल हैं, जिन्हें सामान्य ट्रांसक्रिप्शन टूल ठीक से संभाल नहीं पाते। इसकी सबसे बड़ी सफलता इस सोच से आई कि बड़े भाषा मॉडल्स को सिर्फ चैटबॉट की तरह नहीं, बल्कि निर्णय लेने वाले जज की तरह इस्तेमाल किया जाए। इसके लिए TwinMind ने यूट्यूब और पॉडकास्ट से भारी मात्रा में ऑडियो डेटा इकट्ठा किया, एक ही ऑडियो क्लिप को कई प्रतिस्पर्धी मॉडल्स से प्रोसेस कराया और फिर एक LLM से तय कराया कि संदर्भ के अनुसार कौन-सा ट्रांसक्रिप्शन सबसे सही है। डैनियल के अनुसार, अलग-अलग दस मॉडलों की तुलना करके गलतियों को सुधारा जा सकता है और एक भरोसेमंद डेटा सेट तैयार किया जा सकता है।

इसके बाद इस डेटा का उपयोग छोटे, अत्यधिक अनुकूलित एआई मॉडल्स को प्रशिक्षित करने में किया गया, जो बिना बैटरी अधिक खर्च किए सीधे डिवाइस पर चल सकते हैं। डैनियल बताते हैं, “अगर कोई फीचर लोकल डिवाइस पर नहीं चल पाता, तो वह अपने-आप क्लाउड पर स्विच हो जाता है। इसी तरीके से हम प्रति यूज़र लागत को एक डॉलर प्रति माह से कम रखते हैं।” उनका मानना है कि भविष्य में हर व्यक्ति के पास अपनी निजी एआई मेमोरी लेयर होगी, जिसे अलग-अलग ऐप्स उपयोग कर सकेंगे। “हर इंसान का अपना एआई होगा, जो उसकी सोच, संस्कृति और जीवनशैली को समझेगा।”
हार्डवेयर आधारित तरीका
जहां TwinMind एआई मेमोरी के लिए केवल सॉफ्टवेयर पर निर्भर है, वहीं अनिथ पटेल का Buddi AI इसी समस्या का एक अलग समाधान पेश करता है। Buddi एक पहनने योग्य हार्डवेयर डिवाइस पर आधारित है—जैसे क्लिप या पेंडेंट—जिसे यूज़र पूरे दिन अपने साथ रखते हैं। सैन फ्रांसिस्को स्थित Anith की सोच साफ है: “मोबाइल ऐप हर समय आपकी बात नहीं सुन सकता, क्योंकि ऑपरेटिंग सिस्टम माइक्रोफोन एक्सेस को सीमित कर देता है। हार्डवेयर में यह बाधा नहीं होती।”
अनिथ ने चेन्नई स्थित SRM यूनिवर्सिटी से बीटेक किया और बाद में IoT सेक्टर में काम किया। उनका अनुभव दृष्टिबाधितों के लिए वियरेबल टेक्नोलॉजी, फिनटेक और एआई एजुकेशन प्रोजेक्ट्स तक फैला हुआ है। Buddi का विचार तब आकार लेने लगा, जब उन्होंने बार-बार देखा कि लोग कंप्यूटर से दूर रहने पर बातचीत के अहम बिंदु भूल जाते हैं। शुरुआती प्रोटोटाइप अहमदाबाद में उनके लैब में 3D प्रिंट किए गए और अमेरिका व ब्रिटेन में यूज़र्स के साथ टेस्ट किए गए। वे कहते हैं, “हम जानना चाहते थे कि लोग इस पर कैसी प्रतिक्रिया देते हैं। यह कैटेगरी नई थी और प्राइवेसी एक बड़ी चिंता थी, लेकिन जब लोगों को इसकी उपयोगिता समझ आई, तो नजरिया बदल गया।”
यह डिवाइस लगातार बातचीत को रिकॉर्ड करता है, उन्हें टेक्स्ट में बदलता है, सारांश और एक्शन पॉइंट्स तैयार करता है और फिर इस डेटा को मोबाइल ऐप व एंटरप्राइज डैशबोर्ड से सिंक करता है। इसे खास तौर पर B2B उपयोग के लिए डिजाइन किया गया है, विशेषकर फील्ड सेल्स टीमों के लिए। अनिथ बताते हैं, “अमेरिका में सेल्स मैनेजर्स को रियल-टाइम में यह पता चल जाता है कि फील्ड में क्या हो रहा है, बिना टीम के घंटों डॉक्युमेंटेशन में समय गंवाए।”
हर ग्राहक के साथ हुई बातचीत अपने-आप ट्रांसक्राइब होती है, उसका सार बनता है और वह एक्शन आइटम्स में बदल जाती है, जो सीधे कैलेंडर और CRM सिस्टम से जुड़ जाते हैं। इससे मैन्युअल नोट-टेकिंग में लगने वाला समय बचता है। मैनेजर्स को टीम-लेवल एनालिटिक्स मिलती है—जैसे बातचीत के ट्रेंड, फॉलो-अप और नतीजे—जबकि सेल्स प्रोफेशनल्स को साफ रिकॉर्ड मिलता है कि क्या वादा किया गया था, अगला कदम क्या है और कहां डील अटक सकती है। समय के साथ यह फील्ड गतिविधियों की एक “लिविंग मेमोरी” तैयार करता है, जिससे जोखिम पहचानने, ट्रेनिंग सुधारने और डील्स जल्दी क्लोज़ करने में मदद मिलती है।
Buddi हार्डवेयर इंजीनियरिंग को एक मॉड्यूलर सॉफ्टवेयर सिस्टम के साथ जोड़ता है। इस डिवाइस में इनबिल्ट स्टोरेज, ब्लूटूथ और माइक्रोफोन मौजूद हैं, जिससे यह फोन से कनेक्ट न होने की स्थिति में भी काम कर सकता है। अनिथ के अनुसार, “अगर फोन कनेक्ट नहीं है, तो डिवाइस डेटा सेव कर लेता है। जैसे ही ब्लूटूथ दोबारा जुड़ता है, डेटा अपने आप सिंक हो जाता है। हमने USB सिंकिंग का विकल्प भी दिया है क्योंकि ब्लूटूथ की गति अपेक्षाकृत धीमी होती है।”
TwinMind की तरह ही Buddi अंग्रेज़ी के साथ-साथ कई भारतीय भाषाओं को सपोर्ट करता है, हालांकि अनिथ अपनी प्राथमिकताओं को लेकर स्पष्ट हैं। वे कहते हैं, “हमारा मुख्य ग्राहक वर्ग मूल रूप से अंग्रेज़ी बोलने वाला है, इसलिए हमारा फोकस अंग्रेज़ी में शब्दों की त्रुटि दर को न्यूनतम रखने पर है।” लंबे समय में Buddi का विज़न केवल बिक्री उत्पादकता तक सीमित नहीं है। अनिथ इसे संगठनों की सामूहिक याददाश्त के रूप में देखते हैं। उनके शब्दों में, “हम कंपनियों के लिए एक दिमाग बनाना चाहते हैं, ताकि वे ज़मीनी स्तर पर समस्याएँ उभरने से पहले ही उनका अनुमान लगा सकें।”
