मुख्य समाचारफ्रन्ट पेजसमाचारनयाँ यात्रा २०२५दृष्टिकोणअर्थअन्तर्वार्ताखेलकुदविश्वफिचरप्रदेशपालिका अपडेट
  • वि.सं २o८१ माघ १६ बुधबार
  • Thursday, 30 January, 2025
तोङलियाङ लिउ
२o८१ माघ १६ बुधबार १o:३३:oo
Read Time : > 2 मिनेट
दृष्टिकोण प्रिन्ट संस्करण

डिपसिक : ठुला अमेरिकी प्रविधि कम्पनीका लागि चुनौती

Read Time : > 2 मिनेट
तोङलियाङ लिउ
नयाँ पत्रिका
२o८१ माघ १६ बुधबार १o:३३:oo

डिपसिकका एआई मोडेल निःशुल्क एमआइटी लाइसेन्सअन्तर्गत सार्वजनिक गरिएका छन्, जोसुकैले पनि यी मोडेल परिमार्जन गर्न सक्छन्

चिनियाँ आर्टिफिसियल इन्टेलिजेन्स (एआई) कम्पनी डिपसिकले अत्यन्त प्रभावकारी एआई मोडेल सार्वजनिक गर्दै प्रविधि क्षेत्रलाई चकित बनाएको छ । यसले ओपनएआई र एन्थ्रोपिकजस्ता अमेरिकी कम्पनीका अत्याधुनिक उत्पादनसँग प्रतिस्पर्धा गर्न सक्छ । सन् २०२३ मा स्थापित डिपसिकले आफ्ना प्रतिस्पर्धीका तुलनामा धेरै कम लागत र कम्प्युटिङ स्रोत प्रयोग गरेर यो उपलब्धि हासिल गरेको हो । गत साता सार्वजनिक भएको डिपसिकको ‘रिजनिङ’ आर १ मोडेलले अनुसन्धानकर्तामाझ उत्साह, लगानीकर्तामाझ आश्चर्य र एआई क्षेत्रका ठुला कम्पनीबाट प्रतिक्रिया उत्पन्न गराउन सफल भयो । कम्पनीले यसलाई पछ्याउँदै २८ जनवरीमा टेक्स्ट (पाठ) मात्र नभई चित्रसँग पनि काम गर्न सक्ने मोडेल सार्वजनिक गरेको छ ।

गत डिसेम्बरमा डिपसिकले आफ्नो भी ३ मोडेल सार्वजनिक गरेको थियो । यो एक अत्यन्त शक्तिशाली ‘मानकीय’ लार्ज ल्यांग्वेज मोडेल हो, जसले ओपनएआईको जिपिटी–४ ओ र एन्थ्रोपिकको क्लाउड ३.५ को स्तरमा प्रदर्शन गर्छ । उसो त यी मोडेल गल्ती गर्न सक्ने र यिनले कहिलेकाहीँ आफैँले तथ्य बनाउने प्रवृत्ति भए पनि प्रश्नको उत्तर दिनु, निबन्ध लेख्नु र कम्प्युटर कोड उत्पादनजस्ता कार्य गर्न सक्षम छन् । समस्या समाधान र गणितीय तर्कका केही परीक्षणले यिनले औसत मानिसको तुलनामा राम्रो अंक ल्याउँछन् । भी ३ लाई करिब ५५ लाख ८० हजार अमेरिकी डलर लागतमा प्रशिक्षण दिइएको थियो । यो जिपिटी–४ को तुलनामा उल्लेखनीय रूपमा सस्तो छ । यसको विकास लागत १० करोड अमेरिकी डलरभन्दा बढी परेको थियो । डिपसिकले भी ३ मोडेललाई एच ८०० जिपियू चिप भएको दुई हजार कम्प्युटरको प्रयोगबाट प्रशिक्षण दिइएको दाबी गरेको छ । यो अन्य कम्पनीका तुलनामा एकदमै न्यून हो किनभने अन्य कम्पनीले अधिक शक्तिशाली एच १०० चिप भएका १६ हजारसम्मका कम्प्युटर प्रयोग गरेको हुन सक्ने देखिन्छ । २० जनवरीमा डिपसिकले अर्को मोडेल आर १ सार्वजनिक गरेको छ । यसलाई ‘तर्क गर्ने’ मोडेलको संज्ञा पनि दिइएको छ, जसले जटिल समस्यालाई क्रमशः चरणबद्ध रूपमा समाधान गर्ने प्रयास गर्छ ।

आर १ मोडेल भी ३ को परिमार्जित संस्करण हो, जसलाई रिइन्फोर्समेन्ट लर्निङ नामक प्रविधि प्रयोग गरी परिमार्जन गरिएको हो । आर १ ले गत वर्ष सार्वजनिक गरिएको ओपन एआईको ओ १ जस्तै स्तरमा काम गर्ने देखिन्छ । डिपसिकले यस्तै प्रविधि प्रयोग गरेर घरेलु कम्प्युटरमा चलाउन सकिने साना ओपन–सोर्स मोडेलको ‘तर्क गर्ने’ संस्करण पनि बनाएको छ । यो सार्वजनिकीकरणले डिपसिकप्रति ठुलो चासो उत्पन्न गरेको छ, जसले भी३मा आधारित च्याटबोट एपको लोकप्रियता बढाएको छ र लगानीकर्ताले एआई उद्योगको पुनर्मूल्यांकन गर्दा प्रविधि बजारमा ठुलो स्तरमा मूल्यको गिरावट निम्त्याएको छ । यो लेख लेखिँदासम्म चिप निर्माता एनभिडियाले करिब ६ खर्ब अमेरिकी डलरबराबरको बजार मूल्य गुमाइसकेको छ ।

डिपसिकको सफलता कम स्रोत प्रयोग गरेर उत्कृष्ट नतिजा प्राप्त गर्ने क्षमतामा केन्द्रित छ । विशेषतः डिपसिकका निर्माताले दुई प्रविधिमा अग्रणी भूमिका खेलेका छन्, जसलाई एआई अनुसन्धानकर्ताले व्यापक रूपमा अपनाउन सक्छन् । पहिलो प्रविधि ‘स्पार्सिटी’ भनिने गणितीय अवधारणासँग सम्बन्धित छ । यो एआई मोडेलसँग धेरै संख्यामा प्यारामिटर छन्, जसले इनपुटमा आधारित प्रतिक्रिया निर्धारण गर्छन् (भी३मा करिब ६ खर्ब ७१ अर्ब प्यारामिटर छन्) र कुनै पनि इनपुटका लागि यी प्यारामिटरमध्ये सानो अंश मात्र प्रयोग गरिन्छ । उसो त कुन प्यारामिटर आवश्यक पर्छ भनेर पूर्वानुमान गर्न सजिलो छैन । तर, डिपसिकले यसका लागि नयाँ प्रविधि प्रयोग ग¥यो र त्यसपछि केवल आवश्यक प्यारामिटरलाई प्रशिक्षण दिएको छ । यसका कारण डिपसिकका मोडेललाई परम्परागत विधिका तुलनामा धेरै कम प्रशिक्षण आवश्यक प¥यो । अर्को चासोको विषय भी३ले कम्प्युटर मेमोरीमा जानकारी कसरी भण्डारण गर्छ भन्ने विषयसँग सम्बन्धित छ । डिपसिकले सम्बन्धित तथ्यांकलाई कुशलतापूर्वक कम्प्रेस गर्ने एक निपुण उपाय फेला पारेको छ । यसले तथ्यांकलाई सजिलै भण्डारण गर्न र छिटो पहुँच पाउन सकिने बनाउँछ ।

डिपसिकका एआई मोडेल र प्रविधि निःशुल्क एमआइटी लाइसेन्सअन्तर्गत सार्वजनिक गरिएका छन् । जोसुकैले पनि ती मोडेल डाउनलोड गरी परिमार्जन गर्न सक्छन् । यो केही एआई कम्पनीका लागि नराम्रो खबर हुन सक्छ, किनभने शक्तिशाली मोडेल निःशुल्क उपलब्ध हुँदा तिनको मुनाफामा ह्रास आउन सक्छ । तर, यो बृहत् एआई अनुसन्धान समुदायका लागि निकै राम्रो खबर हो । हालका अवस्थामा धेरैजसो एआई अनुसन्धानका लागि अत्यधिक कम्प्युटिङ स्रोतको पहुँच आवश्यक पथ्र्यो । विश्वविद्यालयमा आधारित अनुसन्धानकर्ता (वा ठुला प्रविधि कम्पनीबाहेक अन्य स्थानमा रहेका अनुसन्धानकर्ता) अर्थात् मजस्ताले परीक्षण र प्रयोग सञ्चालन गर्न सीमितता झेलिरहेका छन् ।

यस अवस्थामा अधिक प्रभावकारी मोडेल र प्रविधिले परिस्थितिलाई परिवर्तन गरिरहेको छ । अब हामीलाई परीक्षण र विकास गर्न निकै सहज हुन सक्छ । उपभोक्ताका लागि पनि एआईको पहुँच सस्तो हुने सम्भावना छ । धेरै एआई मोडेल अब ‘क्लाउड’मा सदस्यता शुल्क तिर्नुको सट्टा प्रयोगकर्ताकै ल्यापटप वा फोनजस्ता उपकरणमा सञ्चालन गर्न सकिनेछ । यद्यपि जोसँग पहिल्यै पर्याप्त स्रोत छ, तिनका लागि यो प्रभावकारिता खासै उपयोगी नहुन सक्छ । डिपसिकको दृष्टिकोणले समग्रमा थप राम्रो प्रदर्शन गर्ने मोडेल बनाउन मद्दत गर्नेछ वा केवल प्रभावकारी मोडेल निर्माणमा सीमित रहनेछ भन्ने कुरा अझै अस्पष्ट छ ।

(लिउ सिड्नी विश्वविद्यालयको मेसिन लर्निङका सह–प्राध्यापक तथा सिड्नी एआई केन्द्रका निर्देशक हुन्) 
द कन्भर्सेसनबाट