பயிற்சி AI மாதிரிகள்: குறைந்த விலை AI மேம்பாட்டிற்கான தேடல்

பட கடன்:
பட கடன்
கசய்துள்ைது

பயிற்சி AI மாதிரிகள்: குறைந்த விலை AI மேம்பாட்டிற்கான தேடல்

பயிற்சி AI மாதிரிகள்: குறைந்த விலை AI மேம்பாட்டிற்கான தேடல்

உபதலைப்பு உரை
செயற்கை நுண்ணறிவு மாதிரிகள் உருவாக்குவதற்கும் பயிற்சி செய்வதற்கும் மிகவும் விலையுயர்ந்தவை, அவை பெரும்பாலான ஆராய்ச்சியாளர்கள் மற்றும் பயனர்களுக்கு அணுக முடியாதவை.
    • ஆசிரியர் பற்றி:
    • ஆசிரியர் பெயர்
      குவாண்டம்ரன் தொலைநோக்கு
    • மார்ச் 21, 2023

    செயற்கை நுண்ணறிவு (AI) வளர்ச்சியில் உள்ள பல சவால்களுக்கு ஆழ்ந்த கற்றல் (DL) ஒரு திறமையான தீர்வாக நிரூபிக்கப்பட்டுள்ளது. இருப்பினும், DL மேலும் விலை உயர்ந்து வருகிறது. ஆழமான நரம்பியல் நெட்வொர்க்குகளை இயக்குவதற்கு அதிக செயலாக்க ஆதாரங்கள் தேவை, குறிப்பாக முன் பயிற்சியில். மோசமானது, இந்த ஆற்றல்-தீவிர செயல்முறையானது, இந்த தேவைகள் பெரிய கார்பன் தடயங்களை விளைவித்து, AI ஆராய்ச்சி வணிகமயமாக்கலின் ESG மதிப்பீடுகளை சேதப்படுத்துகிறது.

    பயிற்சி AI மாதிரிகள் சூழல்

    முன் பயிற்சி என்பது பெரிய அளவிலான நரம்பியல் நெட்வொர்க்குகளை உருவாக்குவதற்கான மிகவும் பிரபலமான அணுகுமுறையாகும், மேலும் இது கணினி பார்வை (CV) மற்றும் இயற்கை மொழி செயலாக்கம் (NLP) ஆகியவற்றில் பெரும் வெற்றியைக் காட்டியுள்ளது. இருப்பினும், பெரிய DL மாடல்களை உருவாக்குவது மிகவும் விலை உயர்ந்ததாகிவிட்டது. எடுத்துக்காட்டாக, OpenAI இன் ஜெனரேட்டிவ் ப்ரீ-ட்ரெய்ன்ட் டிரான்ஸ்ஃபார்மர் 3 (GPT-3), 175 பில்லியன் அளவுருக்கள் மற்றும் சிறந்த கிராபிக்ஸ் கார்டுகளுடன் கூடிய மகத்தான சர்வர் க்ளஸ்டர்களுக்கான அணுகல் தேவை, இதன் மதிப்பு USD $12 மில்லியன். மாடலை இயக்க சக்திவாய்ந்த சர்வர் மற்றும் நூற்றுக்கணக்கான ஜிகாபைட் வீடியோ ரேண்டம் அணுகல் நினைவகம் (VRAM) தேவை.

    பெரிய தொழில்நுட்ப நிறுவனங்கள் இத்தகைய பயிற்சி செலவுகளை வாங்க முடியும் என்றாலும், சிறிய தொடக்கங்கள் மற்றும் ஆராய்ச்சி நிறுவனங்களுக்கு இது தடைசெய்யும். மூன்று காரணிகள் இந்த செலவை தூண்டுகின்றன. 

    1. விரிவான கணக்கீட்டு செலவுகள், ஆயிரக்கணக்கான கிராஃபிக் செயலாக்க அலகுகளுடன் (GPUs) பல வாரங்கள் தேவைப்படும்.

    2. ஃபைன்-டியூன் செய்யப்பட்ட மாடல்களுக்கு பாரிய சேமிப்பு தேவைப்படுகிறது, பொதுவாக நூற்றுக்கணக்கான ஜிகாபைட்கள் (ஜிபிக்கள்) ஆகும். மேலும், வெவ்வேறு பணிகளுக்கான பல மாதிரிகள் சேமிக்கப்பட வேண்டும்.

    3. பெரிய மாடல்களைப் பயிற்றுவிப்பதற்கு துல்லியமான கணக்கீட்டு சக்தி மற்றும் வன்பொருள் தேவைப்படுகிறது; இல்லையெனில், முடிவுகள் சிறந்ததாக இருக்காது.

    தடைசெய்யப்பட்ட செலவுகள் காரணமாக, AI ஆராய்ச்சி பெருகிய முறையில் வணிகமயமாக்கப்பட்டுள்ளது, இதில் பிக் டெக் நிறுவனங்கள் இந்தத் துறையில் ஆய்வுகளை முன்னெடுத்து வருகின்றன. இந்த நிறுவனங்கள் தங்கள் கண்டுபிடிப்புகளிலிருந்து அதிக லாபத்தைப் பெறுகின்றன. இதற்கிடையில், ஆராய்ச்சி நிறுவனங்கள் மற்றும் இலாப நோக்கற்ற நிறுவனங்கள் இந்த துறையில் தங்கள் ஆய்வுகளை நடத்த விரும்பினால் பெரும்பாலும் இந்த வணிகங்களுடன் ஒத்துழைக்க வேண்டும். 

    சீர்குலைக்கும் தாக்கம்

    நரம்பியல் நெட்வொர்க்குகளை "கத்தரிக்கலாம்" என்று கூறும் சான்றுகள் உள்ளன. இதன் பொருள், மிகைப்படுத்தப்பட்ட நரம்பியல் நெட்வொர்க்குகளுக்குள், ஒரு சிறிய குழு அதன் செயல்பாட்டில் அதிக தாக்கங்கள் இல்லாமல் அசல் AI மாதிரியின் அதே அளவிலான துல்லியத்தை அடைய முடியும். எடுத்துக்காட்டாக, 2020 ஆம் ஆண்டில், ஸ்வார்த்மோர் கல்லூரி மற்றும் லாஸ் அலமோஸ் தேசிய ஆய்வகத்தைச் சேர்ந்த AI ஆராய்ச்சியாளர்கள், கணிதவியலாளர் ஜான் கான்வேயின் கேம் ஆஃப் லைப்பில் எதிர்காலப் படிகளைக் கணிக்க ஒரு சிக்கலான DL மாடல் கற்றுக் கொள்ள முடியும் என்றாலும், எப்போதும் ஒரு சிறிய நரம்பியல் வலையமைப்பைக் கற்பிக்க முடியும் என்று விளக்கினர். அதையே செய்ய.

    டிஎல் மாடலின் பல அளவுருக்கள் முழு பயிற்சியையும் முடித்த பிறகு அதை நிராகரித்தால், அதை அதன் அசல் அளவின் 10 சதவீதமாகக் குறைத்து, அதே முடிவை இன்னும் அடைய முடியும் என்று ஆராய்ச்சியாளர்கள் கண்டுபிடித்துள்ளனர். மடிக்கணினிகள் மற்றும் ஸ்மார்ட்போன்கள் போன்ற சாதனங்களில் இடத்தை சேமிக்க பல தொழில்நுட்ப நிறுவனங்கள் ஏற்கனவே தங்கள் AI மாதிரிகளை சுருக்கி வருகின்றன. இந்த முறை பணத்தை மிச்சப்படுத்துவது மட்டுமல்லாமல், இணைய இணைப்பு இல்லாமல் மென்பொருளை இயக்கவும், நிகழ்நேரத்தில் முடிவுகளைப் பெறவும் அனுமதிக்கிறது. 

    சிறிய நரம்பியல் நெட்வொர்க்குகளுக்கு நன்றி, சோலார் பேட்டரிகள் அல்லது பொத்தான் செல்கள் மூலம் இயக்கப்படும் சாதனங்களில் DL சாத்தியமாகிய நிகழ்வுகளும் இருந்தன. இருப்பினும், கத்தரித்து முறையின் ஒரு வரம்பு என்னவென்றால், மாடல் குறைக்கப்படுவதற்கு முன் முழுமையாக பயிற்சியளிக்கப்பட வேண்டும். நரம்பியல் துணைக்குழுக்களில் சில ஆரம்ப ஆய்வுகள் இருந்தன, அவை சொந்தமாக பயிற்சியளிக்கப்படலாம். இருப்பினும், அவற்றின் துல்லியம் மிகைப்படுத்தப்பட்ட நரம்பியல் நெட்வொர்க்குகளின் துல்லியம் போன்றது அல்ல.

    AI மாதிரிகள் பயிற்சியின் தாக்கங்கள்

    பயிற்சி AI மாதிரிகளின் பரவலான தாக்கங்கள் பின்வருமாறு: 

    • நரம்பியல் நெட்வொர்க்குகளைப் பயிற்றுவிப்பதற்கான பல்வேறு முறைகளில் ஆராய்ச்சியை அதிகரித்தல்; இருப்பினும், நிதி பற்றாக்குறையால் முன்னேற்றம் குறையக்கூடும்.
    • பெரிய தொழில்நுட்பம் தங்கள் AI ஆராய்ச்சி ஆய்வகங்களுக்கு தொடர்ந்து நிதியளிக்கிறது, இதன் விளைவாக அதிக வட்டி மோதல்கள் ஏற்படுகின்றன.
    • AI மேம்பாட்டிற்கான செலவுகள் ஏகபோகங்களை உருவாக்குவதற்கான நிலைமைகளை உருவாக்குகின்றன, புதிய AI தொடக்கங்கள் நிறுவப்பட்ட தொழில்நுட்ப நிறுவனங்களுடன் சுயாதீனமாக போட்டியிடும் திறனைக் கட்டுப்படுத்துகின்றன. வளர்ந்து வரும் வணிக சூழ்நிலையில் ஒரு சில பெரிய தொழில்நுட்ப நிறுவனங்கள் மாபெரும் தனியுரிம AI மாதிரிகளை உருவாக்கி சிறிய AI நிறுவனங்களுக்கு சேவை/பயன்பாட்டாக குத்தகைக்கு விடுவதைக் காணலாம்.
    • ஆராய்ச்சி நிறுவனங்கள், இலாப நோக்கற்ற நிறுவனங்கள் மற்றும் பல்கலைக்கழகங்கள் தங்கள் சார்பாக சில AI சோதனைகளை நடத்த பெரிய தொழில்நுட்பத்தால் நிதியளிக்கப்படுகின்றன. இந்தப் போக்கு கல்வி நிறுவனங்களில் இருந்து பெருநிறுவனங்களுக்கு அதிக மூளை வடிகால் வழிவகுக்கும்.
    • பெரிய தொழில்நுட்பங்கள் தங்கள் ஆராய்ச்சி மற்றும் மேம்பாட்டுத் திட்டங்களுக்குப் பொறுப்பேற்க அவர்களின் AI நெறிமுறை வழிகாட்டுதல்களை வெளியிடுவதற்கும் தொடர்ந்து புதுப்பிப்பதற்கும் அதிகரித்த அழுத்தம்.
    • பயிற்சி AI மாதிரிகள் அதிக விலையுயர்ந்ததால், அதிக கம்ப்யூட்டிங் சக்தி தேவைப்படுகிறது, இது அதிக கார்பன் உமிழ்வுகளுக்கு வழிவகுக்கிறது.
    • இந்த மாபெரும் AI மாதிரிகளின் பயிற்சியில் பயன்படுத்தப்படும் தரவை ஒழுங்குபடுத்த முயற்சிக்கும் சில அரசு நிறுவனங்கள். அத்துடன், SME கண்டுபிடிப்புகளை ஊக்குவிக்கும் முயற்சியில், ஒரு குறிப்பிட்ட அளவிலான AI மாதிரிகளை சிறிய உள்நாட்டு நிறுவனங்களுக்கு அணுகும்படி கட்டாயப்படுத்தும் சட்டத்தை போட்டி முகவர்கள் உருவாக்கலாம்.

    கருத்தில் கொள்ள வேண்டிய கேள்விகள்

    • நீங்கள் AI துறையில் பணிபுரிந்தால், உங்கள் நிறுவனம் சுற்றுச்சூழலுக்கு ஏற்ற AI மாதிரிகளை எவ்வாறு உருவாக்குகிறது?
    • விலையுயர்ந்த AI மாடல்களின் சாத்தியமான நீண்ட கால விளைவுகள் என்ன?

    நுண்ணறிவு குறிப்புகள்

    இந்த நுண்ணறிவுக்கு பின்வரும் பிரபலமான மற்றும் நிறுவன இணைப்புகள் குறிப்பிடப்பட்டுள்ளன: