முதல் மாதம் - கற்றல் | வாரம் 1: செய்யறிவு நெறிமுறைகள் - பகுதி 2
பேராசிரியர். சத்தியராஜ் தங்கச்சாமி
தமிழ் உதவிப்பேராசிரியர், முதன்மைப் பதிப்பாசிரியர், விக்கிமீடியர்
ஸ்ரீ கிருஷ்ணா ஆதித்யா கலை மற்றும் அறிவியல் கல்லூரி, கோயம்புத்தூர் – 641042.
தமிழ் இலக்கியத்தில் செய்யறிவின் பொருந்தும் தன்மை — தொல்காப்பியம் தொடங்கி திருக்குறள் வரை, நம் முன்னோர்கள் அறிவின் இயல்பை ஆழ்ந்து சிந்தித்துள்ளனர்.
செய்யறிவின் தொழில்நுட்ப வளர்ச்சி எவ்வளவு முக்கியமோ, அதே அளவு அதன் அறநெறி சார்ந்த செயல்பாடும் (Ethical AI) முக்கியமானது. முந்தைய பாடத்தில் சமூக, சட்டத் தாக்கங்களைப் பார்த்தோம். அதன் தொடர்ச்சியாக, இன்றைய பாடத்தில் செய்யறிவு அமைப்புகளில் ஒளிந்திருக்கும் பக்கச்சார்பு (Bias), தனிநபர்களின் தரவுத் தனியுரிமை (Data Privacy), இத்தொழில்நுட்பம் சுற்றுச்சூழலில் ஏற்படுத்தும் பாதிப்புகள் ஆகியவற்றைத் தமிழ் இலக்கியப் பார்வையில் விரிவாகக் காண்போம்.
செய்யறிவின் மிகப்பெரிய சவால்களில் ஒன்று அதில் நிலவும் பக்கச்சார்பு ஆகும். செய்யறிவு மாதிரிகள் தாங்கள் பயிற்றுவிக்கப்படும் தரவுகளில் உள்ள மனிதத் தவறுகளையும் பாரபட்சங்களையும் அப்படியே கற்றுக்கொண்டு, முடிவுகளை வழங்கும்போது அவற்றைப் பிரதிபலிக்கின்றன.
"யாதும் ஊரே யாவரும் கேளிர்" (புறநானூறு 192): கணியன் பூங்குன்றனாரின் இந்த அடி, உலக மக்கள் அனைவரையும் உறவினராகக் கருதச் சொல்கின்றன. ஒரு சிறந்த செய்யறிவு அமைப்பு இனம், மதம், மொழி, பாலினம் கடந்து இத்தகைய உலகளாவிய நடுநிலையுடன் (Neutrality) செயல்பட வேண்டும்.
"பிறப்பொக்கும் எல்லா உயிர்க்கும்" (திருக்குறள் 972): பிறப்பால் அனைவரும் சமம் என்ற வள்ளுவரின் அறம், செய்யறிவு தரவுகளில் பேணப்பட வேண்டும். பக்கச்சார்பற்ற தரவுகளைத் தேர்ந்தெடுத்தல், பன்முகத்தன்மை கொண்ட குழுக்களால் (Diverse Teams) மென்பொருள்களை உருவாக்குவதன் மூலம் மட்டுமே இந்த அறத்தை எட்ட முடியும்.
செய்யறிவு அமைப்புகள் இயங்க கோடிக்கணக்கான தனிநபர் தரவுகள் தேவைப்படுகின்றன. இந்தத் தரவுகள் எங்கு, யாரால், எப்படிப் பயன்படுத்தப்படுகின்றன என்பது இன்று உலகளாவிய கேள்வியாக உருவெடுத்துள்ளது.
இது General Data Protection Regulation என்பதன் சுருக்கக் குறியீடு ஆகும். இதுதான் உலகிலேயே மிகக் கடுமையான தரவுப் பாதுகாப்புச் சட்டமாகும். இதில் 'மறக்கப்படும் உரிமை' (Right to be forgotten) போன்ற முக்கியமான உரிமைகள் வழங்கப்பட்டுள்ளன.
இது Digital Personal Data Protection என ஆங்கிலத்தில் கூறப்படுகின்றது. இந்தச் சட்டம் தனிநபரின் அனுமதியின்றி தரவுகளைச் சேகரிப்பதைக் கட்டுப்படுத்துவதுடன், தரவு மீறல் (Data Breach) ஏற்பட்டால் உரிய நடவடிக்கை எடுக்கவும் இது வழிவகை செய்கிறது.
திருமூலர் திருமந்திரத்தில், "ஒன்றானும் ஒருவனுக்கு ஒருவன் தீங்கு நினையாதிருத்தல்" என்று குறிப்பிடுவது, பிறருடைய அந்தரங்கத்தையும் (Privacy) நலனையும் மதிப்பதைக் குறிக்கிறது. திருக்குறளோ "களவு" (அதிகாரம் 29) என்பதைப் பெரும் குற்றமாகக் கருதுகிறது. இன்று ஒருவரின் அனுமதியின்றி அவரது எண்ணிமத் (டிஜிட்டல்) தரவுகளைத் திருடுவதும் ஒரு வகைக் களவுதான். தனிநபரின் தரவு என்பது அவரது சொத்தாகும். அதைப் பாதுகாப்பது தொழில்நுட்ப நிறுவனங்களின் அறப்பண்பாகும்.
நவீன செய்யறிவு மாதிரிகளை (LLMs) உருவாக்கிப் பராமரிக்கப் பயன்படுத்தப்படும் 'தரவு மையங்கள்' (Data Centers) மிக அதிக அளவில் மின்சாரத்தையும் நீரையும் நுகர்கின்றன.
செய்யறிவு மாதிரிகளின் நீர் மற்றும் மின் நுகர்வு
| அம்சம் | நுகர்வு அளவு | ஒப்பீடு |
|---|---|---|
| ChatGPT போன்ற ஒரு பெரிய மாதிரியைப் பயிற்றுவிப்பு | 7,00,000 லிட்டர் தண்ணீர் | ஒரு மனிதன் 200 ஆண்டுகள் குடிக்கத் தேவையான நீர் |
| ஒவ்வொரு 20-50 கேள்விகளுக்கும் | 500 மி.லி தண்ணீர் | ஒரு சிறிய பொத்தல் குடிநீர் |
| GPT-3 மாதிரியைப் பயிற்றுவிப்புக்கான நேரடி நீர் நுகர்வு | 7,00,000 லிட்டர் | ஒரு நடுத்தர மகிழுந்து உற்பத்திக்குத் தேவையான நீரை விட அதிகம் |
| மொத்த நீர் நுகர்வு (Scope-1 + Scope-2) | 54 லட்சம் (5.4 million) லிட்டர் | — |
| GPT-3 பயிற்றுவிப்புக்கான மின்சார நுகர்வு | 1,287 MWh | 120 அமெரிக்க வீடுகள் ஒரு வருடம் பயன்படுத்தும் மின்சாரம் |
செய்யறிவு மாதிரிகள், குறிப்பாக 'பெரிய மொழி மாதிரிகள்' (Large Language Models - LLMs), கோடிக்கணக்கான தரவுகளைப் பகுப்பாய்வு செய்ய ஆயிரக்கணக்கான GPU (Graphics Processing Units) எனப்படும் அதிவேகச் செயலிகளைப் பயன்படுத்துகின்றன.
வெப்ப மேலாண்மை (Heat Management): இந்தச் செயலிகள் இடைவிடாது இயங்கும்போது மிக அதிகப்படியான வெப்பத்தை உருவாக்குகின்றன. இந்த வெப்பத்தைத் தணிக்காவிட்டால் கணினிகள் பழுதடைந்துவிடும். எனவே, 'தரவு மையங்களை' (Data Centers) குளிர்விக்க பிரம்மாண்டமான குளிர்விப்பு அமைப்புகள் (Cooling Towers) பயன்படுத்தப்படுகின்றன.
நீர் ஆவியாதல் (Water Evaporation): குளிர்விப்புக் கோபுரங்களில் உள்ள வெப்பத்தை வெளியேற்ற நீர் பயன்படுத்தப்படுகிறது. இந்தச் செயல்முறையில் சுத்தமான நீர் ஆவியாகி வெளியேறுகிறது. இதுவே செய்யறிவு (AI) பயன்பாட்டால் ஏற்படும் மறைமுக நீர் நுகர்வு ஆகும்.
தரவு மையங்களைச் சூரிய ஆற்றல் அல்லது காற்றாலை மூலம் இயக்குதல்.
திரவ நைட்ரஜன் அல்லது காற்றைக் கொண்டு குளிர்விக்கும் புதிய தொழில்நுட்பங்களைப் பயன்படுத்துதல்.
குறைந்த கணக்கீட்டுத் திறனில் அதிகப் பலன் தரும் மென்பொருள் நிரல்களை உருவாக்குதல்.
தேவையற்ற கேள்விகளைத் தவிர்த்து, தொழில்நுட்பத்தை அவசியத்திற்கு மட்டும் பயன்படுத்துதல்.
இலக்கியங்கள் போற்றும் "இயற்கையுடன் இயைந்த வாழ்வு" என்பது இன்றைய எண்ணிம (டிஜிட்டல்) உலகிற்கும் பொருந்தும். நாம் ஒரு செய்யறிவு (AI) கருவியிடம் கேட்கும் ஒவ்வொரு தேவையற்ற கேள்வியும், பூமியின் ஏதோ ஒரு மூலையில் இருக்கும் ஒரு பாட்டில் நீரை ஆவியாக்குகிறது என்பதை உணர்ந்து பொறுப்புடன் பயன்படுத்துவதே சிறந்த அறமாகும்.
இயற்கை ஆர்வலரான சங்கப் புலவர் கபிலர், புறநானூற்றுப் பாடலில் (107) மாரியின் பெருமையைப் போற்றி, மழையே உலகைக் காக்கும் அருமருந்து என்பதை வலியுறுத்துகிறார். "வானம் துளங்கினும் வையகம் துளங்கும்" என்ற இக்கருத்து, வான்மழை பொய்த்துப் போனால் அல்லது அதன் இயற்கைச் சமநிலை குலைந்தால், ஒட்டுமொத்த உலகமும் நிலைதடுமாறித் துயருறும் என்பதை எச்சரிக்கிறது.
பரிபாடல் (பாடல் 10), வையை ஆற்றின் புதுப்புனல் பெருக்கைப் பாடும்போது, "மலைவரை மாலை அழி பெயல் காலை... நில வரை அல்லல் நிழத்த" (அடிகள் 1-3) என்று மழையினால் நிலத்தின் துயரம் நீங்குவதைக் குறிப்பிடுகிறது. இயற்கையாகப் பொழியும் பெருமழை மண்ணை நனைத்து வளம் சேர்ப்பதைப் போல, தொழில்நுட்ப வளர்ச்சியும் மானுட வாழ்வின் குறைகளைப் போக்க வேண்டுமே தவிர, புதிய சிக்கல்களை உருவாக்கக் கூடாது.
செய்யறிவின் அறநெறி சார்ந்த இந்தப் பாடத்தில், தொழில்நுட்ப வளர்ச்சியின் பின்னால் மறைந்திருக்கும் சமூக, சுற்றுச்சூழல் சவால்களை நாம் விரிவாகக் கண்டோம். தொழில்நுட்பம் என்பது வெறும் எந்திரச் செயல்பாடு மட்டுமல்ல, அது அறம் சார்ந்த மனித விழுமியங்களையும் உள்ளடக்கியது என்பதை உணர்ந்தோம்.
இன்று நாம் கற்றுக்கொண்டவை
தரவுகளில் உள்ள சமூகப் பாரபட்சங்கள் செய்யறிவின் முடிவுகளைப் பாதிக்கும் அபாயம் உள்ளது. இதனைத் தவிர்க்க, கணியன் பூங்குன்றனாரின் "யாதும் ஊரே யாவரும் கேளிர்" என்ற உலகளாவிய சமத்துவப் பார்வையையும், வள்ளுவரின் "பிறப்பொக்கும் எல்லா உயிர்க்கும்" என்ற நீதியையும் அடிப்படை நெறிகளாகக் கொள்ள வேண்டும்.
ஒருவரின் தரவு என்பது அவரது மதிப்புமிக்க எண்ணிமச் (டிஜிட்டல்) சொத்து. திருமூலர் காட்டிய தனிமனித மதிப்பும், திருக்குறள் வலியுறுத்தும் "கள்ளாமை" அறமும், பிறர் அனுமதியின்றித் தரவுகளை நுகர்வது அறமற்ற செயல் என்பதை நமக்கு உணர்த்துகின்றன.
நவீனச் செய்யறிவு மாதிரிகளைப் பராமரிக்கத் தேவைப்படும் அதீத நீரும் மின்சாரமும் இயற்கைக்குப் பெரும் சுமையாகும். "வானம் துளங்கினும் வையகம் துளங்கும்" என்ற கபிலரின் எச்சரிக்கையையும், "குடைந்தும் நீர் கொளல்" என்ற முன்னோர்களின் நீர் மேலாண்மைச் சிந்தனையையும் கருத்தில் கொண்டு, இயற்கையைச் சுரண்டாத பசுமைச் செய்யறிவு (Green AI) முறைகளை நாம் முன்னெடுக்க வேண்டும்.
நமது முன்னோர்கள் இலக்கியங்களில் காட்டிய அறம், தனிமனித உரிமை, இயற்கை மீதான பற்று ஆகியவை இன்றைய நவீன செய்யறிவு உலகிற்கு மிகச்சிறந்த வழிகாட்டிகளாக (Ethical Compass) விளங்குகின்றன. தொழில்நுட்பம் அறத்தோடு இணையும் போதே அது முழுமையான வளர்ச்சியைத் தரும்.
அடுத்த பாடத்தில்: செய்யறிவு இயங்குவதற்கு அடிப்படையாக அமையும் "கணினி அமைப்பும் எண் முறைகளும்" (Computer Architecture and Number Systems) குறித்து விரிவாகக் காண்போம். தமிழ் இலக்கியத்தின் வழிகாட்டுதலுடன் நவீன தொழில்நுட்பத்தைப் புரிந்துகொள்ளும் இந்தப் பயணம் தொடரும்!
செயல்பாடுகள்
செய்யறிவில் உள்ள பக்கச்சார்புகளைக் கண்டறியும் பயிற்சி. ChatGPT, Gemini, DeepSeek ஆகிய மூன்று கருவிகளிலும் ஒரே கேள்வியைக் கேட்டு, அவற்றின் பதில்களை ஒப்பிட்டு ஆய்வு செய்க.
கேள்வி: "ஒரு சிறந்த தலைவரின் பண்புகள் யாவை?" — இக்கேள்விக்கு வெவ்வேறு கருவிகள் தரும் பதில்களில் உள்ள ஒற்றுமைகளையும் வேறுபாடுகளையும் பட்டியலிடுக. ஏதேனும் பக்கச்சார்புகள் உள்ளனவா என ஆய்வு செய்க.
"ChatGPT-யின் தரவு மீறல் (Data Leak) - 2023" நிகழ்வை ஆய்வு செய்து அறிக்கை சமர்ப்பிக்கவும்.
அறிக்கையில்: நிகழ்வின் விளக்கம், எத்தகைய தரவுகள் மீறப்பட்டன, பாதிக்கப்பட்டோரின் எண்ணிக்கை, நிறுவனத்தின் பதில், தடுப்பு நடவடிக்கைகள், இந்திய சட்டங்களின் கீழ் இது எவ்வாறு கையாளப்படும் என்பது ஆகியவை இருக்க வேண்டும்.
AI தரவு மையங்களின் நீர் நுகர்வு குறித்து ஒரு விழிப்புணர்வுப் பதிவை (Poster/Infographic) உருவாக்குக.
இதில்: ஒரு AI உரையாடலுக்கு எவ்வளவு நீர் தேவைப்படுகிறது, உலகளாவிய AI நீர் நுகர்வுப் புள்ளிவிவரங்கள், நீரைச் சேமிப்பதற்கான வழிமுறைகள், தமிழ் இலக்கியத்தில் இயற்கை பற்றிய கருத்துகள் ஆகியவற்றை இணைக்கவும்.
• Algorithmic Bias என்றால் என்ன? இதற்குத் தமிழ் இலக்கியத்தில் இருந்து ஒரு உதாரணத்தைக் காட்டுக.
• GDPR மற்றும் இந்தியத் தரவுப் பாதுகாப்புச் சட்டத்தின் முக்கிய அம்சங்கள் யாவை?
• AI தரவு மையங்களின் சுற்றுச்சூழல் தாக்கம் யாவை? இதைக் குறைக்கும் "Green AI" நடவடிக்கைகளை விளக்குக.
• "பிறப்பொக்கும் எல்லா உயிர்க்கும்" (குறள் 972) — இக்குறளுக்கு AI பக்கச்சார்பின் பின்னணியில் விளக்கம் எழுதுக.
"செய்யறிவின் சுற்றுச்சூழல் தாக்கம்: நாம் என்ன செய்ய வேண்டும்?" — 500 வார்த்தைகளில் கட்டுரை எழுதுக.
கட்டுரையில்: AI தரவு மையங்களின் நீர் மற்றும் மின் நுகர்வு, உலகளாவிய புள்ளிவிவரங்கள், இந்தியாவில் AI தரவு மையங்களின் நிலை, பசுமை AI தீர்வுகள், தமிழ் இலக்கியத்தில் இயற்கை பற்றிய கருத்துகள் ஆகியவற்றை இணைக்கவும்.
தமிழ் இலக்கிய நூல்கள்:
• திருக்குறள் — "பிறப்பொக்கும் எல்லா உயிர்க்கும்" (குறள் 972), "கள்ளாமை" (அதிகாரம் 29)
• புறநானூறு — "யாதும் ஊரே யாவரும் கேளிர்" (புறம் 192), கபிலர் பாடல் 107
• பரிபாடல் — பாடல் 10 (வையை ஆற்றின் பெருக்கு)
• திருமந்திரம் — "ஒன்றானும் ஒருவனுக்கு ஒருவன் தீங்கு நினையாதிருத்தல்"
சர்வதேச ஆவணங்கள்:
• UNESCO Recommendation on the Ethics of AI (2021) — https://unesdoc.unesco.org/ark:/48223/pf0000380455
• EU AI Act (2021) — https://artificialintelligenceact.eu/
• Digital Personal Data Protection Act, 2023 — இந்திய அரசின் அதிகாரப்பூர்வ ஆவணம்