திங்கள், 16 டிசம்பர், 2024

தொல்காப்பியம் - நூன்மரபு (பைத்தான்வழி உரை 1) Python via Tholkaapiyam Nuunmarapu

தொல்காப்பியத்தைப் பைத்தான் தொழில்நுட்பத்தோடு கற்றுக்கொள்ள விரும்புவர்களுக்கு இந்தப் பாடம் ஒரு புதிய அனுபவத்தைத் தரக் காத்திருக்கின்றது. அப்படி என்ன அனுபவம் எனும் எண்ணம் உருவாகின்றதா? அது தொழில்நுட்ப முறையிலான விளக்கமாகும். அது என்ன தொழில்நுட்ப விளக்கம் என்ற வினா எழுகின்றதா? அது மனித மொழியைப் போன்று கணினி மொழியாகிய பைத்தான் அடிப்படையிலான விளக்கமாகும். இப்படி விளக்குவதனால் என்ன நடக்கும். தொல்காப்பிய விதிகளை மையமிட்ட தொழில்நுட்பம் உருவாகும். தட்டச்சுப் பிழைகளைச் சரிசெய்யும் நுட்பம் இன்னும் பொலிவுறும். இக்கால மாணவர்கள் மொழியைப் பிழையுடன் எழுதி வருவது பெரும் மன வருத்தைத் தருகின்றது. அதுவும் குறிப்பாகக் கல்லூரி மாணவர்களுக்கு உயிர், மெய், குறில், நெடில் எழுத்துக்களைக்கூட அவர்கள் கற்காமல் உயர்கல்வி வரை வந்திருக்கின்றனர். இதுபோன்ற நிலைகளை ஓரளவிற்கு எதிர்காலத்தில் குறைத்திட இதுபோன்ற கற்றலும் தேவைப்படும். தொழில்நுட்ப மேம்பாட்டில் விளையாட்டுக் குறுஞ்செயலிகள் உருவாக்கவும் இந்தக் கற்றல் மிக முக்கியமானதே. ஆகையால் இந்தக் கட்டுரை அதனை முக்கிய நோக்கமாகக் கொண்டு அமைகின்றது. அதுமட்டுமின்றித் தொல்காப்பிய இலக்கணம் கணினி மொழிக்கு ஏற்ப எழுதப்பெற்றிருக்கும் சிறப்பையும் இக்கட்டடுரை வலியுறுத்துகின்றது.

தொல்காப்பியம் - அறிமுகம்

தொல்காப்பியம் பொது ஊழி ஆண்டிற்கு முன்பு 14இல் எழுதப்பெற்றதாக க.நெடுஞ்செழியன் [1] கூறியுள்ளார். இதனை எழுதியவர் தொல்காப்பியர். இவர் தொல்காப்பியத்தை மூன்று அதிகாரங்களாகக் கட்டமைத்துள்ளார். பேரா. க. பாலசுப்பிரமணியன் தொல்காப்பியம் [2] [5] எனும் இலக்கண நூல் முழுமையும் ஒருவரால்தான் எழுதப்பெற்றது என்றும், அதுவும் தமிழ்மொழியின் கட்டமைப்பைக் கூறும் இலக்கண நூல் என்றும் கூறியுள்ளமை கூர்ந்து நோக்கத்தக்கது. ஆகையால் தொல்காப்பிய இலக்கணத்தின் மூன்று அதிகாரங்களையும் கணினி மொழி அடிப்படையிலான விளக்கம் அளிக்கப்பெறும்பொழுது அதன் சிறப்பு மட்டுமின்றித் தமிழ்மொழிக்கான தொழில்நுட்பக் கருவிகள் அதிகம் உருவாகவும் வழிவகுக்கும் என்பதைத் தொடர்ந்து சில [3] [4] ஆய்வுகளில் வலியுறுத்தி வரப்பெறுகின்றமையும் இங்குக் கூறுதல் தகும். பேரா.ந.தெய்வசுந்தரம், கணினி மொழியியல் அடிப்படையில் தொல்காப்பியத்தின் சிறப்பை இன்னும் தெளிவுப்படுத்தியுள்ளார் [6]

தொல்காப்பிய அதிகாரங்கள்

தொல்காப்பியம் மூன்று அதிகாரங்களால் ஆனது. அவை,

  1. எழுத்ததிகாரம்

  2. சொல்லதிகாரம்

  3. பொருளதிகாரம்

என்பனவாகும். இவற்றுள், எழுத்ததிகாரம்,

  1.  நூன்மரபு

  2. மொழிமரபு

  3. பிறப்பியல்

  4. புணரியல்

  5. தொகைமரபு

  6. உருபியல்

  7. உயிர் மயங்கியல்

  8. புள்ளி மயங்கியல்

  9. குற்றியலுகரப் புணரியல்

ஆகிய ஒன்பது இயல்களால் கட்டமைக்கப் பெற்றுள்ளது. அவற்றுள், நூன்மரபு எழுத்ததிகாரத்தின் முதல் இயலாக அமைந்துள்ளது. இந்த இயல் தமிழ் மொழியமைப்பைப் பேசும் தொடக்கப்புள்ளியாகும். ஒரு குழந்தைக்கு மொழியைக் கற்பிக்க எடுக்கும் முதல் அளவுகோல் எழுத்தறிமுகமாக இருக்குமல்லவா? அதுபோல் தொல்காப்பியர் நூன்மரபு எனும் இயலை அமைத்துள்ளார். இங்குப் புலியூர்க் கேசிகனின் உரை அமைப்பில் உள்ளமை போன்று,

  1. எழுத்தின் வகை

  2. மாத்திரை

  3. எண்

  4. வடிவம்

  5. மெய்ம்மயக்கம்

  6. பிற மரபுகள்

ஆகிய ஆறு பகுதிகளாகப் பிரித்து விளக்கமாக அறிவோம். 

திறமூலத் தமிழ் நூலகம் நிறுவல்

தொல்காப்பிய நூன்மரபுப் பகுதிகளை இன்னும் பைத்தான் கணினி அடிப்படையில் எழுதவும் புரிந்துகொள்ளவும் திறமூலத் தமிழ் நூலகத்தை நிறுவும் செயல்பாட்டை முதலில் அறிவோம். அப்பொழுதுதான் பைத்தான் மொழியில் எழுதி, பிரிக்க, வேறு செயல்பாட்டைச் செய்துபார்க்க முடியும். ஆகவே முதலில் அது பற்றிப் பார்ப்போம்.

!pip install Open-Tamil

ஐயா, இது என்ன? இதனைக் கொஞ்சம் விளக்குங்கள்.

!pip install Open-Tamil [8] என்ற குறியீடு, பைத்தான் மொழியில் தமிழ் எழுத்துக்களைப் பயன்படுத்துவதற்குத் தேவையான நூலகத்தை உங்கள் கணினியில் நிறுவுகிறது. இந்த நூலகம், தமிழ் எழுத்துக்களை உருவாக்க, படிக்க, எழுத, செயலாக்கத் தேவையான அனைத்து வகையான செயல்பாடுகளையும் வழங்குகிறது.

இந்தக் குறியீட்டைப் பயன்படுத்தி, உங்கள் கணினியில் Open-Tamil என்ற நூலகத்தை நிறுவலாம். பின்னர், இந்த நூலகத்தைப் பயன்படுத்தி, பைத்தான் மொழியில் தமிழ் எழுத்துக்களைக் கொண்ட குறியீட்டை எழுதலாம்.

இந்தக் குறியீட்டை உங்கள் கணினியில் நிறுவ, பின்வரும் வழிமுறைகளைப் பின்பற்றவும்:

  1. உங்கள் கணினியில் ஒரு கட்டளைப் பதிவு நிரலாக்கியைத் திறக்கவும்.

  2. !pip install Open-Tamil என்ற குறியீட்டை உள்ளிடவும்.

  3. Enter விசை அழுத்தவும்.

இந்தக் குறியீட்டை நிறுவிய பின்னர், உங்கள் கணினியில் Open-Tamil என்ற நூலகம் நிறுவப்பட்டிருக்க வேண்டும்.

படம் - 1, பைத்தான் - !pip install Open-Tamil

சரி ஐயா, நிறுவி விட்டேன்.

# -*- coding: utf-8 -*-

ஐயா, இது எதற்கு? 

# -- coding: utf-8 -- என்ற குறியீடு, பைத்தான் மொழியில் பயன்படுத்தப்படும் ஒரு குறியீட்டுத் தொகுப்பு ஆகும். இது, பைத்தான் மொழியில் பயன்படுத்தப்படும் அனைத்து எழுத்துக்களும், தமிழ் எழுத்துக்களுடன் இணைந்து பயன்படுத்தப்படலாம் என்பதை அறிவிக்கிறது. இது, பைத்தான் மொழியின் வார்த்தைகளையும் கட்டளைகளையும் சரியாகப் புரிந்து கொள்ளப்பட்டுச் செயல்படுத்தப்படுவதற்கு உதவுகிறது.

import tamil

ஐயா, இது என்ன?

import tamil என்ற குறியீடு, பைத்தான் மொழியில் தமிழ் எழுத்துக்களைப் பயன்படுத்துவதற்குத் தேவையான நூலகத்தை இறக்குமதி செய்கிறது. இந்த நூலகம், தமிழ் எழுத்துக்களை உருவாக்க, படிக்க, எழுத, செயலாக்கத் தேவையான அனைத்து வகையான செயல்பாடுகளையும் வழங்குகிறது.

தொல்காப்பிய ஆசானுக்கு வணக்கம் - முதல் நிரல் எழுதுதல்

மேற்கூறிய அந்தக் குறியீட்டைப் பயன்படுத்தி, பைத்தான் மொழியில் தமிழ் எழுத்துக்களைக் கொண்ட குறியீட்டை எழுதலாம். சான்றாக, பின்வரும் குறியீட்டைப் பயன்படுத்தி, "தொல்காப்பிய ஆசானுக்கு வணக்கம்" என்ற தமிழ்ச் சொல் தொடரை எழுதலாம்:

import tamil

print("தொல்காப்பிய ஆசானுக்கு வணக்கம்")

ஐயா, பைத்தான் மொழியின் அடிப்படைகளை நீங்கள் முந்தைய வகுப்பில் கூறியமையால் எளிமையாக விங்கிக்கொள்ள முடிந்தது. மேலும், நூன்மரபு முதல் விதியைப் பைத்தான் அடிப்படையில் கூறுங்கள். இன்னும் ஆர்வமாக உள்ளது.

ஆம். அன்பரே! கற்கும் ஆர்வத்தை நாம் ஏற்படுத்திக் கொண்டால் அனைத்தும் எளிது! இல்லை என்றால் கல்வி பாகற்காயாய்க் கசக்கும். சரி… சரி… இன்னொன்றையும் நீங்கள் அறியவேண்டும். செய்யறிவு (AI) பற்றித் தெரியுமா?

கேள்விப்பட்டுள்ளோம் ஐயா. செயற்கை நுண்ணறிவு என்றும், ஏ.ஐ. (AI) என்றும் கூறுவார்களே அதுதானே.

ஆம். அதில் கூகுள் பார்டு (BardAI) எனும் செய்யறிவு நுட்பம் சொன்ன விளக்கம்தான் நீங்கள் பைத்தான் மொழியின் ஒவ்வொரு வரியையும் புரிந்துகொண்டீர்கள். இனி, வரக்கூடிய விளக்கமும் அது இணையத் தரவுகளை அடிப்படையாகக் கொண்டு, விளக்குவதையும் அறியுங்கள். அப்பொழுதுதான் இன்னும் பைத்தானின் நுட்பத்தை எளிதில் விளங்கிக் கொள்ளமுடியும்.

தொல்காப்பியம்_எழுத்ததிகாரம்_இயல்கள் - இரண்டாம் பட்டியல் நிரல் எழுதுதல்

import tamil


தொல்காப்பியம்_எழுத்ததிகாரம்_இயல்கள் = ['நூன்மரபு', 'மொழிமரபு', 'பிறப்பியல்', 'புணரியல்', 'தொகைமரபு', 'உருபியல்', 'உயிர் மயங்கியல்', 'புள்ளி மயங்கியல்', 'குற்றியலுகரப் புணரியல்']

print(தொல்காப்பியம்_எழுத்ததிகாரம்_இயல்கள்)

இது ஒரு நிரல்தொகுப்பு. இந்த நிரலில் import tamil என்ற குறியீடு, தமிழ் மொழிக்குத் தேவையான அனைத்து வகையான செயல்பாடுகளையும் வழங்கும் tamil என்ற நூலகத்தை இறக்குமதி செய்கிறது. அதன்பின்பு உள்ள தொல்காப்பியம்_எழுத்ததிகாரம்_இயல்கள் என்ற குறியீடு, தொல்காப்பியத்தின் எழுத்ததிகாரத்தில் உள்ள ஒன்பது இயல்களைக் கொண்ட ஒரு பட்டியலை உருவாக்குகிறது. அதற்கடுத்து உள்ள, print(தொல்காப்பியம்_எழுத்ததிகாரம்_இயல்கள்) என்ற இந்தப் பைத்தான் நிரல், தொல்காப்பியம் எழுத்ததிகாரத்தில் உள்ள ஒன்பது இயல்களைக் கொண்ட ஒரு பட்டியலை விளைவாகத் தருகின்றது. இந்த நிரலை இயக்கும்போது, பின்வரும் முடிவு கிடைக்கும்:

['நூன்மரபு', 'மொழிமரபு', 'பிறப்பியல்', 'புணரியல்', 'தொகைமரபு', 'உருபியல்', 'உயிர் மயங்கியல்', 'புள்ளி மயங்கியல்', 'குற்றியலுகரப் புணரியல்']

இதுவரை எழுதிய பைத்தான் நிரல்களை கோலேப்பில் தந்து இயக்கிப் பார்க்கலாம். அது தரும் விளைவுப் படத்தினைப் பார்த்தால் இன்னும் தெளிவாகக் கற்றுக்கொள்ளலாம்.

படம் - 2, பைத்தான் நிரல் - கோலேப்

நூன்மரபு - மூன்றாம் பட்டியல் நிரல் எழுதுதல்

import tamil

நூன்மரபு = ['எழுத்துக்களின் வகை', 'மாத்திரை', 'எண்', 'வடிவு', 'மயக்கம்', 'பிற மரபுகள்']

print(நூன்மரபு)

இது ஒரு நிரல்தொகுப்பு. இந்த நிரலில் நூன்மரபு என்ற பட்டியல், நூன்மரபு இயலில் உள்ள ஆறு பிரிவுகளின் பெயர்களைக் கொண்டுள்ளது. அடுத்துள்ள, print(நூன்மரபு) என்ற குறியீடு, நூன்மரபு என்ற பட்டியலை விளைவாகத் தருகின்றது. இந்த நிரலை இயக்கும்போது, பின்வரும் முடிவு கிடைக்கும்:

['எழுத்துக்களின் வகை', 'மாத்திரை', 'எண்', 'வடிவு', 'மயக்கம்', 'பிற மரபுகள்']

  1. எழுத்தின் வகை - கருத்தியல் நிரலாக எழுதும் முயற்சி

எழுத்து எனப்படுப
அகரம் முதல்
னகர இறுவாய் முப்பஃது என்ப
சார்ந்து வரல் மரபின் மூன்று அலங்கடையே. ⁠1

வணக்கம் ஐயா, தொல்காப்பிய நூன்மரபைப் பைத்தான் மூலமாகக் கற்றுத் தருகின்றேன் எனக் கூறிவிட்டு, வழக்கமான உரையாசிரியர்களைப் போலவே, நூன்மரபு விதிகளைக் கூறுகின்றீர்களே. ஆம். அன்பரே! முதலில் தொல்காப்பிய நூற்பாவை நாம் தெரிந்துகொள்வோம். பின்பு அதனை எப்படிப் பைத்தான் மொழியில் எழுதுவது என அறிவோம். அப்பொழுதுதான் அதிலுள்ள தருக்கத்தை அறியமுடியும். 

ஐயா, தருக்கம் என்றால் என்ன?

அதுவா, வேறொன்றுமில்லை. தருக்கம் செய்கிறார்கள் எனக் கேள்விப் பட்டிருக்கின்றீர்களா?

ஆம். ஐயா. கேள்விகள் கேட்டால், அதற்குரிய விளக்கத்திற்குத் தேவையான சான்றுகளைக் காட்டிக் கூறுவார்களே? அதுதானே ஐயா.

ஆம். சரியாகப் புரிந்துகொண்டுள்ளீர்கள். சரி, இனி நாம் தொல்காப்பியர் எழுதிய எழுத்ததிகார நூன்மரபு முதல் விதிக்குப் போவோமா?

இந்த முதல் விதியில் தொல்காப்பியர் கூற வருவது என்ன? தமிழ் மொழியின் அமைப்பில் முதன்மையான எழுத்துக்கள் இரண்டு வகைப்பபடும் என்கிறார். அந்த எழுத்துக்கள் முதலெழுத்து, சார்பெழுத்து என்பன.

ஐயா, 

எழுத்து எனப்படுப
அகரம் முதல்
னகர இறுவாய் முப்பஃது என்ப

இது வரை உள்ள தகவல்களை முதல் எழுத்துக்குரியது என்றும்,
சார்ந்து வரல் மரபின் மூன்று அலங்கடையே.

இதுவரை சார்பெழுத்துக்குரியது என்றும் புரிந்துகொண்டுள்ளேன். சரிதானே ஐயா! ஆம் சரிதான் அன்பரே!

தொல்காப்பியர் முதல் எழுத்து என்று சொல்லக் கூடியவற்றை ‘அகரம் முதல் னகர இறுவாய்’ எனக் கூறுகின்றார். அதாவது உயிர், மெய் எழுத்துக்களைக் கூறுகின்றார். சரி, இப்பொழுது இதுவரை பைத்தானில் பட்டியல் உருவாக்கும் நுட்பத்தையும், விளைவாகக் காட்டவேண்டிய நுட்பத்தையும் அறிந்தாய் அல்லவா? இப்பொழுது பைத்தான் மொழியில் எழுதிக் காண்பியுங்கள் பார்ப்போம். 

எழுத்துக்களின்_வகை = ['முதலெழுத்து', 'சார்பெழுத்து']

print(எழுத்துக்களின்_வகை)

ஐயா, இது அந்த நூற்பாவில் உள்ள எழுத்துக்களின் வகைகளை விளைவாகக் காட்ட எழுதியுள்ளேன். நன்று. அடுத்து, முதலெழுத்துக்குரிய நிரல்.

முதலெழுத்து = ['உயிரெழுத்து', 'மெய்யெழுத்து']

print(முதலெழுத்து)

அருமை. சரி, இன்னொரு நுட்பத்தையும் உனக்குக் கற்றுத் தருகின்றேன். கூர்ந்து பார் அன்பரே!

உயிரெழுத்து = tamil.utf8.uyir_letters

print(உயிரெழுத்து)

#மெய்யெழுத்து = ['க்', 'ங்', 'ச்', 'ஞ்', 'ட்', 'ண்', 'த்', 'ந்', 'ப்', 'ம்', 'ய்', 'ர்', 'ல்', 'வ்', 'ழ்', 'ள்', 'ற்', 'ன்']

மெய்யெழுத்து = tamil.utf8.mei_letters

print(மெய்யெழுத்து)

இதுவும் ஒரு பைத்தான் நிரல். முன்பு பார்த்ததற்கும் இந்த நிரலிற்கும் என்ன வேறுபாடு அன்பரே! கண்டுபிடியுங்கள். ஐயா, இதில் மெய்யெழுத்து எனும் பட்டியலில்  tamil.utf8.uyir_letters எனும் மதிப்புத் தரப்பெற்றுள்ளது ஐயா. ஆம் சரியாகக் கண்டறிந்தீர்கள். பாராட்டு. சரி, அதற்குரிய விளைவு என்னவென்று பின்வரும் படத்தைப் பாருங்கள்.

படம் - 3, பைத்தான் நிரல் - கோலேப்

tamil.utf8.uyir_letters இந்த மதிப்பை Open-Tamil என்ற நூலகத்திலிருந்து வருவித்து உரிய விளைவைத் தருவதைப் பார்க்கலாம். இதுபோல் பின்வரும் நிரல்களின் விளைவுகளும் அவ்வாறே அமையும் என்பதை அறிந்திருப்பீர்கள் அல்லவா? சரி, அந்த நூற்பா தரும் பிற விளக்கங்களுக்கான நிரல்களையும் பின்வருமாறு எழுதி, இயக்கிப் பழகுங்குள். இதற்குரிய நிரல்தொகுப்பினைக் கித்துப்பில் [9] உள்ளது. வேண்டுமானால் அதனைப் பைத்தான் இயக்கிப் பார்க்கும் முனையத்தில் பயன்படுத்திக் கொள்ளலாம்.

உயிரெழுத்து_வகை = ['குறில்', 'நெடில்']

print(உயிரெழுத்து_வகை)

இது உயிரெழுத்து வகையைக் குறிக்கும் நிரல்.

உயிரெழுத்து_வகை_குறில் = tamil.utf8.kuril_letters

print(உயிரெழுத்து_வகை_குறில்)

இது உயிரெழுத்து வகையில் உள்ள குறில் எழுத்துக்களைக் குறிக்கும் நிரல்.

உயிரெழுத்து_வகை_நெடில் = tamil.utf8.nedil_letters

print(உயிரெழுத்து_வகை_நெடில்)

இது உயிரெழுத்து வகையில் உள்ள நெடில் எழுத்துக்களைக் குறிக்கும் நிரல்.

அவைதாம்,
குற்றியலிகரம் குற்றியலுகரம்
ஆய்தம் என்ற
முப்பாற்புள்ளியும் எழுத்து ஓரன்ன. ⁠ 2


இந்த நூற்பாவின் கருத்துக்களைப் பின்வருமாறு நிரல் எழுதி உருவாக்கி வைத்துக் கொள்வோமா?

சார்பெழுத்து = ['குற்றியலிகரம்', 'குற்றியலுகரம்', 'ஆய்தம்']

print(சார்பெழுத்து)

இது சார்பெழுத்து வகையைக் குறிக்கும் நிரல்.

உயிர்_மெய் = [

    'க', 'கா', 'கி', 'கீ', 'கு', 'கூ', 'கெ', 'கே', 'கை', 'கொ', 'கோ', 'கௌ',

    'ங', 'ஙா', 'ஙி', 'ஙீ', 'ஙு', 'ஙூ', 'ஙெ', 'ஙே', 'ஙை', 'ஙொ', 'ஙோ', 'ஙௌ',

    'ச', 'சா', 'சி', 'சீ', 'சு', 'சூ', 'செ', 'சே', 'சை', 'சொ', 'சோ', 'சௌ',

    'ஞ', 'ஞா', 'ஞி', 'ஞீ', 'ஞு', 'ஞூ', 'ஞெ', 'ஞே', 'ஞை', 'ஞொ', 'ஞோ', 'ஞௌ',

    'ட', 'டா', 'டி', 'டீ', 'டு', 'டூ', 'டெ', 'டே', 'டை', 'டொ', 'டோ', 'டௌ',

    'ண', 'ணா', 'ணி', 'ணீ', 'ணு', 'ணூ', 'ணெ', 'ணே', 'ணை', 'ணொ', 'ணோ', 'ணௌ',

    'த', 'தா', 'தி', 'தீ', 'து', 'தூ', 'தெ', 'தே', 'தை', 'தொ', 'தோ', 'தௌ',

    'ந', 'நா', 'நி', 'நீ', 'நு', 'நூ', 'நெ', 'நே', 'நை', 'நொ', 'நோ', 'நௌ',

    'ப', 'பா', 'பி', 'பீ', 'பு', 'பூ', 'பெ', 'பே', 'பை', 'பொ', 'போ', 'பௌ',

    'ம', 'மா', 'மி', 'மீ', 'மு', 'மூ', 'மெ', 'மே', 'மை', 'மொ', 'மோ', 'மௌ',

    'ய', 'யா', 'யி', 'யீ', 'யு', 'யூ', 'யெ', 'யே', 'யை', 'யொ', 'யோ', 'யௌ',

    'ர', 'ரா', 'ரி', 'ரீ', 'ரு', 'ரூ', 'ரெ', 'ரே', 'ரை', 'ரொ', 'ரோ', 'ரௌ',

    'ல', 'லா', 'லி', 'லீ', 'லு', 'லூ', 'லெ', 'லே', 'லை', 'லொ', 'லோ', 'லௌ',

    'வ', 'வா', 'வி', 'வீ', 'வு', 'வூ', 'வெ', 'வே', 'வை', 'வொ', 'வோ', 'வௌ',

    'ழ', 'ழா', 'ழி', 'ழீ', 'ழு', 'ழூ', 'ழெ', 'ழே', 'ழை', 'ழொ', 'ழோ', 'ழௌ',

    'ள', 'ளா', 'ளி', 'ளீ', 'ளு', 'ளூ', 'ளெ', 'ளே', 'ளை', 'ளொ', 'ளோ', 'ளௌ'

    'ற', 'றா', 'றி', 'றீ', 'று', 'றூ', 'றெ', 'றே', 'றை', 'றொ', 'றோ', 'றௌ',

    'ன', 'னா', 'னி', 'னீ', 'னு', 'னூ', 'னெ', 'னே', 'னை', 'னொ', 'னோ', 'னௌ'

]

print(உயிர்_மெய்)

இது சார்பெழுத்து வகையில் உள்ள உயிர்மெய் எழுத்துக்களைக் குறிக்கும் நிரல்.

ஐயா, ஓர் ஐயம். என்ன ஐயம்? ஏனென்னய்யா இப்படியே பைத்தான் நிரலாக எழுதிக்கொண்டே போகின்றோம். நல்ல ஐயம். என்எல்டிகே (NLTK), சுபேசி (spaCy), சென்சிம் (Gensim) இதுபோன்ற நூலகங்களைக் கேள்விப் பட்டதுண்டா? இல்லை ஐயா. இந்த நூலகங்களைப் பயன்படுத்தி இயற்கை மொழிசார்ந்த ஆய்வுகளை உலகம் முழுவதிலும் உள்ள ஆய்வாளர்கள் செய்து வருகின்றார்கள். அதுபோல் பிற்காலத்தில் தொல்காப்பியர் என்ற நூலகம் உருவாக்கி, தமிழ் மொழி ஆய்வுகள் செய்ய இந்த மாதிரி எழுது நிரல்கள்தான் உதவியாக இருக்கும். நூலகம் உருவாக்கும் வழிமுறைகளை இந்த இயலின் விளக்குகின்றேன். அதுவரை பல்வேறு நுட்பங்களைத் தெரிந்துகொண்டே வா அன்பரே! 

சரி ஐயா…

சரி இந்த வகுப்பை இத்துடன் முடித்துக் கொள்வோம். பிற குறிப்புகளை ஒவ்வொரு பாடவேளையிலும் அறிந்துகொள்வோமா?

முடிவுரை

இதுவரை விளக்கப்பெற்ற கருத்துக்களின் அடிப்படையில் தொல்காப்பியத்தின் ஒருங்குத் தன்மையையும், தொல்காப்பியர் எழுதிய நூற்பாச் செய்திகளை, பைத்தான் நிரலாக எழுதி இயக்கிப் பார்க்கமுடியும் என்ற நம்பிக்கையை அளித்திருக்கும் என நம்பலாம். இது ஒரு தொடக்கமே. இனிவரும் ஒவ்வொரு பகுதிகளிலும் இன்னும் கூடுதலாகச் சிலநுட்பங்களை எடுத்துரைக்க முனைவோம்.

துணைநின்றவை

  1. நெடுஞ்செழியன் க., தொல்காப்பியர் காலம், https://newindian.activeboard.com/t59991225/topic-59991225/, last accessed 2023/10//14

  2. பாலசுப்பிரமணியன் க., தொல்காப்பியத்தின் ஒருமையும் முழுமையும், உலகத் தமிழாராய்ச்சி நிறுவனம், சென்னை, (2015)

  3. முனைவர் அ.வினோத், கோ.பூவேந்திரன், முனைவர் சத்தியராஜ் தங்கச்சாமி (2023, அக்டோபர் 15, 16). தொல்காப்பியக் குறுஞ்செயலி உருவாக்கம், தொழில்நுட்ப மாநாடு, குமரகுரு தொழில்நுட்பக் கல்லூரி, கோயமுத்தூர்.

  4. Vinoth A, Sathiyaraj Thangasamy, R.Nithya, Poovandran G, Mounash V, Subalalitha C N, Ariharasuthan R, Parameshwar Arunachalam and Syed Jafer K Automatic identification of Meimayakkam in Tamil words using Rule based and Transfer learning approaches,  International Conference on Speech and Language Technologies for Low-resource Languages. SPELLL 2023

  5. பாலசுப்பிரமணியன் க., தொல்காப்பிய இலக்கண மரபு, அரிமா நோக்கு, சென்னை, (2017)

  6. தெய்வசுந்தரம் ந., மொழியியலும் கணினிமொழியியலும் (தொகுதி இரண்டு), அமுத நிலையம், சென்னை. (2021)

  7. Vinoth A., Sathiyaraj Thangasamy, John Paul Boopathi A., Poovandran G., App Development for Tholkaappiya Meymayakkam First rule problem solve, Kanithamizh conference 2024, TVA, Chennai. (Submitted)

  8. https://pypi.org/project/Open-Tamil/

  9. https://github.com/neyakkoot/Tholkaappiyar_Nuunmarapu 

சத்தியராஜ் தங்கச்சாமி

தமிழ் உதவிப்பேராசிரியர் & விக்கிமீடியர், 

ஸ்ரீ கிருஷ்ணா ஆதித்யா கலை மற்றும் அறிவியல் கல்லூரி, கோயம்புத்தூர் – 641042.

கருத்துகள் இல்லை:

கருத்துரையிடுக

உங்கள் கருத்துகள் வரவேற்கப்படுகின்றன