Tholkaapiyam லேபிளுடன் இடுகைகளைக் காண்பிக்கிறது. அனைத்து இடுகைகளையும் காண்பி
Tholkaapiyam லேபிளுடன் இடுகைகளைக் காண்பிக்கிறது. அனைத்து இடுகைகளையும் காண்பி

செவ்வாய், 17 மார்ச், 2026

வாரம் 1: தொல்காப்பியம் - நூன்மரபு அறிமுகமும் பைத்தானும்

📜 வாரம் 1: தொல்காப்பியம் - நூன்மரபு அறிமுகமும் பைத்தானும் | Python via Tholkaapiyam

வாரம் 1: தொல்காப்பியம் - நூன்மரபு

Python via Tholkaapiyam Nuunmarapu

முனைவர் சத்தியராஜ் தங்கச்சாமி

தமிழ் உதவிப்பேராசிரியர் & விக்கிமீடியர்,

ஸ்ரீ கிருஷ்ணா ஆதித்யா கலை மற்றும் அறிவியல் கல்லூரி, கோயம்புத்தூர் – 641042.

அறிமுகம்

தொல்காப்பியத்தைப் பைத்தான் தொழில்நுட்பத்தோடு கற்றுக்கொள்ள விரும்புவர்களுக்கு இந்தப் பாடம் ஒரு புதிய அனுபவத்தைத் தரக் காத்திருக்கின்றது. அப்படி என்ன அனுபவம் எனும் எண்ணம் உருவாகின்றதா? அது தொழில்நுட்ப முறையிலான விளக்கமாகும். அது என்ன தொழில்நுட்ப விளக்கம் என்ற வினா எழுகின்றதா? அது மனித மொழியைப் போன்று கணினி மொழியாகிய பைத்தான் அடிப்படையிலான விளக்கமாகும். இப்படி விளக்குவதனால் என்ன நடக்கும். தொல்காப்பிய விதிகளை மையமிட்ட தொழில்நுட்பம் உருவாகும். தட்டச்சுப் பிழைகளைச் சரிசெய்யும் நுட்பம் இன்னும் பொலிவுறும். இக்கால மாணவர்கள் மொழியைப் பிழையுடன் எழுதி வருவது பெரும் மன வருத்தைத் தருகின்றது. அதுவும் குறிப்பாகக் கல்லூரி மாணவர்களுக்கு உயிர், மெய், குறில், நெடில் எழுத்துக்களைக்கூட அவர்கள் கற்காமல் உயர்கல்வி வரை வந்திருக்கின்றனர். இதுபோன்ற நிலைகளை ஓரளவிற்கு எதிர்காலத்தில் குறைத்திட இதுபோன்ற கற்றலும் தேவைப்படும். தொழில்நுட்ப மேம்பாட்டில் விளையாட்டுக் குறுஞ்செயலிகள் உருவாக்கவும் இந்தக் கற்றல் மிக முக்கியமானதே. ஆகையால் இந்தக் கட்டுரை அதனை முக்கிய நோக்கமாகக் கொண்டு அமைகின்றது. அதுமட்டுமின்றித் தொல்காப்பிய இலக்கணம் கணினி மொழிக்கு ஏற்ப எழுதப்பெற்றிருக்கும் சிறப்பையும் இக்கட்டுரை வலியுறுத்துகின்றது.

1. தொல்காப்பியம் - அறிமுகம்

தொல்காப்பியம் பொது ஊழி ஆண்டிற்கு முன்பு 14இல் எழுதப்பெற்றதாக க.நெடுஞ்செழியன் [1] கூறியுள்ளார். இதனை எழுதியவர் தொல்காப்பியர். இவர் தொல்காப்பியத்தை மூன்று அதிகாரங்களாகக் கட்டமைத்துள்ளார். பேரா. க. பாலசுப்பிரமணியன் தொல்காப்பியம் [2] [5] எனும் இலக்கண நூல் முழுமையும் ஒருவரால்தான் எழுதப்பெற்றது என்றும், அதுவும் தமிழ்மொழியின் கட்டமைப்பைக் கூறும் இலக்கண நூல் என்றும் கூறியுள்ளமை கூர்ந்து நோக்கத்தக்கது. ஆகையால் தொல்காப்பிய இலக்கணத்தின் மூன்று அதிகாரங்களையும் கணினி மொழி அடிப்படையிலான விளக்கம் அளிக்கப்பெறும்பொழுது அதன் சிறப்பு மட்டுமின்றித் தமிழ்மொழிக்கான தொழில்நுட்பக் கருவிகள் அதிகம் உருவாகவும் வழிவகுக்கும் என்பதைத் தொடர்ந்து சில [3] [4] ஆய்வுகளில் வலியுறுத்தி வரப்பெறுகின்றமையும் இங்குக் கூறுதல் தகும். பேரா.ந.தெய்வசுந்தரம், கணினி மொழியியல் அடிப்படையில் தொல்காப்பியத்தின் சிறப்பை இன்னும் தெளிவுப்படுத்தியுள்ளார் [6].

2. தொல்காப்பிய அதிகாரங்கள்

தொல்காப்பியம் மூன்று அதிகாரங்களால் ஆனது. அவை,

  • எழுத்ததிகாரம்
  • சொல்லதிகாரம்
  • பொருளதிகாரம்

என்பனவாகும். இவற்றுள், எழுத்ததிகாரம்,

  • நூன்மரபு
  • மொழிமரபு
  • பிறப்பியல்
  • புணரியல்
  • தொகைமரபு
  • உருபியல்
  • உயிர் மயங்கியல்
  • புள்ளி மயங்கியல்
  • குற்றியலுகரப் புணரியல்

ஆகிய ஒன்பது இயல்களால் கட்டமைக்கப் பெற்றுள்ளது. அவற்றுள், நூன்மரபு எழுத்ததிகாரத்தின் முதல் இயலாக அமைந்துள்ளது. இந்த இயல் தமிழ் மொழியமைப்பைப் பேசும் தொடக்கப்புள்ளியாகும். ஒரு குழந்தைக்கு மொழியைக் கற்பிக்க எடுக்கும் முதல் அளவுகோல் எழுத்தறிமுகமாக இருக்குமல்லவா? அதுபோல் தொல்காப்பியர் நூன்மரபு எனும் இயலை அமைத்துள்ளார். இங்குப் புலியூர்க் கேசிகனின் உரை அமைப்பில் உள்ளமை போன்று,

  • எழுத்தின் வகை
  • மாத்திரை
  • எண்
  • வடிவம்
  • மெய்ம்மயக்கம்
  • பிற மரபுகள்

ஆகிய ஆறு பகுதிகளாகப் பிரித்து விளக்கமாக அறிவோம்.

3. திறமூலத் தமிழ் நூலகம் நிறுவல்

தொல்காப்பிய நூன்மரபுப் பகுதிகளை இன்னும் பைத்தான் கணினி அடிப்படையில் எழுதவும் புரிந்துகொள்ளவும் திறமூலத் தமிழ் நூலகத்தை நிறுவும் செயல்பாட்டை முதலில் அறிவோம். அப்பொழுதுதான் பைத்தான் மொழியில் எழுதி, பிரிக்க, வேறு செயல்பாட்டைச் செய்துபார்க்க முடியும். ஆகவே முதலில் அதுபற்றிப் பார்ப்போம்.

!pip install Open-Tamil
ஐயா, இது என்ன? இதனைக் கொஞ்சம் விளக்குங்கள்.

!pip install Open-Tamil [8] என்ற குறியீடு, பைத்தான் மொழியில் தமிழ் எழுத்துக்களைப் பயன்படுத்துவதற்குத் தேவையான நூலகத்தை உங்கள் கணினியில் நிறுவுகிறது. இந்த நூலகம், தமிழ் எழுத்துக்களை உருவாக்க, படிக்க, எழுத, செயலாக்கத் தேவையான அனைத்து வகையான செயல்பாடுகளையும் வழங்குகிறது.

இந்தக் குறியீட்டைப் பயன்படுத்தி, உங்கள் கணினியில் Open-Tamil என்ற நூலகத்தை நிறுவலாம். பின்னர், இந்த நூலகத்தைப் பயன்படுத்தி, பைத்தான் மொழியில் தமிழ் எழுத்துக்களைக் கொண்ட குறியீட்டை எழுதலாம்.

இந்தக் குறியீட்டை உங்கள் கணினியில் நிறுவ, பின்வரும் வழிமுறைகளைப் பின்பற்றவும்:

  • உங்கள் கணினியில் ஒரு கட்டளைப் பதிவு நிரலாக்கியைத் திறக்கவும்.
  • !pip install Open-Tamil என்ற குறியீட்டை உள்ளிடவும்.
  • Enter விசை அழுத்தவும்.

இந்தக் குறியீட்டை நிறுவியபின்னர், உங்கள் கணினியில் Open-Tamil என்ற நூலகம் நிறுவப்பட்டிருக்க வேண்டும்.

சரி ஐயா, நிறுவி விட்டேன்.
# -*- coding: utf-8 -*-
ஐயா, இது எதற்கு?

# -- coding: utf-8 -- என்ற குறியீடு, பைத்தான் மொழியில் பயன்படுத்தப்படும் ஒரு குறியீட்டுத் தொகுப்பு ஆகும். இது, பைத்தான் மொழியில் பயன்படுத்தப்படும் அனைத்து எழுத்துக்களும், தமிழ் எழுத்துக்களுடன் இணைந்து பயன்படுத்தப்படலாம் என்பதை அறிவிக்கிறது. இது, பைத்தான் மொழியின் வார்த்தைகளையும் கட்டளைகளையும் சரியாகப் புரிந்து கொள்ளப்பட்டுச் செயல்படுத்தப்படுவதற்கு உதவுகிறது.

import tamil
ஐயா, இது என்ன?

import tamil என்ற குறியீடு, பைத்தான் மொழியில் தமிழ் எழுத்துக்களைப் பயன்படுத்துவதற்குத் தேவையான நூலகத்தை இறக்குமதி செய்கிறது. இந்த நூலகம், தமிழ் எழுத்துக்களை உருவாக்க, படிக்க, எழுத, செயலாக்கத் தேவையான அனைத்து வகையான செயல்பாடுகளையும் வழங்குகிறது.

4. தொல்காப்பிய ஆசானுக்கு வணக்கம் - முதல் நிரல் எழுதுதல்

மேற்கூறிய அந்தக் குறியீட்டைப் பயன்படுத்தி, பைத்தான் மொழியில் தமிழ் எழுத்துக்களைக் கொண்ட குறியீட்டை எழுதலாம். சான்றாக, பின்வரும் குறியீட்டைப் பயன்படுத்தி, "தொல்காப்பிய ஆசானுக்கு வணக்கம்" என்ற தமிழ்ச் சொல் தொடரை எழுதலாம்:

import tamil
print("தொல்காப்பிய ஆசானுக்கு வணக்கம்")
விளைவு:
தொல்காப்பிய ஆசானுக்கு வணக்கம்
5. பைத்தான் - ஓர் அறிமுகம்
ஐயா, பைத்தான் என்றால் என்ன? அந்த மொழியின் அடிப்படைகளைக் கொஞ்சம் விளக்கமுடியுமா?

பைத்தான் என்பது ஒரு கணினி மொழியாகும். இந்த மொழியைக் கூகுள், யூடியூப், முகநூல், பிட்லி, யாகூ நிலப்படம், யாகூ குழுமம், சோப், அல்ட்ரா சீக், லினக்சு வாரச் செய்தி, ரெட்ஹேட், டிக்க, இவன்ட்பிரைட், லேன்யார்ட், மிக்ஸ் பேனல், கோரா, பின்டிரசட், ரேட்டிட், பாத், இன்சடாகிராம், மொசில்லா நிறுவனம், சர்வே மங்கி, எல்பு, அசனா, சேக்கேன்டு, லைப்பு, வால்ட், டிச்சினி, கூகிள் அப் இஞ்ன், இவ் அன்லைன், கேம்ங் கனோனிக்கல் நிறுவனம், Rackspace, சிஸ்கோ சிஸ்டம்ஸ், ஐபிஎம், இன்டச்சிட்ரியல் லைட் மேசிக் பிக்சர், தேசிய வானூர்தியியல் விண்வெளி நிர்வாகம், ஹனிவெல் ஐரேபட், One Laptop Per Child (OLPC), டிச்கச்(disqus) ஆகிய நிறுவனங்கள் பயன்படுத்தி வருகின்றமை குறிப்பிடத்தக்கது [10]. இதன்மூலம் இந்தப் பைத்தான் மொழியின் முக்கியத்துவத்தை உணரலாம். இந்த மொழியைக் கற்றுக்கொள்வது எளிதான ஒன்றேயாகும்.

இந்த மொழி இணைய மென்பொருள் (Web Application), மின்னஞ்சல் அலகிடல் (Email Parsing), வலையமைப்பு நிரலான் (Network Program), மேசைத்தளம் மென்பொருள் (Desktop Application), இணைய நெறிமுறை (Internet Protocol), கணினி நிருவாகம் (System administration), விளையாட்டுகள் (sports) ஆகிய பயன்பாட்டுத் துறைகளை உள்ளடக்கியுள்ளது [10].

இந்த மொழியினை எளிமையாகக் கையாளலாம். ஒரு நிரல் மொழி (அதாங்க புரோகிராமிங் லாங்குவேஜ்) படிக்க வேண்டும் என்றால்,

  • தரவு வகை (Datatype) தெரிந்திருக்க வேண்டும்.
  • இலக்கணம் (syntax) தெரிந்திருக்க வேண்டும்.
  • {, [, ; என்று பல உருவங்கள் கண் முன்னேயும் கனவிலும் வந்து போக வேண்டும் [11]

எனப் பலரது கருத்து. ஆனால், தமிழைப் போல, ஆங்கிலத்தைப் போல – இயல்பாக அமைந்திருப்பதுதான் பைத்தானின் மிகப்பெரிய சிறப்பு. எடுத்துக்காட்டாக இரண்டு எண்களைக் கூட்ட வேண்டும் என்று வைத்துக்கொள்வோம். இதுதான் நம்முடைய முதல் வேலை என்று வைத்துக் கொள்ளுங்கள். எப்படிச் செய்வது? முதலில் இரண்டு எண்களின் மதிப்பைச் சொல்லி விடுங்கள்.

எண்1, எண்2 = 100, 90
# அல்லது
எண்1 = 100
எண்2 = 90

புதியவர்கள் மிக எளிதாக நிரலைப் புரிந்து கொள்வார்கள். இப்போது வரும் விடையை அச்சிட்டுப் பார்க்க,

print(எண்1 + எண்2)
விளைவு:
190

என்று கொடுத்தால் போதுமானது [11]. இப்பொழுது எளிமையாக விங்கிக்கொள்ள முடிந்தது அல்லவா.

சரி ஐயா, மேலும், நூன்மரபு முதல் விதியைப் பைத்தான் அடிப்படையில் கூறுங்கள். இன்னும் ஆர்வமாக உள்ளது.

ஆம். அன்பரே! கற்கும் ஆர்வத்தை நாம் ஏற்படுத்திக் கொண்டால் அனைத்தும் எளிது! இல்லை என்றால் கல்வி பாகற்காயாய்க் கசக்கும். சரி… சரி… இன்னொன்றையும் நீங்கள் அறிய வேண்டும். செய்யறிவு (AI) பற்றித் தெரியுமா?

கேள்விப்பட்டுள்ளோம் ஐயா. செயற்கை நுண்ணறிவு என்றும், ஏ.ஐ. (AI) என்றும் கூறுவார்களே அதுதானே.

ஆம். அதில் கூகுள் பார்டு (BardAI) எனும் செய்யறிவு நுட்பம் சொன்ன விளக்கம்தான் நீங்கள் பைத்தான் மொழியின் ஒவ்வொரு வரியையும் புரிந்துகொண்டீர்கள். இனி, வரக்கூடிய விளக்கமும் அது இணையத் தரவுகளை அடிப்படையாகக் கொண்டு, விளக்குவதையும் அறியுங்கள். அப்பொழுதுதான் இன்னும் பைத்தானின் நுட்பத்தை எளிதில் விளங்கிக் கொள்ள முடியும்.

6. தொல்காப்பியம்_எழுத்ததிகாரம்_இயல்கள் - இரண்டாம் பட்டியல் நிரல் எழுதுதல்
import tamil

தொல்காப்பியம்_எழுத்ததிகாரம்_இயல்கள் = ['நூன்மரபு', 'மொழிமரபு', 'பிறப்பியல்', 'புணரியல்', 'தொகைமரபு', 'உருபியல்', 'உயிர் மயங்கியல்', 'புள்ளி மயங்கியல்', 'குற்றியலுகரப் புணரியல்']
print(தொல்காப்பியம்_எழுத்ததிகாரம்_இயல்கள்)

இது ஒரு நிரல்தொகுப்பு. இந்த நிரலில் import tamil என்ற குறியீடு, தமிழ் மொழிக்குத் தேவையான அனைத்து வகையான செயல்பாடுகளையும் வழங்கும் tamil என்ற நூலகத்தை இறக்குமதி செய்கிறது. அதன்பின்பு உள்ள தொல்காப்பியம்_எழுத்ததிகாரம்_இயல்கள் என்ற குறியீடு, தொல்காப்பியத்தின் எழுத்ததிகாரத்தில் உள்ள ஒன்பது இயல்களைக் கொண்ட ஒரு பட்டியலை உருவாக்குகிறது. அதற்கடுத்து உள்ள, print(தொல்காப்பியம்_எழுத்ததிகாரம்_இயல்கள்) என்ற இந்தப் பைத்தான் நிரல், தொல்காப்பியம் எழுத்ததிகாரத்தில் உள்ள ஒன்பது இயல்களைக் கொண்ட ஒரு பட்டியலை விளைவாகத் தருகின்றது. இந்த நிரலை இயக்கும்போது, பின்வரும் முடிவு கிடைக்கும்:

['நூன்மரபு', 'மொழிமரபு', 'பிறப்பியல்', 'புணரியல்', 'தொகைமரபு', 'உருபியல்', 'உயிர் மயங்கியல்', 'புள்ளி மயங்கியல்', 'குற்றியலுகரப் புணரியல்']

இதுவரை எழுதிய பைத்தான் நிரல்களை கோலேப்பில் தந்து இயக்கிப் பார்க்கலாம்.

7. நூன்மரபு - மூன்றாம் பட்டியல் நிரல் எழுதுதல்
import tamil

நூன்மரபு = ['எழுத்துக்களின் வகை', 'மாத்திரை', 'எண்', 'வடிவு', 'மயக்கம்', 'பிற மரபுகள்']
print(நூன்மரபு)

இது ஒரு நிரல்தொகுப்பு. இந்த நிரலில் நூன்மரபு என்ற பட்டியல், நூன்மரபு இயலில் உள்ள ஆறு பிரிவுகளின் பெயர்களைக் கொண்டுள்ளது. அடுத்துள்ள, print(நூன்மரபு) என்ற குறியீடு, நூன்மரபு என்ற பட்டியலை விளைவாகத் தருகின்றது. இந்த நிரலை இயக்கும்போது, பின்வரும் முடிவு கிடைக்கும்:

['எழுத்துக்களின் வகை', 'மாத்திரை', 'எண்', 'வடிவு', 'மயக்கம்', 'பிற மரபுகள்']
8. எழுத்தின் வகை - நூற்பா 1
எழுத்து எனப்படுப
அகரம் முதல்
னகர இறுவாய் முப்பஃது என்ப
சார்ந்து வரல் மரபின் மூன்று அலங்கடையே.
வணக்கம் ஐயா, தொல்காப்பிய நூன்மரபைப் பைத்தான் மூலமாகக் கற்றுத் தருகின்றேன் எனக் கூறிவிட்டு, வழக்கமான உரையாசிரியர்களைப் போலவே, நூன்மரபு விதிகளைக் கூறுகின்றீர்களே.

ஆம். அன்பரே! முதலில் தொல்காப்பிய நூற்பாவை நாம் தெரிந்துகொள்வோம். பின்பு அதனை எப்படிப் பைத்தான் மொழியில் எழுதுவது என அறிவோம். அப்பொழுதுதான் அதில் உள்ள தருக்கத்தை அறிய முடியும்.

ஐயா, தருக்கம் என்றால் என்ன?

அதுவா, வேறொன்றுமில்லை. தருக்கம் செய்கிறார்கள் எனக் கேள்விப் பட்டிருக்கின்றீர்களா?

ஆம். ஐயா. கேள்விகள் கேட்டால், அதற்குரிய விளக்கத்திற்குத் தேவையான சான்றுகளைக் காட்டிக் கூறுவார்களே? அதுதானே ஐயா.

ஆம். சரியாகப் புரிந்துகொண்டுள்ளீர்கள். சரி, இனி நாம் தொல்காப்பியர் எழுதிய எழுத்ததிகார நூன்மரபு முதல் விதிக்குப் போவோமா?

இந்த முதல் விதியில் தொல்காப்பியர் கூற வருவது என்ன? தமிழ் மொழியின் அமைப்பில் முதன்மையான எழுத்துக்கள் இரண்டு வகைப்படும் என்கிறார். அந்த எழுத்துக்கள் முதலெழுத்து, சார்பெழுத்து என்பன.

ஐயா,
எழுத்து எனப்படுப
அகரம் முதல்
னகர இறுவாய் முப்பஃது என்ப
இதுவரை உள்ள தகவல்களை முதல் எழுத்துக்குரியது என்றும்,
சார்ந்து வரல் மரபின் மூன்று அலங்கடையே.
இதுவரை சார்பெழுத்துக்குரியது என்றும் புரிந்துகொண்டுள்ளேன். சரிதானே ஐயா!

ஆம் சரிதான் அன்பரே!

தொல்காப்பியர் முதல் எழுத்து என்று சொல்லக் கூடியவற்றை 'அகரம் முதல் னகர இறுவாய்' எனக் கூறுகின்றார். அதாவது உயிர், மெய் எழுத்துக்களைக் கூறுகின்றார். சரி, இப்பொழுது இதுவரை பைத்தானில் பட்டியல் உருவாக்கும் நுட்பத்தையும், விளைவாகக் காட்டவேண்டிய நுட்பத்தையும் அறிந்தாய் அல்லவா? இப்பொழுது பைத்தான் மொழியில் எழுதிக் காண்பியுங்கள் பார்ப்போம்.

எழுத்துக்களின்_வகை = ['முதலெழுத்து', 'சார்பெழுத்து']
print(எழுத்துக்களின்_வகை)
['முதலெழுத்து', 'சார்பெழுத்து']
ஐயா, இது அந்த நூற்பாவில் உள்ள எழுத்துக்களின் வகைகளை விளைவாகக் காட்ட எழுதியுள்ளேன்.

நன்று. அடுத்து, முதலெழுத்துக்குரிய நிரல்.

முதலெழுத்து = ['உயிரெழுத்து', 'மெய்யெழுத்து']
print(முதலெழுத்து)
['உயிரெழுத்து', 'மெய்யெழுத்து']

அருமை. சரி, இன்னொரு நுட்பத்தையும் உனக்குக் கற்றுத் தருகின்றேன். கூர்ந்து பார் அன்பரே!

உயிரெழுத்து = tamil.utf8.uyir_letters
print(உயிரெழுத்து)

# மெய்யெழுத்து = ['க்', 'ங்', 'ச்', 'ஞ்', 'ட்', 'ண்', 'த்', 'ந்', 'ப்', 'ம்', 'ய்', 'ர்', 'ல்', 'வ்', 'ழ்', 'ள்', 'ற்', 'ன்']
மெய்யெழுத்து = tamil.utf8.mei_letters
print(மெய்யெழுத்து)

இதுவும் ஒரு பைத்தான் நிரல். முன்பு பார்த்ததற்கும் இந்த நிரலிற்கும் என்ன வேறுபாடு அன்பரே! கண்டுபிடியுங்கள்.

ஐயா, இதில் மெய்யெழுத்து எனும் பட்டியலில் tamil.utf8.uyir_letters எனும் மதிப்புத் தரப்பெற்றுள்ளது ஐயா.

ஆம் சரியாகக் கண்டறிந்தீர்கள். பாராட்டு. tamil.utf8.uyir_letters இந்த மதிப்பை Open-Tamil என்ற நூலகத்திலிருந்து வருவித்து உரிய விளைவைத் தருவதைப் பார்க்கலாம். இதுபோல் பின்வரும் நிரல்களின் விளைவுகளும் அவ்வாறே அமையும் என்பதை அறிந்திருப்பீர்கள் அல்லவா? சரி, அந்த நூற்பா தரும் பிற விளக்கங்களுக்கான நிரல்களையும் பின்வருமாறு எழுதி, இயக்கிப் பழகுங்கள். இதற்குரிய நிரல்தொகுப்பினைக் கித்துப்பில் [9] உள்ளது. வேண்டுமானால் அதனைப் பைத்தான் இயக்கிப் பார்க்கும் முனையத்தில் பயன்படுத்திக் கொள்ளலாம்.

உயிரெழுத்து_வகை = ['குறில்', 'நெடில்']
print(உயிரெழுத்து_வகை)

இது உயிரெழுத்து வகையைக் குறிக்கும் நிரல்.

['குறில்', 'நெடில்']
உயிரெழுத்து_வகை_குறில் = tamil.utf8.kuril_letters
print(உயிரெழுத்து_வகை_குறில்)

இது உயிரெழுத்து வகையில் உள்ள குறில் எழுத்துக்களைக் குறிக்கும் நிரல்.

உயிரெழுத்து_வகை_நெடில் = tamil.utf8.nedil_letters
print(உயிரெழுத்து_வகை_நெடில்)

இது உயிரெழுத்து வகையில் உள்ள நெடில் எழுத்துக்களைக் குறிக்கும் நிரல்.

9. நூற்பா 2 - சார்பெழுத்து
அவைதாம்,
குற்றியலிகரம் குற்றியலுகரம்
ஆய்தம் என்ற
முப்பாற்புள்ளியும் எழுத்து ஓரன்ன.

இந்த நூற்பாவின் கருத்துக்களைப் பின்வருமாறு நிரல் எழுதி உருவாக்கி வைத்துக் கொள்வோமா?

சார்பெழுத்து = ['குற்றியலிகரம்', 'குற்றியலுகரம்', 'ஆய்தம்']
print(சார்பெழுத்து)

இது சார்பெழுத்து வகையைக் குறிக்கும் நிரல்.

['குற்றியலிகரம்', 'குற்றியலுகரம்', 'ஆய்தம்']
உயிர்_மெய் = [
    'க', 'கா', 'கி', 'கீ', 'கு', 'கூ', 'கெ', 'கே', 'கை', 'கொ', 'கோ', 'கௌ',
    ...
    'ன', 'னா', 'னி', 'னீ', 'னு', 'னூ', 'னெ', 'னே', 'னை', 'னொ', 'னோ', 'னௌ'
]
print(உயிர்_மெய்)

இது சார்பெழுத்து வகையில் உள்ள உயிர்மெய் எழுத்துக்களைக் குறிக்கும் நிரல்.

ஐயா, ஓர் ஐயம். என்னய்யா இப்படியே பைத்தான் நிரலாக எழுதிக்கொண்டே போகின்றோம்.

நல்ல ஐயம். என்எல்டிகே (NLTK), சுபேசி (spaCy), சென்சிம் (Gensim) இது போன்ற நூலகங்களைக் கேள்விப் பட்டதுண்டா?

இல்லை ஐயா.

இந்த நூலகங்களைப் பயன்படுத்தி இயற்கை மொழிசார்ந்த ஆய்வுகளை உலகம் முழுவதிலும் உள்ள ஆய்வாளர்கள் செய்து வருகின்றார்கள். அதுபோல் பிற்காலத்தில் தொல்காப்பியர் என்ற நூலகம் உருவாக்கி, தமிழ் மொழி ஆய்வுகள் செய்ய இந்த மாதிரி எழுது நிரல்கள்தான் உதவியாக இருக்கும். நூலகம் உருவாக்கும் வழிமுறைகளை இந்த இயலின் விளக்குகின்றேன். அதுவரை பல்வேறு நுட்பங்களைத் தெரிந்துகொண்டே வா அன்பரே!

சரி ஐயா…

சரி இந்த வகுப்பை இத்துடன் முடித்துக் கொள்வோம். பிற குறிப்புகளை ஒவ்வொரு பாடவேளையிலும் அறிந்துகொள்வோமா?

10. முடிவுரை

இதுவரை விளக்கப்பெற்ற கருத்துக்களின் அடிப்படையில் தொல்காப்பியத்தின் ஒருங்குத் தன்மையையும், தொல்காப்பியர் எழுதிய நூற்பாச் செய்திகளை, பைத்தான் நிரலாக எழுதி இயக்கிப் பார்க்க முடியும் என்ற நம்பிக்கையை அளித்திருக்கும் என நம்பலாம். இது ஒரு தொடக்கமே. இனிவரும் ஒவ்வொரு பகுதிகளிலும் இன்னும் கூடுதலாகச் சிலநுட்பங்களை எடுத்துரைக்க முனைவோம்.

11. துணைநின்றவை
📺 காணொலி விரிவுரையைப் பாருங்கள்
முதல் வார முழு விளக்கவுரை (காணொலி நேரம்: 32:15)

வாரம் 8: தொல்காப்பியம் - நூன்மரபு (பைத்தான்வழி உரை-8)

📜 வாரம் 8: தொல்காப்பியம் - நூன்மரபு (பைத்தான்வழி உரை-8) | Tolkappiyam Nunmarabu Python Text-8 ...