வெள்ளி, 20 ஜூன், 2025

SPELLL-2025: குறைவான வளமுள்ள மொழிகளுக்கான பேச்சு, மொழி தொழில்நுட்ப மாநாடு

குறைவான வளமுள்ளதும் சிறுபான்மையினர் பேசும் மொழிகளுக்கான பேச்சும் மொழித் தொழில்நுட்பத்தில் உலகளாவிய முன்னேற்றத்திற்காக SPELLL-2025 மாநாடு, இந்தியத் தகவல் தொழில்நுட்ப நிறுவனம் (IIIT), கோட்டயம், கேரளா, இந்தியாவில், திசம்பர் 18-20, 2025-இல் நடைபெற உள்ளது. இந்த மாநாடு, குறைவான வளமுள்ள மொழிகளின் மொழி, பேச்சுத் தரவுத் தொழில்நுட்பங்களை மேம்படுத்தவும், அவற்றை எண்ணிம (டிஜிட்டல்) யுகத்தில் ஒருங்கிணைக்கவும், பல்வேறு துறைகள், மனிதவியல், சமூக அறிவியல்களில் பயன்படுத்தவும் நோக்கமாகக் கொண்டுள்ளது.

வெள்ளி, 13 ஜூன், 2025

Detecting caste and migration hate speech in low-resource Tamil language

சாதி மற்றும் இடம்பெயர்வு வெறுப்பு பேச்சைக் குறைந்த வளம் கொண்ட தமிழில் கண்டறிவது – ஒரு புதிய ஆய்வு

அண்மையில் வெளியான ஒரு ஆய்வு, சமூக ஊடகங்களில் தமிழில் வெளிப்படும் சாதி மற்றும் இடம்பெயர்வு தொடர்பான வெறுப்பு பேச்சுகளைக் கண்டறிய புதிய தரவுத்தொகுப்பை அறிமுகப்படுத்தியுள்ளது.

ஏன் இந்த ஆய்வு?

இந்திய அரசியலமைப்பு, மக்களை பட்டியல் சாதி, பட்டியல் பழங்குடி, பிற பிற்படுத்தப்பட்ட வகுப்புகள் மற்றும் முன்னேறிய சாதிகள் எனப் பிரிக்கிறது. இந்தப் பிரிவுகள் வரலாற்று சமத்துவமின்மையை பிரதிபலிக்கின்றன. இதனால் சமூகத்தில் பாகுபாடு, வெறுப்பு, பிரச்சினைகள் ஏற்படுகின்றன. அதே சமயம், வேலைவாய்ப்பு மற்றும் வாழ்க்கை வசதிக்காக நாடு முழுவதும் இடம்பெயரும் மக்கள், அங்குள்ளவர்களால் வெளியாராகக் கருதப்படுகின்றனர். இதனால் வேலைவாய்ப்பு, குற்றம் போன்றவற்றில் அச்சம் ஏற்பட்டு, இடம்பெயர்வு தொடர்பான வெறுப்பு கூடுகிறது.

சமூக ஊடகங்களில் வெறுப்பு பேச்சு

இந்தியாவில் சமூக ஊடகங்கள், குறிப்பாக தமிழ் போன்ற குறைந்த வளம் கொண்ட மொழிகளில், சாதி மற்றும் இடம்பெயர்வு தொடர்பான வெறுப்பு பேச்சுகள் அதிகரித்துள்ளன. இது சமூக ஒற்றுமையைப் பாதிக்கிறது.

புதிய தரவுத்தொகுப்பு மற்றும் ஆய்வு

Bharathi Raja Chakravarthi, Saranya Rajiakodi, Rahul Ponnusamy, Bhuvaneswari Sivagnanam, Sara Yogesh Thakare, Sathiyaraj Thangasamy போன்ற ஆராய்ச்சியாளர்கள் இந்தப் பிரச்சினையை எதிர்கொள்ள தமிழில் சாதி மற்றும் இடம்பெயர்வு தொடர்பான வெறுப்பு பேச்சைக் கண்டறிய ஒரு புதிய தரவுத்தொகுப்பை உருவாக்கியுள்ளனர். இந்தத் தரவுத்தொகுப்பு, இந்த மாதிரியான வெறுப்பு பேச்சுகளைக் கண்டறிய பயிற்சி பெற்ற முன்மாதிரி மாதிரிகளுக்கு (baseline models) உதவுகிறது.

முக்கியமான முடிவுகள்

  • புதிய தரவுத்தொகுப்பு: தமிழில் சாதி மற்றும் இடம்பெயர்வு தொடர்பான வெறுப்பு பேச்சுகளுக்கான முதல் முக்கிய தரவுத்தொகுப்பு.

  • அடிப்படை மாதிரி சோதனைகள்: மேக்ரோ-F1 மதிப்பெண் 0.73 என்பது, இந்தப் பிரச்சினையைக் கண்டறியும் திறன் மிகவும் நம்பிக்கையானது என்பதைக் காட்டுகிறது.

  • மேம்பட்ட மாதிரிகள்: கஸ்டம் இழப்புச் செயல்பாடுகள், அடாப்டர்-அடிப்படையிலான நுண்ணியம், மற்றும் பாராமீட்டர்-திறமையான நுண்ணியம் போன்ற முறைகள் பயன்படுத்தப்பட்டுள்ளன.

  • தொடர்ந்து ஆராய்ச்சிக்கான வாய்ப்பு: இந்தத் தரவுத்தொகுப்பு பொது மக்களுக்கும் ஆராய்ச்சியாளர்களுக்கும் வெளியிடப்பட்டுள்ளது. ஒரு பகிர்வுத் தேடல் (shared task) நடத்தப்பட்டு, பங்கேற்பாளர் முறைமைகள் தரவரிசைப்படுத்தப்பட்டுள்ளன.

எதிர்காலத்திற்கான வழிகாட்டி

இந்தத் தரவுத்தொகுப்பு, தமிழில் சாதி மற்றும் இடம்பெயர்வு தொடர்பான வெறுப்பு பேச்சுகளைக் கண்டறியும் ஆராய்ச்சியை மேம்படுத்த உதவும். சமூக ஊடகங்களில் வெறுப்பு பேச்சுகளைக் குறைப்பதற்கான புதிய வழிமுறைகள் உருவாக்கப்படும்.

மேலும் விவரங்களுக்கு:
ஆய்வு வெளியீட்டு இணைப்பு (Springer)


இந்த ஆய்வு, தமிழில் வெறுப்பு பேச்சுகளைக் கண்டறியும் ஆராய்ச்சிக்கு ஒரு மைல்கல்!


புதன், 4 ஜூன், 2025

அடைக்கலக் காதை

இளங்கோவடிகள் அறிமுகம்

இளங்கோவடிகள் சங்க காலப் புலவர்களில் ஒருவராகவும், ஐம்பெரும் காப்பியங்களுள் ஒன்றான சிலப்பதிகாரத்தை இயற்றியவராகவும் போற்றப்படுகிறார். இவரைப் பற்றிப் பல தகவல்கள் இன்றும் ஆராய்ச்சிக்குரியவையாகவே உள்ளன. சேர மரபில் வந்த இளவரசர் இவர் என்றும், துறவு பூண்டு சமணத் துறவியாக வாழ்ந்தார் என்றும் கூறப்படுகிறது. "அரசியல் பிழைத்தோர்க்கு அறம் கூற்றாகும்", "உரைசால் பத்தினியை உயர்ந்தோர் ஏத்துவர்", "ஊழ்வினை உருத்து வந்து ஊட்டும்" என்ற மூன்று அடிப்படைக் கொள்கைகளை உணர்த்துவதற்காகவே சிலப்பதிகாரத்தை இயற்றினார் என்பது பொதுவான கருத்து.