மற்றொரு பொதுவான என்.எல்.பியின் பணி உரை அல்லது முழு ஆவணங்களின் பகுதிகளுக்குள் வகைப்படுத்தங்கள் (டோக்கன்கள்) அல்லது சொற்றொடர்களைப் பொருத்துவதாகும். வழக்கமான வெளிப்பாடுகளுடன் நீங்கள் மாதிரி பொருத்தத்தைச் செய்யலாம், ஆனால் இசுபேசியின் பொருந்தக்கூடிய திறன்கள் பயன்படுத்த எளிதாக இருக்கும்.
[மெய்வேந்து] கவிதை, கட்டுரை, சிறுகதை, புதினம் ஆகிய இலக்கிய வடிவங்களோடு, தமிழியல், வரலாறு, தொல்லியல் சார்ந்த அரிய தகவல்களையும் தாங்கி வரும் பன்முக வலைப்பூ. (A multidisciplinary blog featuring Poetry, Essays, Fiction, History, and Archaeology.)
பக்கங்கள்
- முகப்பு
- Diclaimer
- About us
- Conduct
- Privacy Policy
- தொல்காபை ஆய்வி
- Tamil Poets
- ஒப்பிலக்கணம்
- ஒப்பிலக்கியம்
- கவிதை
- கவிதை
- ஆங்கிலம்
- படைப்புகள் வெளியிட
- பன்மொழியாளர்
- கன்னடம்
- தெலுங்கு
- தமிழ்ப் புலவர்
- நூலறிமுகம்
- அகர முதலி
- என்னைப்பற்றி
- தொல்காப்பியச் செயலி
- வினாடி-வினா (Quizzes)
- வினாடி - வினா (TRB, UGC-Quiz)
- MiLifeStyle Products
- பகுதி 1 தமிழ்
ஞாயிறு, 25 ஜூலை, 2021
ஞாயிறு, 18 ஜூலை, 2021
அடிச்சொல் அறிமுறை (உரை முன்செயலாக்கம் - Text preprocessing)
ஞாயிறு, 11 ஜூலை, 2021
வகைப்படுத்தம் (Tokenizing)
இது வகைப்படுத்த வேண்டியவைகளைக் கொண்ட ஆவணப் பொருளை வழங்குகிறது. வகைப்படுத்தம் என்பது ஆவணத்தில் உள்ள தனிப்பட்ட சொற்கள், நிறுத்தற்குறி போன்ற உரையின் ஒவ்வொரு அலகையும் குறிக்கும். "வேண்டாம்" போன்ற சுருக்கங்களை இசுபேசி இரண்டு வகைப்படுதங்களாகப் பிரிக்கிறது. அது "செய்", "இல்லை" என்பதாகும். ஆவணத்தின் மூலம் மீண்டும் செயல்படுவதன் மூலம் வகைப்படுத்தங்களைக் காணலாம்.
ஞாயிறு, 4 ஜூலை, 2021
இயற்கைமொழிச் செயலாக்கம் (NLP)
அறிமுகம்
தரவு பல வடிவங்களில் உள்ளது. நேர முத்திரைகள், சென்சார் அளவீடுகள், படங்கள், வகைப்படுத்தப்பட்ட குறிகள், இவை போக இன்னும் பல. ஆனால் உரை இன்னும் அதைப் பயன்படுத்தத் தெரிந்தவர்களுக்கு மிகவும் மதிப்புமிக்க தரவுகளில் சில.
இயற்கைமொழிச் செயலாக்கம் (என்.எல்.பி) பற்றிய இந்தப் பாடத்திட்டத்தில், உரையுடன் பணியாற்றுவதில் மிக முக்கியமான சில பணிகளை மேற்கொள்ள நீங்கள் முன்னணி என்.எல்.பி நூலகத்தைப் (ஸ்பாசி) பயன்படுத்தலாம்.
ஞாயிறு, 6 ஜூன், 2021
இசுபேசியுடன் (spaCy) இயற்கைமொழிச் செயலாக்கம்
இசுபேசி (spaCy) என்பது என்.எல்.பியின் முன்னணி நூலகமாகும். இது விரைவில் மிகவும் பிரபலமான பைத்தான் கட்டமைப்பில் ஒன்றாகவும் மாறியுள்ளது. பெரும்பாலான மக்கள் அதை உள்ளுணர்வுடன் காண்கிறார்கள். மேலும் இது சிறந்த ஆவணங்களைக் கொண்டுள்ளது.
சிதம்பரப்பாட்டியல்
சிதம்பரப் பாட்டியல்: செய்யுள் இலக்கணக் கையேடு தமிழ் இலக்கியத்தின் யாப்பு மற்றும் செய்யுள் நெறிகளை விளக்கும் ஒரு ம...
-
அறிமுகம் "கவிக்கோ" அப்துல் ரகுமான் (நவம்பர் 9, 1937 - ஜூன் 2, 2017) ஒரு தலைசிறந்த தமிழ்க் கவிஞரும், பேராசிரியரும் ஆவார். 'வா...
-
சேர்த்து எழுதுதல் (Word Combining) ஒரு சொல்லாக்க நடைமுறை ஆகும்: வரையறை: பல்வேறு சொற்களை ஒன்றாகச் சேர்த்து புதிய சொல் உருவாக்கும் செயல்முறை த...
-
முன்னுரை பழமன் எழுதிய புதினம் ஒத்தப்பனை ஆகும். இந்தப் புதினம் கொங்கு வட்டார வேளாண் மக்களின் துயரம் மிகுந்த வாழ்க்கையை பதிவுசெய்கிறது. அப...