Text preprocessing லேபிளுடன் இடுகைகளைக் காண்பிக்கிறது. அனைத்து இடுகைகளையும் காண்பி
Text preprocessing லேபிளுடன் இடுகைகளைக் காண்பிக்கிறது. அனைத்து இடுகைகளையும் காண்பி

ஞாயிறு, 18 ஜூலை, 2021

அடிச்சொல் அறிமுறை (உரை முன்செயலாக்கம் - Text preprocessing)

சொற்களால் நாம் எவ்வாறு மாதிரியாக இருக்கிறோம் என்பதை மேம்படுத்த சில வகையான முன் செயலாக்கங்கள் உள்ளன. முதலாவது "லெமடிசிங் (lemmatizing)". ஒரு வார்த்தையின் "லெம்மா (lemma)" அதன் அடிப்படை வடிவம். உதாரணமாக, "நடை" என்பது "நடைப் பயிற்சி" என்ற வார்த்தையின் லெம்மா ஆகும். எனவே, நீங்கள் நடைப்பயிற்சி என்ற வார்த்தையை லெமடைசு செய்யும்போது, அதை நடைப்பயணமாக மாற்றுவீர்கள்.

தமிழ் இலக்கிய வரலாறு - சோழர் காலம், நவீன காலப் பகுதிகள்

தமிழ் இலக்கிய வரலாறு: காப்பியங்கள் முதல் இக்காலம் வரை தமிழின் வளமான காப்பிய மரபுகள், இடைக்கால பக்தி இலக்கியங்கள் ...