பைத்தான் குறியீட்டைச் செய்யறிவு மூலம் உருவாக்குதல்
Google Colab, pandas, numpy — நிரலாக்கம் தெரியாத ஆய்வாளர்களும் AI உதவியுடன் பைத்தான் குறியீடுகளை எழுதி, தரவு சுத்திகரிப்பு (Data Cleaning), பகுப்பாய்வு, வடிகட்டுதல் ஆகியவற்றை எளிதாகச் செய்யலாம்.
📘 47.0 அறிமுகம்
பைத்தான் (Python) தரவுப் பகுப்பாய்வு, இயந்திரக் கற்றல், அறிவியல் கணக்கீடுகளுக்குப் பயன்படும் ஆற்றல்மிக்க மொழி. ஆனால் நிரலாக்கம் தெரியாத ஆய்வாளர்களுக்கு இது சவாலாக உள்ளது. செய்யறிவு (AI) ஒரு “Coding Assistant” ஆகச் செயல்பட்டு, pandas, numpy அடிப்படையிலான குறியீடுகளை உருவாக்கித் தருகிறது. Google Colab போன்ற இலவசத் தளங்களில் இந்தக் குறியீடுகளை இயக்கி, ஆயிரக்கணக்கான தரவுகளை நொடிகளில் பகுப்பாய்வு செய்யலாம்.
⚙️ 47.1 பைத்தான் (Python) & கூகுள் கோலேப் (Google Colab) – அறிமுகம்
• pandas: தரவுகளைப் படித்தல், சுத்திகரித்தல், மாற்றியமைத்தல்
• numpy: எண்கணிதக் கணக்கீடுகள்
• matplotlib, seaborn: விளக்கப்படங்கள் (Visualization)
• இலவசக் கிளவுட் சேவை
• மென்பொருள் நிறுவல் தேவையில்லை
• உலாவியிலேயே Python குறியீட்டை இயக்கலாம்
• Google கணக்கு மட்டும் போதும்
📌 47.2 செய்யறிவு உதவியுடன் பைத்தான் குறியீடு உருவாக்குதல் – 3 படிகள்
“என்னிடம் ஒரு [CSV / Excel] கோப்பு உள்ளது. கோப்பின் பெயர் ‘[கோப்பின்_பெயர்]’. இதில் [நெடுவரிசை A]: [தரவு வகை], [நெடுவரிசை B]: [தரவு வகை] உள்ளது. எனக்குத் தேவையான பணி: [உங்கள் தேவையைத் தமிழில் விளக்குக]. இதற்கான பைத்தான் குறியீட்டை உருவாக்கித் தருக. pandas நூலகத்தைப் பயன்படுத்துக. ஒவ்வொரு படிநிலைக்கும் தமிழில் விளக்கக் குறிப்புகளைச் (Comments) சேர்க்கவும்.”
📌 47.3 எடுத்துக்காட்டுகள் – AI-யிடம் பைத்தான் குறியீட்டைக் கேட்டல்
தூண்டல்: “students_data.csv கோப்பைப் படித்து முதல் 5 வரிசைகளைக் காட்டும் குறியீடு”
df = pd.read_csv('students_data.csv')
print(df.head())
தூண்டல்: “sales_data.csv-ல் ‘Sales’ நெடுவரிசையில் NULL உள்ள வரிசைகளை நீக்கும் குறியீடு”
df_cleaned = df.dropna(subset=['Sales'])
print(df_cleaned.head())
தூண்டல்: “survey_data.csv-ல் ‘Feedback’ நெடுவரிசையில் உள்ள Good/Average/Poor எண்ணிக்கை”
print(df['Feedback'].value_counts())
தூண்டல்: “employees.csv-ல் ‘Department’ == ‘IT’ உள்ளவர்களின் Name, Salary”
it_emp = df[df['Department'] == 'IT']
print(it_emp[['Name', 'Salary']])
✍️ 47.4 பயிற்சி 27 – Google Colab-இல் பைத்தான் குறியீட்டை இயக்குதல்
📋 வழிமுறை:
- உங்கள் ஆய்வுத் தரவுகளைக் கொண்ட CSV கோப்பைத் தயார் செய்க (Excel-ல் “Save As CSV”).
- colab.research.google.com → New Notebook.
- இடதுபுறம் File icon → உங்கள் CSV கோப்பைப் பதிவேற்றம் செய்க.
- கீழே உள்ள மாதிரித் தூண்டல்களைப் பயன்படுத்தி AI-யிடம் (ChatGPT/Gemini/Claude) Python குறியீட்டைக் கேட்கவும்.
- AI தந்த குறியீட்டை Colab கலத்தில் ஒட்டி, ▶ (Play) பொத்தானை அழுத்தி இயக்கவும்.
• “என்னிடம் ‘data.csv’ கோப்பு உள்ளது. ‘Marks’ நெடுவரிசையின் சராசரியைக் (Mean) கணக்கிடும் பைத்தான் குறியீட்டைத் தருக.”
• “என்னிடம் ‘survey.csv’ உள்ளது. ‘Age’ நெடுவரிசையில் 30-க்கும் மேற்பட்டவர்களை மட்டும் வடிகட்டிக் காட்டும் குறியீடு.”
• “இரண்டு நெடுவரிசைகளுக்கு இடையிலான தொடர்பை (correlation) கணக்கிடும் Python குறியீடு.”
📌 47.5 இறுதியாக
பைத்தான் நிரலாக்கம் தெரியாவிட்டாலும், AI-யின் உதவியுடன் சிக்கலான தரவுப் பகுப்பாய்வுப் பணிகளைச் செய்யலாம். Google Colab இலவசமாகவும், நிறுவல் தேவையில்லாமலும் இருப்பதால், எந்த ஆய்வாளரும் உலாவி வழியாகத் தரவு பகுப்பாய்வைத் தொடங்கலாம்.
🎯 இப்பாடத்தில் நாம் கற்றுக்கொண்ட முக்கியக் கருத்துகள்
- பைத்தான் நூலகங்கள்: pandas (தரவு மேலாண்மை), numpy (எண்கணிதம்), matplotlib (வரைபடம்).
- Google Colab: மென்பொருள் நிறுவல் இல்லாமல், இணைய உலாவி வழியாக Python குறியீட்டை இயக்கும் இலவசக் கிளவுட் தளம்.
- AI-யுடன் குறியீடு உருவாக்கம்: தரவுக் கோப்பின் அமைப்பை விளக்கித் தேவையான pandas அடிப்படையிலான நிரலைப் பெறுதல்.
- பயன்பாட்டு எடுத்துக்காட்டுகள்: CSV படித்தல், NULL நீக்குதல், value_counts, நிபந்தனை வடிகட்டுதல், சராசரி/தொடர்பு கணக்கிடுதல்.
- இலக்கிய இணைப்பு: “இயந்திரம்” — பைத்தான் என்பது தரவுப் பகுப்பாய்விற்கான நவீன இயந்திரம்; AI அதை இயக்கும் திறனை அனைவருக்கும் வழங்குகிறது.
🎥 காணொளி வழிகாட்டி: AI-யுடன் Python குறியீடு & Google Colab
Colab-இல் CSV பதிவேற்றம், AI மூலம் pandas குறியீடு உருவாக்கம், நேரடி இயக்க முறைகள்.