புள்ளியியல் பகுப்பாய்வுக்குச்
செய்யறிவுடன் குறியீடு எழுதுதல்
T-Test, ANOVA, Chi-Square Test, p-value — செய்யறிவு (AI) மூலம் புள்ளியியல் சோதனைகளை மேற்கொண்டு, ஆய்வு முடிவுகளின் நம்பகத்தன்மையை உறுதி செய்யும் நுட்பங்கள்.
📘 50.0 அறிமுகம்
ஆய்வு முடிவுகளின் நம்பகத்தன்மையை உறுதி செய்ய புள்ளியியல் (Statistics) சோதனைகள் மிக அவசியமானவை. சராசரி (Mean), இடைநிலை (Median) மட்டுமின்றி, டி-தேர்வு (T-Test), அனோவா (ANOVA), கை-வர்க்கச் சோதனை (Chi-Square) போன்ற மேம்பட்ட சோதனைகள் ஆய்வின் முடிவுகள் புள்ளியியல் அடிப்படையில் முக்கியத்துவம் வாய்ந்தவையா (Statistically Significant) என்பதை உறுதி செய்கின்றன. AI இந்தச் சோதனைகளுக்கான Python குறியீடுகளை எளிதாக உருவாக்கித் தருகிறது.
📊 50.1 புள்ளியியல் சோதனைகள் (Statistical Tests) – அறிமுகம்
| சோதனை | தமிழ்ப் பெயர் | எப்போது பயன்படுத்துவது | எடுத்துக்காட்டு |
|---|---|---|---|
| T-Test | டி-தேர்வு | இரு குழுக்களின் (Two Groups) சராசரிகளை ஒப்பிட | ஆண், பெண் மாணவர்களின் மதிப்பெண்களில் வேறுபாடு உள்ளதா? |
| ANOVA | அனோவா | மூன்று அல்லது அதற்கு மேற்பட்ட குழுக்களின் சராசரிகளை ஒப்பிட | UG, PG, PhD மாணவர்களின் மதிப்பெண்களில் வேறுபாடு உள்ளதா? |
| Chi-Square Test | சி-சதுர சோதனை | வகைப்படுத்தப்பட்ட (Categorical) தரவுகளுக்கிடையே தொடர்பு உள்ளதா எனச் சோதிக்க | பட்டம் (UG/PG), வேலை வாய்ப்பு (Employed/Unemployed) ஆகியவற்றுக்கிடையே தொடர்பு உள்ளதா? |
| Pearson Correlation | பியர்சன் தொடர்பு | இரண்டு தொடர்ச்சியான (Continuous) மாறிகளுக்கிடையே தொடர்பு உள்ளதா எனச் சோதிக்க | படிக்கும் நேரத்திற்கும் (Study Hours) மதிப்பெண்களுக்கும் (Marks) தொடர்பு உள்ளதா? |
⚙️ 50.2 செய்யறிவு உதவியுடன் புள்ளியியல் சோதனைகள் செய்தல் – 2 படிகள்
“நான் பதிவேற்றியுள்ள தரவுத் தொகுப்பில், [குழு 1], [குழு 2] என இரண்டு குழுக்களுக்கான தரவுகள் உள்ளன. [மதிப்பெண் நெடுவரிசை] என்பதில் மதிப்பெண்கள் உள்ளன. இரு குழுக்களின் சராசரிகளுக்கு இடையே புள்ளியியல் அடிப்படையில் முக்கியத்துவம் வாய்ந்த வேறுபாடு உள்ளதா என்பதைச் சோதிக்க, டி-தேர்வு (Independent T-Test) செய்வதற்கான பைத்தான் குறியீட்டைத் தருக. scipy.stats நூலகத்தைப் பயன்படுத்துக. p-value < 0.05 எனில், வேறுபாடு முக்கியத்துவம் வாய்ந்தது என விளக்குக.”
“நான் பதிவேற்றியுள்ள தரவுத் தொகுப்பில், [குழு 1], [குழு 2], [குழு 3] என மூன்று குழுக்களுக்கான தரவுகள் உள்ளன. இவற்றுக்கு இடையே புள்ளியியல் அடிப்படையில் முக்கியத்துவம் வாய்ந்த வேறுபாடு உள்ளதா என்பதைச் சோதிக்க, அனோவா (ANOVA) செய்வதற்கான பைத்தான் குறியீட்டைத் தருக. F-statistic, p-value காட்டுக.”
“நான் பதிவேற்றியுள்ள தரவுத் தொகுப்பில், [நெடுவரிசை A], [நெடுவரிசை B] என இரண்டு வகைப்படுத்தப்பட்ட (Categorical) தரவுகள் உள்ளன. இவற்றுக்கிடையே புள்ளியியல் அடிப்படையில் முக்கியத்துவம் வாய்ந்த தொடர்பு உள்ளதா எனச் சோதிக்க, Chi-Square Test செய்வதற்கான பைத்தான் குறியீட்டைத் தருக. chi-square statistic, p-value காட்டுக.”
📌 50.3 எடுத்துக்காட்டுகள் – AI-யுடன் புள்ளியியல் சோதனைகள்
தூண்டல்: “gender_marks.csv-ல் Male vs Female Marks - T-Test”
male_marks = df[df['Gender']=='Male']['Marks']
female_marks = df[df['Gender']=='Female']['Marks']
t_stat, p_value = stats.ttest_ind(male_marks, female_marks)
print(f"p-value: {p_value}")
தூண்டல்: “program_marks.csv-ல் UG, PG, PhD Marks - ANOVA”
ug = df[df['Program']=='UG']['Marks']
pg = df[df['Program']=='PG']['Marks']
phd = df[df['Program']=='PhD']['Marks']
f_stat, p_value = stats.f_oneway(ug, pg, phd)
தூண்டல்: “program_employment.csv-ல் Program vs Employment”
table = pd.crosstab(df['Program'], df['Employment'])
chi2, p_value, dof, expected = chi2_contingency(table)
✍️ 50.4 பயிற்சி 30 – புள்ளியியல் சோதனைக் குறியீடுகளை உருவாக்கி Google Colab-இல் இயக்குதல்
📋 வழிமுறை:
- உங்கள் ஆய்வுத் தரவுகளைக் கொண்ட CSV கோப்பைத் தயார் செய்க.
- Google Colab-ஐத் திறந்து (colab.research.google.com), புதிய Notebook உருவாக்கி, CSV கோப்பைப் பதிவேற்றுக.
- உங்கள் ஆய்வுக் கேள்விக்குப் பொருத்தமான புள்ளியியல் சோதனையைத் தேர்வு செய்க (T-Test / ANOVA / Chi-Square).
- மேலே உள்ள Prompt Templates-ஐப் பயன்படுத்தி AI-யிடம் (ChatGPT/Gemini) Python குறியீட்டைக் கேட்கவும்.
- AI தந்த குறியீட்டை Colab-இல் ஒட்டி இயக்கி, p-value மதிப்பைப் பதிவு செய்க.
• p-value < 0.05: ஆய்வு முடிவுகள் புள்ளியியல் அடிப்படையில் முக்கியத்துவம் வாய்ந்தவை (Statistically Significant) → உண்மையான தொடர்பு/வேறுபாடு உள்ளது.
• p-value > 0.05: புள்ளியியல் அடிப்படையில் முக்கியத்துவம் அற்றவை → குறிப்பிடத்தக்க வேறுபாடு இல்லை.
📌 50.5 இறுதியாக
புள்ளியியல் சோதனைகள் (Statistical Tests) ஆய்வு முடிவுகளின் நம்பகத்தன்மையை உறுதி செய்யும் அத்தியாவசியக் கருவிகள். AI-யின் உதவியுடன் T-Test, ANOVA, Chi-Square போன்ற சோதனைகளுக்கான Python குறியீடுகளை உருவாக்கி, Google Colab-இல் இயக்கி p-value அடிப்படையில் முடிவுகளைத் துல்லியமாகத் தீர்மானிக்கலாம்.
🎯 இப்பாடத்தில் நாம் கற்றுக்கொண்ட முக்கியக் கருத்துகள்
- புள்ளியியல் சோதனைகளின் வகைகள்: T-Test, ANOVA, Chi-Square Test, Pearson Correlation — ஒவ்வொன்றின் பயன்பாடுகள்.
- AI உதவியுடன் குறியீடு உருவாக்கம்: தூண்டலில் சோதனை வகை, நெடுவரிசைகள், குழுக்களைக் குறிப்பிட்டுப் Python குறியீட்டைப் பெறுதல்.
- Google Colab-இல் இயக்குதல்: AI தந்த குறியீட்டை இயக்கி t-statistic, F-statistic, chi-square statistic, p-value ஆகிய அளவீடுகளைப் பெறுதல்.
- p-value-இன் முக்கியத்துவம்: p-value < 0.05 எனில் முடிவுகள் புள்ளியியல் அடிப்படையில் முக்கியத்துவம் வாய்ந்தவை.
- இலக்கிய இணைப்பு: “அளவு” — புள்ளியியல் சோதனைகள் ஆய்வு முடிவுகளின் நம்பகத்தன்மையை உறுதி செய்கின்றன; “மெய்ப்பொருள் காண்பது அறிவு”.
🎥 காணொளி வழிகாட்டி: AI-யுடன் புள்ளியியல் பகுப்பாய்வு
T-Test, ANOVA, Chi-Square — AI-யுடன் புள்ளியியல் சோதனைகள் செய்வது எப்படி என்பதற்கான நேரடி விளக்கம்.
COUNTIF, VLOOKUP, IF — AI உதவியுடன் தமிழில் கேட்டு Excel சூத்திரங்களைப் பெறுதல்.
pandas, numpy — தரவு சுத்திகரிப்பு, வடிகட்டுதல், பகுப்பாய்வுக்கான AI குறியீடு.
சராசரி, இடைநிலை, திட்டவிலக்கம், போக்குகள், தொடர்புகள்.
Bar Chart, Pie Chart, Scatter Plot — AI-யுடன் காட்சிப்படுத்தல்.
T-Test, ANOVA, Chi-Square — p-value அடிப்படையில் முடிவுகளின் நம்பகத்தன்மை.
“எண்ணித் துணிக”, “காட்சி”, “அளவு”, “மெய்ப்பொருள் காண்பது அறிவு”.
📋 வழிமுறை:
- உங்கள் ஆய்வுத் தரவுகளைக் கொண்ட CSV கோப்பைத் தயார் செய்க (குறைந்தது 4-5 நெடுவரிசைகள்).
- ChatGPT/Gemini-யில் கீழ்க்காணும் தூண்டலைப் பயன்படுத்தி Python குறியீட்டைக் கேட்கவும்.
- Google Colab-இல் குறியீட்டை இயக்கி, Bar Chart, Pie Chart, Scatter Plot ஆகிய மூன்று வரைபடங்களையும் PNG/PDF ஆகச் சேமிக்கவும்.
“என்னிடம் ‘[your_file_name].csv’ என்ற CSV கோப்பு உள்ளது. இதில் [Column1], [Column2], [Column3], [Column4] நெடுவரிசைகள் உள்ளன. இந்தத் தரவுகளைப் பயன்படுத்தி, Bar Chart, Pie Chart, Scatter Plot ஆகிய மூன்று வெவ்வேறு விளக்கப்படங்களை உருவாக்கும் Python குறியீட்டைத் தருக. matplotlib மற்றும் seaborn பயன்படுத்துக. ஒவ்வொரு வரைபடத்திற்கும் தலைப்புகள், அச்சுத் தலைப்புகளை அமைத்துத் தருக.”