Statistical லேபிளுடன் இடுகைகளைக் காண்பிக்கிறது. அனைத்து இடுகைகளையும் காண்பி
Statistical லேபிளுடன் இடுகைகளைக் காண்பிக்கிறது. அனைத்து இடுகைகளையும் காண்பி

வெள்ளி, 12 ஜூன், 2026

நாள் 50 - புள்ளியியல் பகுப்பாய்வுக்குச் செய்யறிவுடன் குறியீடு எழுதுதல் (Writing Code for Statistical Analysis using AI)

நாள் 50 - புள்ளியியல் பகுப்பாய்வுக்குச் செய்யறிவுடன் குறியீடு எழுதுதல் & வாரம் 10 சுருக்கம்
📐 நாள் 50 · AI-யுடன் புள்ளியியல் பகுப்பாய்வு

புள்ளியியல் பகுப்பாய்வுக்குச்
செய்யறிவுடன் குறியீடு எழுதுதல்

T-Test, ANOVA, Chi-Square Test, p-value — செய்யறிவு (AI) மூலம் புள்ளியியல் சோதனைகளை மேற்கொண்டு, ஆய்வு முடிவுகளின் நம்பகத்தன்மையை உறுதி செய்யும் நுட்பங்கள்.

📏 “எப்பொருள் எத்தன்மைத் தாயினும் அப்பொருள் மெய்ப்பொருள் காண்பது அறிவு” (குறள் 355) — புள்ளியியல் சோதனைகள் ஆய்வு முடிவுகளின் “மெய்ப்பொருளை” (உண்மையான நம்பகத்தன்மையை) அறிவியல் பூர்வமாக உறுதி செய்கின்றன.

📘 50.0 அறிமுகம்

ஆய்வு முடிவுகளின் நம்பகத்தன்மையை உறுதி செய்ய புள்ளியியல் (Statistics) சோதனைகள் மிக அவசியமானவை. சராசரி (Mean), இடைநிலை (Median) மட்டுமின்றி, டி-தேர்வு (T-Test), அனோவா (ANOVA), கை-வர்க்கச் சோதனை (Chi-Square) போன்ற மேம்பட்ட சோதனைகள் ஆய்வின் முடிவுகள் புள்ளியியல் அடிப்படையில் முக்கியத்துவம் வாய்ந்தவையா (Statistically Significant) என்பதை உறுதி செய்கின்றன. AI இந்தச் சோதனைகளுக்கான Python குறியீடுகளை எளிதாக உருவாக்கித் தருகிறது.

📊 50.1 புள்ளியியல் சோதனைகள் (Statistical Tests) – அறிமுகம்

சோதனைதமிழ்ப் பெயர்எப்போது பயன்படுத்துவதுஎடுத்துக்காட்டு
T-Testடி-தேர்வுஇரு குழுக்களின் (Two Groups) சராசரிகளை ஒப்பிடஆண், பெண் மாணவர்களின் மதிப்பெண்களில் வேறுபாடு உள்ளதா?
ANOVAஅனோவாமூன்று அல்லது அதற்கு மேற்பட்ட குழுக்களின் சராசரிகளை ஒப்பிடUG, PG, PhD மாணவர்களின் மதிப்பெண்களில் வேறுபாடு உள்ளதா?
Chi-Square Testசி-சதுர சோதனைவகைப்படுத்தப்பட்ட (Categorical) தரவுகளுக்கிடையே தொடர்பு உள்ளதா எனச் சோதிக்கபட்டம் (UG/PG), வேலை வாய்ப்பு (Employed/Unemployed) ஆகியவற்றுக்கிடையே தொடர்பு உள்ளதா?
Pearson Correlationபியர்சன் தொடர்புஇரண்டு தொடர்ச்சியான (Continuous) மாறிகளுக்கிடையே தொடர்பு உள்ளதா எனச் சோதிக்கபடிக்கும் நேரத்திற்கும் (Study Hours) மதிப்பெண்களுக்கும் (Marks) தொடர்பு உள்ளதா?

⚙️ 50.2 செய்யறிவு உதவியுடன் புள்ளியியல் சோதனைகள் செய்தல் – 2 படிகள்

🔹 படி 1: தரவுத் தொகுப்பை (CSV/Excel) AI-யிடம் பதிவேற்றுக (ChatGPT Plus / Claude / Google Colab).
🔹 படி 2: தெளிவான புள்ளியியல் தூண்டலை (Prompt) வழங்குக — சோதனை வகை, நெடுவரிசைகள், குழுக்களைக் குறிப்பிடுக.
📝 டி-தேர்வு (T-Test) – Prompt Template:
“நான் பதிவேற்றியுள்ள தரவுத் தொகுப்பில், [குழு 1], [குழு 2] என இரண்டு குழுக்களுக்கான தரவுகள் உள்ளன. [மதிப்பெண் நெடுவரிசை] என்பதில் மதிப்பெண்கள் உள்ளன. இரு குழுக்களின் சராசரிகளுக்கு இடையே புள்ளியியல் அடிப்படையில் முக்கியத்துவம் வாய்ந்த வேறுபாடு உள்ளதா என்பதைச் சோதிக்க, டி-தேர்வு (Independent T-Test) செய்வதற்கான பைத்தான் குறியீட்டைத் தருக. scipy.stats நூலகத்தைப் பயன்படுத்துக. p-value < 0.05 எனில், வேறுபாடு முக்கியத்துவம் வாய்ந்தது என விளக்குக.”
📊 அனோவா (ANOVA) – Prompt Template:
“நான் பதிவேற்றியுள்ள தரவுத் தொகுப்பில், [குழு 1], [குழு 2], [குழு 3] என மூன்று குழுக்களுக்கான தரவுகள் உள்ளன. இவற்றுக்கு இடையே புள்ளியியல் அடிப்படையில் முக்கியத்துவம் வாய்ந்த வேறுபாடு உள்ளதா என்பதைச் சோதிக்க, அனோவா (ANOVA) செய்வதற்கான பைத்தான் குறியீட்டைத் தருக. F-statistic, p-value காட்டுக.”
🔗 கை-வர்க்கச் சோதனை (Chi-Square) – Prompt Template:
“நான் பதிவேற்றியுள்ள தரவுத் தொகுப்பில், [நெடுவரிசை A], [நெடுவரிசை B] என இரண்டு வகைப்படுத்தப்பட்ட (Categorical) தரவுகள் உள்ளன. இவற்றுக்கிடையே புள்ளியியல் அடிப்படையில் முக்கியத்துவம் வாய்ந்த தொடர்பு உள்ளதா எனச் சோதிக்க, Chi-Square Test செய்வதற்கான பைத்தான் குறியீட்டைத் தருக. chi-square statistic, p-value காட்டுக.”

📌 50.3 எடுத்துக்காட்டுகள் – AI-யுடன் புள்ளியியல் சோதனைகள்

📏 T-Test (இரு குழுக்கள்)
தூண்டல்: “gender_marks.csv-ல் Male vs Female Marks - T-Test”
from scipy import stats
male_marks = df[df['Gender']=='Male']['Marks']
female_marks = df[df['Gender']=='Female']['Marks']
t_stat, p_value = stats.ttest_ind(male_marks, female_marks)
print(f"p-value: {p_value}")
✅ p-value < 0.05 → வேறுபாடு முக்கியத்துவம் வாய்ந்தது
📊 ANOVA (மூன்று+ குழுக்கள்)
தூண்டல்: “program_marks.csv-ல் UG, PG, PhD Marks - ANOVA”
from scipy import stats
ug = df[df['Program']=='UG']['Marks']
pg = df[df['Program']=='PG']['Marks']
phd = df[df['Program']=='PhD']['Marks']
f_stat, p_value = stats.f_oneway(ug, pg, phd)
✅ F-statistic & p-value → குழுக்களிடையே வேறுபாடு உள்ளதா?
🔗 Chi-Square Test (வகைப்பாடுகள்)
தூண்டல்: “program_employment.csv-ல் Program vs Employment”
from scipy.stats import chi2_contingency
table = pd.crosstab(df['Program'], df['Employment'])
chi2, p_value, dof, expected = chi2_contingency(table)
✅ p-value < 0.05 → தொடர்பு முக்கியத்துவம் வாய்ந்தது

✍️ 50.4 பயிற்சி 30 – புள்ளியியல் சோதனைக் குறியீடுகளை உருவாக்கி Google Colab-இல் இயக்குதல்

📋 வழிமுறை:

  • உங்கள் ஆய்வுத் தரவுகளைக் கொண்ட CSV கோப்பைத் தயார் செய்க.
  • Google Colab-ஐத் திறந்து (colab.research.google.com), புதிய Notebook உருவாக்கி, CSV கோப்பைப் பதிவேற்றுக.
  • உங்கள் ஆய்வுக் கேள்விக்குப் பொருத்தமான புள்ளியியல் சோதனையைத் தேர்வு செய்க (T-Test / ANOVA / Chi-Square).
  • மேலே உள்ள Prompt Templates-ஐப் பயன்படுத்தி AI-யிடம் (ChatGPT/Gemini) Python குறியீட்டைக் கேட்கவும்.
  • AI தந்த குறியீட்டை Colab-இல் ஒட்டி இயக்கி, p-value மதிப்பைப் பதிவு செய்க.
🔸 p-value விளக்கம்:
p-value < 0.05: ஆய்வு முடிவுகள் புள்ளியியல் அடிப்படையில் முக்கியத்துவம் வாய்ந்தவை (Statistically Significant) → உண்மையான தொடர்பு/வேறுபாடு உள்ளது.
p-value > 0.05: புள்ளியியல் அடிப்படையில் முக்கியத்துவம் அற்றவை → குறிப்பிடத்தக்க வேறுபாடு இல்லை.

📌 50.5 இறுதியாக

புள்ளியியல் சோதனைகள் (Statistical Tests) ஆய்வு முடிவுகளின் நம்பகத்தன்மையை உறுதி செய்யும் அத்தியாவசியக் கருவிகள். AI-யின் உதவியுடன் T-Test, ANOVA, Chi-Square போன்ற சோதனைகளுக்கான Python குறியீடுகளை உருவாக்கி, Google Colab-இல் இயக்கி p-value அடிப்படையில் முடிவுகளைத் துல்லியமாகத் தீர்மானிக்கலாம்.

🎯 இப்பாடத்தில் நாம் கற்றுக்கொண்ட முக்கியக் கருத்துகள்

  • புள்ளியியல் சோதனைகளின் வகைகள்: T-Test, ANOVA, Chi-Square Test, Pearson Correlation — ஒவ்வொன்றின் பயன்பாடுகள்.
  • AI உதவியுடன் குறியீடு உருவாக்கம்: தூண்டலில் சோதனை வகை, நெடுவரிசைகள், குழுக்களைக் குறிப்பிட்டுப் Python குறியீட்டைப் பெறுதல்.
  • Google Colab-இல் இயக்குதல்: AI தந்த குறியீட்டை இயக்கி t-statistic, F-statistic, chi-square statistic, p-value ஆகிய அளவீடுகளைப் பெறுதல்.
  • p-value-இன் முக்கியத்துவம்: p-value < 0.05 எனில் முடிவுகள் புள்ளியியல் அடிப்படையில் முக்கியத்துவம் வாய்ந்தவை.
  • இலக்கிய இணைப்பு: “அளவு” — புள்ளியியல் சோதனைகள் ஆய்வு முடிவுகளின் நம்பகத்தன்மையை உறுதி செய்கின்றன; “மெய்ப்பொருள் காண்பது அறிவு”.

🎥 காணொளி வழிகாட்டி: AI-யுடன் புள்ளியியல் பகுப்பாய்வு

T-Test, ANOVA, Chi-Square — AI-யுடன் புள்ளியியல் சோதனைகள் செய்வது எப்படி என்பதற்கான நேரடி விளக்கம்.

📚 வாரம் 10 – சுருக்கம் (தரவுப் பகுப்பாய்வும் காட்சிப்படுத்தலும்)
📊 விரிதாள் சூத்திரங்கள்
COUNTIF, VLOOKUP, IF — AI உதவியுடன் தமிழில் கேட்டு Excel சூத்திரங்களைப் பெறுதல்.
🐍 பைத்தான் குறியீடு
pandas, numpy — தரவு சுத்திகரிப்பு, வடிகட்டுதல், பகுப்பாய்வுக்கான AI குறியீடு.
📈 தரவுப் பகுப்பாய்வு
சராசரி, இடைநிலை, திட்டவிலக்கம், போக்குகள், தொடர்புகள்.
📉 விளக்கப்படங்கள்
Bar Chart, Pie Chart, Scatter Plot — AI-யுடன் காட்சிப்படுத்தல்.
📐 புள்ளியியல் சோதனைகள்
T-Test, ANOVA, Chi-Square — p-value அடிப்படையில் முடிவுகளின் நம்பகத்தன்மை.
🎯 இலக்கிய இணைப்பு
“எண்ணித் துணிக”, “காட்சி”, “அளவு”, “மெய்ப்பொருள் காண்பது அறிவு”.
🧠 வாரம் 10 முக்கியக் கற்றல்கள்: தொழில்நுட்ப அறிவு குறைவாக இருந்தாலும், சரியான தூண்டல்கள் (Prompts) மூலம் AI-யுடன் சிக்கலான தரவுப் பணிகளைச் செய்யலாம். புள்ளியியல் சான்றுகளுடன் ஆய்வு முடிவுகளை முன்வைக்கும் பண்பு மேம்பட்டுள்ளது.
📢 அடுத்த வாரத்தில் (வாரம் 11): AI-யைப் பயன்படுத்தி ஒரு முழுமையான ஆய்வுக் கட்டுரையை (Research Paper) உலகளாவிய தரத்துடன் எவ்வாறு எழுதுவது என்பது குறித்துப் பயிலப்போகிறோம்.
📝 வாரத் தேர்வு: CSV கோப்பிலிருந்து மூன்று வெவ்வேறு விளக்கப்படங்களை உருவாக்குதல்

📋 வழிமுறை:

  • உங்கள் ஆய்வுத் தரவுகளைக் கொண்ட CSV கோப்பைத் தயார் செய்க (குறைந்தது 4-5 நெடுவரிசைகள்).
  • ChatGPT/Gemini-யில் கீழ்க்காணும் தூண்டலைப் பயன்படுத்தி Python குறியீட்டைக் கேட்கவும்.
  • Google Colab-இல் குறியீட்டை இயக்கி, Bar Chart, Pie Chart, Scatter Plot ஆகிய மூன்று வரைபடங்களையும் PNG/PDF ஆகச் சேமிக்கவும்.
🔸 தூண்டல் (Prompt):
“என்னிடம் ‘[your_file_name].csv’ என்ற CSV கோப்பு உள்ளது. இதில் [Column1], [Column2], [Column3], [Column4] நெடுவரிசைகள் உள்ளன. இந்தத் தரவுகளைப் பயன்படுத்தி, Bar Chart, Pie Chart, Scatter Plot ஆகிய மூன்று வெவ்வேறு விளக்கப்படங்களை உருவாக்கும் Python குறியீட்டைத் தருக. matplotlib மற்றும் seaborn பயன்படுத்துக. ஒவ்வொரு வரைபடத்திற்கும் தலைப்புகள், அச்சுத் தலைப்புகளை அமைத்துத் தருக.”
🧠 “எண்ணித் துணிக கருமம்” — தரவுகளை AI-யின் உதவியுடன் புள்ளியியல் முறையில் பகுப்பாய்வு செய்து, நம்பகமான ஆய்வு முடிவுகளை எடுங்கள். இவ்வாரம் நீங்கள் கற்றுக்கொண்ட திறன்கள் உங்கள் ஆய்வுப் பயணத்தை அடுத்த கட்டத்திற்கு நகர்த்தும்.
© மாதம் - 3 | வாரம் 10 · நாள் 50 — புள்ளியியல் பகுப்பாய்வுக்குச் செய்யறிவுடன் குறியீடு எழுதுதல் (Statistical Analysis using AI) & வாரத் தேர்வு · தமிழ் AI ஆய்வு முறைமை

நாள் 50 - புள்ளியியல் பகுப்பாய்வுக்குச் செய்யறிவுடன் குறியீடு எழுதுதல் (Writing Code for Statistical Analysis using AI)

நாள் 50 - புள்ளியியல் பகுப்பாய்வுக்குச் செய்யறிவுடன் குறியீடு எழுதுதல் & வாரம் 10 சுருக்கம் ...