உயிர்ப்புள்ளியியல்
பொருளடக்கம்
1. அறிமுகம் (Introduction)
2. தொகுப்பும் மாதிரியும் (Population and Sample) தொகுப்பு (Population) மாதிரியும் மாதிரி எடுத்தலும் (Sample and Sampling)
3. மாறிகள் (Variables) உயிரியியலில் மாறிகள் (Variables in Biology) மாறி வகைகள் (Types of variables) மாறி எண் (Variate)
4. தகவல் சேகரிப்பு (Collection of Data) முதல்நிலை மற்றும் இரண்டாம்நிலை தகவல்கள் (Primary and Secondary Data)
5. தகவல்கள் வகைப்படுத்தலும் பட்டியலிடுதலும் (Classification and Tabulation of Data) வகைப்படுத்தல் (Classification) பட்டியலிடுதல் (Tabulation)
6. புள்ளி விவர படங்களும் வரைபடங்களும் (Statistical Diagrams and Graphs) தேவை (Need) பயன்கள் (Uses) வரைவதற்கான பொது வழிமுறைகள் (General Guidelines to draw Diagrams and Graphs) புள்ளிவிவர படங்களின் வகைகள் (Types of Diagrams)
7. நிகழ்வெண் பரவல் (Frequency Distribution) வரையறை (Definition) ஒப்புமை மற்றும் விழுக்காடு ஒப்புமை நிகழ்வெண்கள் (Relative and Percent Frequencies) உதிரி நிகழ்வெண் பரவல் (Discrete Frequency Distribution) தொடர் நிகழ்வெண் பரவல் (Continuous Frequency Distribution) நிகழ்வெண் பரவலின் பிரிவுகளின் எண்ணிக்கையை நிர்ணயித்தல் (Determining the number of Classes of Frequency distribution) ஒப்புமை மற்றும் விழுக்காடு ஒப்புமை நிகழ்வெண்கள் (Relative and Percent Frequencies) திரள் நிகழ்வெண் பரவல்கள் (Cumulative Frequency Distributions) நிகழ்வெண் வரைபடங்கள் (Frequency Graphs)
8. தகவல்களை விவரிக்கும் புள்ளியியல் முறைகள் (Descriptive Statistics)
9. மையப்போக்கு அளவைகள் - சராசரிகள் (Measures of Central Tendency - Averages) வரையறை (Definition) சராசரியின் நோக்கம் (Objectives of an Average ) சராசரி வகைகள் (Types of Averages)
10. சிதறல் போக்கின் அளவைகள் (Measures of Dispersion) வரையறை (Definition) சிதறல் அளவைகள் (Dispersion Measures)
11. பரவலின் கோணல் தன்மையும் தட்டை தன்மையும் (Skewness and Kurtosis) கோணல் தன்மை (Skewness) தட்டை தன்மை (Kurtosis) சிதறல், கோணல் தன்மை, தட்டை தன்மை - ஒப்பீடு (Dispersion, Skewness, Kurtosis) தண்டு-இலை படம் (Stem-and-Leaf Diagram) கட்டம் வரைபடம் (Box Plot)
12. அனுமான புள்ளியியல் (Inferential Statistics)
13. நிகழ்தகவு (நிகழ்வாய்ப்பு) (Probability) நிகழ்தகவு அளவுகோல் (Probability Scale) சில முக்கிய சொற்களின் வரையறையும் விளக்கமும் (Definition and Explanation of Some Terms) எளிய தேர்வு, வரிசை மாற்றம், கலவை (சேர்க்கை) (Simple Choice, Permutation and Combination) நிகழ்தகவு வகைகள் (Types of Probability) நிகழ்தகவு விதிகள் (Rules of Probability) உயிரியிலில் நிகழ்தகவு கோட்பாடுகளின் பயன்பாடு (Application of Probability Principles to Biological Problems) வெண் வரைபடம் (Venn Diagram) 14. தத்துவார்த்த நிகழ்தகவு பரவல்கள் (Theoretical Probability Distributions)
15. χ2 - சோதனை (χ2 - test) அறிமுகம் (Introduction) வரையறை (Definition) χ2 - சோதனையை பிரயோகிக்க தேவையான ஊகங்களும் நிபந்தனைகளும் (Assumptions and Conditions for the use of χ2-test) χ2 -சோதனை செய்முறை (χ2 - test Procedure) χ2- சோதனை பயன்பாடுகள் (χ2 -test Applications)
16. ஈருறுப்பு பரவல் (Binomial Distribution) அறிமுகம் (Introduction) வரையறை (Definition) ஈருறுப்பு பரவலுக்கான ஊகங்கள் (Assumptions for Binomial Distribution) ஈருறுப்பு பரவலின் பண்புகள் (Properties of Binomial Distribution) ஈருறுப்பு சமன்பாட்டின் விரிவாக்கம் (Expansion of Binomial Expression) ஈருறுப்பு நிகழ்தகவு கண்டறியும் தொடர்பெருக்க முறை (Factorial Method of Binomial Probability) ஈருறுப்பு பரவல் பொருத்துதலும் பொருத்தச் சீர்மை சோதனையும் (Fitting a Binomial Distribution and Testing its Goodness-of-fit)
17. பாய்சான் பரவல் (Poisson Distribution) அறிமுகமும் வரையறையும் (Introduction and Definition) பாய்சான் நிகழ்வுகளுக்கு உதாரணங்கள் (Examples of Poisson events) பாய்சான் நிகழ்தகவு பரவல் வருவித்தல் (Derivation of Poisson Distribution) பாய்சான் பரவலின் பண்புகள் (Properties of Poisson Distribution) பாய்சான் பரவலின் பயன்பாடுகள் (Applications of Poisson Distribution)
18. இயல் பரவல் (Normal Distribution)
அறிமுகம் (Introduction)
இயல் வளைகோட்டின் பண்புகள் (Properties of Normal Curve)
இயல் நிகழ்தகவு கணக்கீடு (Computation of Normal Probability)
தகவலுக்கு இயல் வளைகோடு பொருத்துதல் (Fitting Normal Curve for the Data)
19. தொகுப்பு பற்றிய அனுமான கணிப்பு (Inference about Population) அறிமுகம் (Introduction) மாதிரி எடுத்தல் (Sampling) மாதிரியின் அளவு (Sample Size) மாதிரிகளின் பரவல் (Sampling Distribution) அனுமான கணிப்பில் திட்டப்பிழையின் பயன்கள் (Uses of Standard Error in Inference)
20. மாதிரி எடுக்கும் முறைகள் (Sampling Methods) தொகுப்பு (Population) வரையறுக்கப்பட்ட மற்றும் வரையறுக்கப்படாத தொகுப்புகள் (Finite and Infinite Populations) மாதிரி (Sample) மாதிரி எடுத்தல் (Sampling) மாதிரி எடுத்தலின் அவசியம் (Necessity of Sampling) மாதிரி எடுத்தல் முறைகள் (Methods of Sampling)
21. கருதுகோள் சோதித்தல் (Hypothesis Testing) அறிமுகம் (Introduction) கருதுகோளும் இன்மை கருதுகோளும் (Hypothesis and Null-hypothesis) மாதிரிகளின் பரவல் (Sampling Distribution) கணிச மட்டம் (Level of Significance) இன்மை கருதுகோள் பற்றிய முடிவு (Decision about Null-hypothesis)
22. ஸ்டுடென்ட் t-சோதனை (Student's Test) அறிமுகம் (Introduction) ஸ்டுடென்ட் t-பரவல் (t-distribution) t-பரவலின் பயன்பாடுகள் (Applications of t-distribution)
23. வேற்றுமைப் பகுப்பாய்வு (Analysis of Variance - ANOVA) அறிமுகம் (Introduction) அடிப்படைத் தத்துவம் (Principle of ANOVA) வேறுபாட்டினை பிரித்தல் (Partitioning of the Variance) இரு சராசரிகளை ஒப்பிடுதல் (Comparison of Pairs of Means) வேற்றுமைப் பகுப்பாய்வின் அடிப்படை ஊகக் கருத்துக்கள் (Assumptions underlying ANOVA) வேற்றுமைப் பகுப்பாய்வின் பயன்பாடுகள் (Applications of ANOVA)
24. ஒட்டுறவு (Correlation) அறிமுகம் (Introduction) ஒட்டுறவு வகைகள் (Types of Correlation) ஒட்டுறவை அறியும் முறைகள் (Methods of Study of Correlation) ஒட்டுரவுக் கெழுவின் கணிசத்தை சோதித்தல் (Testing the Significance of the Correlation Coefficient)
25. தொடர்புப்போக்கு (Regression) அறிமுகம் (Introduction) தொடர்புப்போக்கின் சமன்பாடுகள் (Regression Equations) தொடர்புப்போக்கு கோடுகள் (Regression Lines) தொடர்புப்போக்கு கோடுகளின் பண்புகள் (Properties of Regression Lines) ஒட்டுரவுக்கும் தொடர்புப்போக்கிற்குமான வேறுபாடுகள் (Differences between Correlation and Regression)
26. மக்கள் தொகையியல் (Demography) வரையறை (Definition) மக்கள் தொகை கணக்கெடுப்பு (Census) உயிர்நிலைப் புள்ளிவிவரம் (Vital Statistics) மக்கள் தொகை வளர்ச்சியும் மதிப்பீடும் (Population Growth and Estimation) மக்கள் தொகை முன்கணிப்பு (Population Forecast) உயிர்நிலை புள்ளிவிவர வீதங்கள் (பிறப்பு இறப்பு வீதங்கள்) (Vital Statistics Rates - Natality and Mortality Rates)
1. அறிமுகம் உயிர்ப்புள்ளியியல் என்றால் புள்ளியியல் முறைகளை உயிரியல் தேவைகளுக்கு உபயோகிப்பதாகும். புள்ளியியல் என்பது இயற்கை நிகழ்வுகளிலிருந்து பெறப்பட்ட எண்சார் தகவல்களை விஞ்ஞான முறைப்படி ஆழ்ந்து அறிவதாகும். விஞ்ஞான முறைப்படி அறிவது என்பது தகவல்களை விருப்பு வெறுப்பின்றி பதிவிட்டு மதிப்பிடுவதாகும். தகவல் அல்லது தகவல்கள் (Data) எண்ணிக்கையிலான (numerical) விவரங்கள் மட்டுமே. புள்ளியியல், தொகுப்பு அல்லது தொகை (Population) சம்பத்தப்பட்டது; தனியொரு விவரத்தை அது கருத்தில் கொள்ளாது. உதரணமாக, ஒரேயொரு தவளையின் எடையையோ, அல்லது ஒரேயொரு உருளைக்கிழங்கின் எடையையோ அது கருத்தில் கொள்ளாது. தவளிகளின், அதாவது, ஒரு தவளைத் தொகையின் எடைகள் (a population of frogs weights) அல்லது ஓர் உருளைக்கிழங்கு தொகையின் எடைகளை (a population of potato weights) மட்டுமே அது கணிக்கும். ஒரு தகவல், புள்ளியியல் அடிப்படையில் ஆயப்பட வேண்டுமென்றால், அத்தகவல் எண்ணிக்கையிலான தகவலாக (numerical data) இருக்க வேண்டும். அப்படியான எண்ணிக்கைகள், அளவைகள் (measurements) மூலமாகவோ (உ-ம்., மீனின் எடை g-ல், செடியின் உயரம் cm-ல், திரவத்தின் கொள்ளளவு ml-ல்) அல்லது எண்ணுதல் (counting) மூலமாகவோ (உ-ம்., ஒரு குடும்பத்தில் உள்ள நபர்களின் எண்ணிக்கை, ஒரு பப்பாளியில் உள்ள விதைகளின் எண்ணிக்கை) பெறப்பட்டதாக இருக்க வேண்டும். புள்ளியியலுக்கான எண்ணிக்கை தகவல்கள் இயற்கையாக நிகழும் நிகழ்வுகளிலிருந்து பெறப்பட்டதாக இருக்கவேண்டும். இயற்கையில் உள்ள உயிருள்ள அல்லது உயிரற்ற பொருள்களில் (இயற்பியல், வேதியியல் உயிரியல்) நிகழும் அத்தனை நிகழ்வுகளுமே இயற்கை நிகழ்வுகள்தாம் (natural phenomena). பரிசோதனைக் கூடங்களில் பெறப்படும் எண்ணிக்கையிலான முடிவுகளும் இயற்கை நிகழ்விலிருந்து பெறப்பட்ட எண்ணிக்கையாகவே கருதப்படும். மனிதனின் கற்பனையில் உதிக்கும் எண்களோ அல்லது அவன் நிர்ணயிக்கும் எண்களோ இயற்கையிலிருந்து கிடைத்தவையாக கருதப்படாது. புள்ளிவிவரம் (statistics) என்ற சொல் இரண்டு அர்த்தங்களில் பயன்படுத்த படுகிறது. பொதுவாக, வகைப்படுத்தப்பட்ட தகவல்களை புள்ளிவிவரம் என்று சொல்வதுண்டு. இரண்டாவதாக, தகவல்களை விவரிப்பதற்காக கணக்கிடப்படும் எண்களை (உ.ம்., சராசரி, திட்டவிலக்கம்) புள்ளிவிவரம் என்பர் குறிப்பிடுவதுண்டு. உயிரியல் மாணவர்களுக்கு மட்டுமல்லாமல் அனைத்து அறிவியல் மாணவர்களுக்கும் புள்ளியியல் ஓர் அடிப்படை தேவையாகும். ஓர் உயிரியலாளர் தான் பார்த்ததை அல்லது கண்டுபிடித்ததை எண்ணிக்கை அடிப்படையில் சொல்லி விளக்க முடியாவிட்டால், அவரது கண்டறிவும், கண்டுபிடிப்பும், கணிப்பும் திருப்திகரமானதாக இருக்க வாய்ப்பில்லை. மேலும், குறைந்தபட்ச புள்ளியியல் அறிவு இல்லாமல் உயிரில் மாணவர்களால் ஆராய்சிகளில் பங்கேற்கவோ, விஞ்ஞான சஞ்சிகைகளின் கட்டுரைகளை சரியாகப் புரிந்துகொள்வதோ மிகக்கடினம். இக்கட்டுரையின் நோக்கம் அனைத்து உயிரியல் (தாவரவியல், விலங்கியல், நுண்ணுயிரியல், உயிர்வேதியியல், உயிர்த்தொழில்நுட்பவியல், வேளாண்மையியல், கால்நடைவளவியல், மருத்துவவியல், இன்ன பிற) மாணவர்களும் (இளங்கலை, முதுகலை, ஆராய்ச்சி) பயன்பெற புள்ளியியல் அடிப்படை கோட்பாடுகளை எளிய தமிழில் விளக்குவதாகும்.
2. தொகையும் மாதிரியும் (Population and Sample) 2.1 தகவல் (data, தரவு, தரவுகள், விவரம், தகவல் கூறுகள்) என்பது நிகழ்வு செய்திகளின் (events) தொகுப்பு. அது ஒரு தொகையிலிருந்து (population) சேகரிக்கப்படுகிறது. இங்கு, தொகை என்பது மக்கள் அல்லது விலங்குகள் தொகையை குறிப்பிடாது. அது, புள்ளிவிவரத் தொகையாகும் (statistical population). தொகை வரையறை: எந்த நிகழ்வைப்பற்றி ஆராய்ந்து அறிந்துகொள்ளப் போகிறோமோ அந்நிகழ்வின் ஒவ்வொரு கண்டறிவின் (individual observation) மொத்த தொகுப்பே தொகையாகும். அந்நிகழ்வு, உலகத்தின் எப்பகுதியிலும் எந்நேரத்திலும் நிகழ்ந்திருக்கலாம். அல்லது, குறிப்பிட்ட வரையறுக்கப்பட்ட எல்லைக்குள்ளும் நேரத்திற்குள்ளும் நிகழ்ந்திருக்கலாம். எடுத்துக்காட்டாக, நாம் ஒருவகை மீனின் (கட்லா) எடையைப் பற்றி அறிந்துகொள்ள வேண்டியிருந்தால், இந்த ஆய்வின் புள்ளிவிவரத் தொகை இப்புவியில் உள்ள கட்லா மீன்களின் தனித் தனி எடைகள் அனைத்தையும் உள்ளடக்கும். புரிந்து கொள்ளவேண்டியது, இந்த புள்ளிவிவரத் தொகை, அனைத்து கட்லா மீன்களின் எடைகளே தவிர அனைத்து கட்லா மீன்கள் அல்ல. இவ்வுலகில் எத்தனை கட்லா மீன்கள் உள்ளனவோ அத்தனை எடைகள் இருக்கும். நம் நோக்கம் பூமியிலுள்ள அத்தனை கட்லாக்களின் எடை பற்றியதல்ல; இந்தியாவில் தமிழ்நாட்டிலுள்ள ஒரு குறிப்பிட்ட ஏரியில் வாழும் கட்லா மீன்களின் எடையைப் பற்றி மட்டும் அறிந்துகொள்வதுதான். ஆகவே, நாம் தொகை என்று குறிப்பிடும்போது, அதை மிகத்தெளிவாக வரையறுக்கவேண்டும். அதாவது, மாதிரி எடுக்கும் இடம், எல்லைகள், நேரம் போன்ற விவரகளை தெளிவாக, விரிவாக விவரிக்க வேண்டும். கட்லா மீன் எடையை பாதிக்கக்கூடிய காரணிகள் நிறைய உள்ளன. மீனின் வயது, பால் (ஆண், பெண்), முதிர்ச்சி நிலை, என்ன வகையான உணவு அம்மீன்களுக்கு கிடைக்கின்றன, போன்றவை சில காரணிகளாகும். ஆகவே, தொகையை வரையறுக்கும்போது, மாதிருக்கு எடுக்கப்பட்ட மீன்கள் எவ்வாறு பிடிக்கப்பட்டன (உ.ம்., வலையா, தூண்டிலா?), எந்நேரத்தில் பிடிக்கப்பட்டன (உ.ம். வருடம், மாதம், தேதி, பொழுது), முதிர்ச்சியடைந் மீன்களா, ஆண் மீன்களா, பெண் மீன்களா, முதிர்ச்சி அடையாத மீன்களா, போன்ற அனைத்து எடையை பாதிக்கும் காரணிகளையும் தெளிவாக குறிப்பிடவேண்டும். இவ்வாறான வரையறுத்தல் ஆய்வை தொடங்குவதற்கு முன்பே செய்யப்படவேண்டிய ஒன்றாகும்.
புள்ளியியல் தொகை இருவகைப் படும்: முடிவுடைய தொகைகள் மற்றும் முடிவில்லாத தொகைகள்
2.1.1 முடிவுடைய தொகை (Finite Population): ஒரு தொகையில் உள்ள அனைத்து தனித்தனி கண்டறியும் அளவுகளின் (individual observations) எண்ணிக்கை தெரியுமானால், அத்தொகை முடிவுடைய தொகையாகும். உதரணமாக, ஓர் மீன் வளர்ப்புக் குட்டையில் 5000 கட்லா மீன்கள் இருக்குமேயானால், இந்த மீன்களின் எடைகளின் தொகை முடிவுடைய தொகை ஆகும்.
2.1.2. முடிவில்லாத தொகை (Infinite Population): ஒரு தொகையில் உள்ள அனைத்து தனித்தனி கண்டறியும் அளவுகளின் எண்ணிக்கை தெரியாவிட்டலோ அல்லது எண்ணிக்கையிலடங்காத அளவு பெரிதாக இருந்தாலோ அத்தொகை முடிவில்லாத தொகை எனப்படும். உதரணமாக, வங்காள விரிகுடாவின் நீர் வெப்பநிலையை (temperature) அறிய விரும்புகிறோம். எத்தனை வெப்பநிலைகள் இக்கடலின் இருக்க முடியும்? அது எண்ணிலடங்காது. ஆகவே, வங்காள விரிகுடாவின் நீர் வெப்பநிலையின் தொகை ஓர் முடிவில்லாத தொகை ஆகும். முடிவானதோ அல்லது முடிவில்லாததோ, தொகை எப்பொழுதும் மிகப் பெரியது. அத்தொகையில் உள்ள ஒவ்வொரு அலகிலிருந்தும் (unit) தகவல் சேகரிப்பதென்பது இயலாத ஒன்று. ஆகவே, ஒரு தொகையை ஆய வேண்டுமென்றால், அத்தொகையிலிருந்து மாதிரி (sample) எடுத்து, அம்மாதிரியை ஆராய்ந்து, அதில் கிடைக்கும் முடிவுகளின் அடிப்படியில், அத்தொகையைப் பற்றிய கணிப்பை செய்யவேண்டும்.
2.2 மாதிரியும் (பதக்கூறு, பதம்) மாதிரி எடுக்கும் முறையும் மாதிரி என்பது எந்தத் தொகையைப் பற்றி கணிப்புகள் செய்யப்பட வேண்டுமோ அந்தத் தொகையிலிருந்து ஒரு குறிப்பிட்ட முறையில் எடுக்கப்பட்ட தனித்தனி கண்டறிவுகளின் திரட்டல் (collection) ஆகும். ஆகவே, மாதிரி தொகையின் உட்கணம் (subset, subgroup) ஆகும். மாதிரி எடுத்தல் என்றால் தொகையிலிருந்து மாதிரி எடுக்கும் செயல்முறை ஆகும். மாதிரி எடுத்தலின் முக்கிய நோக்கம் ஓர் தொகையின் குணாதிசயங்களையும் அதன் செயல்பாடுகளையும் மிகக் குறைந்த பண, நேர, சக்தி விரையங்களுடன் முடிந்த அளவு தெரிந்து கொள்வதாகும். அதாவது, ஓர் தொகையின் வரைகூறுகள் (parameters) பற்றி மாதிரி புள்ளிவிவரங்களின் உதவியோடு கணிப்பதாகும். மாதிரி எடுத்தல் கோட்பாடு இரு முக்கிய தத்துவங்களின் அடிப்படையை சார்ந்துள்ளது. அக்கோட்பாடுகள்: (1) புள்ளியியல் ஒழுங்குமுறை நியதி (law of statistical regularity); (2) மிகப்பெரும் எண்களின் நிலைமம் (மாறாமை, inertia) நியதி (law of inertia of large numbers). 2.2.1 புள்ளியியல் ஒழுங்குமுறை நியதி (law of statistical regularity): இயற்கையில் ஒவ்வொரு நிகழ்வும் ஒரு வியக்கதகு ஒழுங்குமுறையில் நடைபெறுகின்றது. உதரணமாக, 4000 மாணவர்கள் கல்லூரியிலிருந்து, 50 மாணவர்களை ஒரு சமவாய்ப்பு மாதிரியாக (random sample) எடுப்போமேயானால், இம்மாதிரியின் சராசரி உயரம் (மாதிரி புள்ளிவிவரம், sample statistic) அக்கல்லூரி மாணவத் தொகையின் சராசரியிலிருந்து (தொகை பண்பளவு, population parameter) குறிப்பிடத்தக்க அளவு வேறுபடாது. இது, புள்ளியியல் ஒழுங்குமுறை நியதியின் வெளிப்பாடு. ஒரு சார்பற்ற மாதிரி, அதன் தொகையின் அனைத்து குணாதிசயங்களையும் பிரதிபலிக்கும். 2.2.2. மிகப்பெரும் எண்களின் நிலைமம் நியதி (Law of Inertia of Large Numbers): புள்ளியியல் ஒழுங்குமுறை நியதியின் தொடர்ச்சியே மிகப்பெரும் எண்களின் நிலைம நியதி. ஒரு தொகையில் உள்ள தனித்தனி உருப்படிகளில் மாற்றங்கள் ஏற்படலாம். ஆனால், அத்தொகை முழுமையாகப் பார்க்கப்படும்பொழுது அம்மாற்றங்கள் குறிப்பிடப்படும்படியாக இருக்காது. ஏனென்றால், ஒரு தொகையில், மாற்றங்கள் படிப்படியாக வளர்வதில்லை; மாறாக, அவை ஒன்றுக்கொன்று ஈடு செய்துகொள்ளும். இதுதான், மிகப்பெரும் எண்களின் நிலைமம் எனப்படுகிறது. இதன் பொருள், மிகப்பெரும் எண்கள் மிகமிக மெதுவாகவே மாறுகின்றன.