Concept of random sampling, sampling fluctuations,…..
Statistics MCQ Quiz (XI-XII)
প্রশ্ন ১: একটি পরিসংখ্যানের প্রমিত ত্রুটি (standard error) কী পরিমাপ করে? Question 1: What does the standard error of a statistic measure?
নমুনার গড় The mean of the sample
পরিসংখ্যানটির নমুনায়ন বিভাজনের সম্যক বিচ্যুতি The standard deviation of the sampling distribution of the statistic
সমগ্রকের (population) ভেদাঙ্ক The variance of the population
নমুনা এবং সমগ্রকের গড়ের মধ্যে পার্থক্য The difference between sample and population mean
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: প্রমিত ত্রুটি হলো একটি পরিসংখ্যানের (যেমন নমুনা গড়) নমুনায়ন বিভাজনের সম্যক বিচ্যুতি। এটি পরিমাপ করে যে নমুনা থেকে গণনা করা পরিসংখ্যানটি সমগ্রকের প্রকৃত প্যারামিটার থেকে কতটা ভিন্ন হতে পারে। এটি স্যাম্পলিং ফ্লাকচুয়েশন বা নমুনায়ন বিচ্যুতির একটি পরিমাপ।
Explanation: The standard error is the standard deviation of the sampling distribution of a statistic (like the sample mean). It measures how much the statistic, calculated from a sample, is likely to vary from the true population parameter. It is a measure of sampling fluctuation.
প্রশ্ন ২: নমুনায়ন বিচ্যুতি (Sampling Fluctuation) বলতে কী বোঝায়? Question 2: What is meant by Sampling Fluctuation?
সমগ্রকের প্যারামিটারের পরিবর্তন The variation of population parameters
পরিমাপের ত্রুটি Errors in measurement
একই সমগ্রক থেকে নেওয়া বিভিন্ন নমুনার পরিসংখ্যানের মধ্যে ভিন্নতা The variation in the values of a statistic from different samples taken from the same population
ব্যাখ্যা: দৈব চয়নের (random sampling) কারণে, একই সমগ্রক থেকে নেওয়া বিভিন্ন নমুনার জন্য গণনা করা পরিসংখ্যান (যেমন গড়, মধ্যক) সাধারণত ভিন্ন হয়। এই ভিন্নতাকেই নমুনায়ন বিচ্যুতি বা স্যাম্পলিং ফ্লাকচুয়েশন বলা হয়।
Explanation: Due to random chance, the statistics (like mean, median) calculated from different samples drawn from the same population will generally differ. This variation is known as sampling fluctuation.
প্রশ্ন ৩: যদি X₁, X₂ দুটি স্বাধীন দ্বিপদ চলক (Binomial variates) হয় যেখানে X₁ ~ B(n₁, p) এবং X₂ ~ B(n₂, p), তাহলে X₁ + X₂-এর বিভাজন কী হবে? Question 3: If X₁ and X₂ are two independent Binomial variates with X₁ ~ B(n₁, p) and X₂ ~ B(n₂, p), what will be the distribution of X₁ + X₂?
B(n₁ + n₂, 2p)
B(n₁n₂, p²)
B(n₁ + n₂, p)
Poisson(n₁p + n₂p)
সঠিক উত্তর (Correct Answer): (c)
ব্যাখ্যা: দ্বিপদ বিভাজনের একটি গুরুত্বপূর্ণ ধর্ম হলো এর যোজ্যতা (additive property)। যদি একাধিক স্বাধীন দ্বিপদ চলকের সাফল্যের সম্ভাবনা ‘p’ একই থাকে, তাহলে তাদের যোগফলও একটি দ্বিপদ চলক হবে, যার চেষ্টার সংখ্যা (number of trials) হবে মূল চলকগুলির চেষ্টার সংখ্যার যোগফলের সমান এবং সাফল্যের সম্ভাবনা ‘p’ অপরিবর্তিত থাকবে।
Explanation: A key property of the Binomial distribution is its additive property. If multiple independent Binomial variates have the same probability of success ‘p’, their sum will also be a Binomial variate, where the number of trials is the sum of the individual trials, and the probability ‘p’ remains the same.
প্রশ্ন ৪: যদি X₁, X₂ দুটি স্বাধীন পয়সোঁ চলক (Poisson variates) হয় যেখানে X₁ ~ P(λ₁) এবং X₂ ~ P(λ₂), তাহলে X₁ + X₂-এর বিভাজন কী হবে? Question 4: If X₁ and X₂ are two independent Poisson variates with X₁ ~ P(λ₁) and X₂ ~ P(λ₂), what will be the distribution of X₁ + X₂?
P(λ₁λ₂)
P(λ₁ + λ₂)
Binomial(λ₁, λ₂)
Normal(λ₁ + λ₂, λ₁ + λ₂)
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: পয়সোঁ বিভাজনেরও যোজ্যতা ধর্ম রয়েছে। দুটি স্বাধীন পয়সোঁ চলকের যোগফল একটি নতুন পয়সোঁ চলক হয়, যার প্যারামিটার (গড়) হবে মূল চলকগুলির প্যারামিটারের যোগফলের সমান।
Explanation: The Poisson distribution also has the additive property. The sum of two independent Poisson variates is a new Poisson variate whose parameter (mean) is the sum of the parameters of the original variates.
প্রশ্ন ৫: একটি কেন্দ্রীয় কাই-স্কোয়ার (Central Chi-square) বিভাজনের স্বাধীনতার মাত্রা (degrees of freedom) ‘n’ হলে, এর গড় (mean) কত? Question 5: If a central Chi-square distribution has ‘n’ degrees of freedom, what is its mean?
n/2
2n
n
n²
সঠিক উত্তর (Correct Answer): (c)
ব্যাখ্যা: একটি কাই-স্কোয়ার (χ²) বিভাজনের গড় তার স্বাধীনতার মাত্রার সমান। অর্থাৎ, E(χ²ₙ) = n। এর ভেদাঙ্ক (variance) হলো 2n।
Explanation: The mean of a Chi-square (χ²) distribution is equal to its degrees of freedom. That is, E(χ²ₙ) = n. Its variance is 2n.
প্রশ্ন ৬: স্টুডেন্ট-এর টি-ডিস্ট্রিবিউশন (Student’s t-distribution) কখন ব্যবহৃত হয়? Question 6: When is Student’s t-distribution used?
যখন নমুনার আকার বড় (n > 30) এবং সমগ্রকের ভেদাঙ্ক জানা থাকে। When the sample size is large (n > 30) and population variance is known.
যখন সমগ্রকের বিভাজন অজানা থাকে। When the population distribution is unknown.
যখন সমগ্রকটি নর্মাল এবং নমুনার আকার ছোট (n < 30) ও সমগ্রকের ভেদাঙ্ক অজানা থাকে। When the population is normal, sample size is small (n < 30), and population variance is unknown.
কেবলমাত্র দুটি সমগ্রকের ভেদাঙ্কের অনুপাত পরীক্ষা করার জন্য। Only for testing the ratio of two population variances.
সঠিক উত্তর (Correct Answer): (c)
ব্যাখ্যা: টি-ডিস্ট্রিবিউশন প্রধানত ছোট নমুনার (সাধারণত n < 30) ক্ষেত্রে ব্যবহৃত হয়, যখন মূল সমগ্রকটি নর্মাল (বা প্রায় নর্মাল) কিন্তু এর ভেদাঙ্ক (σ²) অজানা থাকে। তখন σ² এর পরিবর্তে নমুনার ভেদাঙ্ক (s²) ব্যবহার করা হয়।
Explanation: The t-distribution is primarily used for small samples (typically n < 30) when the underlying population is normal (or nearly normal) but its variance (σ²) is unknown. In such cases, the sample variance (s²) is used as an estimate for σ².
প্রশ্ন ৭: F-ডিস্ট্রিবিউশন প্রধানত কীসের জন্য ব্যবহৃত হয়? Question 7: What is the F-distribution primarily used for?
একটি একক সমগ্রকের গড় পরীক্ষা করতে। Testing the mean of a single population.
দুটি স্বাধীন নর্মাল সমগ্রকের ভেদাঙ্কের সমতা পরীক্ষা করতে। Testing the equality of variances of two independent normal populations.
সম্পর্ক সহগ (correlation coefficient) পরীক্ষা করতে। Testing the correlation coefficient.
নমুনার আকারের তাৎপর্য পরীক্ষা করতে। Testing the significance of the sample size.
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: F-পরিসংখ্যান দুটি স্বাধীন কাই-স্কোয়ার চলকের অনুপাত (তাদের নিজ নিজ স্বাধীনতার মাত্রা দিয়ে ভাগ করে) হিসাবে সংজ্ঞায়িত করা হয়। এটি প্রধানত দুটি নর্মাল সমগ্রকের ভেদাঙ্কের সমতা পরীক্ষা করার জন্য এবং ANOVA-তে একাধিক গ্রুপের গড়ের সমতা পরীক্ষা করার জন্য ব্যবহৃত হয়।
Explanation: The F-statistic is defined as the ratio of two independent chi-square variables divided by their respective degrees of freedom. It is primarily used to test the equality of variances of two normal populations and also in ANOVA to test the equality of means of multiple groups.
প্রশ্ন ৮: একটি নর্মাল সমগ্রক N(μ, σ²) থেকে নেওয়া n আকারের নমুনার গড়ের (sample mean, x̄) নমুনায়ন বিভাজন কী? Question 8: What is the sampling distribution of the sample mean (x̄) from a sample of size n taken from a normal population N(μ, σ²)?
N(μ, σ²)
N(μ, σ²/n)
t-distribution with n-1 df
χ²-distribution with n df
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: যদি একটি দৈব নমুনা একটি নর্মাল সমগ্রক থেকে নেওয়া হয়, তবে নমুনা গড়ের (x̄) নমুনায়ন বিভাজনও নর্মাল হবে। এর গড় হবে সমগ্রকের গড়ের সমান (μ) এবং এর ভেদাঙ্ক হবে সমগ্রকের ভেদাঙ্ককে নমুনার আকার দিয়ে ভাগ করার সমান (σ²/n)।
Explanation: If a random sample is drawn from a normal population, the sampling distribution of the sample mean (x̄) will also be normal. Its mean will be the same as the population mean (μ), and its variance will be the population variance divided by the sample size (σ²/n).
প্রশ্ন ৯: যদি Z₁, Z₂, …, Zₙ স্বাধীন এবং প্রত্যেকটি N(0, 1) অনুসরণ করে, তাহলে Σ(Zᵢ²) কোন বিভাজন অনুসরণ করবে? Question 9: If Z₁, Z₂, …, Zₙ are independent and each follows N(0, 1), then what distribution will Σ(Zᵢ²) follow?
N(0, n)
t-distribution with n df
F-distribution with (n, n) df
Chi-square distribution with n df
সঠিক উত্তর (Correct Answer): (d)
ব্যাখ্যা: কাই-স্কোয়ার বিভাজনের সংজ্ঞা অনুসারে, ‘n’ সংখ্যক স্বাধীন স্ট্যান্ডার্ড নর্মাল চলকের (N(0,1)) বর্গের যোগফল একটি কাই-স্কোয়ার (χ²) বিভাজন অনুসরণ করে, যার স্বাধীনতার মাত্রা (degrees of freedom) ‘n’।
Explanation: By definition of the Chi-square distribution, the sum of squares of ‘n’ independent standard normal variates (N(0,1)) follows a Chi-square (χ²) distribution with ‘n’ degrees of freedom.
প্রশ্ন ১০: Student’s ratio, t = (x̄ – μ) / (s / √n) – এই রাশিতে ‘s’ কী নির্দেশ করে? Question 10: In the Student’s ratio, t = (x̄ – μ) / (s / √n), what does ‘s’ represent?
সমগ্রকের সম্যক বিচ্যুতি (Population standard deviation)
নমুনা ভেদাঙ্ক (Sample variance)
নমুনা সম্যক বিচ্যুতি (Sample standard deviation)
নমুনা প্রসার (Sample range)
সঠিক উত্তর (Correct Answer): (c)
ব্যাখ্যা: Student’s t-statistic-এ ‘s’ হলো নমুনার সম্যক বিচ্যুতি, যা সমগ্রকের অজানা সম্যক বিচ্যুতি ‘σ’-এর একটি প্রাক্কলন (estimate)। এর সূত্র হলো s = √[Σ(xᵢ – x̄)² / (n-1)]।
Explanation: In the Student’s t-statistic, ‘s’ is the sample standard deviation, which is an estimate of the unknown population standard deviation ‘σ’. Its formula is s = √[Σ(xᵢ – x̄)² / (n-1)].
প্রশ্ন ১১: যদি X₁, X₂, …, Xₙ একটি অবিচ্ছিন্ন সমগ্রক থেকে নেওয়া একটি দৈব নমুনা হয়, তাহলে X(r) (যেখানে 1 ≤ r ≤ n) কী নির্দেশ করে? Question 11: If X₁, X₂, …, Xₙ is a random sample from a continuous population, what does X(r) (where 1 ≤ r ≤ n) denote?
r-তম কাঁচা পরিঘাত (r-th raw moment)
r-তম ক্রম পরিসংখ্যান (r-th order statistic)
r-তম নমুনা (r-th sample)
r-তম কোয়ান্টাইল (r-th quantile)
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: যখন নমুনার মানগুলিকে ছোট থেকে বড় ক্রমে সাজানো হয়, তখন r-তম অবস্থানে থাকা মানটিকে r-তম ক্রম পরিসংখ্যান বা order statistic বলা হয়। যেমন, X(1) হলো নমুনার সর্বনিম্ন মান (minimum) এবং X(n) হলো সর্বোচ্চ মান (maximum)।
Explanation: When the sample values are arranged in ascending order, the value at the r-th position is called the r-th order statistic. For example, X(1) is the sample minimum and X(n) is the sample maximum.
প্রশ্ন ১২: নমুনার প্রসার (Sample Range) কীভাবে সংজ্ঞায়িত করা হয়? Question 12: How is the Sample Range defined?
X(n) + X(1)
X(n) / X(1)
X(n) – X(1)
(X(n) + X(1))/2
সঠিক উত্তর (Correct Answer): (c)
ব্যাখ্যা: নমুনার প্রসার (Range) হলো নমুনার সর্বোচ্চ মান (n-তম ক্রম পরিসংখ্যান, X(n)) এবং সর্বনিম্ন মানের (প্রথম ক্রম পরিসংখ্যান, X(1)) মধ্যে পার্থক্য।
Explanation: The sample range is the difference between the maximum value (the n-th order statistic, X(n)) and the minimum value (the first order statistic, X(1)) in the sample.
প্রশ্ন ১৩: বড় নমুনার ক্ষেত্রে (large sample), একটি নমুনা কোয়ান্টাইলের (sample quantile) নমুনায়ন বিভাজন প্রায়শই কী ধরনের হয়? Question 13: For a large sample, what is the approximate sampling distribution of a sample quantile?
পয়সোঁ বিভাজন (Poisson distribution)
কাই-স্কোয়ার বিভাজন (Chi-square distribution)
নর্মাল বিভাজন (Normal distribution)
এফ-বিভাজন (F-distribution)
সঠিক উত্তর (Correct Answer): (c)
ব্যাখ্যা: কেন্দ্রীয় সীমা উপপাদ্যের (Central Limit Theorem) একটি সম্প্রসারণ অনুসারে, পর্যাপ্ত বড় নমুনার ক্ষেত্রে, নমুনা কোয়ান্টাইলের (যেমন মধ্যক বা চতুর্থক) নমুনায়ন বিভাজন প্রায় নর্মাল হয়।
Explanation: According to an extension of the Central Limit Theorem, for a sufficiently large sample size, the sampling distribution of a sample quantile (like the median or a quartile) is approximately normal.
প্রশ্ন ১৪: Hotelling’s T² পরিসংখ্যানটি কোন একক-চলক (univariate) পরিসংখ্যানের একটি বহুমাত্রিক (multivariate) সাধারণীকরণ? Question 14: Hotelling’s T² statistic is a multivariate generalization of which univariate statistic?
Z-পরিসংখ্যান Z-statistic
কাই-স্কোয়ার পরিসংখ্যান Chi-square statistic
F-পরিসংখ্যান F-statistic
স্টুডেন্ট-এর t-পরিসংখ্যান Student’s t-statistic
সঠিক উত্তর (Correct Answer): (d)
ব্যাখ্যা: t-পরিসংখ্যান একটি একক সমগ্রকের গড় পরীক্ষা করে। Hotelling’s T² পরিসংখ্যান একাধিক চলকের গড় ভেক্টর (mean vector) নিয়ে একই কাজ করে। তাই এটি t-পরিসংখ্যানের বহুমাত্রিক সংস্করণ। বিশেষ করে, T² এবং t² এর মধ্যে সরাসরি সম্পর্ক বিদ্যমান।
Explanation: The t-statistic tests the mean of a single population. Hotelling’s T² statistic does the same for a mean vector involving multiple variables. Therefore, it is the multivariate version of the t-statistic. Specifically, there’s a direct relationship between T² and t².
প্রশ্ন ১৫: মুখ্য উপাদান বিশ্লেষণের (Principal Component Analysis – PCA) প্রাথমিক লক্ষ্য কী? Question 15: What is the primary goal of Principal Component Analysis (PCA)?
পর্যবেক্ষণগুলিকে বিভিন্ন শ্রেণিতে ভাগ করা To classify observations into groups
একটি নির্ভরশীল চলকের পূর্বাভাস দেওয়া To predict a dependent variable
অসম্পর্কিত নতুন চলক তৈরি করে ডেটার মাত্রা কমানো To reduce the dimensionality of the data by creating new uncorrelated variables
সমগ্রকের গড় সম্পর্কে হাইপোথিসিস পরীক্ষা করা To test hypotheses about population means
সঠিক উত্তর (Correct Answer): (c)
ব্যাখ্যা: PCA একটি ডাইমেনশনালিটি রিডাকশন কৌশল। এটি পরস্পর সম্পর্কযুক্ত চলকগুলিকে এমন কিছু নতুন, অসম্পর্কিত চলকে (মুখ্য উপাদান বা principal components) রূপান্তরিত করে যা মূল ডেটার বেশিরভাগ ভেদাঙ্ককে (variance) ধারণ করে। এর ফলে চলকের সংখ্যা কমে কিন্তু তথ্যের অপচয় ন্যূনতম হয়।
Explanation: PCA is a dimensionality reduction technique. It transforms a set of correlated variables into a set of new, uncorrelated variables (principal components) that capture most of the variance in the original data. This reduces the number of variables while minimizing information loss.
প্রশ্ন ১৬: দুটি চলক সেটের মধ্যে রৈখিক সম্পর্ক পরিমাপ করতে কোন বহুমাত্রিক কৌশল ব্যবহৃত হয়? Question 16: Which multivariate technique is used to measure the linear relationship between two sets of variables?
মুখ্য উপাদান বিশ্লেষণ (Principal Component Analysis)
ফ্যাক্টর বিশ্লেষণ (Factor Analysis)
ক্যানোনিকাল কোরিলেশন (Canonical Correlation)
ক্লাস্টার বিশ্লেষণ (Cluster Analysis)
সঠিক উত্তর (Correct Answer): (c)
ব্যাখ্যা: ক্যানোনিকাল কোরিলেশন অ্যানালাইসিস (CCA) দুটি চলকের সেটের (যেমন, {x₁, x₂} এবং {y₁, y₂, y₃}) মধ্যে সম্পর্ক খুঁজে বের করে। এটি প্রতিটি সেট থেকে চলকের রৈখিক সংমিশ্রণ (linear combinations) তৈরি করে, যাতে এই সংমিশ্রণগুলির মধ্যে পারস্পরিক সম্পর্ক (correlation) সর্বোচ্চ হয়।
Explanation: Canonical Correlation Analysis (CCA) finds the relationship between two sets of variables (e.g., {x₁, x₂} and {y₁, y₂, y₃}). It creates linear combinations of variables from each set in a way that the correlation between these combinations is maximized.
দুটি বিন্দুর মধ্যে ইউক্লিডিয়ান দূরত্ব The Euclidean distance between two points
একটি বিন্দু থেকে একটি ডিস্ট্রিবিউশনের কেন্দ্রের দূরত্ব, চলকগুলির মধ্যে কোরিলেশন বিবেচনা করে The distance of a point from the center of a distribution, considering the correlation between variables
দুটি সমগ্রকের গড়ের মধ্যে পার্থক্য The difference between the means of two populations
দুটি ভেক্টরের মধ্যে কোণ The angle between two vectors
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: মহালানোবিসের দূরত্ব ইউক্লিডিয়ান দূরত্বের একটি উন্নত সংস্করণ। এটি কেবল দুটি বিন্দুর মধ্যে দূরত্ব পরিমাপ করে না, বরং চলকগুলির ভেদাঙ্ক (variance) এবং সহ-ভেদাঙ্ক (covariance) বা কোরিলেশনকেও বিবেচনায় নেয়। এটি আউটলায়ার শনাক্তকরণ এবং ক্লাস্টারিং-এ ব্যাপকভাবে ব্যবহৃত হয়।
Explanation: Mahalanobis distance is an enhanced version of Euclidean distance. It measures the distance between two points not just in space, but also by taking into account the variance and covariance (or correlation) of the variables. It is widely used in outlier detection and clustering.
প্রশ্ন ১৮: Wilk’s Lambda (Λ) ক্রাইটেরিয়ন কীসের জন্য ব্যবহৃত হয়? Question 18: What is the Wilk’s Lambda (Λ) criterion used for?
দুটি একক-চলক গড়ের সমতা পরীক্ষা Testing the equality of two univariate means
দুটি বা ততোধিক গ্রুপের গড় ভেক্টরের সমতা পরীক্ষা (MANOVA) Testing the equality of mean vectors of two or more groups (MANOVA)
একটি একক ভেদাঙ্ক পরীক্ষা Testing a single variance
মাত্রা কমানোর জন্য (Dimensionality reduction) For dimensionality reduction
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: Wilk’s Lambda বহুমাত্রিক ভেদাঙ্ক বিশ্লেষণে (Multivariate Analysis of Variance – MANOVA) ব্যবহৃত একটি গুরুত্বপূর্ণ পরিসংখ্যান। এটি পরীক্ষা করে যে একাধিক গ্রুপের গড় ভেক্টরগুলি (mean vectors) তাৎপর্যপূর্ণভাবে ভিন্ন কিনা। Λ-এর মান 0 থেকে 1 এর মধ্যে থাকে, যেখানে ছোট মান গ্রুপগুলির মধ্যে বড় পার্থক্যের ইঙ্গিত দেয়।
Explanation: Wilk’s Lambda is a crucial statistic used in Multivariate Analysis of Variance (MANOVA). It tests whether the mean vectors of multiple groups are significantly different. The value of Λ ranges from 0 to 1, where smaller values indicate larger differences between groups.
প্রশ্ন ১৯: নমুনা নির্ভরণ সহগ (sample regression coefficient, b) এর নমুনায়ন বিভাজন কী ধরনের হয়, যদি ত্রুটিগুলি (errors) নর্মাল হয়? Question 19: What is the sampling distribution of the sample regression coefficient (b), if the errors are normal?
কাই-স্কোয়ার বিভাজন Chi-square distribution
টি-বিভাজন (t-distribution)
বাইমডাল বিভাজন (Bimodal distribution)
এফ-বিভাজন (F-distribution)
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: সরল রৈখিক নির্ভরণে (simple linear regression), যদি ত্রুটিপদগুলি (error terms) স্বাধীন এবং নর্মালভাবে বণ্টিত হয়, তবে নমুনা নির্ভরণ সহগ ‘b’-এর তাৎপর্য পরীক্ষা করার জন্য ব্যবহৃত পরিসংখ্যানটি একটি টি-বিভাজন অনুসরণ করে, যার স্বাধীনতার মাত্রা n-2।
Explanation: In simple linear regression, if the error terms are independent and normally distributed, the statistic used to test the significance of the sample regression coefficient ‘b’ follows a t-distribution with n-2 degrees of freedom.
প্রশ্ন ২০: (n-1)S²/σ² রাশিটি কোন বিভাজন অনুসরণ করে, যেখানে S² হলো একটি নর্মাল সমগ্রক থেকে নেওয়া n আকারের নমুনার ভেদাঙ্ক? Question 20: What distribution does the quantity (n-1)S²/σ² follow, where S² is the sample variance from a sample of size n from a normal population?
n-1 স্বাধীনতার মাত্রা সহ টি-বিভাজন t-distribution with n-1 df
n স্বাধীনতার মাত্রা সহ কাই-স্কোয়ার বিভাজন Chi-square distribution with n df
n-1 স্বাধীনতার মাত্রা সহ কাই-স্কোয়ার বিভাজন Chi-square distribution with n-1 df
(n-1, n-1) স্বাধীনতার মাত্রা সহ এফ-বিভাজন F-distribution with (n-1, n-1) df
সঠিক উত্তর (Correct Answer): (c)
ব্যাখ্যা: এটি নর্মাল সমগ্রক থেকে নমুনায়নের একটি মৌলিক উপপাদ্য। নর্মাল সমগ্রক N(μ, σ²) থেকে নেওয়া n আকারের নমুনার জন্য, রাশি (n-1)S²/σ² একটি কাই-স্কোয়ার বিভাজন অনুসরণ করে যার স্বাধীনতার মাত্রা (n-1)। এই সম্পর্কটি সমগ্রকের ভেদাঙ্ক σ² সম্পর্কে হাইপোথিসিস পরীক্ষা এবং আস্থা অন্তর (confidence interval) নির্মাণে ব্যবহৃত হয়।
Explanation: This is a fundamental theorem of sampling from a normal population. For a sample of size n from a normal population N(μ, σ²), the quantity (n-1)S²/σ² follows a Chi-square distribution with (n-1) degrees of freedom. This relationship is used for hypothesis testing and constructing confidence intervals for the population variance σ².
প্রশ্ন ২১: যদি X₁ এবং X₂ দুটি স্বাধীন গামা চলক হয়, যেখানে X₁ ~ Gamma(α₁, β) এবং X₂ ~ Gamma(α₂, β), তাহলে X₁ + X₂ -এর বিভাজন কী হবে? Question 21: If X₁ and X₂ are two independent Gamma variates with X₁ ~ Gamma(α₁, β) and X₂ ~ Gamma(α₂, β), what is the distribution of X₁ + X₂?
Gamma(α₁ + α₂, 2β)
Gamma(α₁α₂, β)
Gamma(α₁ + α₂, β)
Exponential(α₁ + α₂)
সঠিক উত্তর (Correct Answer): (c)
ব্যাখ্যা: গামা বিভাজনের একটি গুরুত্বপূর্ণ যোজ্যতা ধর্ম রয়েছে। যদি একাধিক স্বাধীন গামা চলকের স্কেল প্যারামিটার (scale parameter) ‘β’ একই থাকে, তবে তাদের যোগফলও একটি গামা চলক হবে। নতুন গামা চলকের শেপ প্যারামিটার (shape parameter) হবে মূল চলকগুলির শেপ প্যারামিটারগুলির যোগফলের সমান (α₁ + α₂) এবং স্কেল প্যারামিটার ‘β’ অপরিবর্তিত থাকবে।
Explanation: The Gamma distribution has an important additive property. If multiple independent Gamma variates have the same scale parameter ‘β’, their sum is also a Gamma variate. The new shape parameter will be the sum of the original shape parameters (α₁ + α₂), and the scale parameter ‘β’ remains the same.
প্রশ্ন ২২: দুটি স্বাধীন এবং সমভাবে বণ্টিত (i.i.d.) আয়তক্ষেত্রাকার বা ইউনিফর্ম চলকের (Uniform on [0,1]) যোগফলের বিভাজন কী? Question 22: What is the distribution of the sum of two independent and identically distributed (i.i.d.) rectangular or uniform variables (Uniform on [0,1])?
নর্মাল বিভাজন (Normal distribution)
ত্রিভুজাকার বিভাজন (Triangular distribution)
আর একটি ইউনিফর্ম বিভাজন (Another Uniform distribution)
বিটা বিভাজন (Beta distribution)
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: দুটি স্বাধীন এবং সমভাবে বণ্টিত U(0,1) চলকের যোগফলের বিভাজন একটি ত্রিভুজাকার বিভাজন অনুসরণ করে, যার শীর্ষবিন্দু (peak) x=1-এ থাকে এবং এর সীমা [0, 2] হয়। এটি একটি ক্লাসিক কনভোলিউশন (convolution) সমস্যা।
Explanation: The sum of two i.i.d. U(0,1) variables follows a triangular distribution, which peaks at x=1 and is defined on the interval [0, 2]. This is a classic convolution problem.
প্রশ্ন ২৩: একটি অ-কেন্দ্রীয় কাই-স্কোয়ার (Non-central Chi-square) বিভাজনের ক্ষেত্রে অতিরিক্ত কোন প্যারামিটারটি থাকে, যা কেন্দ্রীয় বিভাজনে থাকে না? Question 23: What additional parameter does a Non-central Chi-square distribution have that a central one does not?
ব্যাখ্যা: কেন্দ্রীয় কাই-স্কোয়ার বিভাজন শুধুমাত্র স্বাধীনতার মাত্রা (df) দ্বারা নির্ধারিত হয়। এটি স্ট্যান্ডার্ড নর্মাল চলক (গড়=0) থেকে উদ্ভূত হয়। অ-কেন্দ্রীয় কাই-স্কোয়ার বিভাজনটি অ-শূন্য গড় (non-zero mean) বিশিষ্ট নর্মাল চলকের বর্গের যোগফল থেকে আসে। এই গড়গুলির প্রভাব একটি অতিরিক্ত প্যারামিটার, অ-কেন্দ্রীয়তা প্যারামিটার (λ), দ্বারা পরিমাপ করা হয়।
Explanation: A central chi-square distribution is defined only by its degrees of freedom (df). It arises from standard normal variables (mean=0). A non-central chi-square distribution arises from the sum of squares of normal variables with non-zero means. The effect of these means is captured by an additional parameter, the non-centrality parameter (λ).
প্রশ্ন ২৪: দুটি স্বাধীন নর্মাল সমগ্রক N(μ₁, σ₁²) এবং N(μ₂, σ₂²) থেকে নেওয়া n₁ ও n₂ আকারের নমুনার গড় যথাক্রমে x̄₁ এবং x̄₂ হলে, x̄₁ – x̄₂ এর নমুনায়ন বিভাজন কী হবে? Question 24: If x̄₁ and x̄₂ are the means of samples of size n₁ and n₂ from two independent normal populations N(μ₁, σ₁²) and N(μ₂, σ₂²) respectively, what is the sampling distribution of x̄₁ – x̄₂?
Explanation: A linear combination of two independent normal variables is also a normal variable. We have x̄₁ ~ N(μ₁, σ₁²/n₁) and x̄₂ ~ N(μ₂, σ₂²/n₂). Therefore, E(x̄₁ – x̄₂) = E(x̄₁) – E(x̄₂) = μ₁ – μ₂. Since the variables are independent, Var(x̄₁ – x̄₂) = Var(x̄₁) + Var(x̄₂) = σ₁²/n₁ + σ₂²/n₂. Hence, the distribution is N(μ₁ – μ₂, σ₁²/n₁ + σ₂²/n₂).
প্রশ্ন ২৫: দ্বিচলক নর্মাল সমগ্রক (bivariate normal population) থেকে নেওয়া নমুনায় সম্পর্ক সহগ (correlation coefficient) r-এর তাৎপর্য পরীক্ষা করার জন্য (অর্থাৎ, H₀: ρ=0) কোন পরিসংখ্যান ব্যবহার করা হয়? Question 25: To test the significance of the sample correlation coefficient r (i.e., H₀: ρ=0) from a bivariate normal population, which statistic is used?
t = r * √(n-2) / √(1-r²)
F = r² / (1-r²)
Z = r / √(1/n)
χ² = (n-1)r²
সঠিক উত্তর (Correct Answer): (a)
ব্যাখ্যা: যখন শূন্য প্রকল্প (null hypothesis) হয় যে সমগ্রকের সম্পর্ক সহগ ρ=0, তখন নমুনা সম্পর্ক সহগ r থেকে গণনা করা t = r * √(n-2) / √(1-r²) পরিসংখ্যানটি n-2 স্বাধীনতার মাত্রা সহ একটি টি-বিভাজন অনুসরণ করে।
Explanation: When the null hypothesis is that the population correlation coefficient ρ=0, the statistic t = r * √(n-2) / √(1-r²), calculated from the sample correlation coefficient r, follows a t-distribution with n-2 degrees of freedom.
প্রশ্ন ২৬: মুখ্য উপাদানগুলি (Principal Components) একে অপরের সাথে কীরূপ? Question 26: How are the Principal Components related to each other?
ব্যাখ্যা: PCA-এর একটি মূল বৈশিষ্ট্য হলো এটি মূল সম্পর্কযুক্ত চলকগুলিকে এমন নতুন চলকে রূপান্তরিত করে যেগুলি রৈখিকভাবে অসম্পর্কিত (linearly uncorrelated) বা অর্থোগোনাল (orthogonal)। প্রথম মুখ্য উপাদানটি সর্বাধিক ভেদাঙ্ক ধারণ করে, দ্বিতীয়টি বাকি ভেদাঙ্কের সর্বাধিক অংশ ধারণ করে এবং এটি প্রথমটির সাথে অসম্পর্কিত, এবং এভাবেই চলতে থাকে।
Explanation: A key feature of PCA is that it transforms the original correlated variables into new variables that are linearly uncorrelated or orthogonal. The first principal component captures the maximum variance, the second captures the maximum of the remaining variance and is uncorrelated with the first, and so on.
প্রশ্ন ২৭: Hotelling’s T² কখন ব্যবহৃত হয় না? Question 27: When is Hotelling’s T² not used?
একটি নমুনার গড় ভেক্টরকে একটি নির্দিষ্ট ভেক্টরের সাথে তুলনা করতে। To compare a sample mean vector to a specified vector.
দুটি স্বাধীন নমুনার গড় ভেক্টরের সমতা পরীক্ষা করতে। To test the equality of two independent sample mean vectors.
দুটি ভেদাঙ্কের অনুপাত পরীক্ষা করতে। To test the ratio of two variances.
যুগ্ম নমুনার (paired samples) ক্ষেত্রে গড় পার্থক্য ভেক্টর শূন্য কিনা তা পরীক্ষা করতে। To test if the mean difference vector is zero in paired samples.
সঠিক উত্তর (Correct Answer): (c)
ব্যাখ্যা: দুটি ভেদাঙ্কের অনুপাত পরীক্ষা করার জন্য F-test ব্যবহৃত হয়। Hotelling’s T² একটি বহুমাত্রিক পরীক্ষা যা গড় ভেক্টর (mean vectors) নিয়ে কাজ করে, ভেদাঙ্ক নিয়ে নয়। এটি এক-নমুনা, দুই-নমুনা এবং যুগ্ম-নমুনা t-test-এর বহুমাত্রিক সংস্করণ।
Explanation: The F-test is used to test the ratio of two variances. Hotelling’s T² is a multivariate test that deals with mean vectors, not variances. It is the multivariate equivalent of the one-sample, two-sample, and paired-sample t-tests.
প্রশ্ন ২৮: আংশিক নির্ভরণ সহগের (Partial Regression Coefficient) নমুনায়ন বিভাজনের তাৎপর্য পরীক্ষা করতে কী ব্যবহৃত হয়? Question 28: What is used to test the significance of the sampling distribution of a Partial Regression Coefficient?
শুধুমাত্র F-test Only F-test
শুধুমাত্র Z-test Only Z-test
t-test
Chi-square test
সঠিক উত্তর (Correct Answer): (c)
ব্যাখ্যা: একাধিক নির্ভরণে (multiple regression), প্রতিটি আংশিক নির্ভরণ সহগের (যেমন, b₁, b₂, …) তাৎপর্য পরীক্ষা করার জন্য একটি t-test ব্যবহৃত হয়। এই পরীক্ষাটি বলে যে অন্যান্য চলকগুলিকে স্থির রেখে নির্দিষ্ট স্বাধীন চলকটি নির্ভরশীল চলকের উপর তাৎপর্যপূর্ণ প্রভাব ফেলে কিনা।
Explanation: In multiple regression, a t-test is used to test the significance of each partial regression coefficient (e.g., b₁, b₂, …). This test determines whether a specific independent variable has a significant effect on the dependent variable, holding other variables constant.
প্রশ্ন ২৯: একাধিক সম্পর্ক সহগ (Multiple Correlation Coefficient, R)-এর তাৎপর্য পরীক্ষা করতে কোন পরিসংখ্যান ব্যবহৃত হয়? Question 29: Which statistic is used to test the significance of the Multiple Correlation Coefficient (R)?
t-statistic
F-statistic
Z-statistic
Chi-square statistic
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: সম্পূর্ণ নির্ভরণ মডেলের (overall regression model) তাৎপর্য, যা একাধিক সম্পর্ক সহগ R দ্বারা পরিমাপ করা হয়, তা পরীক্ষা করার জন্য একটি F-test ব্যবহৃত হয়। F-পরিসংখ্যানটি নির্ভরণ দ্বারা ব্যাখ্যাত ভেদাঙ্ক (explained variance) এবং অবশিষ্ট ভেদাঙ্কের (residual variance) অনুপাত থেকে গণনা করা হয়।
Explanation: An F-test is used to test the significance of the overall regression model, which is measured by the multiple correlation coefficient R. The F-statistic is calculated from the ratio of the variance explained by the regression to the residual variance.
প্রশ্ন ৩০: যখন নমুনার আকার খুব বড় হয়, তখন টি-ডিস্ট্রিবিউশন (t-distribution) কোন ডিস্ট্রিবিউশনের কাছাকাছি চলে যায়? Question 30: As the sample size becomes very large, the t-distribution approaches which distribution?
এফ-ডিস্ট্রিবিউশন (F-distribution)
স্ট্যান্ডার্ড নর্মাল ডিস্ট্রিবিউশন (Standard Normal distribution)
ব্যাখ্যা: টি-ডিস্ট্রিবিউশনের স্বাধীনতার মাত্রা (df = n-1) বাড়ার সাথে সাথে এর আকার স্ট্যান্ডার্ড নর্মাল ডিস্ট্রিবিউশনের (Z-distribution) আকারের সাথে মিলে যায়। সাধারণত, যখন df > 30 হয়, তখন টি-ডিস্ট্রিবিউশনকে নর্মাল ডিস্ট্রিবিউশন দ্বারা ভালোভাবে অনুমান করা যায়।
Explanation: As the degrees of freedom (df = n-1) of the t-distribution increase, its shape converges to that of the standard normal distribution (Z-distribution). Conventionally, when df > 30, the t-distribution can be well-approximated by the normal distribution.
প্রশ্ন ৩১: F-ডিস্ট্রিবিউশনের স্বাধীনতার মাত্রা (d₁, d₂) হলে, 1/F(d₁,d₂) কোন ডিস্ট্রিবিউশন অনুসরণ করে? Question 31: If a variable follows an F-distribution with (d₁, d₂) degrees of freedom, what distribution does 1/F(d₁,d₂) follow?
F(d₁, d₂)
F(d₂, d₁)
t(d₁ + d₂)
Chi-square(d₁ + d₂)
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: এটি F-ডিস্ট্রিবিউশনের একটি গুরুত্বপূর্ণ ধর্ম। যদি একটি চলক F(d₁, d₂) ডিস্ট্রিবিউশন অনুসরণ করে, তবে তার অন্যোন্যক (reciprocal) চলকটি একটি F-ডিস্ট্রিবিউশন অনুসরণ করবে যার স্বাধীনতার মাত্রা দুটি উল্টে যাবে, অর্থাৎ F(d₂, d₁)।
Explanation: This is an important property of the F-distribution. If a variable follows an F(d₁, d₂) distribution, its reciprocal will follow an F-distribution with the degrees of freedom interchanged, i.e., F(d₂, d₁).
প্রশ্ন ৩২: ক্যানোনিকাল কোরিলেশন অ্যানালাইসিসে, ক্যানোনিকাল ভেরিয়েবলের সংখ্যা কত হতে পারে? Question 32: In Canonical Correlation Analysis, what is the maximum number of canonical variables?
দুটি চলক সেটের মধ্যে সর্বনিম্ন চলকের সংখ্যার সমান Equal to the minimum of the number of variables in the two sets
দুটি চলক সেটের মধ্যে সর্বোচ্চ চলকের সংখ্যার সমান Equal to the maximum of the number of variables in the two sets
দুটি সেটের চলকের সংখ্যার যোগফলের সমান Equal to the sum of the number of variables in the two sets
সর্বদা দুটি Always two
সঠিক উত্তর (Correct Answer): (a)
ব্যাখ্যা: যদি দুটি চলক সেটে যথাক্রমে p এবং q সংখ্যক চলক থাকে, তবে সর্বাধিক min(p, q) সংখ্যক ক্যানোনিকাল ভেরিয়েবল জোড়া তৈরি করা সম্ভব। প্রতিটি জোড়া একে অপরের থেকে অসম্পর্কিত।
Explanation: If there are p and q variables in the two sets respectively, then a maximum of min(p, q) pairs of canonical variables can be extracted. Each pair is uncorrelated with the others.
প্রশ্ন ৩৩: মহালানোবিস দূরত্ব (D²) কখন ইউক্লিডিয়ান দূরত্বের (Euclidean distance) সমান হয়? Question 33: When is Mahalanobis distance (D²) equal to Euclidean distance?
যখন চলকগুলি অত্যন্ত সম্পর্কযুক্ত থাকে When the variables are highly correlated
যখন চলকগুলি অসম্পর্কিত এবং তাদের ভেদাঙ্ক ১ হয় When the variables are uncorrelated and have a variance of 1
যখন ডেটা নর্মালভাবে বণ্টিত নয় When the data is not normally distributed
যখন নমুনার আকার ছোট When the sample size is small
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: মহালানোবিস দূরত্বের সূত্রে কোভেরিয়েন্স ম্যাট্রিক্সের ইনভার্স ব্যবহার করা হয়। যদি চলকগুলি অসম্পর্কিত (uncorrelated) হয় এবং তাদের ভেদাঙ্ক (variance) 1 হয়, তবে কোভেরিয়েন্স ম্যাট্রিক্সটি একটি আইডেন্টিটি ম্যাট্রিক্স (identity matrix) হয়ে যায়। এই বিশেষ ক্ষেত্রে, মহালানোবিস দূরত্ব স্কেলড ইউক্লিডিয়ান দূরত্বের সমান হয়।
Explanation: The formula for Mahalanobis distance uses the inverse of the covariance matrix. If the variables are uncorrelated and their variance is 1, the covariance matrix becomes an identity matrix. In this special case, the Mahalanobis distance becomes equal to the scaled Euclidean distance.
প্রশ্ন ৩৪: Wilk’s Lambda (Λ) এর মান 1 হলে কী বোঝায়? Question 34: What does a Wilk’s Lambda (Λ) value of 1 imply?
গ্রুপগুলির মধ্যে গড় ভেক্টরে বিশাল পার্থক্য রয়েছে। There is a huge difference in the mean vectors between groups.
শূন্য প্রকল্প (Null hypothesis) বাতিল করা উচিত। The null hypothesis should be rejected.
গ্রুপগুলির মধ্যে গড় ভেক্টরে কোনও পার্থক্য নেই। There is no difference in the mean vectors between groups.
ডেটাতে আউটলায়ার রয়েছে। There are outliers in the data.
সঠিক উত্তর (Correct Answer): (c)
ব্যাখ্যা: Wilk’s Lambda গ্রুপ-মধ্যস্থ (within-group) ভেদাঙ্কের সাথে মোট ভেদাঙ্কের (total variance) অনুপাত পরিমাপ করে। Λ = 1 মানে হলো গ্রুপ-মধ্যস্থ ভেদাঙ্ক এবং মোট ভেদাঙ্ক সমান, যা নির্দেশ করে যে গ্রুপ-বহির্ভূত (between-group) ভেদাঙ্ক শূন্য। এর অর্থ হলো গ্রুপগুলির গড় ভেক্টরগুলি অভিন্ন।
Explanation: Wilk’s Lambda measures the ratio of within-group variance to total variance. A value of Λ = 1 means the within-group variance is equal to the total variance, which implies that the between-group variance is zero. This means the group mean vectors are identical.
প্রশ্ন ৩৫: দৈব চয়ন (Random Sampling) কেন গুরুত্বপূর্ণ? Question 35: Why is Random Sampling important?
এটি সবচেয়ে সস্তা পদ্ধতি। It is the cheapest method.
এটি নিশ্চিত করে যে নমুনাটি সমগ্রকের প্রতিনিধিত্ব করবে এবং পক্ষপাত এড়াতে সাহায্য করে। It ensures the sample is representative of the population and helps avoid bias.
এটি সর্বদা সবচেয়ে বড় নমুনা দেয়। It always gives the largest sample.
এটি নমুনায়ন ত্রুটি সম্পূর্ণভাবে দূর করে। It completely eliminates sampling error.
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: দৈব চয়ন সমগ্রকের প্রতিটি সদস্যকে নমুনায় নির্বাচিত হওয়ার সমান সুযোগ দেয়। এটি পদ্ধতিগত পক্ষপাত (systematic bias) দূর করে এবং সম্ভাবনা তত্ত্বের (probability theory) নিয়মগুলি প্রয়োগ করে নমুনা থেকে সমগ্রক সম্পর্কে সিদ্ধান্ত (inference) নেওয়ার ভিত্তি স্থাপন করে।
Explanation: Random sampling gives every member of the population an equal chance of being selected in the sample. This eliminates systematic bias and provides the basis for making inferences about the population from the sample using the rules of probability theory.
প্রশ্ন ৩৬: আংশিক সম্পর্ক সহগ (Partial Correlation Coefficient) কী পরিমাপ করে? Question 36: What does a Partial Correlation Coefficient measure?
দুটি চলকের মধ্যে মোট সম্পর্ক। The total correlation between two variables.
এক বা একাধিক অন্য চলকের প্রভাব দূর করার পর দুটি চলকের মধ্যে সম্পর্ক। The correlation between two variables after removing the effect of one or more other variables.
একটি নির্ভরশীল এবং একাধিক স্বাধীন চলকের মধ্যে সম্পর্ক। The correlation between one dependent and multiple independent variables.
দুটি অ-রৈখিক চলকের মধ্যে সম্পর্ক। The correlation between two non-linear variables.
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: আংশিক সম্পর্ক সহগ দুটি চলকের মধ্যে “বিশুদ্ধ” রৈখিক সম্পর্ক পরিমাপ করে। এটি তৃতীয় এক বা একাধিক চলকের রৈখিক প্রভাবকে উভয় চলক থেকে সরিয়ে দিয়ে তাদের মধ্যেকার সম্পর্ককে গণনা করে।
Explanation: The partial correlation coefficient measures the “pure” linear relationship between two variables. It calculates the correlation between them after removing the linear effects of one or more other third variables from both.
প্রশ্ন ৩৭: একটি নর্মাল সমগ্রক থেকে নেওয়া নমুনার জন্য, নমুনা গড় (x̄) এবং নমুনা ভেদাঙ্ক (S²) কীরূপ? Question 37: For a sample from a normal population, what is the relationship between the sample mean (x̄) and the sample variance (S²)?
ধনাত্মকভাবে সম্পর্কযুক্ত (Positively correlated)
স্বাধীন (Independent)
ঋণাত্মকভাবে সম্পর্কযুক্ত (Negatively correlated)
সম্পূর্ণভাবে নির্ভরশীল (Perfectly dependent)
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: ফিশারের উপপাদ্য (Fisher’s Theorem) অনুসারে, যদি একটি দৈব নমুনা একটি নর্মাল সমগ্রক থেকে নেওয়া হয়, তবে নমুনা গড় (x̄) এবং নমুনা ভেদাঙ্ক (S²) পরিসংখ্যানগতভাবে স্বাধীন হয়। এটি পরিসংখ্যানগত অনুমানের একটি অত্যন্ত গুরুত্বপূর্ণ ফলাফল।
Explanation: According to Fisher’s Theorem, if a random sample is taken from a normal population, the sample mean (x̄) and the sample variance (S²) are statistically independent. This is a very important result in statistical inference.
প্রশ্ন ৩৮: একটি পরিসংখ্যানের নমুনায়ন বিভাজনের (sampling distribution) আকৃতি কীসের উপর নির্ভর করে না? Question 38: The shape of the sampling distribution of a statistic does NOT depend on which of the following?
মূল সমগ্রকের বিভাজন (The distribution of the parent population)
নমুনার আকার (The sample size)
ব্যবহৃত নমুনায়ন পদ্ধতি (The sampling method used)
সমগ্রকের একটি নির্দিষ্ট সদস্যের মান (The value of a specific member of the population)
সঠিক উত্তর (Correct Answer): (d)
ব্যাখ্যা: একটি নমুনায়ন বিভাজন হলো একটি নির্দিষ্ট আকারের সমস্ত সম্ভাব্য নমুনা থেকে গণনা করা একটি পরিসংখ্যানের মানের বিভাজন। এর আকৃতি মূল সমগ্রকের বিভাজন, নমুনার আকার এবং নমুনায়ন পদ্ধতির উপর নির্ভর করে। কিন্তু সমগ্রকের কোনো একটি নির্দিষ্ট সদস্যের মান এর উপর প্রভাব ফেলে না।
Explanation: A sampling distribution is the distribution of the values of a statistic calculated from all possible samples of a given size. Its shape depends on the parent population’s distribution, the sample size, and the sampling method. It is not influenced by the value of one specific individual member of the population.
প্রশ্ন ৩৯: PCA-তে, আইগেনভ্যালু (eigenvalue) কী নির্দেশ করে? Question 39: In PCA, what does an eigenvalue represent?
মুখ্য উপাদানের দিক (The direction of the principal component)
সংশ্লিষ্ট মুখ্য উপাদান দ্বারা ব্যাখ্যাত ভেদাঙ্কের পরিমাণ The amount of variance explained by the corresponding principal component
মূল চলকের সংখ্যা (The number of original variables)
ডেটার গড় (The mean of the data)
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: কোভেরিয়েন্স বা কোরিলেশন ম্যাট্রিক্সের প্রতিটি আইগেনভ্যালু তার সংশ্লিষ্ট আইগেনভেক্টর (যা মুখ্য উপাদানের দিক নির্দেশ করে) দ্বারা ব্যাখ্যাত ভেদাঙ্কের পরিমাণ নির্দেশ করে। বড় আইগেনভ্যালু মানে সেই মুখ্য উপাদানটি ডেটার বেশি ভেদাঙ্ক ধারণ করে।
Explanation: Each eigenvalue of the covariance or correlation matrix represents the amount of variance explained by its corresponding eigenvector (which defines the direction of the principal component). A larger eigenvalue means that the principal component explains more of the data’s variance.
প্রশ্ন ৪০: যদি একটি t-পরিসংখ্যানের মান খুব বড় (ধনাত্মক বা ঋণাত্মক) হয়, তাহলে এটি কী ইঙ্গিত দেয়? Question 40: If the value of a t-statistic is very large (positive or negative), what does it suggest?
শূন্য প্রকল্প (Null hypothesis) সম্ভবত সত্য। The null hypothesis is likely true.
শূন্য প্রকল্পের বিরুদ্ধে শক্তিশালী প্রমাণ রয়েছে। There is strong evidence against the null hypothesis.
নমুনার আকার খুব ছোট। The sample size is too small.
সমগ্রকের ভেদাঙ্ক খুব বড়। The population variance is very large.
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: t-পরিসংখ্যান পরিমাপ করে যে নমুনা গড় সমগ্রকের প্রকল্পিত গড় থেকে প্রমিত ত্রুটির এককে কত দূরে। একটি বড় t-মান (critical value-এর চেয়ে বড়) নির্দেশ করে যে পর্যবেক্ষিত পার্থক্যটি শুধুমাত্র দৈবচয়নের কারণে হওয়ার সম্ভাবনা কম, এবং এটি শূন্য প্রকল্পের বিরুদ্ধে একটি শক্তিশালী প্রমাণ।
Explanation: The t-statistic measures how far the sample mean is from the hypothesized population mean, in units of standard error. A large t-value (larger than the critical value) indicates that the observed difference is unlikely to be due to random chance alone, providing strong evidence against the null hypothesis.
প্রশ্ন ৪১: Hotelling’s T² ডিস্ট্রিবিউশন কোন ডিস্ট্রিবিউশনের সাথে সম্পর্কিত? Question 41: The Hotelling’s T² distribution is related to which other distribution?
ব্যাখ্যা: Hotelling’s T² পরিসংখ্যানকে একটি উপযুক্ত ধ্রুবক দ্বারা গুণ করলে এটি একটি F-ডিস্ট্রিবিউশনে রূপান্তরিত হয়। এই সম্পর্কটি T² পরিসংখ্যানের তাৎপর্য পরীক্ষা করতে ব্যবহৃত হয়। নির্দিষ্টভাবে, [ (n-p) / (p(n-1)) ] * T² ~ F(p, n-p)।
Explanation: The Hotelling’s T² statistic, when multiplied by an appropriate constant, transforms into an F-distribution. This relationship is used to test the significance of the T² statistic. Specifically, [ (n-p) / (p(n-1)) ] * T² ~ F(p, n-p).
প্রশ্ন ৪২: কেন্দ্রীয় সীমা উপপাদ্য (Central Limit Theorem) অনুযায়ী, যদি নমুনার আকার যথেষ্ট বড় হয়, তবে নমুনা গড়ের নমুনায়ন বিভাজন কী হবে? Question 42: According to the Central Limit Theorem, if the sample size is large enough, what will be the sampling distribution of the sample mean?
সর্বদা মূল সমগ্রকের মতো (Always the same as the parent population)
প্রায় নর্মাল (Approximately Normal)
ইউনিফর্ম (Uniform)
কাই-স্কোয়ার (Chi-square)
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: কেন্দ্রীয় সীমা উপপাদ্য পরিসংখ্যানের অন্যতম গুরুত্বপূর্ণ উপপাদ্য। এটি বলে যে, মূল সমগ্রকের বিভাজন যাই হোক না কেন (যতক্ষণ এর একটি সসীম ভেদাঙ্ক থাকে), পর্যাপ্ত বড় আকারের নমুনার (সাধারণত n≥30) ক্ষেত্রে নমুনা গড়ের নমুনায়ন বিভাজন প্রায় নর্মাল হবে।
Explanation: The Central Limit Theorem is one of the most important theorems in statistics. It states that regardless of the distribution of the parent population (as long as it has a finite variance), the sampling distribution of the sample mean will be approximately normal for a sufficiently large sample size (usually n≥30).
প্রশ্ন ৪৩: কন্টিনিউয়াস ইউনিফর্ম ডিস্ট্রিবিউশন U(a, b) থেকে নেওয়া নমুনার প্রসার (Range) এর বিভাজনের সম্ভাবনা ঘনত্ব অপেক্ষক (pdf) কোথায় শূন্য নয়? Question 43: For the distribution of the Range from a sample from a continuous uniform distribution U(a, b), where is the probability density function (pdf) non-zero?
0 থেকে (b-a) এর মধ্যে Between 0 and (b-a)
a থেকে b এর মধ্যে Between a and b
শুধুমাত্র ধনাত্মক মানের জন্য Only for positive values
0 থেকে ∞ পর্যন্ত From 0 to ∞
সঠিক উত্তর (Correct Answer): (a)
ব্যাখ্যা: নমুনার প্রসার (Range, R = X(n) – X(1)) সর্বদা অ-ঋণাত্মক। এর সর্বনিম্ন মান 0 হতে পারে (যখন সব মান সমান) এবং সর্বোচ্চ মান হতে পারে যখন X(n) ≈ b এবং X(1) ≈ a, অর্থাৎ R ≈ b-a। তাই, প্রসারের বিভাজনটি 0 থেকে (b-a) সীমার মধ্যে সংজ্ঞায়িত হয়।
Explanation: The sample range (R = X(n) – X(1)) is always non-negative. Its minimum value can be 0 (when all values are equal), and its maximum value can occur when X(n) ≈ b and X(1) ≈ a, meaning R ≈ b-a. Therefore, the distribution of the range is defined on the interval from 0 to (b-a).
প্রশ্ন ৪৪: একটি t-ডিস্ট্রিবিউশনের লেজ (tail) স্ট্যান্ডার্ড নর্মাল ডিস্ট্রিবিউশনের লেজের তুলনায় কীরূপ? Question 44: How are the tails of a t-distribution compared to the tails of a standard normal distribution?
পাতলা (Thinner)
মোটা (Fatter / Heavier)
একই রকম (The same)
কখনও পাতলা, কখনও মোটা (Sometimes thinner, sometimes fatter)
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: t-ডিস্ট্রিবিউশনের লেজগুলি নর্মাল ডিস্ট্রিবিউশনের চেয়ে বেশি ছড়ানো বা ‘মোটা’ হয়। এর অর্থ হলো t-ডিস্ট্রিবিউশনে চরম মান (extreme values) পাওয়ার সম্ভাবনা বেশি। এটি সমগ্রকের ভেদাঙ্ক অজানা থাকার কারণে অতিরিক্ত অনিশ্চয়তার ফল। স্বাধীনতার মাত্রা বাড়ার সাথে সাথে লেজগুলি পাতলা হয়ে নর্মাল ডিস্ট্রিবিউশনের মতো হয়।
Explanation: The tails of the t-distribution are more spread out or ‘fatter’ than those of the normal distribution. This means there is a higher probability of getting extreme values in a t-distribution. This is a result of the additional uncertainty from not knowing the population variance. As the degrees of freedom increase, the tails become thinner and approach the normal distribution.
প্রশ্ন ৪৫: প্রথম ক্রম পরিসংখ্যান X(1) এর নমুনায়ন বিভাজন কী নির্দেশ করে? Question 45: What does the sampling distribution of the first order statistic, X(1), represent?
নমুনা গড়ের বিভাজন (The distribution of the sample mean)
নমুনা সর্বোচ্চ মানের বিভাজন (The distribution of the sample maximum)
নমুনা সর্বনিম্ন মানের বিভাজন (The distribution of the sample minimum)
নমুনা মধ্যকের বিভাজন (The distribution of the sample median)
সঠিক উত্তর (Correct Answer): (c)
ব্যাখ্যা: ক্রম পরিসংখ্যানের সংজ্ঞা অনুযায়ী, X(1) হলো নমুনার সবচেয়ে ছোট বা সর্বনিম্ন মান। এর নমুনায়ন বিভাজন বর্ণনা করে যে বিভিন্ন নমুনা থেকে প্রাপ্ত সর্বনিম্ন মানগুলি কীভাবে বণ্টিত হবে।
Explanation: By definition of order statistics, X(1) is the smallest or minimum value in a sample. Its sampling distribution describes how the minimum values obtained from different samples would be distributed.
প্রশ্ন ৪৬: ক্যানোনিকাল কোরিলেশন-এর মান ০ হলে কী বোঝায়? Question 46: What does a canonical correlation value of 0 imply?
দুটি চলক সেট পুরোপুরি রৈখিকভাবে সম্পর্কযুক্ত। The two sets of variables are perfectly linearly related.
দুটি চলক সেটের মধ্যে কোনো রৈখিক সম্পর্ক নেই। There is no linear relationship between the two sets of variables.
একটি সেটের চলকগুলি অন্য সেটের ঋণাত্মক। The variables in one set are the negative of the other set.
বিশ্লেষণটি অবৈধ। The analysis is invalid.
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: ক্যানোনিকাল কোরিলেশন দুটি চলক সেটের রৈখিক সংমিশ্রণের মধ্যে সম্পর্ক পরিমাপ করে। এর মান 0 হওয়ার অর্থ হলো এই দুটি সেটের মধ্যে কোনো প্রকার রৈখিক সম্পর্ক খুঁজে পাওয়া যায়নি।
Explanation: Canonical correlation measures the relationship between linear combinations of two sets of variables. A value of 0 means that no linear relationship could be found between these two sets.
প্রশ্ন ৪৭: একটি দৈব নমুনার ধারণা কোনটির উপর ভিত্তি করে? Question 47: The concept of a random sample is based on which of the following?
পর্যবেক্ষণগুলির স্বাধীনতা এবং সমগ্রকের প্রতিটি সদস্যের সমান নির্বাচন সম্ভাবনা। Independence of observations and equal probability of selection for each member of the population.
শুধুমাত্র পর্যবেক্ষণের স্বাধীনতা। Only the independence of observations.
নমুনাটি সমগ্রকের একটি ক্ষুদ্র অংশ হওয়া। The sample being a small fraction of the population.
বিশেষজ্ঞের মতামত দ্বারা নমুনা নির্বাচন। Selecting the sample based on expert opinion.
সঠিক উত্তর (Correct Answer): (a)
ব্যাখ্যা: একটি সরল দৈব নমুনার (simple random sample) দুটি প্রধান বৈশিষ্ট্য হলো: (১) সমগ্রকের প্রতিটি সদস্যের নমুনায় অন্তর্ভুক্ত হওয়ার সম্ভাবনা সমান, এবং (২) প্রতিটি সদস্যের নির্বাচন অন্য সদস্যদের নির্বাচন থেকে স্বাধীন।
Explanation: The two main characteristics of a simple random sample are: (1) every member of the population has an equal probability of being included in the sample, and (2) the selection of each member is independent of the selection of other members.
প্রশ্ন ৪৮: প্রথম মুখ্য উপাদান (first principal component) কী করে? Question 48: What does the first principal component do?
ডেটার সর্বনিম্ন ভেদাঙ্কের দিকটি খুঁজে বের করে। Finds the direction of minimum variance in the data.
ডেটার গড় গণনা করে। Calculates the mean of the data.
ডেটার সর্বোচ্চ ভেদাঙ্কের দিকটি খুঁজে বের করে। Finds the direction of maximum variance in the data.
চলকগুলিকে শ্রেণীবদ্ধ করে। Classifies the variables.
সঠিক উত্তর (Correct Answer): (c)
ব্যাখ্যা: PCA-তে, প্রথম মুখ্য উপাদানটি এমন একটি রৈখিক সংমিশ্রণ যা মূল ডেটার মধ্যে সর্বাধিক ভেদাঙ্ককে ধারণ করে। এটি ডেটার সবচেয়ে গুরুত্বপূর্ণ বৈচিত্র্যের অক্ষটিকে প্রতিনিধিত্ব করে।
Explanation: In PCA, the first principal component is the linear combination of variables that captures the maximum amount of variance in the original data. It represents the axis of greatest variation in the data.
প্রশ্ন ৪৯: দ্বিচলক নর্মাল সমগ্রক থেকে নেওয়া নমুনা সম্পর্ক সহগ ρ≠0 হলে, এর নমুনায়ন বিভাজন কীরূপ হয়? Question 49: For a sample correlation coefficient from a bivariate normal population where ρ≠0, what is the nature of its sampling distribution?
প্রতিসম (Symmetric)
বঙ্কিম (Skewed)
সর্বদা নর্মাল (Always Normal)
ইউনিফর্ম (Uniform)
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: যখন সমগ্রকের সম্পর্ক সহগ (ρ) শূন্য নয়, তখন নমুনা সম্পর্ক সহগ (r)-এর নমুনায়ন বিভাজনটি বঙ্কিম বা অপ্রতিসম হয়। ρ-এর মান +1 বা -1 এর কাছাকাছি হলে বঙ্কিমতা বাড়ে। এই কারণে, ρ≠0 এর জন্য হাইপোথিসিস পরীক্ষা করতে ফিশারের Z-রূপান্তর (Fisher’s Z-transformation) ব্যবহৃত হয়, যা বিভাজনটিকে প্রায় নর্মাল করে তোলে।
Explanation: When the population correlation coefficient (ρ) is not zero, the sampling distribution of the sample correlation coefficient (r) is skewed. The skewness increases as ρ approaches +1 or -1. For this reason, Fisher’s Z-transformation is used for hypothesis testing when ρ≠0, as it transforms the distribution to be approximately normal.
প্রশ্ন ৫০: ‘Standard Error’ এবং ‘Standard Deviation’ এর মধ্যে মূল পার্থক্য কী? Question 50: What is the key difference between ‘Standard Error’ and ‘Standard Deviation’?
এদের মধ্যে কোনো পার্থক্য নেই, দুটি একই জিনিস। There is no difference, they are the same thing.
Standard Deviation ডেটার বিস্তার পরিমাপ করে, আর Standard Error একটি পরিসংখ্যানের নির্ভুলতা পরিমাপ করে। Standard Deviation measures the spread of data, while Standard Error measures the precision of a statistic.
Standard Error সর্বদা Standard Deviation এর থেকে বড় হয়। Standard Error is always larger than Standard Deviation.
Standard Deviation সমগ্রকের জন্য, আর Standard Error নমুনার জন্য ব্যবহৃত হয়। Standard Deviation is for populations, while Standard Error is for samples.
সঠিক উত্তর (Correct Answer): (b)
ব্যাখ্যা: Standard Deviation (সম্যক বিচ্যুতি) একটি ডেটা সেটের মানগুলি তাদের গড় থেকে কতটা বিচ্যুত তার একটি পরিমাপ। এটি ডেটার বিস্তার (dispersion) বর্ণনা করে। অন্যদিকে, Standard Error (প্রমিত ত্রুটি) একটি নমুনা পরিসংখ্যানের (যেমন নমুনা গড়) নমুনায়ন বিভাজনের সম্যক বিচ্যুতি। এটি পরিমাপ করে যে নমুনা পরিসংখ্যানটি সমগ্রকের প্রকৃত প্যারামিটারের কতটা কাছাকাছি বা নির্ভুল।
Explanation: Standard Deviation measures how much the values in a single dataset deviate from their mean; it describes the dispersion of the data. In contrast, Standard Error is the standard deviation of the sampling distribution of a sample statistic (like the sample mean). It measures the precision or accuracy of the sample statistic as an estimate of the true population parameter.