Topic: Statistical Population, Sample, Frequency Curve
1. পরিসংখ্যানগত অনুসন্ধানের অধীনে থাকা সমস্ত এককের সমষ্টিকে কী বলা হয়? / What is the aggregate of all units under a statistical investigation called?
সঠিক উত্তর / Correct Answer:
(B) সমগ্রক / Population
ব্যাখ্যা / Explanation:
সমগ্রক বা পপুলেশন হলো একটি নির্দিষ্ট বৈশিষ্ট্যযুক্ত সমস্ত সম্ভাব্য ব্যক্তি বা বস্তুর সম্পূর্ণ সেট যা নিয়ে গবেষণা করা হয়। নমুনা হলো সেই সমগ্রকের একটি অংশ।
A population is the entire set of all possible individuals or objects with a specific characteristic being studied. A sample is a subset of that population.
2. সমগ্রক থেকে নির্বাচিত একটি অংশকে কী বলা হয়? / What is a part selected from the population called?
সঠিক উত্তর / Correct Answer:
(C) নমুনা / Sample
ব্যাখ্যা / Explanation:
নমুনা হলো সমগ্রকের একটি প্রতিনিধিত্বমূলক অংশ, যা সমগ্রক সম্পর্কে ধারণা বা সিদ্ধান্ত নিতে ব্যবহৃত হয়।
A sample is a representative part of the population, used to make inferences or decisions about the entire population.
3. একটি দৈব চয়ন নমুনায় (random sample) সমগ্রকের প্রতিটি এককের নির্বাচিত হওয়ার সম্ভাবনা কেমন থাকে? / In a random sample, what is the probability of each unit of the population being selected?
সঠিক উত্তর / Correct Answer:
(C) সমান / Equal
ব্যাখ্যা / Explanation:
দৈব চয়ন নমুনার মূলনীতি হলো সমগ্রকের প্রতিটি এককের নির্বাচিত হওয়ার সমান এবং স্বাধীন সুযোগ থাকবে।
The fundamental principle of random sampling is that every unit in the population has an equal and independent chance of being selected.
4. একটি পরিসংখ্যা বিভাজনের লেখচিত্রকে কী বলা হয়? / What is the graphical representation of a frequency distribution called?
সঠিক উত্তর / Correct Answer:
(D) উপরের সবকটি / All of the above
ব্যাখ্যা / Explanation:
পরিসংখ্যা বিভাজনকে বিভিন্ন লেখচিত্রের মাধ্যমে প্রকাশ করা যায়, যেমন আয়তলেখ (Histogram), পরিসংখ্যা বহুভুজ (Frequency Polygon) এবং পরিসংখ্যা রেখা (Frequency Curve)। পাই চিত্র এবং দণ্ডচিত্রও তথ্য উপস্থাপনের পদ্ধতি।
A frequency distribution can be represented by various graphs like Histogram, Frequency Polygon, and Frequency Curve. Pie charts and bar diagrams are also methods of data presentation.
5. যদি একটি পরিসংখ্যা রেখার শীর্ষবিন্দু মসৃণ হয়, তবে তাকে কী বলা হয়? / If the vertices of a frequency polygon are smoothed, what is it called?
সঠিক উত্তর / Correct Answer:
(A) পরিসংখ্যা রেখা / Frequency Curve
ব্যাখ্যা / Explanation:
পরিসংখ্যা বহুভুজের কৌণিক বিন্দুগুলিকে একটি মসৃণ বক্ররেখা দ্বারা যুক্ত করলে যে লেখচিত্র পাওয়া যায়, তাকে পরিসংখ্যা রেখা বা ফ্রিকোয়েন্সি কার্ভ বলে।
When the angular vertices of a frequency polygon are joined by a smooth curve, the resulting graph is called a Frequency Curve.
6. লোরেঞ্জ কার্ভ (Lorenz Curve) কী পরিমাপ করতে ব্যবহৃত হয়? / What is the Lorenz Curve used to measure?
সঠিক উত্তর / Correct Answer:
(D) অসমতা বা কেন্দ্রীভবন / Inequality or Concentration
ব্যাখ্যা / Explanation:
লোরেঞ্জ কার্ভ আয় বা সম্পদের বণ্টনে অসমতা পরিমাপের জন্য একটি জনপ্রিয় লেখচিত্র পদ্ধতি। এটি সমবণ্টন রেখা থেকে যত দূরে থাকে, অসমতা তত বেশি।
The Lorenz Curve is a popular graphical method for measuring inequality in the distribution of income or wealth. The farther it is from the line of equal distribution, the greater the inequality.
7. গিনি সহগ (Gini Coefficient) এর মান 0 হলে কী বোঝায়? / What does a Gini Coefficient value of 0 indicate?
সঠিক উত্তর / Correct Answer:
(B) সম্পূর্ণ সমতা / Perfect equality
ব্যাখ্যা / Explanation:
গিনি সহগের মান 0 থেকে 1 এর মধ্যে থাকে। মান 0 হলে আয় বা সম্পদের সম্পূর্ণ সমবণ্টন বোঝায়, এবং মান 1 হলে সম্পূর্ণ অসমবণ্টন বোঝায়।
The Gini Coefficient ranges from 0 to 1. a value of 0 indicates perfect equality in income or wealth distribution, while a value of 1 indicates perfect inequality.
Topic: Measures of Location and Dispersion
8. নিচের কোনটি কেন্দ্রীয় প্রবণতার পরিমাপক নয়? / Which of the following is not a measure of central tendency?
সঠিক উত্তর / Correct Answer:
(D) পরিসর / Range
ব্যাখ্যা / Explanation:
পরিসর (Range) হলো বিস্তারের পরিমাপক (measure of dispersion), যা তথ্যের সর্বোচ্চ এবং সর্বনিম্ন মানের পার্থক্য নির্দেশ করে। গড়, মধ্যমা এবং সংখ্যাগুরু মান কেন্দ্রীয় প্রবণতার পরিমাপক।
Range is a measure of dispersion, which indicates the difference between the maximum and minimum values of the data. Mean, Median, and Mode are measures of central tendency.
9. চরম মান (extreme values) দ্বারা কোনটি সবচেয়ে বেশি প্রভাবিত হয়? / Which measure is most affected by extreme values?
সঠিক উত্তর / Correct Answer:
(A) যৌগিক গড় / Arithmetic Mean
ব্যাখ্যা / Explanation:
যৌগিক গড় নির্ণয়ে ডেটাসেটের সমস্ত মান ব্যবহৃত হয়। তাই, কোনো একটি মান খুব বড় বা খুব ছোট হলে গড়ের মান সেদিকে ঝুঁকে পড়ে। মধ্যমা ও সংখ্যাগুরু মান চরম মান দ্বারা ততটা প্রভাবিত হয় না।
The arithmetic mean uses all values in the dataset for its calculation. Therefore, if any value is very large or very small, the mean gets skewed towards it. The median and mode are not as affected by extreme values.
10. একটি সুষম নিবেশনের (symmetric distribution) ক্ষেত্রে, গড়, মধ্যমা ও সংখ্যাগুরু মানের সম্পর্ক কী? / For a symmetric distribution, what is the relationship between mean, median, and mode?
সঠিক উত্তর / Correct Answer:
(C) গড় = মধ্যমা = সংখ্যাগুরু মান / Mean = Median = Mode
ব্যাখ্যা / Explanation:
একটি সম্পূর্ণ সুষম নিবেশনে, কেন্দ্রীয় প্রবণতার তিনটি প্রধান পরিমাপক—গড়, মধ্যমা ও সংখ্যাগুরু মান—একই বিন্দুতে অবস্থান করে।
In a perfectly symmetric distribution, the three main measures of central tendency—mean, median, and mode—coincide at the same point.
11. সমক পার্থক্যের (Standard Deviation) বর্গকে কী বলা হয়? / What is the square of the Standard Deviation called?
সঠিক উত্তর / Correct Answer:
(A) ভেদাঙ্ক / Variance
ব্যাখ্যা / Explanation:
ভেদাঙ্ক (Variance) হলো সমক পার্থক্যের (Standard Deviation) বর্গ। সমক পার্থক্য হলো ভেদাঙ্কের ধনাত্মক বর্গমূল।
Variance is the square of the Standard Deviation. The Standard Deviation is the positive square root of the variance.
12. দুটি ভিন্ন এককের ডেটাসেটের বিস্তার তুলনা করার জন্য কোনটি শ্রেষ্ঠ পরিমাপক? / Which is the best measure to compare the dispersion of two datasets with different units?
সঠিক উত্তর / Correct Answer:
(D) বিভেদাঙ্ক / Coefficient of Variation (CV)
ব্যাখ্যা / Explanation:
বিভেদাঙ্ক (CV) হলো একটি আপেক্ষিক পরিমাপক যা একক-মুক্ত। এটি (SD/Mean) * 100% সূত্র দ্বারা গণনা করা হয়, তাই ভিন্ন একক বা ভিন্ন গড়যুক্ত ডেটাসেটের বিস্তার তুলনা করার জন্য এটি আদর্শ।
The Coefficient of Variation (CV) is a relative measure that is unit-free. It is calculated by the formula (SD/Mean) * 100%, making it ideal for comparing the dispersion of datasets with different units or different means.
13. চতুর্থক বিচ্যুতি (Quartile Deviation) এর সূত্র কোনটি? / What is the formula for Quartile Deviation?
সঠিক উত্তর / Correct Answer:
(C) (Q3 – Q1) / 2
ব্যাখ্যা / Explanation:
চতুর্থক বিচ্যুতি বা অর্ধ-আন্তঃচতুর্থক পরিসর হলো তৃতীয় চতুর্থক (Q3) এবং প্রথম চতুর্থক (Q1) এর পার্থক্যের অর্ধেক।
Quartile Deviation, or semi-interquartile range, is half the difference between the third quartile (Q3) and the first quartile (Q1).
14. যদি কোনো ডেটাসেটের প্রতিটি মানকে 5 দ্বারা বাড়ানো হয়, তবে নতুন সমক পার্থক্য কত হবে? / If every value in a dataset is increased by 5, what will be the new standard deviation?
সঠিক উত্তর / Correct Answer:
(C) অপরিবর্তিত থাকবে / Will remain unchanged
ব্যাখ্যা / Explanation:
বিস্তারের পরিমাপকগুলি মূলের পরিবর্তন (change of origin) দ্বারা প্রভাবিত হয় না। অর্থাৎ, প্রতিটি মানের সাথে কোনো ধ্রুবক যোগ বা বিয়োগ করলে সমক পার্থক্য বা ভেদাঙ্কের কোনো পরিবর্তন হয় না।
Measures of dispersion are not affected by a change of origin. That is, adding or subtracting a constant from every value does not change the standard deviation or variance.
15. যদি কোনো ডেটাসেটের প্রতিটি মানকে 3 দ্বারা গুণ করা হয়, তবে নতুন ভেদাঙ্ক কত হবে? / If every value in a dataset is multiplied by 3, what will be the new variance?
সঠিক উত্তর / Correct Answer:
(C) 9 গুণ হবে / Will be multiplied by 9
ব্যাখ্যা / Explanation:
ভেদাঙ্ক স্কেলের পরিবর্তন (change of scale) দ্বারা প্রভাবিত হয়। যদি প্রতিটি মানকে k দ্বারা গুণ করা হয়, তবে নতুন ভেদাঙ্ক k² গুণ হবে। এখানে k=3, তাই ভেদাঙ্ক 3² = 9 গুণ হবে।
Variance is affected by a change of scale. If every value is multiplied by k, the new variance will be multiplied by k². Here k=3, so the variance will be multiplied by 3² = 9.
Topic: Moments, Skewness, and Kurtosis
16. প্রথম কেন্দ্রীয় পরিঘাত (first central moment, μ1) এর মান সর্বদা কত? / What is the value of the first central moment (μ1) always?
সঠিক উত্তর / Correct Answer:
(B) 0
ব্যাখ্যা / Explanation:
প্রথম কেন্দ্রীয় পরিঘাতের সংজ্ঞা হলো E(X – E(X)), যা E(X) – E(X) = 0 হয়। এটি দেখায় যে গড় থেকে বিচ্যুতিগুলির যোগফল সর্বদা শূন্য।
The definition of the first central moment is E(X – E(X)), which equals E(X) – E(X) = 0. This shows that the sum of deviations from the mean is always zero.
17. দ্বিতীয় কেন্দ্রীয় পরিঘাত (second central moment, μ2) কিসের সমান? / What is the second central moment (μ2) equal to?
সঠিক উত্তর / Correct Answer:
(C) ভেদাঙ্ক / Variance
ব্যাখ্যা / Explanation:
দ্বিতীয় কেন্দ্রীয় পরিঘাতের সংজ্ঞা হলো E[(X – E(X))²], যা ভেদাঙ্কের সংজ্ঞার সমান।
The definition of the second central moment is E[(X – E(X))²], which is identical to the definition of variance.
18. প্রতিবৈষম্য (Skewness) কী পরিমাপ করে? / What does Skewness measure?
সঠিক উত্তর / Correct Answer:
(B) নিবেশনের প্রতিসাম্যের অভাব / The lack of symmetry in the distribution
ব্যাখ্যা / Explanation:
প্রতিবৈষম্য বা স্কিউনেস একটি নিবেশন কতটা অপ্রতিসম তা পরিমাপ করে। ধনাত্মক স্কিউনেস মানে নিবেশনের ডানদিকের লেজটি লম্বা, এবং ঋণাত্মক স্কিউনেস মানে বামদিকের লেজটি লম্বা।
Skewness measures how asymmetric a distribution is. Positive skewness means the right tail of the distribution is longer, and negative skewness means the left tail is longer.
19. একটি ধনাত্মক প্রতিসম (positively skewed) নিবেশনে গড়, মধ্যমা ও সংখ্যাগুরু মানের সম্পর্ক কী? / In a positively skewed distribution, what is the relationship between mean, median, and mode?
সঠিক উত্তর / Correct Answer:
(C) গড় > মধ্যমা > সংখ্যাগুরু মান / Mean > Median > Mode
ব্যাখ্যা / Explanation:
ধনাত্মক প্রতিসম নিবেশনে, উচ্চ মানের কিছু আউটলায়ার (outlier) গড়কে ডানদিকে টেনে নেয়, তাই গড়ের মান সবচেয়ে বেশি হয়। মধ্যমা মাঝে থাকে এবং সংখ্যাগুরু মান (সর্বোচ্চ ফ্রিকোয়েন্সি) বামদিকে থাকে।
In a positively skewed distribution, a few high-value outliers pull the mean to the right, making it the largest value. The median lies in between, and the mode (highest frequency) is to the left.
20. তীক্ষ্ণতা (Kurtosis) কী পরিমাপ করে? / What does Kurtosis measure?
সঠিক উত্তর / Correct Answer:
(A) নিবেশনের চূড়ার উচ্চতা বা তীক্ষ্ণতা / The peakedness or flatness of the distribution
ব্যাখ্যা / Explanation:
তীক্ষ্ণতা বা কার্টোসিস একটি নিবেশনের চূড়া কতটা সূঁচালো বা চ্যাপ্টা তা পরিমাপ করে, নর্মাল নিবেশনের সাপেক্ষে।
Kurtosis measures how peaked or flat a distribution is, relative to a normal distribution.
21. একটি নিবেশনকে লেপ্টোকার্টিক (Leptokurtic) বলা হয় যখন β2 এর মান কত হয়? / A distribution is called Leptokurtic when the value of β2 is?
সঠিক উত্তর / Correct Answer:
(C) β2 > 3
ব্যাখ্যা / Explanation:
নর্মাল নিবেশনের জন্য β2 (কার্টোসিস সহগ) = 3। যদি β2 > 3 হয়, নিবেশনটি নর্মাল নিবেশনের চেয়ে বেশি সূঁচালো হয় এবং তাকে লেপ্টোকার্টিক বলে। β2 < 3 হলে তাকে প্লেটিকার্টিক (Platykurtic) এবং β2 = 3 হলে মেসোকার্টিক (Mesokurtic) বলে।
For a normal distribution, β2 (coefficient of kurtosis) = 3. If β2 > 3, the distribution is more peaked than the normal distribution and is called Leptokurtic. If β2 < 3, it's called Platykurtic, and if β2 = 3, it's called Mesokurtic.
22. পিয়ারসনের প্রতিবৈষম্য সহগ (Pearsonian coefficient of skewness) β1 এর সূত্র কী? / What is the formula for Pearson’s coefficient of skewness, β1?
সঠিক উত্তর / Correct Answer:
(D) μ3² / μ2³
ব্যাখ্যা / Explanation:
পিয়ারসনের মোমেন্ট-ভিত্তিক প্রতিবৈষম্য সহগ β1 = μ3² / μ2³ দ্বারা সংজ্ঞায়িত হয়, যেখানে μ2 এবং μ3 যথাক্রমে দ্বিতীয় এবং তৃতীয় কেন্দ্রীয় পরিঘাত। আরেকটি সহগ হলো γ1 = μ3 / μ2^(3/2), যেখানে β1 = γ1²।
Pearson’s moment-based coefficient of skewness β1 is defined as μ3² / μ2³, where μ2 and μ3 are the second and third central moments, respectively. Another coefficient is γ1 = μ3 / μ2^(3/2), where β1 = γ1².
23. একটি সুষম নিবেশনের জন্য β1 এর মান কত? / For a symmetric distribution, what is the value of β1?
সঠিক উত্তর / Correct Answer:
(C) 0
ব্যাখ্যা / Explanation:
একটি সুষম নিবেশনের জন্য, সমস্ত বিজোড় ক্রমের কেন্দ্রীয় পরিঘাত (odd-order central moments) যেমন μ3, μ5 ইত্যাদি শূন্য হয়। যেহেতু β1 = μ3² / μ2³, তাই β1 এর মানও শূন্য হয়।
For a symmetric distribution, all odd-order central moments like μ3, μ5, etc., are zero. Since β1 = μ3² / μ2³, the value of β1 is also zero.
24. β1 এবং β2 ডায়াগ্রাম কী কাজে ব্যবহৃত হয়? / What is the β1 and β2 diagram used for?
সঠিক উত্তর / Correct Answer:
(A) বিভিন্ন ধরনের পরিসংখ্যা নিবেশন সনাক্ত করতে / To identify different types of frequency distributions
ব্যাখ্যা / Explanation:
β1 (প্রতিবৈষম্য) এবং β2 (তীক্ষ্ণতা) এর মানের উপর ভিত্তি করে একটি ডায়াগ্রাম তৈরি করা হয় যা পিয়ারসন সিস্টেমের বিভিন্ন ধরনের নিবেশন (যেমন, Type I, Type IV, Normal, Gamma) সনাক্ত করতে সাহায্য করে।
A diagram based on the values of β1 (skewness) and β2 (kurtosis) is used to help identify different types of distributions in the Pearsonian system (e.g., Type I, Type IV, Normal, Gamma).
Topic: Standard Univariate Distributions
25. দ্বিপদ নিবেশনের (Binomial Distribution) জন্য নিচের কোনটি অপরিহার্য শর্ত নয়? / Which of the following is not an essential condition for a Binomial Distribution?
সঠিক উত্তর / Correct Answer:
(C) সাফল্যের সম্ভাবনা (p) প্রতিটি চেষ্টায় পরিবর্তিত হয় / Probability of success (p) changes in each trial
ব্যাখ্যা / Explanation:
দ্বিপদ নিবেশনের একটি মূল শর্ত হলো প্রতিটি চেষ্টায় সাফল্যের সম্ভাবনা (p) ধ্রুবক থাকে। যদি এটি পরিবর্তিত হয়, তবে সেটি দ্বিপদ নিবেশন হবে না।
A key condition for the Binomial Distribution is that the probability of success (p) remains constant for each trial. If it changes, the distribution is not binomial.
26. একটি দ্বিপদ নিবেশনের গড় (mean) এবং ভেদাঙ্ক (variance) কী? / What are the mean and variance of a Binomial Distribution?
সঠিক উত্তর / Correct Answer:
(A) গড় = np, ভেদাঙ্ক = npq
ব্যাখ্যা / Explanation:
B(n, p) দ্বারা চিহ্নিত একটি দ্বিপদ নিবেশনের গড় হলো μ = np এবং ভেদাঙ্ক হলো σ² = npq, যেখানে q = 1-p।
For a Binomial Distribution denoted by B(n, p), the mean is μ = np and the variance is σ² = npq, where q = 1-p.
27. দ্বিপদ নিবেশনে, ভেদাঙ্কের মান কি গড়ের চেয়ে বেশি হতে পারে? / In a Binomial Distribution, can the variance be greater than the mean?
সঠিক উত্তর / Correct Answer:
(B) না / No
ব্যাখ্যা / Explanation:
দ্বিপদ নিবেশনে গড় = np এবং ভেদাঙ্ক = npq। যেহেতু q = 1-p এবং 0 < p < 1, তাই q এর মান সর্বদা 1 এর চেয়ে কম। সুতরাং, npq সর্বদা np এর চেয়ে কম হবে। অর্থাৎ, ভেদাঙ্ক < গড়।
In a Binomial Distribution, Mean = np and Variance = npq. Since q = 1-p and 0 < p < 1, the value of q is always less than 1. Therefore, npq will always be less than np. i.e., Variance < Mean.
28. পয়সোঁ নিবেশন (Poisson Distribution) কোন ধরনের ঘটনার জন্য ব্যবহৃত হয়? / For what type of events is the Poisson Distribution used?
সঠিক উত্তর / Correct Answer:
(B) বিরল ঘটনা / Rare events
ব্যাখ্যা / Explanation:
পয়সোঁ নিবেশন একটি নির্দিষ্ট সময় বা স্থানে ঘটা বিরল ঘটনার সংখ্যা মডেল করতে ব্যবহৃত হয়, যেমন এক ঘণ্টায় একটি কল সেন্টারে আসা ফোনের সংখ্যা বা এক পৃষ্ঠায় মুদ্রণের ভুলের সংখ্যা।
The Poisson Distribution is used to model the number of rare events occurring in a fixed interval of time or space, such as the number of phone calls received at a call center in an hour or the number of printing errors on a page.
29. পয়সোঁ নিবেশনের একটি অনন্য বৈশিষ্ট্য কী? / What is a unique property of the Poisson Distribution?
সঠিক উত্তর / Correct Answer:
(C) গড় = ভেদাঙ্ক / Mean = Variance
ব্যাখ্যা / Explanation:
পয়সোঁ নিবেশনের জন্য, গড় (μ) এবং ভেদাঙ্ক (σ²) উভয়ই এর একমাত্র প্যারামিটার λ (lambda) এর সমান। অর্থাৎ, μ = σ² = λ।
For a Poisson Distribution, both the mean (μ) and the variance (σ²) are equal to its single parameter, λ (lambda). That is, μ = σ² = λ.
30. কোন পরিস্থিতিতে দ্বিপদ নিবেশন পয়সোঁ নিবেশনের কাছাকাছি হয়? / Under what conditions does the Binomial Distribution approach the Poisson Distribution?
সঠিক উত্তর / Correct Answer:
(B) n খুব বড় এবং p খুব ছোট / n is very large and p is very small
ব্যাখ্যা / Explanation:
যখন চেষ্টার সংখ্যা (n) অসীমের দিকে যায় এবং সাফল্যের সম্ভাবনা (p) শূন্যের দিকে যায়, এমনভাবে যে তাদের গুণফল np একটি সসীম ধ্রুবক λ হয়, তখন দ্বিপদ নিবেশন পয়সোঁ নিবেশনে রূপান্তরিত হয়।
When the number of trials (n) tends to infinity and the probability of success (p) tends to zero, such that their product np is a finite constant λ, the Binomial Distribution approximates to the Poisson Distribution.
31. হাইপারজিওমেট্রিক নিবেশন (Hypergeometric Distribution) কখন ব্যবহৃত হয়? / When is the Hypergeometric Distribution used?
সঠিক উত্তর / Correct Answer:
(B) প্রতিস্থাপন ছাড়া নমুনা চয়নের ক্ষেত্রে / In sampling without replacement
ব্যাখ্যা / Explanation:
যখন একটি সসীম সমগ্রক থেকে প্রতিস্থাপন ছাড়া নমুনা চয়ন করা হয়, তখন প্রতিটি চেষ্টার ফলাফল স্বাধীন থাকে না। এই পরিস্থিতিতে হাইপারজিওমেট্রিক নিবেশন ব্যবহৃত হয়।
When a sample is drawn from a finite population without replacement, the outcome of each trial is not independent. The Hypergeometric Distribution is used in this scenario.
32. ঋণাত্মক দ্বিপদ নিবেশন (Negative Binomial Distribution) কী গণনা করে? / What does the Negative Binomial Distribution count?
সঠিক উত্তর / Correct Answer:
(C) একটি নির্দিষ্ট সংখ্যক সাফল্য (r) পাওয়ার জন্য প্রয়োজনীয় চেষ্টার সংখ্যা / The number of trials required to get a fixed number of successes (r)
ব্যাখ্যা / Explanation:
ঋণাত্মক দ্বিপদ নিবেশন বার্নুলি চেষ্টার একটি ক্রম বিবেচনা করে এবং r-তম সাফল্যটি k-তম চেষ্টায় ঘটার সম্ভাবনা নির্ণয় করে। জ্যামিতিক নিবেশন এর একটি বিশেষ রূপ যেখানে r=1।
The Negative Binomial Distribution considers a sequence of Bernoulli trials and calculates the probability that the r-th success occurs on the k-th trial. The Geometric distribution is a special case where r=1.
33. একটি নর্মাল নিবেশন রেখার (Normal Distribution Curve) আকৃতি কেমন? / What is the shape of a Normal Distribution Curve?
সঠিক উত্তর / Correct Answer:
(C) ঘণ্টাকৃতি এবং প্রতিসম / Bell-shaped and symmetric
ব্যাখ্যা / Explanation:
নর্মাল নিবেশন রেখাটি তার গড়ের চারপাশে প্রতিসম এবং এর আকৃতি একটি ঘণ্টার মতো। এটিকে গাউসিয়ান কার্ভও বলা হয়।
The Normal Distribution curve is symmetric about its mean and has a shape resembling a bell. It is also called the Gaussian curve.
34. একটি প্রমাণ নর্মাল নিবেশনের (Standard Normal Distribution) গড় এবং সমক পার্থক্য কত? / What are the mean and standard deviation of a Standard Normal Distribution?
সঠিক উত্তর / Correct Answer:
(B) গড়=0, সমক পার্থক্য=1 / Mean=0, SD=1
ব্যাখ্যা / Explanation:
প্রমাণ নর্মাল নিবেশন হলো একটি বিশেষ ধরনের নর্মাল নিবেশন যার গড় শূন্য (0) এবং সমক পার্থক্য এক (1)। যেকোনো নর্মাল চলক X-কে Z = (X-μ)/σ সূত্র দ্বারা প্রমাণ নর্মাল চলকে রূপান্তরিত করা যায়।
The Standard Normal Distribution is a special case of the normal distribution with a mean of zero (0) and a standard deviation of one (1). Any normal variable X can be transformed into a standard normal variable Z using the formula Z = (X-μ)/σ.
35. নর্মাল নিবেশন রেখার অধীনে মোট ক্ষেত্রফল কত? / What is the total area under the Normal Distribution curve?
সঠিক উত্তর / Correct Answer:
(B) 1
ব্যাখ্যা / Explanation:
যেকোনো সম্ভাবনা ঘনত্ব ফাংশনের (probability density function) মতো, নর্মাল নিবেশন রেখার অধীনে মোট ক্ষেত্রফল 1, যা মোট সম্ভাবনাকে নির্দেশ করে।
Like any probability density function, the total area under the Normal Distribution curve is 1, which represents the total probability.
36. যদি একটি চলক X নর্মাল নিবেশন অনুসরণ করে, তবে Y = e^X কোন নিবেশন অনুসরণ করবে? / If a variable X follows a Normal distribution, what distribution will Y = e^X follow?
সঠিক উত্তর / Correct Answer:
(C) লগ-নর্মাল নিবেশন / Log-normal distribution
ব্যাখ্যা / Explanation:
লগ-নর্মাল নিবেশনের সংজ্ঞা অনুযায়ী, যদি একটি চলকের লগারিদম নর্মাল নিবেশন অনুসরণ করে, তবে সেই চলকটি লগ-নর্মাল নিবেশন অনুসরণ করে। এখানে log(Y) = X, এবং X নর্মাল, তাই Y লগ-নর্মাল।
By definition of a log-normal distribution, a variable follows a log-normal distribution if its logarithm follows a normal distribution. Here, log(Y) = X, and since X is normal, Y is log-normal.
Topic: Simple Correlation and Linear Regression
37. সহসম্পর্ক সহগ (Correlation Coefficient, r) এর মান কোন সীমার মধ্যে থাকে? / The value of the Correlation Coefficient (r) lies between which range?
সঠিক উত্তর / Correct Answer:
(B) -1 থেকে +1 / -1 to +1
ব্যাখ্যা / Explanation:
কার্ল পিয়ারসনের সহসম্পর্ক সহগের মান সর্বদা -1 এবং +1 এর মধ্যে থাকে। +1 মানে সম্পূর্ণ ধনাত্মক রৈখিক সম্পর্ক, -1 মানে সম্পূর্ণ ঋণাত্মক রৈখিক সম্পর্ক, এবং 0 মানে কোনো রৈখিক সম্পর্ক নেই।
The value of Karl Pearson’s correlation coefficient always lies between -1 and +1. +1 indicates a perfect positive linear relationship, -1 indicates a perfect negative linear relationship, and 0 indicates no linear relationship.
38. যদি r = +1 হয়, তাহলে দুটি চলকের মধ্যে সম্পর্কটি কী? / If r = +1, then what is the relationship between the two variables?
সঠিক উত্তর / Correct Answer:
(A) সম্পূর্ণ ধনাত্মক রৈখিক সম্পর্ক / Perfect positive linear relationship
ব্যাখ্যা / Explanation:
r = +1 নির্দেশ করে যে একটি চলক বাড়লে অন্যটিও আনুপাতিক হারে বাড়ে এবং সমস্ত বিন্দু একটি ধনাত্মক ঢালযুক্ত সরলরেখার উপর অবস্থিত।
r = +1 indicates that as one variable increases, the other also increases proportionally, and all points lie on a straight line with a positive slope.
39. সহসম্পর্ক সহগ (r) কি মূল (origin) এবং স্কেলের (scale) পরিবর্তনের উপর নির্ভরশীল? / Is the correlation coefficient (r) dependent on the change of origin and scale?
সঠিক উত্তর / Correct Answer:
(D) উভয়ের থেকেই স্বাধীন / Independent of both
ব্যাখ্যা / Explanation:
সহসম্পর্ক সহগ একটি একক-মুক্ত পরিমাপ এবং এটি চলকগুলির মানের সাথে কোনো ধ্রুবক যোগ/বিয়োগ বা গুণ/ভাগ করলেও পরিবর্তিত হয় না (যদি না ঋণাত্মক সংখ্যা দ্বারা গুণ করা হয়, সেক্ষেত্রে চিহ্ন পাল্টে যায়)।
The correlation coefficient is a unit-free measure and does not change if a constant is added/subtracted or multiplied/divided to the values of the variables (unless multiplied by a negative number, which inverts the sign).
40. রিগ্রেশন বিশ্লেষণের (Regression Analysis) মূল উদ্দেশ্য কী? / What is the main purpose of Regression Analysis?
সঠিক উত্তর / Correct Answer:
(B) একটি চলকের মানের উপর ভিত্তি করে অন্য একটি চলকের মান অনুমান করা / To predict the value of one variable based on the value of another
ব্যাখ্যা / Explanation:
রিগ্রেশন বিশ্লেষণ একটি স্বাধীন চলকের (independent variable) মানের সাহায্যে একটি অধীন চলকের (dependent variable) মান সম্পর্কে ভবিষ্যদ্বাণী বা অনুমান করার জন্য একটি গাণিতিক মডেল তৈরি করে।
Regression analysis creates a mathematical model to predict or estimate the value of a dependent variable based on the value of an independent variable.
41. দুটি রিগ্রেশন রেখা (regression lines), Y on X এবং X on Y, কখন একই হবে? / When will the two regression lines, Y on X and X on Y, be identical?
সঠিক উত্তর / Correct Answer:
(B) যখন r = +1 বা -1 / When r = +1 or -1
ব্যাখ্যা / Explanation:
যখন চলকগুলির মধ্যে সম্পূর্ণ রৈখিক সহসম্পর্ক থাকে (r = ±1), তখন সমস্ত বিন্দু একটি সরলরেখায় থাকে এবং দুটি রিগ্রেশন রেখাই সেই একই সরলরেখার উপর মিলে যায়।
When there is a perfect linear correlation between the variables (r = ±1), all the points lie on a single straight line, and both regression lines coincide with that same line.
42. দুটি রিগ্রেশন সহগ (regression coefficients), b_yx এবং b_xy, এবং সহসম্পর্ক সহগ (r) এর মধ্যে সম্পর্ক কী? / What is the relationship between the two regression coefficients, b_yx and b_xy, and the correlation coefficient (r)?
সঠিক উত্তর / Correct Answer:
(C) r = √(b_yx * b_xy)
ব্যাখ্যা / Explanation:
সহসম্পর্ক সহগ হলো দুটি রিগ্রেশন সহগের গুণোত্তর গড় (geometric mean)। r-এর চিহ্ন b_yx এবং b_xy উভয়ের চিহ্নের সমান হবে।
The correlation coefficient is the geometric mean of the two regression coefficients. The sign of r will be the same as the sign of both b_yx and b_xy.
43. যদি একটি রিগ্রেশন সহগ 1.5 হয়, তবে অন্য রিগ্রেশন সহগের মান কত হতে পারে? / If one regression coefficient is 1.5, what can be the value of the other regression coefficient?
সঠিক উত্তর / Correct Answer:
(C) 0.4
ব্যাখ্যা / Explanation:
আমরা জানি r² = b_yx * b_xy এবং r² ≤ 1। সুতরাং, b_yx * b_xy ≤ 1। যেহেতু একটি সহগ (1.5) 1-এর চেয়ে বড়, অন্যটি অবশ্যই 1-এর চেয়ে ছোট হতে হবে যাতে তাদের গুণফল 1 বা তার কম হয়। এছাড়াও, উভয় সহগের চিহ্ন একই হতে হবে। 1.5 * 0.4 = 0.6, যা ≤ 1। অন্য বিকল্পগুলি এই শর্ত পূরণ করে না।
We know that r² = b_yx * b_xy and r² ≤ 1. Therefore, b_yx * b_xy ≤ 1. Since one coefficient (1.5) is greater than 1, the other must be less than 1 for their product to be less than or equal to 1. Also, both coefficients must have the same sign. 1.5 * 0.4 = 0.6, which is ≤ 1. The other options do not satisfy this condition.
44. দুটি রিগ্রেশন রেখা কোন বিন্দুতে ছেদ করে? / At which point do the two regression lines intersect?
সঠিক উত্তর / Correct Answer:
(C) (x̄, ȳ)
ব্যাখ্যা / Explanation:
Y on X এবং X on Y উভয় রিগ্রেশন রেখাই সর্বদা দুটি চলকের গড় (x̄, ȳ) বিন্দুর মধ্যে দিয়ে যায়। এটি তাদের ছেদবিন্দু।
Both regression lines, Y on X and X on Y, always pass through the point of means (x̄, ȳ) of the two variables. This is their point of intersection.
45. যদি দুটি চলক স্বাধীন হয়, তাদের সহসম্পর্ক সহগ কত হবে? / If two variables are independent, what will be their correlation coefficient?
সঠিক উত্তর / Correct Answer:
(C) 0
ব্যাখ্যা / Explanation:
যদি দুটি চলক পরিসংখ্যানগতভাবে স্বাধীন হয়, তাদের মধ্যে কোনো রৈখিক সম্পর্ক থাকে না, তাই তাদের সহসম্পর্ক সহগ শূন্য হয়। তবে, এর বিপরীতটি সর্বদা সত্য নয় (r=0 মানেই স্বাধীন নাও হতে পারে, অরৈখিক সম্পর্ক থাকতে পারে)।
If two variables are statistically independent, there is no linear relationship between them, so their correlation coefficient is zero. However, the converse is not always true (r=0 does not necessarily mean independence; a non-linear relationship might exist).
Topic: Non-linear Regression and Measures of Association
46. যখন দুটি চলকের মধ্যে সম্পর্ক সরলরৈখিক নয়, তখন কোন ধরনের রিগ্রেশন ব্যবহার করা হয়? / When the relationship between two variables is not a straight line, what type of regression is used?
সঠিক উত্তর / Correct Answer:
(B) অরৈখিক রিগ্রেশন / Non-linear Regression
ব্যাখ্যা / Explanation:
অরৈখিক রিগ্রেশন বা বক্ররৈখিক রিগ্রেশন ব্যবহার করা হয় যখন চলকগুলির মধ্যে সম্পর্ক একটি বক্ররেখা দ্বারা সবচেয়ে ভালোভাবে প্রকাশ করা যায়, যেমন দ্বিঘাত (quadratic) বা সূচকীয় (exponential) সম্পর্ক।
Non-linear or curvilinear regression is used when the relationship between variables is best represented by a curve, such as a quadratic or exponential relationship.
47. সহসম্পর্ক অনুপাত (Correlation Ratio, η) কী পরিমাপ করে? / What does the Correlation Ratio (η) measure?
সঠিক উত্তর / Correct Answer:
(C) রৈখিক এবং অরৈখিক উভয় প্রকার সম্পর্ক / Both linear and non-linear relationship
ব্যাখ্যা / Explanation:
সহসম্পর্ক অনুপাত (η) দুটি চলকের মধ্যে যেকোনো ধরনের (রৈখিক বা অরৈখিক) কার্যকরী সম্পর্ক পরিমাপ করতে পারে। এর মান 0 থেকে 1 এর মধ্যে থাকে।
The correlation ratio (η) can measure any type of functional relationship (linear or non-linear) between two variables. Its value ranges from 0 to 1.
48. সহসম্পর্ক অনুপাত (η) এবং সহসম্পর্ক সহগ (r) এর মধ্যে সম্পর্ক কী? / What is the relationship between the correlation ratio (η) and the correlation coefficient (r)?
সঠিক উত্তর / Correct Answer:
(C) |r| ≤ η
ব্যাখ্যা / Explanation:
সহসম্পর্ক অনুপাত (η) সর্বদা সহসম্পর্ক সহগের পরম মানের (|r|) চেয়ে বড় বা সমান হয়। যখন সম্পর্কটি সম্পূর্ণ রৈখিক হয়, তখন |r| = η হয়। (η² – r²) এর পার্থক্যটি সম্পর্কটির অরৈখিকতার মাত্রা নির্দেশ করে।
The correlation ratio (η) is always greater than or equal to the absolute value of the correlation coefficient (|r|). When the relationship is perfectly linear, |r| = η. The difference (η² – r²) indicates the degree of non-linearity in the relationship.
49. সহসম্পর্ক সূচক (Correlation Index) কী? / What is the Correlation Index?
সঠিক উত্তর / Correct Answer:
(B) অরৈখিক সম্পর্কের শক্তি পরিমাপক / A measure of the strength of non-linear relationship
ব্যাখ্যা / Explanation:
সহসম্পর্ক সূচক অরৈখিক রিগ্রেশন মডেলের ক্ষেত্রে ব্যবহৃত হয়। এটি পর্যবেক্ষণ করা মান এবং রিগ্রেশন রেখা থেকে অনুমান করা মানগুলির মধ্যে সহসম্পর্ক পরিমাপ করে, যা r-এর অরৈখিক প্রতিরূপ।
The correlation index is used in the context of non-linear regression models. It measures the correlation between the observed values and the values predicted by the regression curve, serving as a non-linear analogue to r.
50. সংস্রব (Association) পরিমাপ করতে কোনটি ব্যবহৃত হয়? / Which of the following is used to measure Association?
সঠিক উত্তর / Correct Answer:
(B) কাই-স্কোয়ার পরীক্ষা (χ²) / Chi-square test (χ²)
ব্যাখ্যা / Explanation:
সংস্রব বা Association গুণবাচক চলকের (qualitative variables) মধ্যে সম্পর্ক পরিমাপ করে। কাই-স্কোয়ার পরীক্ষা দুটি গুণবাচক চলকের মধ্যে কোনো উল্লেখযোগ্য সংস্রব আছে কিনা তা পরীক্ষা করার জন্য ব্যবহৃত একটি জনপ্রিয় পদ্ধতি, যা কন্টিজেন্সি টেবিলের উপর ভিত্তি করে কাজ করে।
Association measures the relationship between qualitative variables. The Chi-square test is a popular method used to test for a significant association between two qualitative variables, based on a contingency table.
51. একটি 2×2 কন্টিজেন্সি টেবিলে (Contingency Table) দুটি গুণবাচক চলক স্বাধীন হলে, কাই-স্কোয়ার (χ²) এর প্রত্যাশিত মান কত? / In a 2×2 contingency table, if two qualitative variables are independent, what is the expected value of Chi-square (χ²)?
সঠিক উত্তর / Correct Answer:
(C) 0
ব্যাখ্যা / Explanation:
কাই-স্কোয়ার পরিসংখ্যান পর্যবেক্ষণ করা পরিসংখ্যা (Observed frequency) এবং প্রত্যাশিত পরিসংখ্যার (Expected frequency) মধ্যে পার্থক্য পরিমাপ করে। যদি চলক দুটি স্বাধীন হয়, তবে পর্যবেক্ষণ করা পরিসংখ্যা এবং প্রত্যাশিত পরিসংখ্যার মান প্রায় সমান হবে, ফলে χ² এর মান শূন্যের কাছাকাছি হবে।
The Chi-square statistic measures the difference between observed frequencies and expected frequencies. If the variables are independent, the observed frequencies will be very close to the expected frequencies, resulting in a χ² value close to zero.
52. ইউলের সংস্রব গুণাঙ্ক (Yule’s coefficient of association, Q) এর সীমা কত? / What is the range of Yule’s coefficient of association (Q)?
সঠিক উত্তর / Correct Answer:
(B) -1 থেকে +1 / -1 to +1
ব্যাখ্যা / Explanation:
ইউলের Q 2×2 কন্টিজেন্সি টেবিলের জন্য সংস্রব পরিমাপ করে এবং এর মান -1 থেকে +1 পর্যন্ত হতে পারে। +1 মানে সম্পূর্ণ ধনাত্মক সংস্রব, -1 মানে সম্পূর্ণ ঋণাত্মক সংস্রব এবং 0 মানে কোনো সংস্রব নেই।
Yule’s Q measures association for a 2×2 contingency table and its value can range from -1 to +1. +1 indicates perfect positive association, -1 indicates perfect negative association, and 0 indicates no association.
Topic: Rank Correlation, Intra-class correlation, Kendall’s τ
53. স্পিয়ারম্যানের ক্রম सहসম্পর্ক সহগ (Spearman’s rank correlation coefficient) কখন ব্যবহার করা হয়? / When is Spearman’s rank correlation coefficient used?
সঠিক উত্তর / Correct Answer:
(D) উপরের সবকটি / All of the above
ব্যাখ্যা / Explanation:
স্পিয়ারম্যানের ক্রম সহসম্পর্ক ডেটাকে র্যাঙ্কে রূপান্তরিত করে কাজ করে। তাই এটি গুণবাচক ডেটা (যেমন সৌন্দর্য, বুদ্ধিমত্তা) এবং পরিমাণগত ডেটা উভয়ের জন্য ব্যবহার করা যায়। এটি আউটলায়ার দ্বারা কম প্রভাবিত হয় এবং অরৈখিক একমুখী (monotonic) সম্পর্ক সনাক্ত করতে পারে।
Spearman’s rank correlation works by converting data into ranks. Therefore, it can be used for both qualitative data (like beauty, intelligence) and quantitative data. It is less affected by outliers and can detect non-linear monotonic relationships.
54. যদি দুটি চলকের র্যাঙ্কগুলি সম্পূর্ণ বিপরীত ক্রমে থাকে, তবে স্পিয়ারম্যানের সহগ (ρ) কত হবে? / If the ranks of two variables are in perfect reverse order, what will be the value of Spearman’s coefficient (ρ)?
সঠিক উত্তর / Correct Answer:
(B) -1
ব্যাখ্যা / Explanation:
যখন একটি চলকের র্যাঙ্ক বাড়ার সাথে সাথে অন্যটির র্যাঙ্ক ধারাবাহিকভাবে কমে, তখন তাদের মধ্যে একটি সম্পূর্ণ ঋণাত্মক একমুখী সম্পর্ক থাকে, এবং স্পিয়ারম্যানের সহগ -1 হয়।
When the rank of one variable consistently decreases as the other’s rank increases, there is a perfect negative monotonic relationship, and Spearman’s coefficient is -1.
55. কেন্ডালের টাউ (Kendall’s Tau, τ) কী পরিমাপ করে? / What does Kendall’s Tau (τ) measure?
সঠিক উত্তর / Correct Answer:
(A) concordant এবং discordant জোড়ার উপর ভিত্তি করে ক্রমিক সংস্রব / Ordinal association based on concordant and discordant pairs
ব্যাখ্যা / Explanation:
কেন্ডালের τ একটি নন-প্যারামেট্রিক পরীক্ষা যা দুটি চলকের মধ্যে ক্রমিক সংস্রব পরিমাপ করে। এটি ডেটার সমস্ত সম্ভাব্য জোড়াকে concordant (একই দিকে সম্পর্ক) এবং discordant (বিপরীত দিকে সম্পর্ক) হিসাবে শ্রেণীবদ্ধ করে গণনা করা হয়।
Kendall’s τ is a non-parametric test that measures the ordinal association between two variables. It is calculated by classifying all possible pairs of data as either concordant (relationship in the same direction) or discordant (relationship in the opposite direction).
56. ইন্ট্রা-ক্লাস সহসম্পর্ক (Intra-class Correlation) কী পরিমাপের জন্য ব্যবহৃত হয়? / What is Intra-class Correlation used to measure?
সঠিক উত্তর / Correct Answer:
(B) একই গ্রুপের মধ্যে থাকা সদস্যদের মধ্যে সাদৃশ্য / The similarity among members within the same group
ব্যাখ্যা / Explanation:
ইন্ট্রা-ক্লাস সহসম্পর্ক (ICC) একই শ্রেণী বা গ্রুপের মধ্যে এককগুলির একজাতীয়তা বা সাদৃশ্য পরিমাপ করে। উদাহরণস্বরূপ, একই পরিবারের ভাইবোনদের উচ্চতার মধ্যে সাদৃশ্য পরিমাপ করতে এটি ব্যবহার করা যেতে পারে।
Intra-class Correlation (ICC) measures the homogeneity or similarity of units within the same class or group. For example, it can be used to measure the similarity in height among siblings from the same family.
57. স্পিয়ারম্যানের ক্রম সহসম্পর্ক সহগের সূত্রে, D_i কী বোঝায়? / In the formula for Spearman’s rank correlation coefficient, what does D_i represent?
সঠিক উত্তর / Correct Answer:
(B) দুটি চলকের র্যাঙ্কের পার্থক্য / The difference between the ranks of the two variables
ব্যাখ্যা / Explanation:
স্পিয়ারম্যানের সহগের সূত্রটি হলো ρ = 1 – [6Σ(D_i)²] / [n(n²-1)], যেখানে D_i হলো প্রতিটি পর্যবেক্ষণকৃত জোড়ার জন্য দুটি চলকের র্যাঙ্কের পার্থক্য (R_xi – R_yi)।
The formula for Spearman’s coefficient is ρ = 1 – [6Σ(D_i)²] / [n(n²-1)], where D_i is the difference in ranks (R_xi – R_yi) for each observed pair.
58. কোন सहসম্পর্ক পদ্ধতিটি পিয়ারসনের r-এর নন-প্যারামেট্রিক বিকল্প হিসাবে বিবেচিত হয়? / Which correlation method is considered a non-parametric alternative to Pearson’s r?
সঠিক উত্তর / Correct Answer:
(C) স্পিয়ারম্যানের ক্রম সহসম্পর্ক / Spearman’s Rank Correlation
ব্যাখ্যা / Explanation:
পিয়ারসনের r পরিমাণগত, রৈখিক সম্পর্ক এবং নর্মাল নিবেশনের অনুমানের উপর নির্ভর করে। যখন এই অনুমানগুলি পূরণ হয় না বা ডেটা ক্রমিক হয়, তখন স্পিয়ারম্যানের ক্রম সহসম্পর্ক একটি শক্তিশালী বিকল্প হিসাবে ব্যবহৃত হয়।
Pearson’s r depends on assumptions of quantitative, linear relationships and normal distribution. When these assumptions are not met, or the data is ordinal, Spearman’s rank correlation is used as a robust alternative.
Topic: Multivariate, Multiple and Partial Correlation
59. মাল্টিভেরিয়েট নিবেশন (Multivariate Distribution) কী? / What is a Multivariate Distribution?
সঠিক উত্তর / Correct Answer:
(B) দুই বা ততোধিক দৈব চলকের যৌথ সম্ভাবনা নিবেশন / A joint probability distribution of two or more random variables
ব্যাখ্যা / Explanation:
যখন একাধিক দৈব চলকের আচরণ একই সাথে বিবেচনা করা হয়, তখন তাদের যৌথ সম্ভাবনা নিবেশনকে মাল্টিভেরিয়েট নিবেশন বলা হয়। দুটি চলকের ক্ষেত্রে একে বাইভেরিয়েট নিবেশন বলে।
When the behavior of multiple random variables is considered simultaneously, their joint probability distribution is called a multivariate distribution. For two variables, it is called a bivariate distribution.
60. একাধিক রৈখিক রিগ্রেশনে (Multiple Linear Regression) কী থাকে? / What does Multiple Linear Regression involve?
সঠিক উত্তর / Correct Answer:
(C) একাধিক স্বাধীন এবং একটি অধীন চলক / Multiple independent and one dependent variable
ব্যাখ্যা / Explanation:
একাধিক রৈখিক রিগ্রেশন একটি অধীন চলকের মানকে দুই বা ততোধিক স্বাধীন চলকের রৈখিক সংমিশ্রণের মাধ্যমে ব্যাখ্যা বা অনুমান করার চেষ্টা করে।
Multiple linear regression attempts to explain or predict the value of a single dependent variable through a linear combination of two or more independent variables.
61. আংশিক সহসম্পর্ক (Partial Correlation) কী পরিমাপ করে? / What does Partial Correlation measure?
সঠিক উত্তর / Correct Answer:
(B) দুটি চলকের মধ্যে সম্পর্ক, যখন এক বা একাধিক অন্য চলকের প্রভাব স্থির রাখা হয় / The relationship between two variables while keeping the effect of one or more other variables constant
ব্যাখ্যা / Explanation:
আংশিক সহসম্পর্ক দুটি চলকের মধ্যে নিট সম্পর্ককে প্রকাশ করে, যেখানে তৃতীয় বা অন্যান্য চলকের প্রভাবকে বাদ দেওয়া হয়। উদাহরণস্বরূপ, আইসক্রিম বিক্রি এবং অপরাধের হারের মধ্যে সম্পর্ক, তাপমাত্রার প্রভাব বাদ দিয়ে।
Partial correlation expresses the net relationship between two variables after removing the influence of a third or other variables. For example, the relationship between ice cream sales and crime rate, after controlling for the effect of temperature.
62. একাধিক সহসম্পর্ক সহগ (Multiple Correlation Coefficient, R) কী পরিমাপ করে? / What does the Multiple Correlation Coefficient (R) measure?
সঠিক উত্তর / Correct Answer:
(B) একটি অধীন চলকের পর্যবেক্ষণকৃত মান এবং রিগ্রেশন মডেল দ্বারা অনুমান করা মানগুলির মধ্যে সহসম্পর্ক / The correlation between the observed values of a dependent variable and the values predicted by the regression model
ব্যাখ্যা / Explanation:
একাধিক সহসম্পর্ক সহগ (R) পরিমাপ করে যে একাধিক স্বাধীন চলক সম্মিলিতভাবে একটি অধীন চলককে কতটা ভালোভাবে ব্যাখ্যা করতে পারে। এর মান 0 থেকে 1 এর মধ্যে থাকে।
The multiple correlation coefficient (R) measures how well a set of independent variables can collectively explain a dependent variable. Its value ranges from 0 to 1.
63. R² (নির্ণায়ক সহগ) এর মান 0.75 হলে এর অর্থ কী? / If the value of R² (Coefficient of Determination) is 0.75, what does it mean?
সঠিক উত্তর / Correct Answer:
(A) স্বাধীন চলকগুলি অধীন চলকের 75% প্রকরণ ব্যাখ্যা করতে পারে / 75% of the variation in the dependent variable can be explained by the independent variables
ব্যাখ্যা / Explanation:
R² (R-squared) হলো নির্ণায়ক সহগ, যা নির্দেশ করে যে রিগ্রেশন মডেলে অন্তর্ভুক্ত স্বাধীন চলকগুলি দ্বারা অধীন চলকের মোট প্রকরণের কত শতাংশ ব্যাখ্যা করা যায়। এখানে, 75% ব্যাখ্যা করা সম্ভব।
R² (R-squared) is the coefficient of determination, which indicates the percentage of the total variation in the dependent variable that can be explained by the independent variables included in the regression model. Here, 75% is explained.
64. যদি r12 = 0.8, r13 = 0.5, এবং r23 = 0.4 হয়, তবে r12.3 (X1 এবং X2 এর মধ্যে আংশিক সহসম্পর্ক, X3 কে স্থির রেখে) এর মান কী হবে? / If r12 = 0.8, r13 = 0.5, and r23 = 0.4, what will be the value of r12.3 (partial correlation between X1 and X2, holding X3 constant)?
সঠিক উত্তর / Correct Answer:
(A) 0.8 এর চেয়ে বড় / Greater than 0.8
ব্যাখ্যা / Explanation:
আংশিক সহসম্পর্কের সূত্র হলো: r12.3 = (r12 – r13*r23) / √[(1-r13²)(1-r23²)]।
মান বসিয়ে পাই: (0.8 – 0.5*0.4) / √[(1-0.25)(1-0.16)] = (0.8 – 0.2) / √[0.75 * 0.84] = 0.6 / √0.63 ≈ 0.6 / 0.794 ≈ 0.756।
সংশোধন: এখানে গণনাটি ভুল হয়েছে।重新 गणना করা যাক: (0.8 – 0.2) / √(0.63) = 0.6 / 0.7937 ≈ 0.756। এই মানটি 0.8 এর চেয়ে ছোট। সুতরাং, সঠিক উত্তর হবে (B)। প্রশ্নটির বিকল্পে হয়তো কোনো ভুল আছে অথবা গণনায় আরও কিছু বিবেচনা করতে হবে। সাধারণ নিয়ম হল, যদি r13 এবং r23 উভয়ের চিহ্ন r12 এর চিহ্নের সমান হয়, তবে r12.3 এর মান |r12| থেকে কম হবে। এখানে তাই ঘটেছে।
The formula for partial correlation is: r12.3 = (r12 – r13*r23) / √[(1-r13²)(1-r23²)].
Plugging in the values: (0.8 – 0.5*0.4) / √[(1-0.25)(1-0.16)] = (0.6) / √[0.75 * 0.84] = 0.6 / √0.63 ≈ 0.756. This value is less than 0.8. Thus, the correct answer is (B). The general rule is if r13 and r23 have the same sign as r12, the value of |r12.3| will be less than |r12|. This is the case here. Let’s select B as the correct answer based on calculation.
(B) 0.8 এর চেয়ে ছোট / Less than 0.8
65. আংশিক সহসম্পর্ক সহগের মান কোন সীমার মধ্যে থাকে? / The value of a partial correlation coefficient lies within which range?
সঠিক উত্তর / Correct Answer:
(B) -1 থেকে +1 / -1 to +1
ব্যাখ্যা / Explanation:
সরল সহসম্পর্ক সহগের মতোই, আংশিক সহসম্পর্ক সহগের মানও -1 এবং +1 এর মধ্যে সীমাবদ্ধ থাকে।
Just like the simple correlation coefficient, the value of the partial correlation coefficient is also bounded between -1 and +1.
Additional Mixed Questions | অতিরিক্ত মিশ্র প্রশ্ন
66. একটি মুদ্রা তিনবার টস করা হলে, ঠিক দুটি হেড পাওয়ার সম্ভাবনা কত? (এটি একটি দ্বিপদ নিবেশনের উদাহরণ) / If a coin is tossed three times, what is the probability of getting exactly two heads? (This is an example of a binomial distribution)
সঠিক উত্তর / Correct Answer:
(B) 3/8
ব্যাখ্যা / Explanation:
এখানে n=3 (চেষ্টার সংখ্যা), k=2 (সাফল্যের সংখ্যা), p=0.5 (হেড পড়ার সম্ভাবনা)। দ্বিপদ সূত্র অনুযায়ী P(X=k) = C(n,k) * p^k * (1-p)^(n-k)। P(X=2) = C(3,2) * (0.5)² * (0.5)¹ = 3 * 0.25 * 0.5 = 0.375 = 3/8।
Here n=3 (number of trials), k=2 (number of successes), p=0.5 (probability of heads). Using the binomial formula P(X=k) = C(n,k) * p^k * (1-p)^(n-k), we get P(X=2) = C(3,2) * (0.5)² * (0.5)¹ = 3 * 0.25 * 0.5 = 0.375 = 3/8.
67. একটি কারখানায় উৎপাদিত 1% বাল্ব ত্রুটিপূর্ণ। 100টি বাল্বের একটি নমুনায় ঠিক 2টি ত্রুটিপূর্ণ বাল্ব পাওয়ার সম্ভাবনা কোন নিবেশন দিয়ে সবচেয়ে ভালোভাবে গণনা করা যায়? / 1% of bulbs produced in a factory are defective. Which distribution is best suited to calculate the probability of finding exactly 2 defective bulbs in a sample of 100?
সঠিক উত্তর / Correct Answer:
(C) পয়সোঁ নিবেশন / Poisson Distribution
ব্যাখ্যা / Explanation:
এখানে n=100 (খুব বড়) এবং p=0.01 (খুব ছোট)। এই পরিস্থিতিতে দ্বিপদ নিবেশনকে পয়সোঁ নিবেশন দ্বারা আসন্ন করা যায়, যেখানে λ = np = 100 * 0.01 = 1। গণনা করা সহজ হয়।
Here n=100 (very large) and p=0.01 (very small). In this situation, the binomial distribution can be approximated by the Poisson distribution with λ = np = 100 * 0.01 = 1. This makes the calculation easier.
68. যদি একটি ডেটাসেটের ভেদাঙ্ক 16 হয়, তবে এর সমক পার্থক্য কত? / If the variance of a dataset is 16, what is its standard deviation?
সঠিক উত্তর / Correct Answer:
(A) 4
ব্যাখ্যা / Explanation:
সমক পার্থক্য হলো ভেদাঙ্কের ধনাত্মক বর্গমূল। সুতরাং, সমক পার্থক্য = √16 = 4।
Standard deviation is the positive square root of the variance. Therefore, Standard Deviation = √16 = 4.
69. একটি ঋণাত্মক প্রতিসম (negatively skewed) নিবেশনের জন্য, কোনটি সত্য? / For a negatively skewed distribution, which of the following is true?
সঠিক উত্তর / Correct Answer:
(A) গড় < মধ্যমা < সংখ্যাগুরু মান / Mean < Median < Mode
ব্যাখ্যা / Explanation:
ঋণাত্মক প্রতিসম নিবেশনে, বামদিকের লেজটি লম্বা থাকে এবং কিছু নিম্ন মানের আউটলায়ার গড়কে বামদিকে টেনে নেয়। ফলে, গড়ের মান সবচেয়ে কম হয়। প্রতিবৈষম্য সহগ (γ1) ঋণাত্মক হয়।
In a negatively skewed distribution, the left tail is longer, and a few low-value outliers pull the mean to the left, making it the smallest value. The coefficient of skewness (γ1) is negative.
70. যদি দুটি রিগ্রেশন সহগ -0.8 এবং -0.2 হয়, তাহলে সহসম্পর্ক সহগ (r) কত? / If the two regression coefficients are -0.8 and -0.2, what is the correlation coefficient (r)?
সঠিক উত্তর / Correct Answer:
(D) -0.4
ব্যাখ্যা / Explanation:
r = ±√(b_yx * b_xy)। এখানে r = ±√((-0.8) * (-0.2)) = ±√0.16 = ±0.4। যেহেতু রিগ্রেশন সহগ দুটিই ঋণাত্মক, তাই r-এর মানও ঋণাত্মক হবে। সুতরাং, r = -0.4।
r = ±√(b_yx * b_xy). Here, r = ±√((-0.8) * (-0.2)) = ±√0.16 = ±0.4. Since both regression coefficients are negative, the value of r must also be negative. Therefore, r = -0.4.
71. একটি নর্মাল নিবেশনে, গড় ± 1 সমক পার্থক্যের মধ্যে কত শতাংশ ডেটা থাকে? / In a normal distribution, what percentage of data lies within mean ± 1 standard deviation?
সঠিক উত্তর / Correct Answer:
(C) প্রায় 68% / Approx. 68%
ব্যাখ্যা / Explanation:
নর্মাল নিবেশনের গবেষণামূলক নিয়ম (empirical rule) অনুযায়ী, প্রায় 68% ডেটা গড় থেকে এক সমক পার্থক্যের মধ্যে, প্রায় 95% দুই সমক পার্থক্যের মধ্যে এবং প্রায় 99.7% তিন সমক পার্থক্যের মধ্যে থাকে।
According to the empirical rule of normal distribution, approximately 68% of the data falls within one standard deviation of the mean, about 95% within two standard deviations, and about 99.7% within three standard deviations.
72. একটি সমগ্রকের প্যারামিটার (parameter) কী? / What is a parameter of a population?
সঠিক উত্তর / Correct Answer:
(B) সমগ্রকের একটি বৈশিষ্ট্যমূলক মান / A characteristic value of a population
ব্যাখ্যা / Explanation:
প্যারামিটার হলো সমগ্রকের একটি সংখ্যাসূচক বৈশিষ্ট্য, যেমন সমগ্রকের গড় (μ) বা সমগ্রকের ভেদাঙ্ক (σ²)। নমুনার সংশ্লিষ্ট মানকে স্ট্যাটিস্টিক (statistic) বলা হয়।
A parameter is a numerical characteristic of a population, such as the population mean (μ) or population variance (σ²). The corresponding value from a sample is called a statistic.
73. কোন নিবেশনটি মেসোকার্টিক (Mesokurtic) হিসাবে পরিচিত? / Which distribution is known as Mesokurtic?
সঠিক উত্তর / Correct Answer:
(B) নর্মাল নিবেশন / Normal Distribution
ব্যাখ্যা / Explanation:
নর্মাল নিবেশনকে কার্টোসিসের মানদণ্ড হিসাবে ধরা হয়। এর তীক্ষ্ণতা সহগ β2 = 3। এই ধরনের নিবেশনকে মেসোকার্টিক (মাঝারি চূড়া) বলা হয়।
The normal distribution is considered the benchmark for kurtosis. Its coefficient of kurtosis is β2 = 3. Such a distribution is called Mesokurtic (medium peak).
74. একটি ডেটাসেটের মানগুলি হলো: 2, 3, 3, 4, 5, 8। এর মধ্যমা কত? / The values in a dataset are: 2, 3, 3, 4, 5, 8. What is its median?
সঠিক উত্তর / Correct Answer:
(C) 3.5
ব্যাখ্যা / Explanation:
ডেটাগুলি ইতিমধ্যেই ক্রমানুসারে সাজানো আছে। এখানে মোট 6টি (জোড় সংখ্যা) মান আছে। তাই মধ্যমা হবে মাঝের দুটি মানের গড়। মাঝের মান দুটি হলো 3 এবং 4। মধ্যমা = (3+4)/2 = 3.5।
The data is already sorted. There are 6 (an even number) values. So, the median will be the average of the two middle values. The middle values are 3 and 4. Median = (3+4)/2 = 3.5.
75. যদি দুটি চলকের মধ্যে সহসম্পর্ক শূন্য (r=0) হয়, তাহলে দুটি রিগ্রেশন রেখার মধ্যে কোণ কত হবে? / If the correlation between two variables is zero (r=0), what will be the angle between the two regression lines?
সঠিক উত্তর / Correct Answer:
(C) 90°
ব্যাখ্যা / Explanation:
যখন r=0, তখন রিগ্রেশন সহগ b_yx এবং b_xy উভয়ই শূন্য হয়। এর ফলে Y on X রেখাটি X-অক্ষের সমান্তরাল হয় এবং X on Y রেখাটি Y-অক্ষের সমান্তরাল হয়। ফলে রেখা দুটি পরস্পর লম্বভাবে (90° কোণে) অবস্থান করে।
When r=0, both regression coefficients b_yx and b_xy are zero. This makes the Y on X line parallel to the X-axis, and the X on Y line parallel to the Y-axis. As a result, the two lines are perpendicular (at a 90° angle) to each other.
76. প্রথম n স্বাভাবিক সংখ্যার সমক পার্থক্য (Standard Deviation) কত? / What is the standard deviation of the first n natural numbers?
সঠিক উত্তর / Correct Answer:
(B) √((n²-1)/12)
ব্যাখ্যা / Explanation:
প্রথম n স্বাভাবিক সংখ্যার ভেদাঙ্ক (Variance) হলো (n²-1)/12। সমক পার্থক্য হলো ভেদাঙ্কের বর্গমূল, তাই এটি √((n²-1)/12)।
The variance of the first n natural numbers is (n²-1)/12. Standard deviation is the square root of variance, so it is √((n²-1)/12).
77. জ্যামিতিক নিবেশন (Geometric Distribution) কোন ধরনের নিবেশনের একটি বিশেষ রূপ? / The Geometric Distribution is a special case of which distribution?
সঠিক উত্তর / Correct Answer:
(C) ঋণাত্মক দ্বিপদ নিবেশন / Negative Binomial Distribution
ব্যাখ্যা / Explanation:
ঋণাত্মক দ্বিপদ নিবেশন r-তম সাফল্য পাওয়ার জন্য প্রয়োজনীয় চেষ্টার সংখ্যা গণনা করে। যখন r=1 হয়, অর্থাৎ প্রথম সাফল্য পাওয়ার জন্য প্রয়োজনীয় চেষ্টার সংখ্যা গণনা করা হয়, তখন এটি জ্যামিতিক নিবেশনে পরিণত হয়।
The Negative Binomial Distribution counts the number of trials needed to get r successes. When r=1, i.e., it counts the trials needed for the first success, it becomes the Geometric Distribution.
78. যদি b_yx > 1 হয়, তবে b_xy এর মান কেমন হবে? / If b_yx > 1, then what will be the value of b_xy?
সঠিক উত্তর / Correct Answer:
(B) < 1
ব্যাখ্যা / Explanation:
আমরা জানি যে দুটি রিগ্রেশন সহগের গুণফল (b_yx * b_xy) সহসম্পর্ক সহগের বর্গের (r²) সমান এবং r² ≤ 1। সুতরাং, b_yx * b_xy ≤ 1। যদি একটি সহগ (b_yx) 1-এর চেয়ে বড় হয়, তবে অন্য সহগটিকে (b_xy) অবশ্যই 1-এর চেয়ে ছোট হতে হবে যাতে তাদের গুণফল 1 বা তার কম হয়।
We know that the product of the two regression coefficients (b_yx * b_xy) is equal to the square of the correlation coefficient (r²), and r² ≤ 1. So, b_yx * b_xy ≤ 1. If one coefficient (b_yx) is greater than 1, the other coefficient (b_xy) must be less than 1 for their product to be less than or equal to 1.
79. গুণবাচক তথ্যের (qualitative data) জন্য কোন কেন্দ্রীয় প্রবণতার পরিমাপক সবচেয়ে উপযুক্ত? / Which measure of central tendency is most suitable for qualitative data?
সঠিক উত্তর / Correct Answer:
(C) সংখ্যাগুরু মান / Mode
ব্যাখ্যা / Explanation:
গুণবাচক বা নামসূচক (nominal) ডেটার জন্য গড় বা মধ্যমা গণনা করা যায় না, কারণ এগুলোর কোনো সংখ্যাগত মান বা ক্রম নেই। সংখ্যাগুরু মান, যা সবচেয়ে বেশিবার আসা মানকে বোঝায়, এই ধরনের ডেটার জন্য একমাত্র উপযুক্ত পরিমাপক। যেমন, ‘সবচেয়ে জনপ্রিয় গাড়ির রঙ’ হলো একটি সংখ্যাগুরু মান।
Mean or median cannot be calculated for qualitative or nominal data, as they lack numerical value or order. The mode, which represents the most frequent value, is the only suitable measure for such data. For example, ‘the most popular car color’ is a mode.
80. একটি নিবেশনের প্রতিবৈষম্য শূন্য এবং তীক্ষ্ণতা 3 হলে, নিবেশনটি কী? / If a distribution has skewness zero and kurtosis 3, what is the distribution?
সঠিক উত্তর / Correct Answer:
(C) নর্মাল / Normal
ব্যাখ্যা / Explanation:
নর্মাল নিবেশনের আদর্শ বৈশিষ্ট্য হলো এটি সম্পূর্ণ প্রতিসম এবং এর প্রতিবৈষম্য শূন্য (β1=0)। এর তীক্ষ্ণতা সহগ β2=3, যা মেসোকার্টিক নিবেশনকে নির্দেশ করে।
The standard characteristics of a normal distribution are that it is perfectly symmetric, with a skewness of zero (β1=0). Its coefficient of kurtosis is β2=3, which indicates a mesokurtic distribution.
81. “পরিসংখ্যান” (Statistics) শব্দটি সর্বপ্রথম কে ব্যবহার করেন বলে মনে করা হয়? / Who is believed to have first used the term “Statistics”?
সঠিক উত্তর / Correct Answer:
(C) Gottfried Achenwall
ব্যাখ্যা / Explanation:
জার্মান পণ্ডিত গটফ্রিড আখেনভাল (1719-1772) 1749 সালে সর্বপ্রথম “Statistik” শব্দটি ব্যবহার করেন, যা রাষ্ট্র সম্পর্কিত তথ্য বা ‘রাষ্ট্রের বিজ্ঞান’ বোঝাতে ব্যবহৃত হত।
The German scholar Gottfried Achenwall (1719-1772) first used the term “Statistik” in 1749, which was used to refer to data about the state or the ‘science of state’.
82. যদি একটি দ্বিপদ নিবেশনের জন্য n=10 এবং p=0.5 হয়, তবে নিবেশনটি কেমন হবে? / If for a binomial distribution, n=10 and p=0.5, what will be the shape of the distribution?
সঠিক উত্তর / Correct Answer:
(A) প্রতিসম / Symmetric
ব্যাখ্যা / Explanation:
একটি দ্বিপদ নিবেশন প্রতিসম হয় যখন সাফল্যের সম্ভাবনা p=0.5 হয়। যদি p<0.5 হয় তবে এটি ধনাত্মক প্রতিসম, এবং যদি p>0.5 হয় তবে এটি ঋণাত্মক প্রতিসম হয়।
A binomial distribution is symmetric when the probability of success p=0.5. It is positively skewed if p<0.5, and negatively skewed if p>0.5.
83. Least Squares Method (ন্যূনতম বর্গ পদ্ধতি) কোনটির সাথে সম্পর্কিত? / The Least Squares Method is associated with which of the following?
সঠিক উত্তর / Correct Answer:
(C) রিগ্রেশন বিশ্লেষণ / Regression Analysis
ব্যাখ্যা / Explanation:
ন্যূনতম বর্গ পদ্ধতি রিগ্রেশন রেখা নির্ণয়ের একটি আদর্শ পদ্ধতি। এই পদ্ধতিতে এমন একটি রেখা খোঁজা হয় যা ডেটা বিন্দুগুলি থেকে লম্ব দূরত্বের বর্গের যোগফলকে ন্যূনতম করে।
The method of least squares is a standard approach in regression analysis for fitting a regression line. This method finds a line that minimizes the sum of the squares of the vertical distances from the data points to the line.
84. একটি ডেটাসেটের বিভেদাঙ্ক (CV) 25% এবং গড় 40 হলে, সমক পার্থক্য কত? / If the Coefficient of Variation (CV) of a dataset is 25% and the mean is 40, what is the standard deviation?
সঠিক উত্তর / Correct Answer:
(A) 10
ব্যাখ্যা / Explanation:
CV = (SD / Mean) * 100%। এখানে, 25 = (SD / 40) * 100। সুতরাং, SD = (25 * 40) / 100 = 1000 / 100 = 10।
CV = (SD / Mean) * 100%. Here, 25 = (SD / 40) * 100. Therefore, SD = (25 * 40) / 100 = 1000 / 100 = 10.
85. লগ-নর্মাল নিবেশনের আকৃতি সাধারণত কেমন হয়? / What is the general shape of a Log-normal distribution?
সঠিক উত্তর / Correct Answer:
(C) ধনাত্মক প্রতিসম / Positively skewed
ব্যাখ্যা / Explanation:
লগ-নর্মাল নিবেশন সর্বদা ধনাত্মক মানের উপর সংজ্ঞায়িত এবং এটি সাধারণত ধনাত্মকভাবে বা ডানদিকে প্রতিসম হয়। এর ডানদিকের লেজটি লম্বা থাকে।
The log-normal distribution is defined on the set of positive real numbers and is typically positively or right-skewed. It has a long right tail.
86. যদি r_xy = 0 হয়, তবে চলক x এবং y হল: / If r_xy = 0, the variables x and y are:
সঠিক উত্তর / Correct Answer:
(A) রৈখিকভাবে সম্পর্কহীন / Linearly uncorrelated
ব্যাখ্যা / Explanation:
r=0 মানে চলক দুটির মধ্যে কোনো রৈখিক সম্পর্ক নেই। কিন্তু তাদের মধ্যে অরৈখিক সম্পর্ক (যেমন, U-আকৃতির) থাকতে পারে। তাই তারা স্বাধীন (independent) নাও হতে পারে। স্বাধীনতা একটি শক্তিশালী শর্ত যা যেকোনো ধরনের সম্পর্ককে বাতিল করে।
r=0 means there is no linear relationship between the variables. However, a non-linear relationship (e.g., a U-shape) could exist. Therefore, they are not necessarily independent. Independence is a stronger condition that rules out any kind of relationship.
87. একটি নিবেশনের চতুর্থ কেন্দ্রীয় পরিঘাতকে (μ4) ভেদাঙ্কের (μ2) বর্গ দ্বারা ভাগ করলে কী পাওয়া যায়? / What is obtained when the fourth central moment (μ4) of a distribution is divided by the square of the variance (μ2)?
সঠিক উত্তর / Correct Answer:
(B) তীক্ষ্ণতা সহগ (β2) / Coefficient of Kurtosis (β2)
ব্যাখ্যা / Explanation:
পিয়ারসনের তীক্ষ্ণতা সহগ, β2, এর সংজ্ঞা হলো β2 = μ4 / μ2²। এটি নিবেশনের চূড়ার তীক্ষ্ণতা পরিমাপ করে।
Pearson’s coefficient of kurtosis, β2, is defined as β2 = μ4 / μ2². It measures the peakedness of the distribution.
88. 52টি তাসের একটি প্যাকেট থেকে প্রতিস্থাপন ছাড়া দুটি তাস তোলা হলে, দুটিই রাজা হওয়ার সম্ভাবনা কোন নিবেশন ব্যবহার করে নির্ণয় করা হয়? / If two cards are drawn from a pack of 52 cards without replacement, which distribution is used to find the probability of both being kings?
সঠিক উত্তর / Correct Answer:
(C) হাইপারজিওমেট্রিক / Hypergeometric
ব্যাখ্যা / Explanation:
যেহেতু তাসগুলি প্রতিস্থাপন ছাড়া তোলা হচ্ছে, তাই প্রতিটি চেষ্টার ফলাফল স্বাধীন নয় (প্রথম তাস তোলার পর সমগ্রক পরিবর্তিত হয়)। এই ধরনের পরিস্থিতি মডেল করার জন্য হাইপারজিওমেট্রিক নিবেশন ব্যবহৃত হয়।
Since the cards are drawn without replacement, the outcome of each trial is not independent (the population changes after the first draw). The Hypergeometric distribution is used to model such scenarios.
89. রিগ্রেশন রেখায় ত্রুটি (Error term) বা রেসিডুয়াল (Residual) কী? / In a regression line, what is the error term or residual?
সঠিক উত্তর / Correct Answer:
(B) পর্যবেক্ষণকৃত Y এবং অনুমান করা Y (Ŷ) এর মধ্যে পার্থক্য / The difference between observed Y and predicted Y (Ŷ)
ব্যাখ্যা / Explanation:
রেসিডুয়াল হলো একটি পর্যবেক্ষণকৃত ডেটা বিন্দুর প্রকৃত মান (Y) এবং রিগ্রেশন রেখা দ্বারা সেই বিন্দুর জন্য অনুমান করা মানের (Ŷ) মধ্যে পার্থক্য। অর্থাৎ, e = Y – Ŷ।
The residual is the difference between the actual value of an observed data point (Y) and the value predicted for that point by the regression line (Ŷ). That is, e = Y – Ŷ.
90. যখন একটি ডেটাসেটের দুটি সংখ্যাগুরু মান থাকে, তখন তাকে কী বলা হয়? / When a dataset has two modes, what is it called?
সঠিক উত্তর / Correct Answer:
(B) বাইমোডাল / Bimodal
ব্যাখ্যা / Explanation:
একটি ডেটাসেটে যদি একটি সংখ্যাগুরু মান থাকে, তাকে ইউনিমোডাল বলে। যদি দুটি থাকে, তাকে বাইমোডাল বলে। যদি দুটির বেশি থাকে, তাকে মাল্টিমোডাল বলে।
If a dataset has one mode, it’s called unimodal. If it has two, it’s called bimodal. If it has more than two, it’s called multimodal.
91. পয়সোঁ নিবেশনের জন্য, যদি গড় (λ) বৃদ্ধি পায়, তাহলে নিবেশনের আকৃতি কিসের কাছাকাছি যায়? / For a Poisson distribution, if the mean (λ) increases, the shape of the distribution approaches what?
সঠিক উত্তর / Correct Answer:
(B) নর্মাল নিবেশন / Normal distribution
ব্যাখ্যা / Explanation:
যখন পয়সোঁ নিবেশনের প্যারামিটার λ (যা গড় এবং ভেদাঙ্ক উভয়ই) যথেষ্ট বড় হয় (সাধারণত λ > 10 বা 20), তখন নিবেশনের আকৃতি প্রতিসম হয়ে ওঠে এবং একটি নর্মাল নিবেশনের সাথে সাদৃশ্যপূর্ণ হয়।
When the parameter λ of a Poisson distribution (which is both the mean and variance) becomes sufficiently large (typically λ > 10 or 20), the shape of the distribution becomes more symmetric and resembles a normal distribution.
92. কোনটি বিস্তারের আপেক্ষিক পরিমাপক (relative measure of dispersion)? / Which of the following is a relative measure of dispersion?
সঠিক উত্তর / Correct Answer:
(D) চতুর্থক বিচ্যুতি গুণাঙ্ক / Coefficient of Quartile Deviation
ব্যাখ্যা / Explanation:
আপেক্ষিক পরিমাপকগুলি একক-মুক্ত হয় এবং তুলনা করার জন্য ব্যবহৃত হয়। পরিসর, সমক পার্থক্য, এবং ভেদাঙ্ক হলো চরম পরিমাপক (absolute measures)। বিভেদাঙ্ক (CV) এবং চতুর্থক বিচ্যুতি গুণাঙ্ক [(Q3-Q1)/(Q3+Q1)] হলো আপেক্ষিক পরিমাপক।
Relative measures are unit-free and are used for comparison. Range, Standard Deviation, and Variance are absolute measures. The Coefficient of Variation (CV) and the Coefficient of Quartile Deviation [(Q3-Q1)/(Q3+Q1)] are relative measures.
93. একাধিক সহসম্পর্ক সহগ (R) এবং আংশিক সহসম্পর্ক সহগগুলির (partial correlation coefficients) মধ্যে সম্পর্ক কী? / What is the relationship between the Multiple Correlation Coefficient (R) and partial correlation coefficients?
সঠিক উত্তর / Correct Answer:
(A) 1 – R² = (1 – r₁₂²)(1 – r₁₃.₂²)
ব্যাখ্যা / Explanation:
এটি একটি গুরুত্বপূর্ণ সূত্র যা একাধিক সহসম্পর্ক এবং আংশিক সহসম্পর্কের মধ্যে সম্পর্ক স্থাপন করে। এখানে R হলো X1-এর উপর X2 এবং X3-এর একাধিক সহসম্পর্ক, r₁₂ হলো X1 ও X2-এর সহসম্পর্ক, এবং r₁₃.₂ হলো X1 ও X3-এর আংশিক সহসম্পর্ক (X2-কে স্থির রেখে)।
This is an important formula that connects multiple and partial correlations. Here, R is the multiple correlation of X1 on X2 and X3, r₁₂ is the correlation between X1 and X2, and r₁₃.₂ is the partial correlation of X1 and X3 controlling for X2.
94. কোন ধরনের নমুনা চয়নে সমগ্রকের প্রতিটি সম্ভাব্য নমুনার নির্বাচিত হওয়ার সমান সম্ভাবনা থাকে? / In which type of sampling does every possible sample of a given size have an equal chance of being selected?
সঠিক উত্তর / Correct Answer:
(C) সরল দৈব চয়ন / Simple Random Sampling
ব্যাখ্যা / Explanation:
সরল দৈব চয়নের সংজ্ঞা অনুযায়ী, সমগ্রক থেকে একটি নির্দিষ্ট আকারের প্রতিটি সম্ভাব্য নমুনার নির্বাচিত হওয়ার সমান সুযোগ থাকে। এটি দৈব চয়নের সবচেয়ে মৌলিক রূপ।
By definition of Simple Random Sampling, every possible sample of a given size has an equal chance of being selected from the population. It is the most basic form of random sampling.
95. “Regression” শব্দটি পরিসংখ্যানের ক্ষেত্রে প্রথম কে ব্যবহার করেন? / Who first used the term “Regression” in the context of statistics?
সঠিক উত্তর / Correct Answer:
(B) Sir Francis Galton
ব্যাখ্যা / Explanation:
স্যার ফ্রান্সিস গ্যালটন ঊনবিংশ শতাব্দীতে বংশগতি নিয়ে গবেষণা করার সময় এই শব্দটি প্রথম ব্যবহার করেন। তিনি লক্ষ্য করেন যে লম্বা বাবা-মায়ের সন্তানদের উচ্চতা গড়ের দিকে “ফিরে আসার” (regress) প্রবণতা দেখায়।
Sir Francis Galton first used the term in the 19th century while studying heredity. He observed that the heights of children of tall parents tended to “regress” towards the mean height of the population.
96. কন্টিজেন্সি টেবিলের স্বাধীনতার মাত্রা (degrees of freedom) নির্ণয়ের সূত্র কী? / What is the formula to calculate the degrees of freedom for a contingency table?
সঠিক উত্তর / Correct Answer:
(A) (r-1)(c-1)
ব্যাখ্যা / Explanation:
একটি কন্টিজেন্সি টেবিলে কাই-স্কোয়ার (χ²) পরীক্ষার জন্য স্বাধীনতার মাত্রা হলো (সারি সংখ্যা – 1) * (কলাম সংখ্যা – 1), যেখানে r হলো সারি সংখ্যা এবং c হলো কলাম সংখ্যা।
For a Chi-square (χ²) test on a contingency table, the degrees of freedom are calculated as (number of rows – 1) * (number of columns – 1), where r is the number of rows and c is the number of columns.
97. যদি স্পিয়ারম্যানের ক্রম সহসম্পর্ক সহগ 1 হয়, এর অর্থ কী? / If Spearman’s rank correlation coefficient is 1, what does it mean?
সঠিক উত্তর / Correct Answer:
(A) দুটি চলকের র্যাঙ্ক একই / The ranks of the two variables are identical
ব্যাখ্যা / Explanation:
ρ=1 নির্দেশ করে যে দুটি চলকের মধ্যে একটি সম্পূর্ণ ধনাত্মক একমুখী (monotonic) সম্পর্ক বিদ্যমান। এর অর্থ হলো, যখন একটি চলকের মান বাড়ে, অন্যটির মানও ধারাবাহিকভাবে বাড়ে, ফলে তাদের র্যাঙ্কগুলি হুবহু একই হয়।
ρ=1 indicates a perfect positive monotonic relationship between the two variables. This means that as one variable increases, the other also consistently increases, resulting in their ranks being exactly the same.
98. একটি নিবেশনের জন্য, গড়=50, মধ্যমা=52, এবং সমক পার্থক্য=5। কার্ল পিয়ারসনের প্রতিবৈষম্য সহগ (Karl Pearson’s Coefficient of Skewness) কত? / For a distribution, Mean=50, Median=52, and SD=5. What is Karl Pearson’s Coefficient of Skewness?
সঠিক উত্তর / Correct Answer:
(B) -1.2
ব্যাখ্যা / Explanation:
কার্ল পিয়ারসনের সহগের সূত্র হলো: Sk = 3 * (গড় – মধ্যমা) / সমক পার্থক্য। এখানে, Sk = 3 * (50 – 52) / 5 = 3 * (-2) / 5 = -6 / 5 = -1.2। এটি একটি ঋণাত্মক প্রতিসম নিবেশন নির্দেশ করে।
Karl Pearson’s coefficient formula is: Sk = 3 * (Mean – Median) / Standard Deviation. Here, Sk = 3 * (50 – 52) / 5 = 3 * (-2) / 5 = -6 / 5 = -1.2. This indicates a negatively skewed distribution.
99. ওজাইভ (Ogive) বা ক্রমযৌগিক পরিসংখ্যা রেখা কী আঁকতে ব্যবহৃত হয়? / What is an Ogive or cumulative frequency curve used to locate graphically?
সঠিক উত্তর / Correct Answer:
(B) মধ্যমা / Median
ব্যাখ্যা / Explanation:
ক্ষুদ্রতর সূচক এবং বৃহত্তর সূচক (less than and more than) ওজাইভ রেখা দুটি যে বিন্দুতে ছেদ করে, সেই বিন্দুর ভুজ (x-coordinate) হলো নিবেশনটির মধ্যমা। এছাড়াও চতুর্থক (quartiles) ও শতাংশক (percentiles) নির্ণয়ে এটি ব্যবহৃত হয়।
The x-coordinate of the point where the ‘less than’ and ‘more than’ ogive curves intersect is the median of the distribution. It is also used to find quartiles and percentiles.
100. মাল্টিকোলিনিয়ারিটি (Multicollinearity) সমস্যাটি কোথায় দেখা যায়? / Where is the problem of Multicollinearity observed?
সঠিক উত্তর / Correct Answer:
(B) একাধিক রৈখিক রিগ্রেশন / Multiple Linear Regression
ব্যাখ্যা / Explanation:
মাল্টিকোলিনিয়ারিটি হলো এমন একটি পরিস্থিতি যেখানে একটি একাধিক রিগ্রেশন মডেলে দুই বা ততোধিক স্বাধীন চলকের মধ্যে উচ্চ মাত্রার সহসম্পর্ক থাকে। এটি মডেলের সহগগুলির নির্ভরযোগ্যতা এবং ব্যাখ্যাকে প্রভাবিত করে।
Multicollinearity is a situation where two or more independent variables in a multiple regression model are highly correlated with each other. This affects the reliability and interpretation of the model’s coefficients.