পরিসংখ্যান বিশ্লেষণ, মধ্যে অনৈক্য একটি ডেটা সেটের সদস্যদের মধ্যে একটি ডাটা রেখা থেকে কত দূরে সরানো যায় তা দেখায়, যা একটি হিসাবে পরিচিত প্রত্যাগতি সীমা । উচ্চতর পার্থক্য, তথ্য পয়েন্ট আরও বিস্তার আউট হয়। বৈকল্পিক বিশ্লেষণের গবেষণায় দেখা যায় যে বৈচিত্রের কোন অংশগুলি তথ্যগুলির বৈশিষ্ট্য দ্বারা ব্যাখ্যা করা যেতে পারে এবং যা র্যান্ডম ফ্যাক্টরকে দায়ী করা যেতে পারে। ব্যাখ্যা করা যায় না যে পার্থক্য অংশ অবশিষ্ট অবশিষ্ট রূপ বলা হয়.
অবশিষ্ট বিভাজন গণনা করতে এক্সেল স্প্রেডশীট ব্যবহার করে
অবশিষ্ট বিয়োগ গণনা সূত্র অনেক জটিল গণনা জড়িত। ছোট তথ্য সেটের জন্য, হাত দ্বারা অবশিষ্ট বিয়োগ গণনা প্রক্রিয়া ক্লান্তিকর হতে পারে। বড় তথ্য সেট জন্য, টাস্ক ক্লান্তিকর হতে পারে। একটি এক্সেল স্প্রেডশীট ব্যবহার করে, আপনি কেবল ডাটা পয়েন্ট প্রবেশ করতে এবং সঠিক সূত্র নির্বাচন করতে হবে। প্রোগ্রাম জটিল গণনা পরিচালনা করে এবং দ্রুত ফলাফল প্রদান করে।
তথ্য পয়েন্ট
একটি নতুন এক্সেল স্প্রেডশীট খুলুন এবং দুটি কলামে ডাটা পয়েন্ট লিখুন। প্রতিক্রিয়া লাইন প্রতিটি তথ্য বিন্দু দুটি উপাদান আছে প্রয়োজন। পরিসংখ্যানবিদ সাধারণত এই উপাদান "এক্স" এবং "Y." লেবেল উদাহরণস্বরূপ, জেনেরিক ইন্সুরেন্স কো। তার কর্মীদের উচ্চতা এবং ওজনের অবশিষ্টাংশের সন্ধান করতে চায়। এক্স পরিবর্তনশীল উচ্চতা প্রতিনিধিত্ব করে এবং Y পরিবর্তনশীল ওজন প্রতিনিধিত্ব করে। কলাম এ এবং উচ্চতা কলাম বিতে ঢোকান।
অর্থ খোঁজা
দ্য গড় তথ্য সেট প্রতিটি উপাদান জন্য গড় প্রতিনিধিত্ব করে। এই উদাহরণে, জেনেরিক ইনস্যুরেন্স 10 কর্মচারীর উচ্চতা ও ওজনগুলির গড়, মানক বিচ্যুতি এবং কোভারিয়েন্স খুঁজে পেতে চায়। কলাম A তে তালিকাভুক্ত উচ্চতার গড়টি F1 এ "= AVERAGE (A1: A10)" ফাংশনটি প্রবেশ করে পাওয়া যেতে পারে। কলাম বিতে তালিকাভুক্ত ওজনগুলির গড়টি F3 এ "= AVERAGE (B1: B10)" ফাংশনটি প্রবেশ করে পাওয়া যেতে পারে।
স্ট্যান্ডার্ড বিচ্যুতি এবং কোভারিয়েন্স খুঁজে
দ্য আদর্শ চ্যুতি ডেটা পয়েন্ট মধ্য থেকে কতদূর ছড়িয়ে দূরে কত পরিমাপ। দ্য সহভেদাংক তথ্য বিন্দু দুটি উপাদান একসঙ্গে পরিবর্তন কত পরিমাপ। উচ্চতাগুলির মান বিচ্যুতিটি "F = STDEV (A1: A10)" ফাংশনটি সেল F2 এ প্রবেশ করে পাওয়া যায়। ওজনের মান বিচ্যুতিটি F4 এ "= STDEV (B1: B10)" ফাংশনটি প্রবেশ করে পাওয়া যায়। উচ্চতা এবং ওজনগুলির মধ্যে কোভেরিয়েন্স কোষ F5 তে "= COVAR (A1: A10; B1: B10)" ফাংশনটি প্রবেশ করে পাওয়া যায়।
রিগ্রেশন লাইন খোঁজা
দ্য প্রত্যাগতি সীমা তথ্য পয়েন্ট প্রবণতা অনুসরণ করে একটি রৈখিক ফাংশন প্রতিনিধিত্ব করে। রিগ্রেশন লাইনের জন্য সূত্রটি এইরকম দেখাচ্ছে: Y = aX + b।
ব্যবহারকারী মাধ্যমের জন্য মান, মান বিচ্যুতি এবং স্বীকৃতি ব্যবহার করে "a" এবং "b" এর জন্য মান খুঁজে পেতে পারেন। "B" এর মানটি সেই বিন্দুটিকে প্রতিনিধিত্ব করে যেখানে রিগ্রেশন লাইনটি Y-অক্ষকে আটকায়। মূল্যটি X-Values এর মান বিচ্যুতির বর্গক্ষেত্রের সাথে কোভেরিয়েন্স গ্রহণ করে এবং এটি ভাগ করে পাওয়া যেতে পারে। এক্সেল সূত্রটি কোষ F6 এ চলে এবং এটি দেখতে দেয়: = F5 / F2 ^ 2।
"A" এর মান রিগ্রেশন লাইনের ঢালাকে প্রতিনিধিত্ব করে। এক্সেল সূত্রটি কোষ F7 এ যায় এবং এটির মত দেখাচ্ছে: = F3-F6 * F1।
রিগ্রেশন লাইনের সূত্রটি দেখতে, সেল F8 এ এই স্ট্রিং কনক্যাটেনেশনটি প্রবেশ করান:
= CONCATENATE ("Y ="; ROUND (F6; 2); "X"; আইএফ (সাইন (F7) = 1; "+"; "-"); ABS (ROUND (F7; 2)))
Y মান গণনা
পরবর্তী ধাপে ডাটা সেটের প্রদত্ত এক্স-মানগুলির জন্য রিগ্রেশন লাইনের Y-মানগুলি গণনা করা হয়। Y মান খুঁজে পেতে সূত্রটি কলাম সি তে গিয়ে দেখায়:
= $ এফ $ 6 * এ (ঝ) + + $ এফ $ 7
যেখানে A (i) সারিতে কলাম A এর মান হয় (i)। সূত্র স্প্রেডশীটে এইরকম দেখায়:
= $ এফ $ 6 * ক 1 + + $ এফ $ 7
= $ এফ $ 6 *, A2 + + $ এফ $ 7
= $ F $ 6 * এ 3 + $ F $ 7, ইত্যাদি
কলাম ডি এ এন্ট্রিগুলি Y এর জন্য প্রত্যাশিত এবং প্রকৃত মানগুলির মধ্যে পার্থক্য প্রদর্শন করে। সূত্রগুলি এভাবে দেখায়:
= বি (ঝ) -C (i)
যেখানে বি (i) এবং C (i) সারি (i) ক্রম অনুসারে কলাম বি এবং সি তে হয়।
অবশিষ্ট বিভাজন খোঁজা
দ্য অবশিষ্ট বিভাজন জন্য সূত্র সেল F9 মধ্যে যায় এবং এই মত দেখায়:
= SUMSQ (D1: D10) / (COUNT টি (D1: D10) -2)
যেখানে SUMSQ (D1: D10) প্রকৃত এবং প্রত্যাশিত Y মানগুলির মধ্যে পার্থক্যগুলির বর্গক্ষেত্রের সমষ্টি এবং (COUNT (D1: D10) -2) তথ্য পয়েন্টগুলির সংখ্যা, বিয়োগ ২ ডিগ্রিধারী স্বাধীনতার ডিগ্রিগুলির জন্য ডেটা।