কিভাবে ডেটা জন্য সম্ভাব্যতা বিতরণ প্রকার নির্ধারণ করতে

সুচিপত্র:

Anonim

যখন আপনি আপনার সিস্টেমে বা প্রক্রিয়াতে তথ্য সংগ্রহ করেছেন, তখন পরবর্তী পদক্ষেপটি কোনটি সম্ভাব্যতা বিতরণের একটি আছে তা নির্ধারণ করতে হয়। সম্ভাব্যতা বিতরণের ধরনগুলি হল: বিচ্ছিন্ন ইউনিফর্ম, বার্নোলি, দ্বৈত, নেতিবাচক দ্বৈত, পয়সন, জ্যামিতিক, অবিচ্ছিন্ন ইউনিফর্ম, স্বাভাবিক (ঘণ্টা বক্ররেখা), সূচকীয়, গামা এবং বিটা বিতরণ। সম্ভাব্য তালিকার কয়েকটি এমনকি সংকীর্ণকরণটি নির্ধারণ করে যে R সবচেয়ে দ্রুততম ঘূর্ণমান মূল্য নির্ধারণ করে।

আইটেম আপনি প্রয়োজন হবে

  • গ্রাফিং সফটওয়্যার

  • R স্কয়ার্ড মান গণনা করার উপায় (সেরা ফিট বিশ্লেষণ)

তথ্য টাইপ একটি চাক্ষুষ উপস্থাপনা জন্য তথ্য প্লট।

কোন ডেটা বিতরণের একটি আছে তা নির্ণয় করার প্রথম ধাপগুলির মধ্যে একটি - এবং এইভাবে সমীকরণের ধরনটি ডেটা মডেল করার জন্য ব্যবহার করা - এটি কী হতে পারে তা বাতিল করা। • ডাটা সেটের মধ্যে কোন শিখর থাকলে, এটি একটি পৃথক ইউনিফর্ম বন্টন হতে পারে না। • যদি তথ্যটি একের বেশি শিখর থাকে তবে এটি পুইসন বা দ্বৈত নয়। • যদি এটি একটি একক বক্ররেখা থাকে, কোন সেকেন্ডারি শিখর থাকে না এবং এটি প্রতিটি দিকে ধীর গতিতে থাকে তবে এটি পুইসন বা গামা বিতরণের হতে পারে। কিন্তু এটি একটি বিচ্ছিন্ন ইউনিফর্ম বিতরণ করা যাবে না। • তথ্য সমানভাবে বিতরণ করা হয়, এবং এটি একপাশে একটি skew ছাড়া হয়, একটি গামা বা Weibull বিতরণ নিষিদ্ধ করা নিরাপদ। • যদি ফাংশনটির গ্রাফড ফলাফলগুলির মধ্যবর্তী অংশে এমনকি একটি বন্টন বা শীর্ষ থাকে তবে এটি একটি জ্যামিতিক বন্টন বা সূচকীয় বন্টন নয়। • যদি একটি ফ্যাক্টর সংঘটিত হয় একটি পরিবেশগত পরিবর্তনশীল সঙ্গে পরিবর্তিত হয়, এটি সম্ভবত একটি Poisson বিতরণ নয়।

সম্ভাব্যতা বিতরণের ধরনটি সংকুচিত হওয়ার পরে, সম্ভাব্য সম্ভাব্যতার সম্ভাব্য সম্ভাব্য সম্ভাব্যতার একটি R স্কয়ার্ড বিশ্লেষণ করবেন। সর্বোচ্চ R স্কয়ার্ড মান সহ এক সবচেয়ে সম্ভবত সঠিক।

একটি বহিরাগত তথ্য বিন্দু মুছে ফেলুন। তারপর R squared পুনরাবৃত্তি। যদি একই সম্ভাব্যতা বিতরণ প্রকারটি সবচেয়ে কাছের মিল হিসাবে আসে তবে উচ্চতর আস্থা রয়েছে যে এটি ডেটা সেটের জন্য ব্যবহারযোগ্য সঠিক সম্ভাব্যতা বন্টন।

পরামর্শ

  • তথ্য একাধিক শিখর একটি বিস্তৃত ছিটকে দেখায়, এটা সম্ভব যে দুটি পৃথক প্রক্রিয়া চলছে বা নমুনা পণ্য মিশ্রিত হয়। তথ্য recollect এবং তারপর পুনরায় বিশ্লেষণ।

সতর্কতা

ডেটা সেটের জন্য এখনও সঠিক কিনা তা নিশ্চিত করতে পরবর্তী ডেটা সেটগুলির বিরুদ্ধে উত্পন্ন সমীকরণগুলি যাচাই করুন। এটা সম্ভব যে পরিবেশগত কারণ এবং প্রক্রিয়া ড্রিফট বর্তমান সমীকরণ এবং মডেলগুলিকে ভুল করেছে।