মান বনাম মধ্যম বনাম মোড
মান, মধ্যমা এবং মোড হল বর্ণনামূলক পরিসংখ্যানে ব্যবহৃত কেন্দ্রীয় প্রবণতার প্রাথমিক পরিমাপ। এগুলি একে অপরের থেকে সম্পূর্ণ আলাদা এবং যে ক্ষেত্রে এগুলি ডেটা সংক্ষিপ্ত করতে ব্যবহৃত হয় তাও আলাদা৷
মান
গাণিতিক গড় হল ডেটা মানের সংখ্যা দ্বারা ভাগ করা ডেটা মানের সমষ্টি, যেমন
[লেটেক্স]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]
যদি ডেটা একটি নমুনা স্থান থেকে হয় তবে এটিকে একটি নমুনা গড় ([latex]\bar{x} [/latex]) বলা হয়, যা নমুনার একটি বর্ণনামূলক পরিসংখ্যান।যদিও এটি একটি নমুনার জন্য সর্বাধিক ব্যবহৃত বর্ণনামূলক পরিমাপ, এটি একটি শক্তিশালী পরিসংখ্যান নয়। এটি বহির্মুখী এবং দোলনের প্রতি খুবই সংবেদনশীল।
উদাহরণস্বরূপ, একটি নির্দিষ্ট শহরের নাগরিকদের গড় আয় বিবেচনা করুন। যেহেতু সমস্ত ডেটা মানগুলি যোগ করা হয় এবং তারপরে ভাগ করা হয়, একজন অত্যন্ত ধনী ব্যক্তির আয় উল্লেখযোগ্যভাবে গড়কে প্রভাবিত করে। অতএব, গড় মানগুলি সর্বদা ডেটার একটি ভাল উপস্থাপনা নয়৷
এছাড়াও, একটি বিকল্প সংকেতের ক্ষেত্রে, একটি উপাদানের মধ্য দিয়ে যাওয়া কারেন্ট পর্যায়ক্রমে ইতিবাচক দিক থেকে নেতিবাচক দিক থেকে পরিবর্তিত হয় এবং এর বিপরীতে। যদি আমরা একটি একক সময়ের মধ্যে উপাদানের মধ্য দিয়ে যাওয়া গড় কারেন্ট নিই, তাহলে এটি একটি 0 দেবে, যার অর্থ এই উপাদানটির মধ্য দিয়ে কোনো কারেন্ট যায় নি, যা স্পষ্টতই সত্য নয়। অতএব, এই ক্ষেত্রেও, পাটিগণিত গড় একটি ভাল পরিমাপ নয়।
ডেটা সমানভাবে বিতরণ করা হলে গাণিতিক গড় একটি ভাল সূচক।একটি সাধারণ বণ্টনের জন্য, গড়টি মোড এবং মধ্যম সমান। রুট গড় বর্গাকার ত্রুটি বিবেচনা করার সময় এটিতে সর্বনিম্ন অবশিষ্টাংশ রয়েছে; অতএব, যখন একটি একক সংখ্যা দ্বারা একটি ডেটাসেট উপস্থাপনের প্রয়োজন হয় তখন সর্বোত্তম বর্ণনামূলক পরিমাপ।
মিডিয়ান
সকল ডেটা মানকে আরোহী ক্রমে সাজানোর পর মধ্যম ডেটা পয়েন্টের মানগুলিকে ডেটাসেটের মধ্যমা হিসাবে সংজ্ঞায়িত করা হয়। মিডিয়ান হল ২য় চতুর্থ, ৫ম ডেসিল এবং ৫০তম পার্সেন্টাইল।
• যদি পর্যবেক্ষণের সংখ্যা (ডেটা পয়েন্ট) বিজোড় হয়, তাহলে মধ্যম হল ক্রমকৃত তালিকার ঠিক মাঝখানে থাকা পর্যবেক্ষণ।
• যদি পর্যবেক্ষণের সংখ্যা (ডেটা পয়েন্ট) জোড় হয়, তাহলে ক্রমকৃত তালিকার মধ্যম দুটি পর্যবেক্ষণের গড় হল মধ্যক৷
মিডিয়ান পর্যবেক্ষণকে দুটি গ্রুপে ভাগ করে; যেমন একটি গ্রুপ (50%) মান বেশি এবং একটি গ্রুপ (50%) মান মধ্যমা থেকে কম। মিডিয়ানগুলি বিশেষভাবে তির্যক বিতরণে ব্যবহৃত হয় এবং গাণিতিক গড় থেকে মোটামুটি ভাল ডেটা উপস্থাপন করে৷
মোড
মোড হল পর্যবেক্ষণের একটি সেটে সবচেয়ে ঘটমান সংখ্যা। একটি ডেটা সেটের মোড সেটের মধ্যে প্রতিটি উপাদানের ফ্রিকোয়েন্সি খুঁজে বের করে গণনা করা হয়।
• যদি কোনো মান একবারের বেশি না ঘটে, তাহলে ডেটা সেটের কোনো মোড নেই৷
• অন্যথায়, সর্বাধিক ফ্রিকোয়েন্সি সহ ঘটে এমন যেকোনো মান হল ডেটা সেটের একটি মোড৷
এক সেটে ১টির বেশি মোড থাকতে পারে; অতএব, মোড একটি ডেটাসেটের একটি অনন্য পরিসংখ্যান নয়। একটি অভিন্ন বিতরণে, একটি মোড আছে। একটি বিযুক্ত সম্ভাব্যতা বন্টনের মোড হল সেই বিন্দু যেখানে সম্ভাব্য ভর ফাংশন তার সর্বোচ্চ বিন্দুতে পৌঁছায়। উপরের ব্যাখ্যাগুলি থেকে রেন্ডারিং, আমরা বলতে পারি যে গ্লোবাল ম্যাক্সিমা হল মোড৷
নিম্নলিখিত ডেটা সেটে তিনটি পদক্ষেপের প্রয়োগ বিবেচনা করুন।
ডেটা: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
মান=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8.12
মিডিয়ান=9 (13তম উপাদান)
মোড=9 (ফ্রিকোয়েন্সি 9=5)
মান, মধ্যমা এবং মোডের মধ্যে পার্থক্য কী?
• পাটিগণিতের গড় হল পর্যবেক্ষণের সংখ্যা দ্বারা ভাগ করা মান (পর্যবেক্ষণ) এর যোগফল। এটি একটি শক্তিশালী পরিসংখ্যান নয়, এবং বিবেচিত বিতরণের মধ্যে স্বাভাবিক বন্টন প্রকৃতির উপর ব্যাপকভাবে নির্ভরশীল। একটি একক আউটলিয়ার তুলনামূলকভাবে বিভ্রান্তিকর মান প্রদান করে গড়তে উল্লেখযোগ্য পরিবর্তন ঘটাতে পারে। ধারণাটি জ্যামিতিক গড়, হারমোনিক গড়, ওজনযুক্ত গড় ইত্যাদিতে প্রসারিত করা যেতে পারে।
• মধ্যমা হল পর্যবেক্ষণের সেটের মধ্যম মান, এবং এটি বহিরাগতদের দ্বারা তুলনামূলকভাবে কম প্রভাবিত হয়। এটি অত্যন্ত তির্যক ক্ষেত্রে সারাংশ পরিসংখ্যান হিসাবে একটি ভাল অনুমান দিতে পারে৷
• মোড হল ডেটাসেটের সবচেয়ে সাধারণ পর্যবেক্ষণ মান। ডিস্ট্রিবিউশনটি ধনাত্মক তির্যক হলে, মোডটি মধ্যমায় বামে থাকে এবং, যদি নেতিবাচকভাবে তির্যক হয়, মোডটি মধ্যমাটির ডানদিকে থাকে৷
• যদি ইতিবাচকভাবে তির্যক হয়, তাহলে গড়টি মধ্যমায় সঠিক; যদি নেতিবাচকভাবে তির্যক গড় হয় মধ্যকের বাম দিকে।
• স্বাভাবিক বণ্টনে, গড়, মোড এবং মধ্যক তিনটিই সমান৷