بزن بریم
منوی دسته بندی
منوی دسته بندی

علم و هنر نمایش داده ها با نمودارهای آماری

استفاده از نمودارهای آماری جهت نمایش داده ها در میان متخصصین امری بسیار رایج می باشد. ولی باید توجه داشت که این کار راز و رمزهایی دارد که وقوف بر آنها بر کارآیی این نمودارها خواهد افزود.

زمانی میتوان حداکثر کارآمدی را از نمودارهای آماری انتظار داشت که نکات ذیل رعایت شده باشند:

تکنیکهای گرافیکی برای خلاصه سازی و کار کردن با مجموعه های بزرگ از داده ها به وجود آمده اند. مجموعه های کوچک داده ها را می توان به سادگی با استفاده از جدول خلاصه نمود. اگر تعداد داده ها در حد چند عدد باشد، بهتر خواهد بود آنها را در یک جمله در متن توضیح دهیم.

نمودار بایستی به گونه ای طراحی شده باشد که گویای آن چیزی باشد که قرار است انتقال داده شود. در غیر اینصورت بهتر است برای بیان آن چیز از کلمات استفاده نمایید. یک نمودار خوب نموداری است که جایگزین هزاران کلمه گردد و کماکان بتواند به روشنی و شفافیت توسط مخاطبین خود درک شود.

نمودارهایی که تنها یک متغیر را نمایش می دهند، اطلاعات چندان زیادی برای نمایش نخواهند داشت. عملکرد واقعی نمودارها هنگامی روشن می شود که از آنها برای دیدن ارتباط دو یا چند متغیر با همدیگر و دلایل چرایی وقوع این روابط استفاده شود.

شکل ظاهری نمودار باید به درک محتوای داده ها کمک کند. اگر شکل جایگزین محتوا شود، نمودار قادر به انجام صحیح وظیفه خود نخواهد بود.

شما اجازه ندارید نمودارهای آماری را وادار کنید آنچه که دوست دارید را بیان کنند. مخاطب دقیق قادر خواهد بود به راحتی هر نوع تحریف و اختلالی را در داده ها تشخیص دهد. به این موضوع در بخش های بعد خواهیم پرداخت.

برای روشن شدن مفاهیم فوق، یکی از بهترین نمودارهای آماری که تاکنون ارائه گردیده است را با هم بررسی می کنیم.

شکل 1 نموداری را نشان می دهد که توسط شارل ژوزف مینارد مهندس عمران فرانسوی ترسیم شده است. این نمودار یک اتفاق بسیار مهم تاریخی یعنی حمله ناپلئون به روسیه را در سال 1812 میلادی نشان می دهد. نوار هاشور خورده در نمودار، یک سری زمانی است که تعداد نیروهای فرانسوی را در مکان های مختلف نقشه نشان داده است. نام این مکان ها هم در نمودار آورده شده اند. هنگامی که ناپلئون در 21 ژوئن 1812 با گذر از رودخانه نیمن حمله به روسیه را آغاز نمود، ارتش وی متشکل از 422000 نفر سرباز بود. هنگامیکه ارتش فرانسه به مسکو رسید، این تعداد به 100000 نفر کاهش یافته بود. در این نقطه بود که فرانسویان شروع به عقب نشینی کردند. نوار سیاه رنگ نشان دهنده ارتش در حال عقب نشینی است. در پایین نمودار می توان تاریخ ها را ملاحظه کرد که شروع آن از اکتبر 1813 می باشد. درست بالای تاریخ ها مینارد یک سری زمانی دیگر را رسم کرده است که درجه حرارت را نشان دهد. هوای روسیه در پاییز به شدت سرد بوده است و طی این فصل بسیاری از سربازان به دلیل سرماخوردگی و بیماری فوت نمودند. همانگونه که قابل مشاهده است دمای هوا در 30 دسامبر به منفی سی درجه سانتیگراد سقوط کرده بود. کارآیی این نمودار در این است که همزمان تغییرات پنج متغیر را نسبت به هم به روشنی و اختصار نشان می دهد.

شکل 1- نمودار ترسیم شده توسط مینارد برای بیان رویداد تاریخی حمله ناپلئون به روسیه

2- فریبکاری نمودارهای آماری

امروزه به صورتی فراگیر از نمودارهای آماری در روزنامه ها، مجلات، کسب و کارها، گزارشات اقتصادی و سمینارها استفاده می گردد. دلیل این امر نیز دسترس پذیری کامپیوترها و نرم افزارهای تحلیل داده ها و بخصوص کلان داده ها هستند.

ارزیابی و قضاوت داده ها به واسطه ابزارهای نمایشی و نمودارها امروزه از اهمیت بسیار زیادی برخوردار می باشند.

متاسفانه این نمودارها به دلیل تاثیر بصری که دارند می توانند با ایجاد تحریف، به سادگی مورد سوءاستفاده قرار گیرند. در حقیقت تحریف نمودارهای آماری به قدری ساده است که در سال 1992 انجمن حسابداران خبره کانادا، پس از بررسی صدها مورد از گزارشات سالانه شرکت های بزرگ متوجه گردید که 8 درصد آنها لااقل یک نمودار گمراه کننده برای پوشاندن نتاج بد خود داشته اند. به همین جهت انجمن حسابداران خبره پیشنهاد نمود دستورالعمل هایی برای تدوین نمودارهای مالی برای شرکت ها ایجاد شوند و شرکت ها مجبور به استفاده از آنها باشند. در این بخش تلاش خواهد شد تا مهمترین موارد تحریف در نمودارهای آماری معرفی گردند.

1-2- نمودار بدون مقیاس

یکی از نخستین مواردی که باید در نمودارهای آماری مورد توجه قرار دهید این است که تمام محورهای نمودار دارای مقیاس دقیق باشند. برخی از اوقات روی یک محور مقیاس وجود دارد و روی دیگری مقیاسی دیده نمی شود. بهتر است در مواجهه با اینگونه نمودارها به خودتان زحمت بررسی ندهید و همان اول کار، آنها را نادیده بگیرید.

به عنوان مثال نمودار شکل 2 را ملاحظه نمایید. ظاهرا این نمودار میزان فروش را در طی سال های گوناگون ارائه می کند و هدف از آن این بوده است که رشد میزان فروش را در طی 5 سال نشان دهد.

ولی همانگونه که ملاحظه می گردد روی محور عمودی که میزان فروش است مقیاسی وجود ندارد. معلوم نیست میزان رشد در فروش در طی 5 سال 1 درصد بوده است یا 100 درصد یا هر مقدار دیگری؟

شکل 2- نمودار بدون مقیاس

2-2- بازی کردن با توضیحات نمودار های آماری

فریبکاری دیگری که می تواند در نمودارهای آماری رخ دهد بازی کردن با توضیح نمودار است. دو نمودار زیر را در شکل 3 در نظر بگیرید: هر دو نمودار، یک شکل را نشان می دهند، ولی در ذیل نمودار سمت چپ نوشته شده است “نرخ های بهره بالاخره شروع به سقوط کردند”، در حالیکه شرح نمودار سمت راست این است “هفته گذشته شاهد کاهش موقتی در روند افزایشی نرخ بهره بودیم”.

توضیح نمودار سمت چپ طوری طراحی شده است که به نظر برسد یک اتفاق بزرگ در بازار در راه است، در حالیکه توضیح ذیل نمودار سمت راست به صورتی بی طرفانه به بیان یک پدیده معمول در بازار پرداخته است. توجه دارید که شرح هر دو نمودار درست هستند و مطلب نادرستی در آنها وجود ندارد. آنهایی که می خواهند مقاصد خود را از طریق نمودارهای آماری پیاده کنند به خوبی به تاثیرات روانی توضیحات نمودارها واقف می باشند.

شکل 3- نمودارهای با توضیحات متفاوت

3-2- به کارگیری مقادیر مطلق به جای مقادیر نسبی

در برخی از حالات با جایگزین نمودن تغییرات مطلق در مقادیر نشان داده شده توسط نمودار با تغییرات نسبی، چشم انداز نمودار دچار تحریف خواهد شد. طبیعتا یک تومان کاهش قیمت در کالای دو تومانی بیشتر ناراحت کننده است تا یک تومان کاهش در کالای یکصد تومانی. در نهم ژانویه سال 1986، روزنامه های امریکای شمالی نموداری را شبیه به شکل 4 نشان دادند و گزارش دادند که بازار سرمایه بر اساس شاخص داوجونز، بدترین روز زیان بار خود را در مقایسه با روزهای گذشته داشته است.

سقوط شاخص داوجونز به اندازه 39 واحد بوده است که حتی از سقوط آن در طی یکشنبه سیاه در 28 اکتبر 1929 هم بیشتر است. نکته ای که روزنامه ها به آن نپرداختند این بود که سطح شاخص داوجونز در 1986 بسیار بالاتر از سطح شاخص در 1929 بوده است. برای درک بهتر موضوع، به جای مقدار عددی مطلق 39 واحد، می توانیم از درصد استفاده کنیم: افت شاخص در 8 ژانویه 1986 معادل 2.5 درصد بوده، در حالیکه این افت در 1929 معادل با 12.8 درصد بوده است.

شکل4- به کارگیری مقادیر مطلق به جای نسبی

4-2- بازی کردن با دامنه اعداد روی محورهای نمودار

می توان بدون ایجاد فریبکاری ظاهری و صرفا با تغییر دادن دامنه مقادیر روی محورها، حس های متفاوتی را از دیدن نمودار به بیننده القا نمود. شکل 5 را به عنوان مثال در نظر بگیرید. در این نمودار میزان رشد فروش فصلی یک شرکت در طی سال گذشته نشان داده شده است. در طی این بازه زمانی فروش از 100 میلیون به 110 میلیون افزایش یافته است. این 10 درصد افزایش در فروش را در اینجا می توان با بازی کردن با دامنه مقادیر روی محور عمودی نمودار فروش، چشمگیر تر از آنچه که واقعا هست نشان داد. آنچه که در اصل رخ داده است همان است که در شکل 5 ملاحظه می گردد.

شکل 5- نمودار واقعی افزایش فروش به میزان ده درصد

بازه مقادیر فروش روی محور عمودی مابین صفر و 125 میلیون دلار قرار دارد. حال اگر با دامنه تغییرات در این بازه بازی کنیم و آنرا بین 100 و 110 قرار دهیم چه اتفاقی رخ می دهد؟ شکل 6-الف و 6-ب این وضعیت را نشان می دهند. طبیعی است که با این کار شیب تغییرات منحنی تندتر خواهد شد و از نظر بیننده ای که به اعداد توجهی ندارد و صرفا ظاهر نمودار را می بیند، تغییرات فروش چشمگیرتر به نظر خواهد آمد.

شکل 6- الف و 6-ب – تاثیر تغییر در دامنه تغییرات اعداد روی محور عمودی نمودار شکل 5

با ایجاد انبساط در محور افقی می توان عکس حالت نشان داده شده در شکل 6 را نشان داد. افزایش فاصله ها روی محور افقی حس کندتر شدن روندها را القا می نماید. به عنوان مثال شکل 7 الف را با شکل 7 ب مقایسه نمایید. هر دو شکل تغییرات میزان سود یک شرکت را به صورت فصلی و در طی دو سال نمایش می دهند. شکل اصلی، شکل 7 الف می باشد. دیده می شود که نوسانات سود نگران کننده هستند و از ثبات چندانی برخوردار نمی باشند. حال شکل 7 ب را ملاحظه نمایید. با منبسط کردن محور افقی عملا از شدت نوسانات کاسته می شود و توهم ثبات برای بیننده ایجاد می گردد.

یک چنین توهم بینایی را می توان با استفاده از نمودارهای مستطیلی نیز ایجاد نمود. یکی از نکات استانداردی که باید در نمودارهای مستطیلی رعایت نمود، برابر بودن عرض تمام مستطیل هاست. به همین جهت نیز مقایسه مستطیل ها صرفا با مقایسه طول (ارتفاع) آنها صورت می پذیرد. ولی اگر با عرض مستطیل ها بازی شود و آنها را متناسب با طولشان تغییر دهیم، توهم بینایی حاصل میشود که باعث خواهد شد مستطیل ها بزرگتر از آنچه که در واقعیت هستند به نظر آیند.

شکل 8 را در نظر بگیرید. این شکل متوسط هزینه هفتگی غذا را در طی سه دوره متوالی پنج ساله 1985، 1990 و 1995 برای خانوارهای کانادایی نشان می دهد. شکل 8 الف نمودار استاندارد مستطیلی را نشان میدهد که بیانگر افزایشی مابین 60 تا 120 دلار برای مخارج هفتگی غذا می باشد. نمودار 8 ب همین اطلاعات را ولی به صورتی اغراق شده نشان داده است. با دیدن این نمودار احساسی که به بیننده دست می دهد این است که هزینه های خورد و خوراک هفتگی در سال 1995 چهار برابر سال 1985 شده اند! در حالیکه در واقعیت هزینه ها دو برابر شده اند نه چهار برابر.

علت بروز چنین احساسی نیز این است که عرض مستطیل مربوط به سال 1995 دو برابر عرض مستطیل مربوط به سال 1985 می باشد و این کار کاملا با استاندارد نمودارهای مستطیلی در مغایرت است.

شکل 8 الف و 8ب – تغییرات در عرض نمودارهای مستطیلی

همین فریبکاری در مورد پیکتوگرام ها هم شایع است (pictogram ترکیب picture و histogram می باشد). در پیکتوگرام ها شکلها جایگزین مستطیلها می شوند. در این نمودارها هم با بازی کردن با اندازه شکلها، حسی اغراق آمیز به بیننده القا می گردد. شکل 9 میزان بارش برف را با یک پیکتوگرام اغراق شده و شکل 10 فروش کوکاکولا را در قالب یک پیکتوگرام صحیح نمایش می دهد.

شکل 9- نمایش میزان بارش برف در سه بازه زمانی مختلف با یک پیکتوگرام اغراق شده

شکل 10- نمایش میزان فروش کوکالا در چهار بازه زمانی مختلف با یک پیکتوگرام صحیح

3- جمع بندی نهایی

هنگامی که با یک نمودار آماری مواجه می شوید، ابتدا توجه خود را به اعداد معطوف کنید. سعی کنید داده های عددی اصلی را که نمودار بر اساس آنها ایجاد شده است بررسی و مطالعه نمایید. بعد از آنکه درکی کلی از روابط مابین اعداد پیدا کردید، به سراغ نمودار و شکل ظاهری آن بروید.

منبع: Statistics for Management and Economics (Gerald Keller) 11e, 2018

نظرات بسته شده است.