نمایش داده‌های پرت و نامتنجانس

بسیار پیش می‌آید که در نمایش یک سری از داده‌ها، یکی از ورودی‌ها مقداری بسیار متفاوت از سایرین دارد. به طور مثال، در یک مجموعه داده، اکثر داده‌ها سه رقمی هستند، ولی یک ورودی پنج یا شش رقمی در بین آنها وجود دارد.  این مثال در شکل زیر نمایش داده شده است. شکل سمت چپ، نمودار رسم شده با داده‌های عادی است. بدیهی است که اکثر داده‌ها به دلیل کوچک بودن مقادیر آنها نسبت به مقادیر مندرج در محور عمودی نمودار، قابل رویت نیستند.

برای نمایش داده‌های پرت و نامتنجانس یک سری داده در نمودار، راه‌های متفاوتی پیشنهاد می‌شود. در نمودار سمت راست، از روش محور لگاریتمی استفاده شده است. در این روش، مقادیر محور هر عددی را که نشان می‌دهند، اکسل به صورت پنهان آن را معادل لگاریتم آن فرض می‌کند. دیده می‌شود که اکنون همه داده‌ها قابل رویت هستند، هرچند بدون رعایت مقیاس یا نشانه‌ای که به خواننده تمایز را منتقل کند.

50 unrelated data in a chart 1
سمت راست: تغییر مقیاس محور عمودی به صورت لگاریتمی | سمت چپ: نمایش اعداد نامتجانس در یک نمودار (شیوه غلط)

در اینجا یک پیشنهاد دیگر برای نمایش این داده‌ها ارائه می‌شود: روش ایجاد شکاف درستون‌های نمودار. بر اساس این پیشنهاد به جای اعداد واقعی بزرگ، اعدادی مجازی کوچکتر در بازه نرمال ترسیم شود. ولی بر روی محور به جای مقادیر مجازی، همان مقدار اصلی نمایش داده شود. این ایده را می‌توانید در شکل زیر ببینید.

50 unrelated data in a chart 2
شیوه مناسب نمایش اعداد نامتجانس در یک نمودار

در شکل بالا محور به دو بازه مربوط به اعداد کوچک و اعداد بزرگ تقسیم شده است و با علامت دو خط، محل برش مشخص شده است. خبر خوب اینکه انجام این کار به راحتی در اکسل ممکن است.

تحلیل سودآوری سبد محصولات شرکت

یک شرکت توزیع مواد غذایی را در نظر بگیرید که ۸ گروه کالایی اصلی و در مجموع ۱۲۰ عنوان کالا توزیع می‌کند. مدیر فروش برای افزایش سودآوری شرکت، بایستی تصویری از وضعیت فعلی فروش و سودآوری این اقلام داشته باشد. یک تحلیل‌گر داده چه کمکی به مدیر فروش می‌تواند بکند؟

اولین سوالی که یک تحلیل‌گر داده بایستی پاسخی برای آن بیابد این است که چه متغیر و شاخص‌هایی از سبد را بایستی به عنوان معیار ارزیابی آن در نظر گیرد؟ معیارهای متعددی در کتابها و سایر منابع معرفی شده‌اند (رجوع کنید به: سایمونز، رابرت، ۱۳۸۵، نظام‌های کنترل و سنجش عملکرد). درآمد ریالی از هر محصول، حاشیه سود و رشد سالانه آن، سه معیاری هستند که برای مدیران فروش جذاب هستند.

دومین سوالی که تحلیل‌گر داده بایستی به آن فکر کند این است که چه روشی برای تحلیل متغیرهای فوق مناسب است؟ برای پاسخ به این سوال بایستی به یاد داشته باشیم که اولا دقیق‌ترین روش، همیشه بهترین نیست و دوم اینکه روش‌های پیچیده لزوما جواب‌های دقیقی ندارند. بایستی با توجه به محدودیت زمانی، مالی، امکانات در دسترس و نیز دقت مورد نیاز در خروجی تحلیل، روش مناسب انتخاب شود. حتی بهتر است که روشی انتخاب شود که سایر مدیران نیز آن را به سادگی بفهمند و با ابزارهای ساده‌ای مانند اکسل بتوان آن را اجرا کرد.

رسم نمودار و ارائه تصویری داده‌ها، یکی از بهترین روش‌ها برای این هدف است. چرا که تصویری کلی از وضعیت کالاهای مختلف، دسته‌بندی و مقایسه آنها ارایه داده و راه را برای تحلیل‌های دقیق‌تر و پرسیدن سوالات جزئی‌تر هموار می‌کند. تاکید ما در دیتا پارتنرز، همواره بر این نکته بوده است که ارایه‌ی خوب داده، بخشی از راه حل مسئله است.

41 sales dashborad1

نمودار حبابی فوق، هر سه معیار را شامل می‌شود و تصویری کلی از وضعیت فروش، سودآوری و تغییرات فروش سال به سال کالاهای مختلف ارایه می‎کند:

  • محور افقی: درآمد ریالی ناشی از هر کالا را طی دوره زمانی یک سال گذشته نشان می‌دهد.
  • محور عمودی: حاشیه سود هر کالا بر حسب درصدی از درآمد ریالی را نمایش می‌دهد.
  • اندازه حباب: میزان مطلق نرخ رشد (مثبت یا منفی) سال به سال مربوط به درآمد ریالی کالا نشان می‌دهد.
  • رنگ حباب: رنگ سبز، نشانگر نرخ رشد مثبت و قرمز نشانگر نرخ رشد منفی است.

نمودار فوق را چگونه می‌توان تفسیر کرد؟ این نمودار چه سوالاتی را پاسخ می‌دهد و چه سوالاتی در ذهن برمی‌انگیزاند؟ این‌ها سوالاتی هستند که در قسمت دوم این مطلب بدان‌ها خواهیم پرداخت. تا آن زمان اگر نظری در این مورد دارید، با ما در میان بگذارید.

محل مناسب نمایه نمودار در گزارش‌های کسب و کار

در رسم هر نمودار، بایستی از علائم و برچسب‌های مناسب برای تعریف و مشخص کردن معنای هر یک از اجزای نمودار استفاده کرد. یکی از این علامت‌ها، نمایه (Legend) یا نام سری داده‌ها در نمودار است.

30 legend 1

به طور سنتی، ابزارهای تحلیل داده و صفحه گسترده‌هایی مانند اکسل، نمایه را در دو طرف، بالا یا پایین نمودار قرار می‌دهند (همانند شکل بالا). قراردادن نمایه در بیرون از فضای نمودار، باعث ناخوانایین نمودارها است. بهتر است نام هر سری داده در کنار آنها و در قسمت درونی نمودار باشد. نام‌ها بایستی به صورت افقی نوشته شوند تا خوانا باشند. مثلا در نمودارهای ستونی انباشته (stacked column charts)، بسته به فضای مناسب برای نمایش، نمایه در سمت چپ یا راست ستون‌ها قرار داده می‌شود. نمونه‌ای از این نمودار در شکل زیر نمایش داده شده است.

30 legend 2

در نمودارهای میله‌ای انباشته (stacked bar charts)، می‌توان نام آنها را در سطح فوقانی نمودار قرار داد. نمونه‌ای از نمودار میله‌ای انباشته در شکل زیر نمایش داده شده است.

30 legend 3

در نمودارهای میله‌ای ساده، نام سری داده را می‌توان در سمت راست و یا در انتهای خطوط قرار داد. در نمودار خطی نیز به همین شکل انجام می‌شود. نمونه‌ای از جایگاه مناسب برچسب داده‌ها در نمودار خطی در شکل زیر نمایش داده شده است.

30 legend 4

در صورتی که به هر دلیل مجبور به استفاده از راهنمای برچسب داده‌ها بیرون از فضای نمودار هستید، از رنگ‌های روشن استفاده کرده تا تمرکز مخاطب از دست نرود. در نمودارهای دوبعدی که هر دو محور دارای مقدار عددی هستند، می‌توان برچسب داده‌ها را در بیرون از نمودار  قرار داد. برای گروه‌بندی دسته‌های داده‌ها می‌توان از نماد‌هایی در بیرون از نمودار کمک گرفت. نمونه‌ای از این موضوع در شکل زیر نمایش داده شده است.

30 legend 5

رعایت نکات این‌چنینی در مورد اجزا و عناصر مختلف نمودار، منجر به خوانایی بیشتر و انتقال بهتر پیام به مخاطب خواهد شد. سعی ما در دیتا پارتنرز بر این بوده است که مسئله‌ی «ارایه داده» را به موازات «تحلیل داده» پیش ببریم و نشان دهیم که بهترین تحلیل‌ها، بدون ارایه‌ی مناسب، آنچنان که باید اثر مطلوبی بر مخاطب نخواهند داشت. امیدواریم این مجموعه مطالب برای شما مفید بوده باشد.

چگونه مقادیر منفی را در یک نمودار نمایش دهیم؟

یکی از گام‌های رسم نمودار، تعیین «عناصر» یک نمودار است. میله‌ها، برچسب‌ها و واحد نمایش، از عناصر مهم نمودار هستند. چارتیست‌های حرفه‌ای پیش از قرار دادن هر عنصری در نمودار، یک سوال استاندارد از خود می‌پرسند: این عنصر، چه پیامی را به مخاطب منتقل می‌کند؟

رنگ نیز از عناصر مهم نمودار است. استفاده از رنگ برای ایجاد تنوع در نمودار، به هیچ وجه کاری حرفه‌ای نیست. یک چارتیست حرفه‌ای هیچگاه از افکت‌های هنری، سایه روشن و سه‌بعدی سازی استفاده نمی‌کند و به طور کلی هر گونه تغییر در ظاهر استاندارد یک نمودار اجتناب می‌کند. استفاده کم یا زیاد از رنگ در نمودار، ممکن است موجب ضعف در انتقال مناسب پیام در یک نمودار شود.

اصلی‌ترین کارکرد رنگ، «برجسته‌سازی پیام» است. یکی از پرکاربردترین برجسته‌سازها، برجسته‌سازی و ایجاد تمایز بین اعداد منفی و مثبت است. یک مثال ساده، در شکل زیر نمایش داده شده است. فرض کنید که این نمودار نشان دهنده تغییر مصرف میوه نسبت به سال گذشته باشد. میله‌های مربوط به میوه‌هایی که مصرف آنها در سال جاری کاهش داشت، قرمز است که نشان دهنده وجود یک روند منفی است. میله‌های مربوط به میوه‌هایی که مصرف آنها رشد داشته، با سبز نشان داده شده‌اند.

28 minus vals 1

در فضای کسب و کار، سبز و قرمز به عنوان نمادهای پذیرفته شده برای نمایش روند مثبت و منفی هستند. از این رو بایستی آنها را با دقت در نمودار به کار برد. بنابراین بهتر است سعی شود تا حد ممکن از این دو رنگ برای انتقال سایر پیام‌ها استفاده نشود.

در مثال زیر، نمودار ستونی میزان مصرف واقعی برخی از میوه‌ها در دو سال گذشته نمایش داده شده است. برای انتقال پیام «تغییرات مثبت یا منفی مصرف میوه‌جات مختلف»، یک محور دیگر در بالای آن افزوده شده که تغییرات مصرف میوه را نمایش می‌دهد.

28 minus vals 2

این داشبورد که با اکسل رسم شده است، الگوی مناسبی برای طراحی داشبورد تحلیل روند فروش است. رنگ سبز و قرمز در این نمودار به صورت استاندارد استفاده شده‌اند. در صورت نیاز، عناصر دیگری را نیز می‌توان به این داشبورد اضافه کرد. ولی پیش از هر کاری، به این سوال اساسی فکر کنید: عناصر جدید، چه پیامی را باید به مخاطب منتقل کنند؟

پی‌نوشت: اگر علاقه‌مند پیگیری مداوم مطالب ما هستید، دیتا پارتنرز را در تلگرام، توییتر و یا اینستاگرام دنبال کنید.

سفره ایرانی‌ها در ده سال اخیر چه تغییری کرده است؟ بخش سوم

در یکی از مطالب پیشین، نمودار کاهش اندازه سفره ایرانیان را از نظر وزنی رسم کردیم. در این نمودار، از علامت مثلث وارونه قرمز برای نمایش کاهش وزن هر یک از اقلام استفاده شد که در شکل زیر دیده می‌شود. ضمنا مقدار کاهش نیز بر حسب درصد در کنار آن درج شد تا بیننده به راحتی میزان کاهش را مشاهده کند.

23 food habit 3

یکی از کاربران محترم، به این نمودار انتقاد کرد که علامت‌های قرمز و مثلث وارونه، به اندازه کافی میزان کاهش را نشان نمی‌دهد. قبلا هم به این نکته اشاره کرده‌ایم که برای طراحی نمودار، بایستی دقت کرد پیامی که قرار است منتقل شود، چیست؟ اگر پیام، مقدار وزن و نیز تغییرات آن است، نمودار زیر پیشنهاد می‌شود.

23 food habit 3 2

در نمودار بالا، برای نمایش میزان تغییر وزن، یک نمودار ستونی رسم شده است. به دلیل اینکه کاهش وزن یک عدد منفی است، رنگ قرمز برای آن انتخاب شد. میزان کاهش نیز مجددا با یک مثلث وارونه در بالای میله‌ها نمایش داده شد تا خوانش آن سخت نباشد.

البته در این مورد به خصوص، به نظر می‌رسد که به دلیل تعدد پیام‌های موجود در این شکل، نمودار ترکیبی فوق کاربردهای خاص‌تری داشته باشد. این خود یک نکته است که تعداد پیام‌هایی که در یک نمودار به تصویر کشیده می‌شود، بایستی محدود باشد. وگرنه خوانش آن را کمی پیچیده می‌کند.