نمایش داده‌های پرت و نامتنجانس

بسیار پیش می‌آید که در نمایش یک سری از داده‌ها، یکی از ورودی‌ها مقداری بسیار متفاوت از سایرین دارد. به طور مثال، در یک مجموعه داده، اکثر داده‌ها سه رقمی هستند، ولی یک ورودی پنج یا شش رقمی در بین آنها وجود دارد.  این مثال در شکل زیر نمایش داده شده است. شکل سمت چپ، نمودار رسم شده با داده‌های عادی است. بدیهی است که اکثر داده‌ها به دلیل کوچک بودن مقادیر آنها نسبت به مقادیر مندرج در محور عمودی نمودار، قابل رویت نیستند.

برای نمایش داده‌های پرت و نامتنجانس یک سری داده در نمودار، راه‌های متفاوتی پیشنهاد می‌شود. در نمودار سمت راست، از روش محور لگاریتمی استفاده شده است. در این روش، مقادیر محور هر عددی را که نشان می‌دهند، اکسل به صورت پنهان آن را معادل لگاریتم آن فرض می‌کند. دیده می‌شود که اکنون همه داده‌ها قابل رویت هستند، هرچند بدون رعایت مقیاس یا نشانه‌ای که به خواننده تمایز را منتقل کند.

50 unrelated data in a chart 1
سمت راست: تغییر مقیاس محور عمودی به صورت لگاریتمی | سمت چپ: نمایش اعداد نامتجانس در یک نمودار (شیوه غلط)

در اینجا یک پیشنهاد دیگر برای نمایش این داده‌ها ارائه می‌شود: روش ایجاد شکاف درستون‌های نمودار. بر اساس این پیشنهاد به جای اعداد واقعی بزرگ، اعدادی مجازی کوچکتر در بازه نرمال ترسیم شود. ولی بر روی محور به جای مقادیر مجازی، همان مقدار اصلی نمایش داده شود. این ایده را می‌توانید در شکل زیر ببینید.

50 unrelated data in a chart 2
شیوه مناسب نمایش اعداد نامتجانس در یک نمودار

در شکل بالا محور به دو بازه مربوط به اعداد کوچک و اعداد بزرگ تقسیم شده است و با علامت دو خط، محل برش مشخص شده است. خبر خوب اینکه انجام این کار به راحتی در اکسل ممکن است.

محل مناسب نمایه نمودار در گزارش‌های کسب و کار

در رسم هر نمودار، بایستی از علائم و برچسب‌های مناسب برای تعریف و مشخص کردن معنای هر یک از اجزای نمودار استفاده کرد. یکی از این علامت‌ها، نمایه (Legend) یا نام سری داده‌ها در نمودار است.

30 legend 1

به طور سنتی، ابزارهای تحلیل داده و صفحه گسترده‌هایی مانند اکسل، نمایه را در دو طرف، بالا یا پایین نمودار قرار می‌دهند (همانند شکل بالا). قراردادن نمایه در بیرون از فضای نمودار، باعث ناخوانایین نمودارها است. بهتر است نام هر سری داده در کنار آنها و در قسمت درونی نمودار باشد. نام‌ها بایستی به صورت افقی نوشته شوند تا خوانا باشند. مثلا در نمودارهای ستونی انباشته (stacked column charts)، بسته به فضای مناسب برای نمایش، نمایه در سمت چپ یا راست ستون‌ها قرار داده می‌شود. نمونه‌ای از این نمودار در شکل زیر نمایش داده شده است.

30 legend 2

در نمودارهای میله‌ای انباشته (stacked bar charts)، می‌توان نام آنها را در سطح فوقانی نمودار قرار داد. نمونه‌ای از نمودار میله‌ای انباشته در شکل زیر نمایش داده شده است.

30 legend 3

در نمودارهای میله‌ای ساده، نام سری داده را می‌توان در سمت راست و یا در انتهای خطوط قرار داد. در نمودار خطی نیز به همین شکل انجام می‌شود. نمونه‌ای از جایگاه مناسب برچسب داده‌ها در نمودار خطی در شکل زیر نمایش داده شده است.

30 legend 4

در صورتی که به هر دلیل مجبور به استفاده از راهنمای برچسب داده‌ها بیرون از فضای نمودار هستید، از رنگ‌های روشن استفاده کرده تا تمرکز مخاطب از دست نرود. در نمودارهای دوبعدی که هر دو محور دارای مقدار عددی هستند، می‌توان برچسب داده‌ها را در بیرون از نمودار  قرار داد. برای گروه‌بندی دسته‌های داده‌ها می‌توان از نماد‌هایی در بیرون از نمودار کمک گرفت. نمونه‌ای از این موضوع در شکل زیر نمایش داده شده است.

30 legend 5

رعایت نکات این‌چنینی در مورد اجزا و عناصر مختلف نمودار، منجر به خوانایی بیشتر و انتقال بهتر پیام به مخاطب خواهد شد. سعی ما در دیتا پارتنرز بر این بوده است که مسئله‌ی «ارایه داده» را به موازات «تحلیل داده» پیش ببریم و نشان دهیم که بهترین تحلیل‌ها، بدون ارایه‌ی مناسب، آنچنان که باید اثر مطلوبی بر مخاطب نخواهند داشت. امیدواریم این مجموعه مطالب برای شما مفید بوده باشد.

چگونه مقادیر منفی را در یک نمودار نمایش دهیم؟

یکی از گام‌های رسم نمودار، تعیین «عناصر» یک نمودار است. میله‌ها، برچسب‌ها و واحد نمایش، از عناصر مهم نمودار هستند. چارتیست‌های حرفه‌ای پیش از قرار دادن هر عنصری در نمودار، یک سوال استاندارد از خود می‌پرسند: این عنصر، چه پیامی را به مخاطب منتقل می‌کند؟

رنگ نیز از عناصر مهم نمودار است. استفاده از رنگ برای ایجاد تنوع در نمودار، به هیچ وجه کاری حرفه‌ای نیست. یک چارتیست حرفه‌ای هیچگاه از افکت‌های هنری، سایه روشن و سه‌بعدی سازی استفاده نمی‌کند و به طور کلی هر گونه تغییر در ظاهر استاندارد یک نمودار اجتناب می‌کند. استفاده کم یا زیاد از رنگ در نمودار، ممکن است موجب ضعف در انتقال مناسب پیام در یک نمودار شود.

اصلی‌ترین کارکرد رنگ، «برجسته‌سازی پیام» است. یکی از پرکاربردترین برجسته‌سازها، برجسته‌سازی و ایجاد تمایز بین اعداد منفی و مثبت است. یک مثال ساده، در شکل زیر نمایش داده شده است. فرض کنید که این نمودار نشان دهنده تغییر مصرف میوه نسبت به سال گذشته باشد. میله‌های مربوط به میوه‌هایی که مصرف آنها در سال جاری کاهش داشت، قرمز است که نشان دهنده وجود یک روند منفی است. میله‌های مربوط به میوه‌هایی که مصرف آنها رشد داشته، با سبز نشان داده شده‌اند.

28 minus vals 1

در فضای کسب و کار، سبز و قرمز به عنوان نمادهای پذیرفته شده برای نمایش روند مثبت و منفی هستند. از این رو بایستی آنها را با دقت در نمودار به کار برد. بنابراین بهتر است سعی شود تا حد ممکن از این دو رنگ برای انتقال سایر پیام‌ها استفاده نشود.

در مثال زیر، نمودار ستونی میزان مصرف واقعی برخی از میوه‌ها در دو سال گذشته نمایش داده شده است. برای انتقال پیام «تغییرات مثبت یا منفی مصرف میوه‌جات مختلف»، یک محور دیگر در بالای آن افزوده شده که تغییرات مصرف میوه را نمایش می‌دهد.

28 minus vals 2

این داشبورد که با اکسل رسم شده است، الگوی مناسبی برای طراحی داشبورد تحلیل روند فروش است. رنگ سبز و قرمز در این نمودار به صورت استاندارد استفاده شده‌اند. در صورت نیاز، عناصر دیگری را نیز می‌توان به این داشبورد اضافه کرد. ولی پیش از هر کاری، به این سوال اساسی فکر کنید: عناصر جدید، چه پیامی را باید به مخاطب منتقل کنند؟

پی‌نوشت: اگر علاقه‌مند پیگیری مداوم مطالب ما هستید، دیتا پارتنرز را در تلگرام، توییتر و یا اینستاگرام دنبال کنید.

نمودار سری زمانی بودجه خانوار در مناطق شهری ایران

بانک مرکزی، نتایج بررسی بودجه خانوار در مناطق شهری ایران در سال ۱۳۹۳ را منتشر کرد. این گزارش اطلاعات جامعی از ترکیب مواد مصرفی خانوار شهری طی ده سال گذشته ارائه می‌دهد. هرچند دو نمودار در این گزارش به کار رفته که امکان بهبود آن است (+).

یکی از سوالات مهمی که اقتصاددانان و جامعه‌شناسان به تحلیل آن علاقه‌مند هستند، روند تغییرات مصرف خانوار به تفکیک محصولات است. به طور مثال، آموزش چند درصد از بودجه خانوار را در سال ۱۳۸۳ تشکیل می‌داده و امروز به چه مقداری رسیده است؟

16 Family Consumption HES 1

در گزارش منتشر شده توسط بانک مرکزی از نمودار دایره‌ای برای نمایش ترکیب مصرف خانوار استفاده شده است. قبلا توضیح دادیم که چارتیست‌های حرفه‌ای علاقه‌ای به استفاده از نمودار دایره‌ای ندارند. چرا که نمودار دایره‌ای، نموداری خوانا و دقیق نیست.  ضمن اینکه مقایسه ترکیب مصرف سالهای مختلف با نمودار دایره‌ای بسیار سخت است. تصور کنید که دو نمودار دایره‌ای برای مقایسه جزئیات در کنار هم قرار گیرند. همانطور که سایت اقتصاد نیوز این کار را کرده است (+).

به جای نمودار دایره‌ای، پیشنهاد می‌شود که از نمودار مساحت  (Area Chart) استفاده شود. استفاده از نمودار مساحت چند مزیت دارد. اول اینکه امکان مقایسه روند کل ده سال اخیر در آن به سادگی فراهم است. دوم اینکه کمبودهای نمودار دایره‌ای در آن وجود ندارد. و در نهایت با قرار دادن برچسب‌های مناسب، امکان مقایسه عددی ترکیب سبد خانوار در سالهای ۸۳ و ۹۳ وجود دارد. ترکیب رنگهای نمودار نیز به گونه‌ای است که در چاپ سیاه و سفید نمودار، مشکل چندانی برای آن به وجود نمی‌آید.

16 Family Consumption HES 2

در گزارش بانک مرکزی از نمودارهای ستونی برای مقایسه مصرف خانوار در هر بخش استفاده شده است.

16 Family Consumption HES 3

نمودار بالا، از چند جهت قابل اصلاح است:

  • روند کل مصرف خانوار، به سختی تشخیص داده می‌شود
  • نسبت هر یک از محصولات به کل مصرف، به سختی تشخیص داده می‌شود.
  • محل قرار گرفتن برچسب داده‌ها، مناسب نیست.
  • اعداد و ارقام کلیدی، در نمودار مشخص نشده است و خواننده بایستی خود، بر روی نمودار تحلیل ارائه کند.

به جای نمودار بالا، می‌شد از نمودار مساحت استفاده کرد. در نمودار مساحت پیشنهادی زیر، به نوع نمایش اعداد، محل قرار گرفتن اعداد و نام سری زمانی توجه کنید.

16 Family Consumption HES 4

نمودار فوق چند ویژگی دارد:

  • هیچ عنصری به نمودار منتشره در گزارش بانک مرکزی کم یا زیاد نشد. ضمن اینکه همانند آن گزارش، این نمودار نیز مناسب پرینت کاغذی A4 به صورت افقی (Landscape) است.
  • اعداد از حالت خام خارج شده و بر حسب میلیون نوشته شدند تا تعداد ارقام در نمودار کاهش یابد. مثلا ۱۰۹۹۰۱۷۳۱ ریال به ۱۰۹٫۹ میلیون ریال تبدیل شد.
  • خوانش عناصر کم اهمیت‌تر مانند دخانیات، ارتباطات، رستوران و هتل کمی سخت است و بهتر است که از نمودار حذف و در قالب عبارت «سایر» تجمیع شوند. چرا که محققین برای بررسی بیشتر می‌توانند به جدول مراجعه کنند. در این صورت نمودار به شکل زیر تبدیل خواهد شد.
  • می‌توان نماگر رشد را به نمودار بالا اضافه کرد به این معنی که مصرف خانوار در طی ده سال گذشته به طور متوسط هر سال چقدر رشد داشته است.

سعی شده است که در نمودار پیشنهادی زیر، نکات فوق رعایت شود:

16 Family Consumption HES 5

اگر پیشنهاد دیگری برای ارایه‌ی داده‌های بودجه خانوار دارید با ما در میان بگذارید.

نمودارهایی که پیام را به درستی منتقل نمی کنند

طراحی نمودار، ترکیبی از هنر و دانش است؛ دانش ریاضی و هنر انتقال پیام. هیچکدام از این دو نباید فدای دیگری شود. نه به کارگیری انمیشن، طرحهای سه بعدی و استفاده از رنگهای متنوع موجب انتقال بهتر پیام می‌شود و نه به کارگیری نمودارهای پیچیده. فنون و ابزارها باید در خدمت انتقال پیام به مخاطب باشند.

موضوع انتقال پیام، اساسی‌ترین شاخص در ارزیابی نمودار است. نمودارهایی که «پیام» را به درستی منتقل نمی‌کنند، به نمودارهای شیطانی معروف هستند. در این پست، دو نمونه از این نوع نمودارها معرفی می‌شوند.

نمودار زیر، یک استریم گراف (Stream Graph) است. در واقع، اولین استریم گراف تاریخ است که در روزنامه نیو یورک تایمز منتشر شده است. این نمودار، همان نمودار مساحت انباشته (Stacked Area) است که به جای اینکه از محور افقی به سمت بالا تجمعی شوند، از محور به دو سمت حرکت کرده است.

14- bad chart for business 1

استریم گراف

موضوع این نمودار میزان فروش فیلم‌های سینمایی در آمریکا در طی زمان است. این نمودار به دنبال پاسخ به سه سوال است:

  • میزان کل فروش هر فیلم چقدر است؟
  • تغییرات میزان فروش آن در طول زمان چگونه است؟
  • اندازه و ترکیب بازار سینمای امریکا در طول زمان چگونه بوده است؟

برای این کار از عناصر رنگ، مساحت، و محور زمان استفاده شده است. نمودار بالا بسیار بد طراحی شده است زیرا پیام مستقیمی را منتقل نمی‌کند. حتی وقتی تمرکز می‌کنیم هم به سختی داده‌ها خوانده می‌شوند و اطلاعاتی به دست می‌آید. مثلا فیلم کارتونی The Simpsons را نگاه کنید. آیا می توانید تشخیص دهد که فروش این فیلم در ماه جولای چقدر از کل فروشش بوده است؟ و در آن دوره، چه سهمی از فروش ماه جولای صنعتی سینمای امریکا را تشکیل می دهد؟ واقعیت این که که این نمودار بیشتر یک اثر هنری است تا یک ابزاری برای انتقال اطلاعات و اصلا مناسب فضای تجاری و تصمیم‌سازی نیست.

یک نمودار زیبا و هنری دیگر، ابر کلمات (Words Cloud) است که برای نشان دادن اهمیت یک موضوع نسبت به سایر موضوعات دیگر به کار می‌رود. هر چقدر که اندازه کلمه‌ای بزرگتر باشد، اهمیت بیشتری در آن متن داشته است. البته فعلا ابزار مناسبی برای طراحی ابر کلمات به زبان فارسی وجود ندارد، ولی سایت‌های متعددی این نمودار را برای کلمات انگلیسی به صورت رایگان تولید می‌کنند.

14- bad chart for business 2

ابر کلمات

هر چند که این نمودار زیباست اما از نظر انتقال اطلاعات و تبیین پیام ضعیف است. کشف یک کلمه از درون این نمودار و مقایسه اندازه آن با سایر کلمات برای ذهن کمی سخت است. از رنگ هم استفاده مناسبی نشده و رنگ‌ها معرف ویژگی خاصی نیستند. باز هم به دلیل ضعف در توانایی انتقال پیام، به کارگیری این نمودار در گزارش‌های تجاری اصلا توصیه نمی‌شود. ولی به عنوان طرح روی جلد، تصویر بدی نیست. البته به این شرط که به زبان فارسی و با فونت و رنگ‌بندی مناسب طراحی شوند.

 جهت پیگیری به‌روز رسانی‌های بعدی دیتاپارتنرز، می‌توانید ما را در شبکه‌های اجتماعی و موبایلی دنبال کنید: اینستاگرام و توییتر و خبرنامه تلگرامی. همچنین اگر از خوراک‌خوان‌هایی نظیر اینو ریدر یا فیدلی استفاده می کنید نیز با افزودن آدرس وبسایت ما را به طور منظم دنبال کنید.