نمایش داده‌های پرت و نامتنجانس

بسیار پیش می‌آید که در نمایش یک سری از داده‌ها، یکی از ورودی‌ها مقداری بسیار متفاوت از سایرین دارد. به طور مثال، در یک مجموعه داده، اکثر داده‌ها سه رقمی هستند، ولی یک ورودی پنج یا شش رقمی در بین آنها وجود دارد.  این مثال در شکل زیر نمایش داده شده است. شکل سمت چپ، نمودار رسم شده با داده‌های عادی است. بدیهی است که اکثر داده‌ها به دلیل کوچک بودن مقادیر آنها نسبت به مقادیر مندرج در محور عمودی نمودار، قابل رویت نیستند.

برای نمایش داده‌های پرت و نامتنجانس یک سری داده در نمودار، راه‌های متفاوتی پیشنهاد می‌شود. در نمودار سمت راست، از روش محور لگاریتمی استفاده شده است. در این روش، مقادیر محور هر عددی را که نشان می‌دهند، اکسل به صورت پنهان آن را معادل لگاریتم آن فرض می‌کند. دیده می‌شود که اکنون همه داده‌ها قابل رویت هستند، هرچند بدون رعایت مقیاس یا نشانه‌ای که به خواننده تمایز را منتقل کند.

50 unrelated data in a chart 1
سمت راست: تغییر مقیاس محور عمودی به صورت لگاریتمی | سمت چپ: نمایش اعداد نامتجانس در یک نمودار (شیوه غلط)

در اینجا یک پیشنهاد دیگر برای نمایش این داده‌ها ارائه می‌شود: روش ایجاد شکاف درستون‌های نمودار. بر اساس این پیشنهاد به جای اعداد واقعی بزرگ، اعدادی مجازی کوچکتر در بازه نرمال ترسیم شود. ولی بر روی محور به جای مقادیر مجازی، همان مقدار اصلی نمایش داده شود. این ایده را می‌توانید در شکل زیر ببینید.

50 unrelated data in a chart 2
شیوه مناسب نمایش اعداد نامتجانس در یک نمودار

در شکل بالا محور به دو بازه مربوط به اعداد کوچک و اعداد بزرگ تقسیم شده است و با علامت دو خط، محل برش مشخص شده است. خبر خوب اینکه انجام این کار به راحتی در اکسل ممکن است.

سفره ایرانی‌ها در ده سال اخیر چه تغییری کرده است؟ بخش اول

در یکی از مطالب گذشته، نمودارهای گزارش نتایج بررسی بودجه خانوار در مناطق شهری ایران در سال ۱۳۹۳ که توسط بانک مرکزی منتشر شد را بررسی کردیم. در ادامه آن گزارش، یکی از سایت‌های اقتصادی مطلبی در مورد تحلیل سفره خانوار ایرانی منتشر کرده است. در این مطلب یک نمودار در مورد میزان تغییر مصرف هر یک از اقلام خوراکی طی ۱۰ سال اخیر ارائه شده است.

18 Food Habit 1

منبع: اقتصادنیوز

می‌توان با در نظر گرفتن عناصر زیر، نمودار غنی‌تر و جذاب‌تری رسم کرد:

  • میزان مصرف طی ده سال گذشته چه تغییری کرده است؟
  • هزینه هر یک از اقلام در سبد مصرف خانوار در ده سال گذشته چه تغییری کرده است؟

در نمودار بالا، تنها تفاضل مصرف هر یک از اقلام در سال ۱۳۹۳ و ۱۳۸۴ به صورت نمودار ستونی نمایش داده شده است. می‌توان از نمودار Stacked Area برای نمایش روند کاهش مصرف هر یک از اقلام استفاده کرد. همچنین برای بررسی روند هزینه‌ای هر یک از اقلام نیز می‌توان از همان نمودار استفاده کرد. به این مطلب در پست قبل اشاره شده است (+).

در این مطلب، نموداری اصلاح شده با کمک اکسل ارائه می‌شود که از نظر بصری و تحلیلی، جذاب‌تر و کارآمدتر از نمودار اقتصادنیوز است. در مقام مقایسه، کدام یک را بیشتر می‌پسندید؟

18 Food Habit 2

نمودار فوق تنها از لحاظ وزنی، تغییر شیوه مصرف در سفره‌های ایرانی را بررسی کرده است. اگر بخواهیم هم از لحاظ وزنی و هم از لحاظ هزینه‌ای، این سفره را طی ده سال گذشته مقایسه کنیم، چه نموداری را پیشنهاد می‌دهید؟

پی‌نوشت: دیتا پارتنرز را در شبکه‌های اجتماعی و موبایلی می توانید دنبال کنید: اینستاگرام و توییتر. همچنین اگر از خوراک‌خوان‌هایی نظیر اینو ریدر یا فیدلی استفاده می کنید، با افزودن آدرس وبسایت، ما را به طور منظم دنبال کنید. منتظر نظرات شما  هستیم 🙂

نمودار سری زمانی بودجه خانوار در مناطق شهری ایران

بانک مرکزی، نتایج بررسی بودجه خانوار در مناطق شهری ایران در سال ۱۳۹۳ را منتشر کرد. این گزارش اطلاعات جامعی از ترکیب مواد مصرفی خانوار شهری طی ده سال گذشته ارائه می‌دهد. هرچند دو نمودار در این گزارش به کار رفته که امکان بهبود آن است (+).

یکی از سوالات مهمی که اقتصاددانان و جامعه‌شناسان به تحلیل آن علاقه‌مند هستند، روند تغییرات مصرف خانوار به تفکیک محصولات است. به طور مثال، آموزش چند درصد از بودجه خانوار را در سال ۱۳۸۳ تشکیل می‌داده و امروز به چه مقداری رسیده است؟

16 Family Consumption HES 1

در گزارش منتشر شده توسط بانک مرکزی از نمودار دایره‌ای برای نمایش ترکیب مصرف خانوار استفاده شده است. قبلا توضیح دادیم که چارتیست‌های حرفه‌ای علاقه‌ای به استفاده از نمودار دایره‌ای ندارند. چرا که نمودار دایره‌ای، نموداری خوانا و دقیق نیست.  ضمن اینکه مقایسه ترکیب مصرف سالهای مختلف با نمودار دایره‌ای بسیار سخت است. تصور کنید که دو نمودار دایره‌ای برای مقایسه جزئیات در کنار هم قرار گیرند. همانطور که سایت اقتصاد نیوز این کار را کرده است (+).

به جای نمودار دایره‌ای، پیشنهاد می‌شود که از نمودار مساحت  (Area Chart) استفاده شود. استفاده از نمودار مساحت چند مزیت دارد. اول اینکه امکان مقایسه روند کل ده سال اخیر در آن به سادگی فراهم است. دوم اینکه کمبودهای نمودار دایره‌ای در آن وجود ندارد. و در نهایت با قرار دادن برچسب‌های مناسب، امکان مقایسه عددی ترکیب سبد خانوار در سالهای ۸۳ و ۹۳ وجود دارد. ترکیب رنگهای نمودار نیز به گونه‌ای است که در چاپ سیاه و سفید نمودار، مشکل چندانی برای آن به وجود نمی‌آید.

16 Family Consumption HES 2

در گزارش بانک مرکزی از نمودارهای ستونی برای مقایسه مصرف خانوار در هر بخش استفاده شده است.

16 Family Consumption HES 3

نمودار بالا، از چند جهت قابل اصلاح است:

  • روند کل مصرف خانوار، به سختی تشخیص داده می‌شود
  • نسبت هر یک از محصولات به کل مصرف، به سختی تشخیص داده می‌شود.
  • محل قرار گرفتن برچسب داده‌ها، مناسب نیست.
  • اعداد و ارقام کلیدی، در نمودار مشخص نشده است و خواننده بایستی خود، بر روی نمودار تحلیل ارائه کند.

به جای نمودار بالا، می‌شد از نمودار مساحت استفاده کرد. در نمودار مساحت پیشنهادی زیر، به نوع نمایش اعداد، محل قرار گرفتن اعداد و نام سری زمانی توجه کنید.

16 Family Consumption HES 4

نمودار فوق چند ویژگی دارد:

  • هیچ عنصری به نمودار منتشره در گزارش بانک مرکزی کم یا زیاد نشد. ضمن اینکه همانند آن گزارش، این نمودار نیز مناسب پرینت کاغذی A4 به صورت افقی (Landscape) است.
  • اعداد از حالت خام خارج شده و بر حسب میلیون نوشته شدند تا تعداد ارقام در نمودار کاهش یابد. مثلا ۱۰۹۹۰۱۷۳۱ ریال به ۱۰۹٫۹ میلیون ریال تبدیل شد.
  • خوانش عناصر کم اهمیت‌تر مانند دخانیات، ارتباطات، رستوران و هتل کمی سخت است و بهتر است که از نمودار حذف و در قالب عبارت «سایر» تجمیع شوند. چرا که محققین برای بررسی بیشتر می‌توانند به جدول مراجعه کنند. در این صورت نمودار به شکل زیر تبدیل خواهد شد.
  • می‌توان نماگر رشد را به نمودار بالا اضافه کرد به این معنی که مصرف خانوار در طی ده سال گذشته به طور متوسط هر سال چقدر رشد داشته است.

سعی شده است که در نمودار پیشنهادی زیر، نکات فوق رعایت شود:

16 Family Consumption HES 5

اگر پیشنهاد دیگری برای ارایه‌ی داده‌های بودجه خانوار دارید با ما در میان بگذارید.

نمودارهایی که پیام را به درستی منتقل نمی کنند

طراحی نمودار، ترکیبی از هنر و دانش است؛ دانش ریاضی و هنر انتقال پیام. هیچکدام از این دو نباید فدای دیگری شود. نه به کارگیری انمیشن، طرحهای سه بعدی و استفاده از رنگهای متنوع موجب انتقال بهتر پیام می‌شود و نه به کارگیری نمودارهای پیچیده. فنون و ابزارها باید در خدمت انتقال پیام به مخاطب باشند.

موضوع انتقال پیام، اساسی‌ترین شاخص در ارزیابی نمودار است. نمودارهایی که «پیام» را به درستی منتقل نمی‌کنند، به نمودارهای شیطانی معروف هستند. در این پست، دو نمونه از این نوع نمودارها معرفی می‌شوند.

نمودار زیر، یک استریم گراف (Stream Graph) است. در واقع، اولین استریم گراف تاریخ است که در روزنامه نیو یورک تایمز منتشر شده است. این نمودار، همان نمودار مساحت انباشته (Stacked Area) است که به جای اینکه از محور افقی به سمت بالا تجمعی شوند، از محور به دو سمت حرکت کرده است.

14- bad chart for business 1

استریم گراف

موضوع این نمودار میزان فروش فیلم‌های سینمایی در آمریکا در طی زمان است. این نمودار به دنبال پاسخ به سه سوال است:

  • میزان کل فروش هر فیلم چقدر است؟
  • تغییرات میزان فروش آن در طول زمان چگونه است؟
  • اندازه و ترکیب بازار سینمای امریکا در طول زمان چگونه بوده است؟

برای این کار از عناصر رنگ، مساحت، و محور زمان استفاده شده است. نمودار بالا بسیار بد طراحی شده است زیرا پیام مستقیمی را منتقل نمی‌کند. حتی وقتی تمرکز می‌کنیم هم به سختی داده‌ها خوانده می‌شوند و اطلاعاتی به دست می‌آید. مثلا فیلم کارتونی The Simpsons را نگاه کنید. آیا می توانید تشخیص دهد که فروش این فیلم در ماه جولای چقدر از کل فروشش بوده است؟ و در آن دوره، چه سهمی از فروش ماه جولای صنعتی سینمای امریکا را تشکیل می دهد؟ واقعیت این که که این نمودار بیشتر یک اثر هنری است تا یک ابزاری برای انتقال اطلاعات و اصلا مناسب فضای تجاری و تصمیم‌سازی نیست.

یک نمودار زیبا و هنری دیگر، ابر کلمات (Words Cloud) است که برای نشان دادن اهمیت یک موضوع نسبت به سایر موضوعات دیگر به کار می‌رود. هر چقدر که اندازه کلمه‌ای بزرگتر باشد، اهمیت بیشتری در آن متن داشته است. البته فعلا ابزار مناسبی برای طراحی ابر کلمات به زبان فارسی وجود ندارد، ولی سایت‌های متعددی این نمودار را برای کلمات انگلیسی به صورت رایگان تولید می‌کنند.

14- bad chart for business 2

ابر کلمات

هر چند که این نمودار زیباست اما از نظر انتقال اطلاعات و تبیین پیام ضعیف است. کشف یک کلمه از درون این نمودار و مقایسه اندازه آن با سایر کلمات برای ذهن کمی سخت است. از رنگ هم استفاده مناسبی نشده و رنگ‌ها معرف ویژگی خاصی نیستند. باز هم به دلیل ضعف در توانایی انتقال پیام، به کارگیری این نمودار در گزارش‌های تجاری اصلا توصیه نمی‌شود. ولی به عنوان طرح روی جلد، تصویر بدی نیست. البته به این شرط که به زبان فارسی و با فونت و رنگ‌بندی مناسب طراحی شوند.

 جهت پیگیری به‌روز رسانی‌های بعدی دیتاپارتنرز، می‌توانید ما را در شبکه‌های اجتماعی و موبایلی دنبال کنید: اینستاگرام و توییتر و خبرنامه تلگرامی. همچنین اگر از خوراک‌خوان‌هایی نظیر اینو ریدر یا فیدلی استفاده می کنید نیز با افزودن آدرس وبسایت ما را به طور منظم دنبال کنید.

نمودار دایره‌ای: چاق و کم‌مصرف

نمودار دایره‌ای (پای چارت : Pie Chart) بدون هیچ دلیلی، یک نمودار محبوب در گزارش‌های تجاری است. نموداری که چارتیست‌های حرفه‌ای از آن به شدت متنفرند. وقتی در جلسات تحلیلی به کارآموزان و دانشجویان گفته می‌شود که از این نمودار در گزارش‌های تجاری استفاده نکنید، تعجب می‌کنند. ولی وقتی دلایل ناکارآمدی این نمودار تشریح می‌شود، معمولا به راحتی قبول می‌کنند. چارتیست‌ها برای اینکه یک نمودار را ارزیابی کنند، می‌پرسند که میزان کارآمدی این نمودار برای انتقال «پیام» چقدر است؟

11 pie chart 1

اولین نقص نمودار دایره‌ای حساسیت زیاد آن به تعداد برش‌ها است. زمانی که تعداد برش‌ها کم باشد، نمودار پیام کاملا ساده‌ای را منتقل می‌کند؛ مانند شکل بالا. در صورتی که به راحتی می‌شود این پیام را با نمایش مستقیم اعداد به خواننده منتقل کرد. طبیعتا شکل زیر بسیار دقیق‌تر پیام را منتقل می‌کند. در ضمن نیاز به مقایسه مرزهای برش‌های نمودار، چک کردن برچسب سری داده‌ها و دقت اضافه برای فهم نمودار نیست.

11 pie chart 2

زمانی که تعداد برش‌ها افزایش می‌یابد، چشم در تحلیل مرز برش‌ها و اینکه کدام برش از دیگری بزرگتر است، دچار مشکل می‌شود. حتی اگر مقدار بر حسب % در هر برش نمایش داده شود، ذهن برای فهم ترتیب و مرتب کردن برش‌ها، دچار زحمت خواهد شد.

11 pie chart 3

اضافه بر خستگی چشم و سختی محاسبه سهم هر کدام از شرکت‌ها، در نمودار بالا احتمالا بتوان تشخیص داد که شرکت الف دارای ۲۵% از سهم بازار است. در همین نمودار، اگر در همین نمودار، جای شرکت الف و جابجا شود، بعید است خواننده بتواند حدس بزند که سهم بازار شرکت الف، ۲۵% است.

11 pie chart 4

فارغ از سهم شرکت الف، سهم شرکت د بیشتر است یا سهم شرکت و؟ تقریبا می‌توان گفت که عمده کسانی که به این نمودار خیره شوند، به سادگی نمی‌توانند تفاوتی بین سهم شرکت د و ه پیدا کنند. حتی اگر مقدار سهم هر شرکت در این نمودار نوشته شود، باید زحمت بیشتری برای منظم کردن آنها بکشند.

نکته دیگر اینکه رنگ‌ها در نمودار دایره‌ای، نقش چندانی بازی نمی‌کنند. در حالی که در طراحی حرفه‌ای چارت، رنگ نشان‌دهنده‌ی یک ویژگی یا مقدار است و به راحتی نبایستی آن را مصرف کرد.

به جای نمودار بالا، چه نموداری مناسب است؟ پاسخ این است که ده‌ها نمودار می‌توان به جایش رسم کرد. ساده‌ترین نمودار که در اغلب موارد می‌توان آن را جایگزین نمودار دایره‌ای کرد، نمودار میله‌ای است که داده‌ها بر حسب مقادیر، منظم شده‌اند [یادآوری، اگر میله‌ها به صورت عمودی رسم شوند، به نمودار ستونی و اگر افقی رسم شوند، میله‌ای گفته می‌شود].

11 pie chart 5

در اولین مطلب دیتا پارتنرز نیز، نمونه‌ی دیگری از طراحی مجدد نمودار ارایه کرده بودیم که به نظر می رسد نگاهی دوباره به آن خالی از لطف نباشد: جهت مشاهده، اینجا کلیک کنید.

پی‌نوشت: دیتا پارتنرز را در شبکه‌های اجتماعی و موبایلی می توانید دنبال کنید: اینستاگرام و توییتر. همچنین اگر از خوراک‌خوان‌هایی نظیر اینو ریدر یا فیدلی استفاده می کنید نیز با افزودن آدرس وبسایت ما را به طور منظم دنبال کنید. به زودی، خبرنامه‌ی ایمیلی دیتا پارتنرز نیز راه خواهد افتاد. منتظر نظرات شما  هستیم 🙂