نمودار دایره‌ای: چاق و کم‌مصرف

نمودار دایره‌ای (پای چارت : Pie Chart) بدون هیچ دلیلی، یک نمودار محبوب در گزارش‌های تجاری است. نموداری که چارتیست‌های حرفه‌ای از آن به شدت متنفرند. وقتی در جلسات تحلیلی به کارآموزان و دانشجویان گفته می‌شود که از این نمودار در گزارش‌های تجاری استفاده نکنید، تعجب می‌کنند. ولی وقتی دلایل ناکارآمدی این نمودار تشریح می‌شود، معمولا به راحتی قبول می‌کنند. چارتیست‌ها برای اینکه یک نمودار را ارزیابی کنند، می‌پرسند که میزان کارآمدی این نمودار برای انتقال «پیام» چقدر است؟

11 pie chart 1

اولین نقص نمودار دایره‌ای حساسیت زیاد آن به تعداد برش‌ها است. زمانی که تعداد برش‌ها کم باشد، نمودار پیام کاملا ساده‌ای را منتقل می‌کند؛ مانند شکل بالا. در صورتی که به راحتی می‌شود این پیام را با نمایش مستقیم اعداد به خواننده منتقل کرد. طبیعتا شکل زیر بسیار دقیق‌تر پیام را منتقل می‌کند. در ضمن نیاز به مقایسه مرزهای برش‌های نمودار، چک کردن برچسب سری داده‌ها و دقت اضافه برای فهم نمودار نیست.

11 pie chart 2

زمانی که تعداد برش‌ها افزایش می‌یابد، چشم در تحلیل مرز برش‌ها و اینکه کدام برش از دیگری بزرگتر است، دچار مشکل می‌شود. حتی اگر مقدار بر حسب % در هر برش نمایش داده شود، ذهن برای فهم ترتیب و مرتب کردن برش‌ها، دچار زحمت خواهد شد.

11 pie chart 3

اضافه بر خستگی چشم و سختی محاسبه سهم هر کدام از شرکت‌ها، در نمودار بالا احتمالا بتوان تشخیص داد که شرکت الف دارای ۲۵% از سهم بازار است. در همین نمودار، اگر در همین نمودار، جای شرکت الف و جابجا شود، بعید است خواننده بتواند حدس بزند که سهم بازار شرکت الف، ۲۵% است.

11 pie chart 4

فارغ از سهم شرکت الف، سهم شرکت د بیشتر است یا سهم شرکت و؟ تقریبا می‌توان گفت که عمده کسانی که به این نمودار خیره شوند، به سادگی نمی‌توانند تفاوتی بین سهم شرکت د و ه پیدا کنند. حتی اگر مقدار سهم هر شرکت در این نمودار نوشته شود، باید زحمت بیشتری برای منظم کردن آنها بکشند.

نکته دیگر اینکه رنگ‌ها در نمودار دایره‌ای، نقش چندانی بازی نمی‌کنند. در حالی که در طراحی حرفه‌ای چارت، رنگ نشان‌دهنده‌ی یک ویژگی یا مقدار است و به راحتی نبایستی آن را مصرف کرد.

به جای نمودار بالا، چه نموداری مناسب است؟ پاسخ این است که ده‌ها نمودار می‌توان به جایش رسم کرد. ساده‌ترین نمودار که در اغلب موارد می‌توان آن را جایگزین نمودار دایره‌ای کرد، نمودار میله‌ای است که داده‌ها بر حسب مقادیر، منظم شده‌اند [یادآوری، اگر میله‌ها به صورت عمودی رسم شوند، به نمودار ستونی و اگر افقی رسم شوند، میله‌ای گفته می‌شود].

11 pie chart 5

در اولین مطلب دیتا پارتنرز نیز، نمونه‌ی دیگری از طراحی مجدد نمودار ارایه کرده بودیم که به نظر می رسد نگاهی دوباره به آن خالی از لطف نباشد: جهت مشاهده، اینجا کلیک کنید.

پی‌نوشت: دیتا پارتنرز را در شبکه‌های اجتماعی و موبایلی می توانید دنبال کنید: اینستاگرام و توییتر. همچنین اگر از خوراک‌خوان‌هایی نظیر اینو ریدر یا فیدلی استفاده می کنید نیز با افزودن آدرس وبسایت ما را به طور منظم دنبال کنید. به زودی، خبرنامه‌ی ایمیلی دیتا پارتنرز نیز راه خواهد افتاد. منتظر نظرات شما  هستیم 🙂

6- نمودار جمعیت‌شناسی

وبسایت اکونومیست نمودار زیبایی در مورد میزان امید به زندگی در کشورهای مختلف ارائه کرده است (+). من هم این نمودار را بدون توجه به اعداد واقعی در اکسل رسم کردم که در شکل زیر می‌‌‌‌‌‌‌‌بینید. فارغ از تفاوت در رنگ‌بندی و مقادیر به کار رفته در نمودار، بقیه عناصر ترسیمی توسط من در اکسل و اکونومیست، تقریبا شبیه به هم هست. این کار را انجام دادم تا نشان دهم که می‌توان نمودارهایی به زیبایی مجلات معتبر دنیا با ابزارهای ساده‌ای مثل اکسل رسم کرد.

زیبایی این نمودار، خلاقیت در نمایش روند بهبود میزان امید به زندگی در طی زمان و همچنین مقایسه کشورهای مختلف به تفکیک جنسیت است. به عبارتی، چندین پیام مختلف را در قالب یک نمودار گنجانده ایم. در این نمودار، میزان امید به زندگی همراه با سلامتی در سال ۱۹۹۹ به عنوان پایه در نظر گرفته شد. سپس، میزان افزایش عمر همراه با سلامتی از سال ۱۹۹۹ تا ۲۰۱۴، میزان میانگین عمر فاقد سلامتی در سال ۱۹۹۹ و افزایش میزان میانگین عمر فاقد سلامتی به آن اضافه شد.

population trend

عمده نمودارهای دموگرافی و جمعیتی با همین الگو نمایش داده می‌شوند. متخصصین بازاریابی هم از این الگو برای نمایش میزان درآمدزایی در بخش‌های مختلف مشتریان استفاده می‌کنند.

در یکی از پست‌های آینده، نمایش‌های زیباتری از همین الگو معرفی می‌کنم که بیشتر برای بازاریاب‌ها و تحلیلگران کسب و کار مفید است.

5- نمایش مناسب داده‌ها برای خوشه‌بندی

خیلی وقت‌ها برای خوشه‌بندی داده‌های تجاری، به دنبال روش‌های پیچیده ریاضی هستیم. هر کدام از روش‌های خوشه‌بندی، ویژگی‌ها و محدودیت‌هایی دارند. منتهی گاهی حتی با نمایش ساده نموداری داده‌ها می‌توانیم، به هدف خودمان برسیم. پیچیده کردن راهکار به معنای مزایای بیشتر آن نیست. تصویرسازی از داده‌ها این ویژگی را دارد که همه اتفاقات خوشه‌بندی، در مقابل تصمیم‌گیران نمایش داده می‌شود. آنها می‌توانند اعمال نظر کنند و اشکالات احتمالی آن را مطرح کنند.

سری داده‌های زیر را در نظر بگیرید. فرض کنید که بخواهیم آنها را خوشه‌بندی کنیم. شاید شما هم مثل من آن را به دو یا سه خوشه تقسیم کنید. یک خوشه مربوط به داده تنهای سمت راست و یک یا دو خوشه هم مربوط به داده‌های سمت چپ.first step clustering

یکی از اولین نکاتی که در نمودار بالا به چشم می‌آید، وجود داده پرت در این سری است. نکته‌ای که شاید بدون تصویرسازی، ممکن بود به چشم نیاید. به عنوان یک تحلیل‌گر می‌توانید حدس بزنید که آن داده به صورت اشتباه ثبت شده و یا اینکه خبر از یک اتفاق غیرعادی می‌دهد. منطقی نیست که این نقطه، کل فرآیند خوشه‌بندی را تحت تأثیر قرار بدهد. بنابراین در گام اول، این نقطه را از کل سری حذف و مجددا خوشه‌بندی می‌کنیم. نمودار زیر، نمایش داده‌های اصلاح شده در مقیاس اولیه است.

second step clustering

به نظر من، خوشه‌بندی داده‌های نمودار بالا، باز هم کار آسانی نیست. تعداد مناسب خوشه چند تا است؟ به خصوص زمانی که قرار است به صورت شهودی خوشه‌بندی شود، کدام داده در کدام خوشه قرار بگیرد؟ طبعا استفاده از روش‌های استاندارد، این مشکل را حل می‌کند. ولی حتی نتایج این روش‌ها را اگر نتوان به صورت دلچسبی نمابش داد، مورد پذیرش و مبنای عمل مدیران قرار نمی‌گیرد.

برای خوشه‌بندی، دو کار انجام دادم. اول اینکه مقیاس نمودار را اصلاح کردم و به جای یک مربع ۳۵ در ۳۵، اندازه‌ها را اصلاح کردم. بعد هم دو خط میانگین عمودی و افقی رسم کردم که داده‌ها را به چهار قسمت تقسیم کرد. حالا از روش‌های استاندارد برای خوشه بندی و تحلیل داده ها استفاده کنید.

third step clustering

4- کاربرد Heatmap در طراحی متن آگهی‌های اینترنتی

یکی از سوالات مهم در طراحی یک آگهی تبلیغاتی این است که چه عباراتی در تیتر و متن آگهی قرار دهیم. یعنی به دنبال کلماتی هستیم تا مشتری را ترغیب کنیم که حتما بر روی آگهی کلیک کند. ابزارهایی مانند «گوگل ترند» و «گوگل کرلیت»، از ابزارهای مناسب برای یافتن دینامیک ترجیحات مشتریان هستند. هر چند طبیعی است که همه اطلاعات لازم را در اختیار ما قرار ندهند.

«شبکه یاهو بینگ»، گزارشی جالب در مورد میزان اثرگذاری کلمات در آگهی‌های تجاری منتشر کرده است. در این گزارش، اطلاعات مربوط به آگهی‌های مربوط به سفر به تفکیک وسیله نقلیه در قالب چند هیت‌مپ ارائه شده است.

در هیت‌مپ زیر، کلمات مندرج در سطرها مربوط به تیتر آگهی هستند و کلمات ستونی، در متن آگهی درج شده‌اند. با توجه به میزان کلیک‌خور آگهی‌ها، رنگ هر یک از درایه‌ها مشخص شده است. به طور مثال بر خلاف تصور، آگهی‌هایی که در تیتر آنها کلمه “Air” و در متن آنها “Discount”، چندان مورد استقبال مخاطبان قرار نگرفته‌اند.

جالب‌تر اینکه آگهی‌هایی که در تیتر آنها کلمه “City” و در متن کلمه “Discount” وجود دارد، بسیار مورد توجه قرار گرفتند. شاید بتوان توجیه کرد که مخاطب به دنبال شهرهایی بوده که سفر به آن شامل تخفیف‌های خوبی است. ولی جالب این جاست که وقتی جای این دو کلمه در متن و تیتر عوض می‌شود، آگهی اصلا کلیک‌خور نداشت.

یکی دیگر از یافته‌های این نمودار، اهمیت کلمه “find” در متن آگهی است. این کلمه تقریبا در ترکیب با هر عبارت دیگری، وقتی در متن آگهی ذکر شده موفق عمل کرده است. ولی وقتی همین کلمه در تیتر آگهی قرار گرفت، عملکرد چندان مطلوبی نداشته است.

البته این نتایج به هیچ وجه قابل توصیه در همه شرایط نیست. چرا که زمان تولید این اطلاعات و نیز میزان استفاده از مرورگر بینگ در هر کشور، بر داده‌های این نمودار اثر زیادی دارد.

travel heatmap lowsize

2- نمودار تأخیر پروازها

سازمان هواپیمایی، گزارشی از وضعیت تأخیر شرکتهای هواپیمایی در فرودگاه مهرآباد منتشر کرد (+). محتوای این گزارش طبعا بایستی برای کسانی که می‌خواهند برای یک سفر برنامه‌ریزی کنند، مفید باشد. ولی قالب این گزارش، اصلا جذاب نیست. مجموعه بزرگ از کلماتی است که در بین آنها گم می‌شویم.

در تهیه این گزارش، از دو متغیر استفاده شده است:

  • سهم پروازهای تأخیری هر شرکت هواپیمایی نسبت به کل پروازهای همان شرکت و البته نسبت به مجموع پروازهای همه شرکتها
  • میانگین زمان تأخیر پروازها

مسافری که می‌خواهد یک شرکت هواپیمایی را برای سفر انتخاب کند، یک سوال ساده دارد: برای سفر به مشهد، کدام شرکت هواپیمایی منظم‌تر عمل می‌کند؟

یک اشکال مهم این گزارش این است که مخاطبش همه اطلاعاتی که می‌خواهد را به دست نمی‌آورد. مثلا به دو عبارت زیر دقت کنید:

  • در این ماه ۳۸ درصد از پروازهای شرکت هواپیما ایران ایرتور با تاخیر انجام شد و سهم تاخیر شرکت هواپیمایی ایرتور از میزان کل تاخیرها ۵ درصد و سهم پروازهای این شرکت از کل پروازها ۴ درصد و میانگین تاخیر هر پرواز این شرکت نیز ۳۷ دقیقه بود [از متن خبر].
  • در دی ماه سال جاری در مجموع ۴ هزار و ۳۲۸ پرواز توسط ۱۳ شرکت هوایی در فرودگاه مهرآباد انجام شد که با توجه به شرایط آب و هوایی فصل زمستان و محدودیت های عملیاتی در فرودگاه ها خصوصاً در استان های خوزستان و خراسان, حجم زیادی از تاخیرات به علت شرایط بدی جوی بوده است [از متن خبر].

مسافری که می‌خواهد برای سفر به مشهد از شرکت ایران ایرتور بلیط خریداری کند، دچار سردرگمی می‌شود که آیا واقعا در حدود ۳۸% موارد، با خرید بلیط این شرکت باید انتظار تأخیر را داشته باشد؟ یا اینکه ممکن است که اکثر پروازهای این شرکت در مسیر مهرآباد-اهواز بوده که طوفان و گرد و غبار، علت اکثر تأخیرها است. ولی در مسیر مشهد، پروازها تأخیر چندانی نداشته است.

یاد یک نمودار «نقشه حرارتی» (heatmap) خوب افتادم. ستون‌های نمودار زیر، نام شرکت هواپیمایی و سطرها، نام شهر را نشان می‌دهند. با استفاده از این نمودار، مسافر شهر مشهد به راحتی می‌تواند تمام شرکتهای هواپیمایی را از نظر کیفیت بررسی کند. تنها مشکلی که باقی می‌ماند، جدا کردن پروازهای با تأخیر ناشی از عوامل جوی از پروازهای با تأخیر ناشی از نقص فنی است. دو روش به ذهن من می‌رسد. یکی اینکه از همان ابتدا آمار پروازهای ناشی از مشکلات جوی و مشکلات فنی را جدا و دو نمودار مستقل رسم کنیم. دیگر اینکه درون هر یک از مربع‌های رنگی، درصد پروازهای ناشی از نقص فنی را به صورت رقمی نمایش بدهیم. من، روش اول را می‌پسندم.

 

نقشه حرارتی تاخیر پروازها بر حسب مقصد و نام شرکت هواپیمایی
نقشه حرارتی تاخیر پروازها بر حسب مقصد و نام شرکت هواپیمایی
در این مطلب، نمونه ای از کاربرد نقشه حرارتی را مرور کردیم. نقشه های حرارتی که زمانی برای نشان دادن داده های تاریخی در جغرافیا و داده های حرارتی اجسام در فیزیک به کار می رفتند، امروزه ابزاری استاندارد برای نمایش داده ها و انتقال پیام، از طریق تخصیص دامنه ای از رنگ ها به دامنه ای از مقادیر داده ها، محسوب می شوند.