6- نمودار جمعیت‌شناسی

وبسایت اکونومیست نمودار زیبایی در مورد میزان امید به زندگی در کشورهای مختلف ارائه کرده است (+). من هم این نمودار را بدون توجه به اعداد واقعی در اکسل رسم کردم که در شکل زیر می‌‌‌‌‌‌‌‌بینید. فارغ از تفاوت در رنگ‌بندی و مقادیر به کار رفته در نمودار، بقیه عناصر ترسیمی توسط من در اکسل و اکونومیست، تقریبا شبیه به هم هست. این کار را انجام دادم تا نشان دهم که می‌توان نمودارهایی به زیبایی مجلات معتبر دنیا با ابزارهای ساده‌ای مثل اکسل رسم کرد.

زیبایی این نمودار، خلاقیت در نمایش روند بهبود میزان امید به زندگی در طی زمان و همچنین مقایسه کشورهای مختلف به تفکیک جنسیت است. به عبارتی، چندین پیام مختلف را در قالب یک نمودار گنجانده ایم. در این نمودار، میزان امید به زندگی همراه با سلامتی در سال ۱۹۹۹ به عنوان پایه در نظر گرفته شد. سپس، میزان افزایش عمر همراه با سلامتی از سال ۱۹۹۹ تا ۲۰۱۴، میزان میانگین عمر فاقد سلامتی در سال ۱۹۹۹ و افزایش میزان میانگین عمر فاقد سلامتی به آن اضافه شد.

population trend

عمده نمودارهای دموگرافی و جمعیتی با همین الگو نمایش داده می‌شوند. متخصصین بازاریابی هم از این الگو برای نمایش میزان درآمدزایی در بخش‌های مختلف مشتریان استفاده می‌کنند.

در یکی از پست‌های آینده، نمایش‌های زیباتری از همین الگو معرفی می‌کنم که بیشتر برای بازاریاب‌ها و تحلیلگران کسب و کار مفید است.

5- نمایش مناسب داده‌ها برای خوشه‌بندی

خیلی وقت‌ها برای خوشه‌بندی داده‌های تجاری، به دنبال روش‌های پیچیده ریاضی هستیم. هر کدام از روش‌های خوشه‌بندی، ویژگی‌ها و محدودیت‌هایی دارند. منتهی گاهی حتی با نمایش ساده نموداری داده‌ها می‌توانیم، به هدف خودمان برسیم. پیچیده کردن راهکار به معنای مزایای بیشتر آن نیست. تصویرسازی از داده‌ها این ویژگی را دارد که همه اتفاقات خوشه‌بندی، در مقابل تصمیم‌گیران نمایش داده می‌شود. آنها می‌توانند اعمال نظر کنند و اشکالات احتمالی آن را مطرح کنند.

سری داده‌های زیر را در نظر بگیرید. فرض کنید که بخواهیم آنها را خوشه‌بندی کنیم. شاید شما هم مثل من آن را به دو یا سه خوشه تقسیم کنید. یک خوشه مربوط به داده تنهای سمت راست و یک یا دو خوشه هم مربوط به داده‌های سمت چپ.first step clustering

یکی از اولین نکاتی که در نمودار بالا به چشم می‌آید، وجود داده پرت در این سری است. نکته‌ای که شاید بدون تصویرسازی، ممکن بود به چشم نیاید. به عنوان یک تحلیل‌گر می‌توانید حدس بزنید که آن داده به صورت اشتباه ثبت شده و یا اینکه خبر از یک اتفاق غیرعادی می‌دهد. منطقی نیست که این نقطه، کل فرآیند خوشه‌بندی را تحت تأثیر قرار بدهد. بنابراین در گام اول، این نقطه را از کل سری حذف و مجددا خوشه‌بندی می‌کنیم. نمودار زیر، نمایش داده‌های اصلاح شده در مقیاس اولیه است.

second step clustering

به نظر من، خوشه‌بندی داده‌های نمودار بالا، باز هم کار آسانی نیست. تعداد مناسب خوشه چند تا است؟ به خصوص زمانی که قرار است به صورت شهودی خوشه‌بندی شود، کدام داده در کدام خوشه قرار بگیرد؟ طبعا استفاده از روش‌های استاندارد، این مشکل را حل می‌کند. ولی حتی نتایج این روش‌ها را اگر نتوان به صورت دلچسبی نمابش داد، مورد پذیرش و مبنای عمل مدیران قرار نمی‌گیرد.

برای خوشه‌بندی، دو کار انجام دادم. اول اینکه مقیاس نمودار را اصلاح کردم و به جای یک مربع ۳۵ در ۳۵، اندازه‌ها را اصلاح کردم. بعد هم دو خط میانگین عمودی و افقی رسم کردم که داده‌ها را به چهار قسمت تقسیم کرد. حالا از روش‌های استاندارد برای خوشه بندی و تحلیل داده ها استفاده کنید.

third step clustering

4- کاربرد Heatmap در طراحی متن آگهی‌های اینترنتی

یکی از سوالات مهم در طراحی یک آگهی تبلیغاتی این است که چه عباراتی در تیتر و متن آگهی قرار دهیم. یعنی به دنبال کلماتی هستیم تا مشتری را ترغیب کنیم که حتما بر روی آگهی کلیک کند. ابزارهایی مانند «گوگل ترند» و «گوگل کرلیت»، از ابزارهای مناسب برای یافتن دینامیک ترجیحات مشتریان هستند. هر چند طبیعی است که همه اطلاعات لازم را در اختیار ما قرار ندهند.

«شبکه یاهو بینگ»، گزارشی جالب در مورد میزان اثرگذاری کلمات در آگهی‌های تجاری منتشر کرده است. در این گزارش، اطلاعات مربوط به آگهی‌های مربوط به سفر به تفکیک وسیله نقلیه در قالب چند هیت‌مپ ارائه شده است.

در هیت‌مپ زیر، کلمات مندرج در سطرها مربوط به تیتر آگهی هستند و کلمات ستونی، در متن آگهی درج شده‌اند. با توجه به میزان کلیک‌خور آگهی‌ها، رنگ هر یک از درایه‌ها مشخص شده است. به طور مثال بر خلاف تصور، آگهی‌هایی که در تیتر آنها کلمه “Air” و در متن آنها “Discount”، چندان مورد استقبال مخاطبان قرار نگرفته‌اند.

جالب‌تر اینکه آگهی‌هایی که در تیتر آنها کلمه “City” و در متن کلمه “Discount” وجود دارد، بسیار مورد توجه قرار گرفتند. شاید بتوان توجیه کرد که مخاطب به دنبال شهرهایی بوده که سفر به آن شامل تخفیف‌های خوبی است. ولی جالب این جاست که وقتی جای این دو کلمه در متن و تیتر عوض می‌شود، آگهی اصلا کلیک‌خور نداشت.

یکی دیگر از یافته‌های این نمودار، اهمیت کلمه “find” در متن آگهی است. این کلمه تقریبا در ترکیب با هر عبارت دیگری، وقتی در متن آگهی ذکر شده موفق عمل کرده است. ولی وقتی همین کلمه در تیتر آگهی قرار گرفت، عملکرد چندان مطلوبی نداشته است.

البته این نتایج به هیچ وجه قابل توصیه در همه شرایط نیست. چرا که زمان تولید این اطلاعات و نیز میزان استفاده از مرورگر بینگ در هر کشور، بر داده‌های این نمودار اثر زیادی دارد.

travel heatmap lowsize

3- نموداری مناسب برای داده‌های تورم کالاهای مصرفی و صنعتی – بخش دوم

یکی از دوستانم بعد از خواندن پست مربوط به داده‌های تورم روستایی، به من پیشنهاد داد که نموداری رسم کنم تا اطلاعات بیشتری را نمایش بدهد. مثلا در نمودار قبلی، داده‌های واقعی مربوط به شاخص قیمت‌ها در ماههای خرداد و تیر را نشان بدهد و با هم مقایسه کند.

به نظر من، در رسم یک نمودار تنها «جنس» اطلاعاتی که قرار است نمایش داده شود، مهم نیست. مهم‌ترین سوال این است که چه «پیام»ی بایستی منتقل شود. زمانی که پیام اصلی مربوط به «مقادیر شاخص قیمت‌ها» با زمانی که «میزان رشد شاخص» است، نمودارهای مناسب متفاوت است. با این همه سعی کردم که در نمودار زیر هر دو پیام را نمایش دهم.

نمودار نقطه ای شاخص قیمت کالاهای روستایی (برای نمایش در اندازه بزرگ، بر روی عکس کلیک کنید)
نمودار نقطه ای شاخص قیمت کالاهای روستایی (برای نمایش در اندازه بزرگ، بر روی عکس کلیک کنید)

البته این نمودار به دلیل تعدد سطرها، کمی شلوغ شد. پیام مربوط به تورم هر دسته از کالاها به دلیل اینکه در کنار مقادیر واقعی شاخص قیمت‌ها نمایش داده شده، کمی کم‌فروغ‌تر شد. علتش هم این هست که میزان داده‌ای که مخاطب من نیاز داشت، بیشتر از نمودار قبلی هست. احتمالا نمودارهای زیباتری هم می‌توان رسم کرد.

قسمت اول این مطلب را از اینجا بخوانید.

2- نمودار تأخیر پروازها

سازمان هواپیمایی، گزارشی از وضعیت تأخیر شرکتهای هواپیمایی در فرودگاه مهرآباد منتشر کرد (+). محتوای این گزارش طبعا بایستی برای کسانی که می‌خواهند برای یک سفر برنامه‌ریزی کنند، مفید باشد. ولی قالب این گزارش، اصلا جذاب نیست. مجموعه بزرگ از کلماتی است که در بین آنها گم می‌شویم.

در تهیه این گزارش، از دو متغیر استفاده شده است:

  • سهم پروازهای تأخیری هر شرکت هواپیمایی نسبت به کل پروازهای همان شرکت و البته نسبت به مجموع پروازهای همه شرکتها
  • میانگین زمان تأخیر پروازها

مسافری که می‌خواهد یک شرکت هواپیمایی را برای سفر انتخاب کند، یک سوال ساده دارد: برای سفر به مشهد، کدام شرکت هواپیمایی منظم‌تر عمل می‌کند؟

یک اشکال مهم این گزارش این است که مخاطبش همه اطلاعاتی که می‌خواهد را به دست نمی‌آورد. مثلا به دو عبارت زیر دقت کنید:

  • در این ماه ۳۸ درصد از پروازهای شرکت هواپیما ایران ایرتور با تاخیر انجام شد و سهم تاخیر شرکت هواپیمایی ایرتور از میزان کل تاخیرها ۵ درصد و سهم پروازهای این شرکت از کل پروازها ۴ درصد و میانگین تاخیر هر پرواز این شرکت نیز ۳۷ دقیقه بود [از متن خبر].
  • در دی ماه سال جاری در مجموع ۴ هزار و ۳۲۸ پرواز توسط ۱۳ شرکت هوایی در فرودگاه مهرآباد انجام شد که با توجه به شرایط آب و هوایی فصل زمستان و محدودیت های عملیاتی در فرودگاه ها خصوصاً در استان های خوزستان و خراسان, حجم زیادی از تاخیرات به علت شرایط بدی جوی بوده است [از متن خبر].

مسافری که می‌خواهد برای سفر به مشهد از شرکت ایران ایرتور بلیط خریداری کند، دچار سردرگمی می‌شود که آیا واقعا در حدود ۳۸% موارد، با خرید بلیط این شرکت باید انتظار تأخیر را داشته باشد؟ یا اینکه ممکن است که اکثر پروازهای این شرکت در مسیر مهرآباد-اهواز بوده که طوفان و گرد و غبار، علت اکثر تأخیرها است. ولی در مسیر مشهد، پروازها تأخیر چندانی نداشته است.

یاد یک نمودار «نقشه حرارتی» (heatmap) خوب افتادم. ستون‌های نمودار زیر، نام شرکت هواپیمایی و سطرها، نام شهر را نشان می‌دهند. با استفاده از این نمودار، مسافر شهر مشهد به راحتی می‌تواند تمام شرکتهای هواپیمایی را از نظر کیفیت بررسی کند. تنها مشکلی که باقی می‌ماند، جدا کردن پروازهای با تأخیر ناشی از عوامل جوی از پروازهای با تأخیر ناشی از نقص فنی است. دو روش به ذهن من می‌رسد. یکی اینکه از همان ابتدا آمار پروازهای ناشی از مشکلات جوی و مشکلات فنی را جدا و دو نمودار مستقل رسم کنیم. دیگر اینکه درون هر یک از مربع‌های رنگی، درصد پروازهای ناشی از نقص فنی را به صورت رقمی نمایش بدهیم. من، روش اول را می‌پسندم.

 

نقشه حرارتی تاخیر پروازها بر حسب مقصد و نام شرکت هواپیمایی
نقشه حرارتی تاخیر پروازها بر حسب مقصد و نام شرکت هواپیمایی
در این مطلب، نمونه ای از کاربرد نقشه حرارتی را مرور کردیم. نقشه های حرارتی که زمانی برای نشان دادن داده های تاریخی در جغرافیا و داده های حرارتی اجسام در فیزیک به کار می رفتند، امروزه ابزاری استاندارد برای نمایش داده ها و انتقال پیام، از طریق تخصیص دامنه ای از رنگ ها به دامنه ای از مقادیر داده ها، محسوب می شوند.