نمایش داده‌های پرت و نامتنجانس

بسیار پیش می‌آید که در نمایش یک سری از داده‌ها، یکی از ورودی‌ها مقداری بسیار متفاوت از سایرین دارد. به طور مثال، در یک مجموعه داده، اکثر داده‌ها سه رقمی هستند، ولی یک ورودی پنج یا شش رقمی در بین آنها وجود دارد.  این مثال در شکل زیر نمایش داده شده است. شکل سمت چپ، نمودار رسم شده با داده‌های عادی است. بدیهی است که اکثر داده‌ها به دلیل کوچک بودن مقادیر آنها نسبت به مقادیر مندرج در محور عمودی نمودار، قابل رویت نیستند.

برای نمایش داده‌های پرت و نامتنجانس یک سری داده در نمودار، راه‌های متفاوتی پیشنهاد می‌شود. در نمودار سمت راست، از روش محور لگاریتمی استفاده شده است. در این روش، مقادیر محور هر عددی را که نشان می‌دهند، اکسل به صورت پنهان آن را معادل لگاریتم آن فرض می‌کند. دیده می‌شود که اکنون همه داده‌ها قابل رویت هستند، هرچند بدون رعایت مقیاس یا نشانه‌ای که به خواننده تمایز را منتقل کند.

50 unrelated data in a chart 1
سمت راست: تغییر مقیاس محور عمودی به صورت لگاریتمی | سمت چپ: نمایش اعداد نامتجانس در یک نمودار (شیوه غلط)

در اینجا یک پیشنهاد دیگر برای نمایش این داده‌ها ارائه می‌شود: روش ایجاد شکاف درستون‌های نمودار. بر اساس این پیشنهاد به جای اعداد واقعی بزرگ، اعدادی مجازی کوچکتر در بازه نرمال ترسیم شود. ولی بر روی محور به جای مقادیر مجازی، همان مقدار اصلی نمایش داده شود. این ایده را می‌توانید در شکل زیر ببینید.

50 unrelated data in a chart 2
شیوه مناسب نمایش اعداد نامتجانس در یک نمودار

در شکل بالا محور به دو بازه مربوط به اعداد کوچک و اعداد بزرگ تقسیم شده است و با علامت دو خط، محل برش مشخص شده است. خبر خوب اینکه انجام این کار به راحتی در اکسل ممکن است.

تحلیل سودآوری سبد محصولات شرکت – قسمت دوم

در مطلب پیشین دیدیم که با کمک نمودار حبابی، می‌توان تصویری از وضع سودآوری سبد محصولات شرکت بدست آورد. در آن نمودار، خط‌چین‌های قرمز میانگین درآمد و حاشیه سود محصولات را نشان می‌دادند. موقعیت دایره‌ی آبی نسبت به خطوط میانگین وضع آن محصول را نسبت به میانگین نشان می‌دهد. همچنین، مساحت دایره، بیانگر رشد فروش محصول نسبت به سال گذشته است.

41 sales dashborad1

حاصلضرب درآمد در حاشیه سود محصول، سود خالص ناشی از آن محصول را برای شرکت نشان می‌دهد. ربع اول نمودار (بالا و راست) جایی‌ست که حداکثر سود را نصیب شرکت می‌کند و مایلیم که تعداد محصولاتی که در ربع اول داریم، حداکثر شود. اما می‌دانیم که واقعیت بازار چیزی دیگر است. داشبوردهایی نظیر این نمودار حبابی، پایان کار نیستند و نباید شتابزده از روی آن‌ها نتیجه‌گیری کرد و تصمیم گرفت. بلکه ابتدای مسیر تحلیلند. کارکرد اصلی داشبوردها «ایجاد سوال» است. باید بدانیم که «چه اتفاقی افتاده است؟» و «چرا این اتفاق افتاده است؟». به بیانی دیگر، باید وضع موجود کسب و کار و روابط حاکم بر آن را بشناسیم و سپس تصمیم بگیریم «چه می‌توانیم بکنیم؟». در مورد این داشبورد، توجه به چند نکته مهم است:

اولا، در تحلیل وضعیت شرکت، باید نیم‌نگاهی به استراتژی و چشم‌انداز شرکت داشت. آیا شرکت قرار است به عنوان شرکتی با «سبد کامل محصولات» شناخته شود که همه‌ی اقلام مرتبط با حوزه‌ی فعالیتش را دارد؟ یا استراتژی شرکت، حرکت به سوی اقلام اساسی و پرفروش‌تر است؟ به عنوان مثال نمی‌توان سبد فروش یک هایپراستار با چند ده هزار قلم کالا را مشابه فروشگاه تخفیفی افق کوروش که فقط اقلام ضروری را ارایه می‌کند تحلیل نمود.

دوم اینکه در تحلیلمان باید به این نکته توجه کنیم که محصولات ارایه‌شده، لزوما عناوینی ۱۰۰% مستقل از هم نیستند. بسیاری از این اقلام به هم وابسته‌اند. کالاها ممکن است جایگزین یا مکمل هم باشند. از این رو، حذف کالایی که حاشیه سود یا فروش کمی دارد ولی مکمل کالایی با حاشیه سود بالاست، ممکن است منجر به کاهش فروش هر دو مورد شود. یا اینکه اضافه نمودن کالایی که حاشیه سود بالایی دارد اما جایگزین کالایی دیگر در سبد است، ممکن است به کاهش فروش کالای اول منجر شود، به گونه‌ای که سود حاصل از افزودن کالای جدید، به قدر سود از دست رفته نباشد.

نکته‌ی سوم، توجه به اصل متنوع‌سازی است. اگر شرکت تصمیم بگیرد که همه‌ی کالاهای سبدش را از میان کالاهای لوکس نسبتا پرفروش انتخاب کند، خود را در معرض ریسک قرار داده است. با رسیدن دوره‌ی رکود اقتصادی، کالاهای لوکس با کاهش فروش بیشتری نسبت به کالاهای ضروری روبرو خواهند شد. و درآمد شرکت با شدت بیشتری کاهش خواهد یافت.

تحلیل و ارایه داده‌های فروش – بخش دوم

یادآوری: در قسمت اول این مطلب، ضمن تشریح مفهوم «داده‌های فروش» و ویژگی‌های آن، جدول زیر را برای ثبت داده‌های فروش معرفی کردیم. این نوع از جدول‌ها در اکثر نرم‌افزارهای فروش وجود دارد. در این قسمت، به بررسی سوالات اساسی برای تحلیل داده‌های فروش می‌پردازیم.

27 Sales Dashboard 1

تحلیل داده‌های فروش شرکت، ابعاد مختلفی به شرح زیر دارد:

سوالات مرتبط با محصول:

  • فروش یک محصول در یک دوره زمانی مشخص، چقدر بوده است؟ (رسم نمودار سری زمانی مقدار فروش)
  • کمترین و بیشترین مقدار فروش در چه زمانی بوده است؟ و دلیل آن چیست؟ (مقایسه مقادیر فروش)
  • میزان کل کدام محصول، بیشتر از سایرین بوده است؟ (مقایسه)
  • آیا اضافه کردن یک محصول جدید به محصولات شرکت، اثر منفی بر فروش محصولات قبلی داشته است؟ (تحلیل روابط علّی و معلولی)
  • به تفکیک بخش‌های مشتریان، چه سبدی از محصولات بیشتر مورد توجه قرار گرفته است؟ (تحلیل بخش‌های مشتریان)

سوالات مرتبط با فروشنده (نماینده فروش):

  • کدام فروشنده فروش بیشتری داشته است؟ چرا؟ (تحلیل بهره‌وری)
  • کدام فروشنده عملکرد غیرقابل قبول داشته است؟ چرا؟
  • کدام فروشنده معاملات بیشتری را به نتیجه رسانده است؟
  • کدام یک بیشترین تعداد لغو معاملات را داشته است؟ (عارضه‌یابی)
  • نسبت تعداد مشتریان به فروشندگان چقدر است؟ آیا این عدد مناسب است؟

سوالات مرتبط با مشتریان:

  • مشتریان خوش حساب و بد حساب شرکت کدامند؟
  • چند درصد از مشتریان شرکت، ۸۰ درصد از فروش آن را ایجاد کرده‌اند؟
  • سودآوری کدام دسته از مشتریان بیشتر است؟
  • آیا تبلیغات محیطی در منطقه‌ای خاص، موجب افزایش مشتریان در آنجا شده است؟
  • آیا بین نوع کالا و جنسیت و سن مشتریان ارتباط معناداری برقرار است؟ (تحلیل روابط علّی و معلولی)
  • در کدام بخش از مشتریان، هنوز امکان افزایش میزان فروش وجود دارد؟ (بخش‌بندی، هدف‌گذاری و جایگاه‌یابی)

مشاهده می‌کنید که نکات تحلیلی بسیار زیادی از همین جدول ساده استخراج می‌شود. نقش تحلیل‌گر داده‌ها در تحلیل داده‌های فروش، فرضیه سازی‌ها و تلاش برای کشف الگوها در داده‌هاست. در قسمت‌های بعدی، روش‌های ساده تحلیلی برای پاسخ به سوالات بالا را با ذکر مثال بررسی خواهیم کرد.

اگر علاقه‌مند پیگیری مداوم مطالب ما هستید، دیتا پارتنرز را در تلگرام، توییتر و اینستاگرام دنبال کنید.

4- کاربرد Heatmap در طراحی متن آگهی‌های اینترنتی

یکی از سوالات مهم در طراحی یک آگهی تبلیغاتی این است که چه عباراتی در تیتر و متن آگهی قرار دهیم. یعنی به دنبال کلماتی هستیم تا مشتری را ترغیب کنیم که حتما بر روی آگهی کلیک کند. ابزارهایی مانند «گوگل ترند» و «گوگل کرلیت»، از ابزارهای مناسب برای یافتن دینامیک ترجیحات مشتریان هستند. هر چند طبیعی است که همه اطلاعات لازم را در اختیار ما قرار ندهند.

«شبکه یاهو بینگ»، گزارشی جالب در مورد میزان اثرگذاری کلمات در آگهی‌های تجاری منتشر کرده است. در این گزارش، اطلاعات مربوط به آگهی‌های مربوط به سفر به تفکیک وسیله نقلیه در قالب چند هیت‌مپ ارائه شده است.

در هیت‌مپ زیر، کلمات مندرج در سطرها مربوط به تیتر آگهی هستند و کلمات ستونی، در متن آگهی درج شده‌اند. با توجه به میزان کلیک‌خور آگهی‌ها، رنگ هر یک از درایه‌ها مشخص شده است. به طور مثال بر خلاف تصور، آگهی‌هایی که در تیتر آنها کلمه “Air” و در متن آنها “Discount”، چندان مورد استقبال مخاطبان قرار نگرفته‌اند.

جالب‌تر اینکه آگهی‌هایی که در تیتر آنها کلمه “City” و در متن کلمه “Discount” وجود دارد، بسیار مورد توجه قرار گرفتند. شاید بتوان توجیه کرد که مخاطب به دنبال شهرهایی بوده که سفر به آن شامل تخفیف‌های خوبی است. ولی جالب این جاست که وقتی جای این دو کلمه در متن و تیتر عوض می‌شود، آگهی اصلا کلیک‌خور نداشت.

یکی دیگر از یافته‌های این نمودار، اهمیت کلمه “find” در متن آگهی است. این کلمه تقریبا در ترکیب با هر عبارت دیگری، وقتی در متن آگهی ذکر شده موفق عمل کرده است. ولی وقتی همین کلمه در تیتر آگهی قرار گرفت، عملکرد چندان مطلوبی نداشته است.

البته این نتایج به هیچ وجه قابل توصیه در همه شرایط نیست. چرا که زمان تولید این اطلاعات و نیز میزان استفاده از مرورگر بینگ در هر کشور، بر داده‌های این نمودار اثر زیادی دارد.

travel heatmap lowsize

2- نمودار تأخیر پروازها

سازمان هواپیمایی، گزارشی از وضعیت تأخیر شرکتهای هواپیمایی در فرودگاه مهرآباد منتشر کرد (+). محتوای این گزارش طبعا بایستی برای کسانی که می‌خواهند برای یک سفر برنامه‌ریزی کنند، مفید باشد. ولی قالب این گزارش، اصلا جذاب نیست. مجموعه بزرگ از کلماتی است که در بین آنها گم می‌شویم.

در تهیه این گزارش، از دو متغیر استفاده شده است:

  • سهم پروازهای تأخیری هر شرکت هواپیمایی نسبت به کل پروازهای همان شرکت و البته نسبت به مجموع پروازهای همه شرکتها
  • میانگین زمان تأخیر پروازها

مسافری که می‌خواهد یک شرکت هواپیمایی را برای سفر انتخاب کند، یک سوال ساده دارد: برای سفر به مشهد، کدام شرکت هواپیمایی منظم‌تر عمل می‌کند؟

یک اشکال مهم این گزارش این است که مخاطبش همه اطلاعاتی که می‌خواهد را به دست نمی‌آورد. مثلا به دو عبارت زیر دقت کنید:

  • در این ماه ۳۸ درصد از پروازهای شرکت هواپیما ایران ایرتور با تاخیر انجام شد و سهم تاخیر شرکت هواپیمایی ایرتور از میزان کل تاخیرها ۵ درصد و سهم پروازهای این شرکت از کل پروازها ۴ درصد و میانگین تاخیر هر پرواز این شرکت نیز ۳۷ دقیقه بود [از متن خبر].
  • در دی ماه سال جاری در مجموع ۴ هزار و ۳۲۸ پرواز توسط ۱۳ شرکت هوایی در فرودگاه مهرآباد انجام شد که با توجه به شرایط آب و هوایی فصل زمستان و محدودیت های عملیاتی در فرودگاه ها خصوصاً در استان های خوزستان و خراسان, حجم زیادی از تاخیرات به علت شرایط بدی جوی بوده است [از متن خبر].

مسافری که می‌خواهد برای سفر به مشهد از شرکت ایران ایرتور بلیط خریداری کند، دچار سردرگمی می‌شود که آیا واقعا در حدود ۳۸% موارد، با خرید بلیط این شرکت باید انتظار تأخیر را داشته باشد؟ یا اینکه ممکن است که اکثر پروازهای این شرکت در مسیر مهرآباد-اهواز بوده که طوفان و گرد و غبار، علت اکثر تأخیرها است. ولی در مسیر مشهد، پروازها تأخیر چندانی نداشته است.

یاد یک نمودار «نقشه حرارتی» (heatmap) خوب افتادم. ستون‌های نمودار زیر، نام شرکت هواپیمایی و سطرها، نام شهر را نشان می‌دهند. با استفاده از این نمودار، مسافر شهر مشهد به راحتی می‌تواند تمام شرکتهای هواپیمایی را از نظر کیفیت بررسی کند. تنها مشکلی که باقی می‌ماند، جدا کردن پروازهای با تأخیر ناشی از عوامل جوی از پروازهای با تأخیر ناشی از نقص فنی است. دو روش به ذهن من می‌رسد. یکی اینکه از همان ابتدا آمار پروازهای ناشی از مشکلات جوی و مشکلات فنی را جدا و دو نمودار مستقل رسم کنیم. دیگر اینکه درون هر یک از مربع‌های رنگی، درصد پروازهای ناشی از نقص فنی را به صورت رقمی نمایش بدهیم. من، روش اول را می‌پسندم.

 

نقشه حرارتی تاخیر پروازها بر حسب مقصد و نام شرکت هواپیمایی
نقشه حرارتی تاخیر پروازها بر حسب مقصد و نام شرکت هواپیمایی
در این مطلب، نمونه ای از کاربرد نقشه حرارتی را مرور کردیم. نقشه های حرارتی که زمانی برای نشان دادن داده های تاریخی در جغرافیا و داده های حرارتی اجسام در فیزیک به کار می رفتند، امروزه ابزاری استاندارد برای نمایش داده ها و انتقال پیام، از طریق تخصیص دامنه ای از رنگ ها به دامنه ای از مقادیر داده ها، محسوب می شوند.