7- نمودار بخش‌بندی کاربران شبکه‌های اجتماعی

اولین گام برای طراحی هر نمودار، مشخص کردن پیامی است که آن نمودار بایستی به خواننده منتقل کند. پیام هر نمودار و اهمیت آن در بین سایر اجزای نمودار، ممکن است موجب طراحی نمودارهای خلاقانه و متفاوتی شود.

نمودار زیر، آمار توزیع جمعیتی کاربران برخی از شبکه‌های اجتماعی را نشان می‌دهد. به یک معنا، این نمودار داده‌های ذائقه‌سنجی کاربران در استفاده از شبکه‌های اجتماعی را نشان می‌دهد. در این نمودار با توجه به تجمعی بودن آن، امکان مقایسه یک سری از داده‌ها به سختی ممکن است. به نوعی می‌توان گفت که مقایسه داده‌های سری ۲۵-۳۴ و ۳۵-۴۴ سال، از روی این تصویر، بسیار مشکل است.

 social network demographics 1

این نمودار را می‌توان به شیوه‌ای دیگر بازآرایی کرد تا داده‌های هر گروه با سادگی بیشتری قابل مقایسه باشد. یک محور عمودی در میان نمودار تعبیه شد تا به جای چهار دسته یکپارچه، دو دسته دوتایی از داده‌ها در کنار هم قرار گیرند.

 social network demographics 2

به نظر شما کدام نمودار می‌تواند بهتر اطلاعات را نمایش دهد و پیام یا پیام‌هایی را به خوبی منتقل کند؟ می‌توان جهت روشن تر شدن مقصود، اصلی‌ترین پیامی که مد نظر داریم را نیز در قسمتی از نمودار بنویسیم. ضمنا هر دو نمودار با همین نرم‌افزار معمولی اکسل رسم شده‌اند و از ابزارهای ویژه‌ای استفاده نشد.

یکی دیگر از نکات مهم در رسم نمودار، محل قرار گرفتن برچسب داده‌ها است. همانطور که در هر دو نمودار بالا می‌بینید، برچسب‌های نام سری داده‌ها به گونه‌ای در بالای نمودار تعبیه شده‌اند که چشم نیاز به مقایسه‌های متعدد رنگ‌ها برای شناخت نام داده ندارد. همچنین مقادیر هر قطعه را نیز روی آن قرار دادیم تا امکان قضاوت تحلیلی بدون رجوع به جدول داده‌ نیز فراهم باشد.

5- نمایش مناسب داده‌ها برای خوشه‌بندی

خیلی وقت‌ها برای خوشه‌بندی داده‌های تجاری، به دنبال روش‌های پیچیده ریاضی هستیم. هر کدام از روش‌های خوشه‌بندی، ویژگی‌ها و محدودیت‌هایی دارند. منتهی گاهی حتی با نمایش ساده نموداری داده‌ها می‌توانیم، به هدف خودمان برسیم. پیچیده کردن راهکار به معنای مزایای بیشتر آن نیست. تصویرسازی از داده‌ها این ویژگی را دارد که همه اتفاقات خوشه‌بندی، در مقابل تصمیم‌گیران نمایش داده می‌شود. آنها می‌توانند اعمال نظر کنند و اشکالات احتمالی آن را مطرح کنند.

سری داده‌های زیر را در نظر بگیرید. فرض کنید که بخواهیم آنها را خوشه‌بندی کنیم. شاید شما هم مثل من آن را به دو یا سه خوشه تقسیم کنید. یک خوشه مربوط به داده تنهای سمت راست و یک یا دو خوشه هم مربوط به داده‌های سمت چپ.first step clustering

یکی از اولین نکاتی که در نمودار بالا به چشم می‌آید، وجود داده پرت در این سری است. نکته‌ای که شاید بدون تصویرسازی، ممکن بود به چشم نیاید. به عنوان یک تحلیل‌گر می‌توانید حدس بزنید که آن داده به صورت اشتباه ثبت شده و یا اینکه خبر از یک اتفاق غیرعادی می‌دهد. منطقی نیست که این نقطه، کل فرآیند خوشه‌بندی را تحت تأثیر قرار بدهد. بنابراین در گام اول، این نقطه را از کل سری حذف و مجددا خوشه‌بندی می‌کنیم. نمودار زیر، نمایش داده‌های اصلاح شده در مقیاس اولیه است.

second step clustering

به نظر من، خوشه‌بندی داده‌های نمودار بالا، باز هم کار آسانی نیست. تعداد مناسب خوشه چند تا است؟ به خصوص زمانی که قرار است به صورت شهودی خوشه‌بندی شود، کدام داده در کدام خوشه قرار بگیرد؟ طبعا استفاده از روش‌های استاندارد، این مشکل را حل می‌کند. ولی حتی نتایج این روش‌ها را اگر نتوان به صورت دلچسبی نمابش داد، مورد پذیرش و مبنای عمل مدیران قرار نمی‌گیرد.

برای خوشه‌بندی، دو کار انجام دادم. اول اینکه مقیاس نمودار را اصلاح کردم و به جای یک مربع ۳۵ در ۳۵، اندازه‌ها را اصلاح کردم. بعد هم دو خط میانگین عمودی و افقی رسم کردم که داده‌ها را به چهار قسمت تقسیم کرد. حالا از روش‌های استاندارد برای خوشه بندی و تحلیل داده ها استفاده کنید.

third step clustering