بلاگ
آموزش جامع فرمول SKEW در گوگل شیت
- فرمول SKEW در گوگل شیت دقیقاً چه چیزی را محاسبه میکند و چرا برای تحلیل دادهها مهم است؟
- چگونه میتوان از تابع SKEW برای اندازهگیری عدم تقارن یک مجموعه داده استفاده کرد؟
- تفاوت اصلی بین دو فرمول SKEW و SKEW.P در گوگل شیت چیست و چه زمانی باید از هر کدام استفاده کنیم؟
- مقادیر مثبت، منفی یا نزدیک به صفر که از فرمول SKEW به دست میآید، چه مفهومی دارند؟
- اشتباهات رایج هنگام استفاده از این فرمول چیست و چگونه میتوان آنها را برطرف کرد؟
در این مقاله جامع، به تمام این سوالات به صورت کامل و دقیق پاسخ خواهیم داد. تحلیل دادهها فقط به محاسبه میانگین و میانه خلاصه نمیشود. برای درک عمیقتر توزیع دادهها، نیاز به ابزارهای آماری پیشرفتهتری داریم. یکی از این ابزارهای قدرتمند، فرمول SKEW در گوگل شیت است که به ما کمک میکند تا میزان تقارن یا عدم تقارن (چولگی) دادههای خود را بسنجیم. درک چولگی به شما دید بهتری نسبت به پراکندگی و تمایل دادهها به یک سمت خاص میدهد و به تصمیمگیریهای هوشمندانهتر کمک میکند. با ما همراه باشید تا به صورت گام به گام و با مثالهای عملی، نحوه استفاده از این تابع کلیدی را بیاموزید.
مفهوم چولگی (Skewness) در آمار چیست؟
قبل از اینکه مستقیماً به سراغ فرمول SKEW در گوگل شیت برویم، بیایید کمی با مفهوم پایهای «چولگی» یا Skewness آشنا شویم. در دنیای آمار، چولگی معیاری برای اندازهگیری عدم تقارن توزیع احتمال یک متغیر تصادفی با مقدار واقعی حول میانگین آن است. به زبان سادهتر، چولگی به ما نشان میدهد که نمودار توزیع دادههای ما تا چه حد به سمت چپ یا راست کشیده شده است.
یک توزیع کاملاً متقارن (مانند توزیع نرمال یا زنگولهای) چولگی برابر با صفر دارد. این یعنی دادهها به طور مساوی در دو طرف میانگین پخش شدهاند. اما اگر نمودار دادهها به یک سمت متمایل باشد، میگوییم توزیع چولگی دارد.
انواع چولگی
چولگی به سه دسته اصلی تقسیم میشود که درک آنها برای تفسیر خروجی فرمول SKEW ضروری است:
- چولگی مثبت (Positive Skew): زمانی رخ میدهد که دمِ سمت راست نمودار بلندتر از دمِ سمت چپ باشد. در این حالت، اکثر دادهها در سمت چپ متمرکز شدهاند و مقادیر فرین یا پرت (Outliers) در سمت راست قرار دارند. در یک توزیع با چولگی مثبت، معمولاً داریم: میانگین > میانه > مد.
- چولگی منفی (Negative Skew): این حالت برعکس چولگی مثبت است. دمِ سمت چپ نمودار بلندتر از دمِ سمت راست است و بیشتر دادهها در سمت راست نمودار جمع شدهاند. در این حالت، مقادیر پرت در سمت چپ قرار میگیرند و رابطه زیر برقرار است: میانگین < میانه < مد.
- چولگی صفر (Zero Skew): همانطور که گفته شد، این حالت نشاندهنده یک توزیع کاملاً متقارن است. در این توزیع، مقادیر میانگین، میانه و مد با یکدیگر برابر هستند.
معرفی فرمول SKEW در گوگل شیت
گوگل شیت تابع SKEW را برای محاسبه چولگی یک مجموعه داده بر اساس یک نمونه (Sample) ارائه میدهد. این تابع میزان عدم تقارن توزیع دادهها را حول میانگین آنها اندازهگیری میکند. این تابع برای تحلیلگرانی که با بخشی از یک جامعه آماری بزرگتر کار میکنند، بسیار کاربردی است.
ساختار (Syntax) فرمول SKEW
ساختار این فرمول بسیار ساده است و به شکل زیر تعریف میشود:
SKEW(value1, [value2, ...])
اجزای این فرمول عبارتند از:
value1: اولین مقدار یا محدودهای از دادهها که میخواهید چولگی آن را محاسبه کنید. این آرگومان اجباری است.[value2, ...]: مقادیر یا محدودههای اضافی که میخواهید در محاسبات لحاظ شوند. این آرگومانها اختیاری هستند.
شما میتوانید تا ۲۵۵ آرگومان را در این فرمول وارد کنید. این آرگومانها میتوانند اعداد، آدرس سلولها (مانند A1) یا محدودهای از سلولها (مانند A1:A100) باشند.
آموزش گام به گام استفاده از تابع SKEW
بیایید با یک مثال عملی ببینیم که چگونه میتوان از فرمول SKEW در گوگل شیت استفاده کرد. فرض کنید نمرات آزمون یک کلاس را در ستون A وارد کردهاید و میخواهید چولگی توزیع این نمرات را محاسبه کنید.
دادههای نمونه: نمرات دانشآموزان در ستون A از A1 تا A20 به شرح زیر است: 15, 18, 12, 19, 20, 14, 16, 17, 18, 11, 10, 19, 13, 15, 17, 18, 20, 9, 18, 16
مرحله اول: انتخاب سلول برای خروجی
ابتدا یک سلول خالی را انتخاب کنید (برای مثال C1) که میخواهید نتیجه فرمول در آن نمایش داده شود. بهتر است در سلول کناری (B1) یک برچسب مانند “چولگی نمرات” بنویسید تا کاربرگ شما خواناتر باشد.
مرحله دوم: وارد کردن فرمول
در سلول C1، علامت مساوی (=) را تایپ کرده و شروع به نوشتن نام فرمول کنید: SKEW. گوگل شیت به شما پیشنهاداتی نمایش میدهد که میتوانید با کلیک بر روی آن، فرمول را انتخاب کنید.
مرحله سوم: تعیین محدوده دادهها
پس از باز شدن پرانتز، باید محدوده دادههای خود را مشخص کنید. در این مثال، دادههای ما در سلولهای A1 تا A20 قرار دارند. بنابراین، محدوده A1:A20 را وارد کنید.
فرمول نهایی به این شکل خواهد بود:
=SKEW(A1:A20)
مرحله چهارم: مشاهده و تفسیر نتیجه
کلید Enter را فشار دهید. گوگل شیت چولگی دادهها را محاسبه و در سلول C1 نمایش میدهد. برای دادههای مثال ما، نتیجه تقریباً برابر با -0.59 خواهد بود.
این عدد منفی به ما میگوید که توزیع نمرات دارای چولگی منفی است. یعنی بیشتر دانشآموزان نمرات بالایی کسب کردهاند (دادهها در سمت راست نمودار متمرکز شدهاند) و تعداد کمی از دانشآموزان نمرات پایینی گرفتهاند که باعث کشیدگی نمودار به سمت چپ شدهاند.
تفاوت کلیدی بین فرمول SKEW و SKEW.P
یکی از سوالات متداول کاربران، تفاوت بین دو تابع SKEW و SKEW.P است. انتخاب بین این دو تابع بستگی به نوع دادههایی دارد که شما در حال تحلیل آن هستید.
تابع SKEW
- این تابع چولگی را برای یک نمونه (Sample) از دادهها محاسبه میکند.
- در علم آمار، ما معمولاً به کل دادههای یک جامعه (Population) دسترسی نداریم و با یک نمونه تصادفی از آن کار میکنیم. SKEW برای این سناریو طراحی شده است.
- این تابع از یک فرمول اصلاح شده برای تخمین چولگی کل جامعه بر اساس نمونه استفاده میکند.
تابع SKEW.P
- این تابع چولگی را برای کل یک جامعه (Population) محاسبه میکند.
- شما باید از این تابع زمانی استفاده کنید که تمام دادههای ممکن برای یک پدیده را در اختیار دارید (مثلاً نمرات تمام دانشآموزان یک مدرسه، نه فقط یک کلاس).
- حرف P در انتهای نام تابع مخفف “Population” است.
قانون کلی: اگر دادههای شما نماینده بخشی از یک گروه بزرگتر هستند، از SKEW استفاده کنید. اگر دادههای شما شامل تمام اعضای گروه مورد مطالعه است، از SKEW.P استفاده کنید. در اکثر موارد تحلیل داده در کسبوکار، ما با نمونه کار میکنیم، بنابراین استفاده از فرمول SKEW در گوگل شیت رایجتر است.
جدول مقایسهای SKEW و SKEW.P
| ویژگی | SKEW | SKEW.P |
|---|---|---|
| کاربرد | محاسبه چولگی بر اساس یک نمونه آماری. | محاسبه چولگی بر اساس کل جامعه آماری. |
| مخفف | – | P مخفف Population (جامعه) است. |
| سناریوی استفاده | تحلیل دادههای یک نظرسنجی، نتایج فروش یک ماه، دادههای یک کلاس درس. | تحلیل دادههای سرشماری کامل، نمرات تمام دانشجویان یک دانشگاه. |
| نتیجه عددی | معمولاً کمی متفاوت از SKEW.P است (به دلیل ضریب تصحیح). | مقدار دقیق چولگی برای مجموعه داده ورودی. |
تفسیر مقادیر خروجی فرمول SKEW
پس از محاسبه، عددی که فرمول SKEW در گوگل شیت برمیگرداند به خودی خود ممکن است گویا نباشد. مهم این است که بدانیم چگونه آن را تفسیر کنیم.
- اگر مقدار SKEW نزدیک به 0 باشد (معمولاً بین -0.5 و +0.5): توزیع دادههای شما تقریباً متقارن است. این یک حالت ایدهآل در بسیاری از تحلیلهای آماری است.
- اگر مقدار SKEW مثبت باشد (معمولاً بزرگتر از +0.5): توزیع دارای چولگی به راست (مثبت) است. این یعنی دم سمت راست نمودار بلندتر است و مقادیر پرت یا بسیار بزرگ، میانگین را به سمت بالا کشیدهاند. برای مثال، در توزیع درآمد یک جامعه، وجود تعداد کمی افراد با درآمد بسیار بالا باعث ایجاد چولگی مثبت میشود.
- اگر مقدار SKEW منفی باشد (معمولاً کوچکتر از -0.5): توزیع دارای چولگی به چپ (منفی) است. دم سمت چپ نمودار بلندتر بوده و وجود مقادیر پرت یا بسیار کوچک، میانگین را به سمت پایین کشیده است. مثال نمرات کلاس که بالاتر ذکر شد، نمونهای از این حالت بود.
نکته مهم: هرچه قدر مطلق مقدار چولگی (بدون در نظر گرفتن علامت مثبت یا منفی) بزرگتر باشد، میزان عدم تقارن توزیع نیز بیشتر است. چولگی بالاتر از 1 یا کمتر از -1 معمولاً به عنوان چولگی بالا در نظر گرفته میشود.
نکات و خطاهای رایج هنگام استفاده از فرمول SKEW
هنگام کار با این فرمول ممکن است با برخی مشکلات یا خطاها مواجه شوید. در اینجا به چند مورد رایج اشاره میکنیم:
- خطای
#DIV/0!: این خطا زمانی رخ میدهد که مجموعه داده شما کمتر از دو مقدار عددی داشته باشد. برای محاسبه چولگی، حداقل به دو داده نیاز است تا بتوان انحراف معیار را محاسبه کرد. - نادیده گرفتن متن و مقادیر غیرعددی: تابع SKEW به طور خودکار سلولهای حاوی متن یا مقادیر منطقی (TRUE/FALSE) را در محدوده مشخص شده نادیده میگیرد. این یک ویژگی مفید است اما اگر انتظار دارید این مقادیر به عنوان صفر در نظر گرفته شوند، باید ابتدا آنها را به صورت دستی به صفر تبدیل کنید.
- استفاده از فرمول اشتباه (SKEW در مقابل SKEW.P): همانطور که توضیح داده شد، اطمینان حاصل کنید که بر اساس ماهیت دادههای خود (نمونه یا جامعه)، تابع مناسب را انتخاب کردهاید. استفاده از تابع اشتباه میتواند منجر به نتیجهگیریهای آماری نادرست شود.
- محدودیت تعداد آرگومانها: اگرچه این تابع تا ۲۵۵ آرگومان را میپذیرد، اما بهترین روش همیشه این است که دادههای خود را در یک محدوده ستونی یا ردیفی واحد قرار دهید و آن محدوده را به عنوان یک آرگومان واحد به فرمول بدهید (مانند
A1:A500) به جای اینکه سلولها را تک به تک وارد کنید.
با درک این نکات، میتوانید با اطمینان بیشتری از فرمول SKEW در گوگل شیت برای تحلیلهای آماری خود استفاده کنید و به درک عمیقتری از ویژگیهای پنهان دادههایتان دست یابید.
واقعاً تحلیل داده بدون درک اسکیونس ناقصه. ممنون که این شکاف دانشی رو برای ما پر کردید.
خواهش میکنم امیرحسین عزیز. هدف ما ارتقای سطح تحلیلهای کسبوکار در فضای فارسیزبان است. موفق باشید.
بسیار عالی. من به عنوان دانشجوی مدیریت، از این ابزارهای گوگل شیت در پروژههام استفاده میکنم. ممنون از آموزشهای کاربردیتون.
خوشحالیم که برای مسیر تحصیلی و حرفهای شما مفید هستیم هانیه جان. تسلط بر ابزارهای آماری مثل این، شما را در بازار کار متمایز میکند.
ممنون. برای تحلیل نرخ تبدیل (Conversion Rate) در کمپینهای تبلیغاتی، چولگی منفی نشونه خوبیه یا بد؟
در نرخ تبدیل، چولگی منفی معمولاً خبر خوبی است کامران عزیز! این یعنی اکثر روزها یا کمپینهای شما نرخ تبدیل بالایی داشتهاند و فقط چند مورد استثنایی نرخ پایین داشتهاند که باعث کشیدگی دنباله به سمت چپ شده است.
کاش برای بخش تفسیر اعداد (مثبت و منفی) چند مثال تصویری هم میذاشتید، ولی در کل توضیحات متنی خیلی شفاف بود.
درود. آیا این تابع در اکسل هم به همین صورت کار میکنه یا تفاوتی در آرگومانها داره؟
درود پیمان عزیز. بله، ساختار و منطق این تابع در اکسل و گوگل شیت کاملاً یکسان است. شما میتوانید با همان نام و آرگومانها در اکسل هم از آن استفاده کنید.
من وقتی فرمول رو وارد میکنم نتیجه #DIV/0! میده. مشکل از کجاست؟
سپیده جان، این خطا معمولاً زمانی رخ میدهد که تعداد دادههای عددی شما کمتر از ۳ عدد باشد. برای محاسبه چولگی، فرمول نیاز به حداقل سه نقطه داده دارد تا بتواند انحراف و عدم تقارن را محاسبه کند.
به نظرم برای یک بیزنس کوچ، تحلیل چولگی درآمد ماهانه میتونه نشون بده که چقدر بیزنس به چند مشتری بزرگ وابسته است. این تحلیل عالی بود.
نکته بسیار طلایی و درستی را اشاره کردید نیما جان. چولگی مثبت شدید در درآمد، نشاندهنده وابستگی به Outlierها (مشتریان خاص) است که ریسک تمرکز را در مدل کسبوکار افزایش میدهد. نگاه بسیار هوشمندانهای دارید.
خیلی وقت بود دنبال تفاوت دقیق SKEW و SKEW.P میگشتم. این مقاله کاملترین منبعی بود که خوندم. مرسی از وقتی که گذاشتید.
یک سوال فنی: اگر در مجموعه دادههای من چند مقدار Null یا متنی وجود داشته باشه، فرمول SKEW در گوگل شیت خطا میده یا اونا رو نادیده میگیره؟
فرهاد عزیز، گوگل شیت به طور خودکار مقادیر متنی و سلولهای خالی را در محاسبات SKEW نادیده میگیرد و فقط روی اعداد تمرکز میکند. بنابراین خطایی دریافت نمیکنید، اما دقت کنید که این موضوع روی اندازه نمونه (n) تأثیر میگذارد.
آیا مقادیر چولگی که نزدیک به صفر هستند همیشه به معنای نرمال بودن توزیع هستند؟ یا ممکنه دادهها متقارن باشن ولی نرمال نباشن؟
آموزش گام به گام و عالی بود. استفاده از مثالهای عملی باعث شد مفهوم آماری خشک چولگی رو خیلی راحتتر درک کنم. ممنون از تیم 9persona.
سپاس از همراهی شما آرش عزیز. هدف ما سادهسازی مفاهیم پیچیده آماری برای مدیران و کوچهای حرفهای است تا تصمیمات مبتنی بر داده (Data-Driven Decisions) بگیرند.
من به عنوان یک کوچ اجرایی، دادههای ارزیابی عملکرد کارکنان رو تحلیل میکنم. وقتی چولگی مثبت میشه، یعنی اکثر کارمندها در سطوح پایین عملکرد هستن؟
دقیقاً همینطور است سارا جان. چولگی مثبت یعنی دنباله توزیع به سمت راست کشیده شده و تراکم دادهها در سمت چپ (مقادیر کمتر) بیشتر است. این زنگ خطری برای مدیران است که نیاز به آموزش یا انگیزهبخشی بیشتری در سازمان دارند.
در تحلیل تکنیکال بازار هم از این مفهوم چولگی زیاد استفاده میکنیم. خوشحالم که نحوه پیادهسازیش در گوگل شیت رو به این سادگی آموزش دادید. آیا تابعی برای محاسبه Kurtosis هم وجود داره؟
ممنون از دیدگاه حرفهای شما حمیدرضا عزیز. بله، در گوگل شیت میتوانید از تابع KURT برای محاسبه کشیدگی (Kurtosis) استفاده کنید که مکمل بسیار خوبی برای SKEW در تحلیل ریسک سرمایهگذاری است. در مقالات بعدی حتماً به آن خواهیم پرداخت.
تفاوت SKEW و SKEW.P رو خیلی خوب توضیح دادید. فقط یک سوال، برای تحلیل رفتار مشتریان در یک کمپین که کل جامعه آماری رو نداریم، حتماً باید از SKEW استفاده کنیم؟
بله مریم جان، سوال بسیار هوشمندانهای پرسیدی. اگر شما صرفاً به بخشی از دادههای مشتریان دسترسی دارید (نمونهگیری)، حتماً از فرمول SKEW استفاده کنید تا خطای برآورد اصلاح شود. SKEW.P فقط زمانی استفاده میشود که دادههای کل جامعه در اختیار شما باشد.
مطلب بسیار مفیدی بود. من همیشه در تحلیل دادههای فروش تیمم فقط به میانگین اکتفا میکردم، اما الان متوجه شدم که چولگی یا همون Skewness چقدر میتونه در پیشبینی دقیقتر به ما کمک کنه. واقعاً کاربردی بود.
خوشحالیم که این مطلب برای شما مفید بوده، سعید عزیز. دقیقاً همینطور است؛ میانگین به تنهایی میتواند فریبنده باشد. در دنیای بیزنس کوچینگ، درک توزیع دادهها (مثل چولگی) به شما نشان میدهد که آیا موفقیتهای شما پایدار هستند یا تحت تأثیر چند رویداد استثنایی قرار گرفتهاند.