اعداد و شمار کے ساتھ شروع کرنے کا طریقہ

کریڈٹ: https://www.flickr.com/photos/gleonhard/31254136671/in/photostream/

ہم سب نے آواز کاٹنے کو سنا ہے۔

"دنیا کا سب سے قیمتی وسائل اب تیل نہیں ، بلکہ اعداد و شمار ہے"

شاید. لیکن اگر اعداد و شمار تیل کی طرح ہیں تو پھر بہت سی تنظیموں میں ڈیٹا کی حالت اس سے ملتی جلتی ہے:

گہرے پانی میں افق کا تیل پھیلنا

ڈیٹا سمندر میں بے شمار ڈیٹا اسٹریمز ضائع ہو رہے ہیں۔ کسی بھی ڈیٹا سائنس دان سے پوچھیں اور وہ آپ کو بتائیں گے کہ ڈیٹا سائنس کے بارے میں سب سے مشکل چیز صحیح ڈیٹا کو حاصل کرنا ہے۔ تو ہم کیسے شروع کریں؟

1. صحیح سوالات پوچھیں

اس کی خاطر اعداد و شمار پر قبضہ کرنا بیکار اور وقت طلب ہے۔ ہمیں اپنی میٹرکس کا پتہ لگانے کی ضرورت ہے ، جو کاروبار کے اہداف پر مبنی ہونا چاہئے۔ سب سے زیادہ فروخت ہونے والی مصنوعات کون سے ہیں؟ جہاں ملٹی مرحلہ کے عمل کو ترک کر رہے ہیں؟ ہمارے پاس کتنے فعال صارفین ہیں؟ بہت ساری تنظیمیں اپنے اسٹیک ہولڈرز کو ان چیزوں کی بنیاد پر میٹرکس پیش کرتے ہیں جن کی وہ پیمائش کرنے کے قابل ہیں (جیسے محصول) جو ضروری نہیں کہ ان کی کمپنی کی سمت میں کون سی بہترین سیدھ میں آجائے۔

ایک بار جب ہم جان لیں کہ ہم کس چیز کی پیمائش کرنے کی کوشش کر رہے ہیں تو ہم اس بات کا تعین کرسکتے ہیں کہ اعداد و شمار کی تلاش کہاں سے کرنا ہے اور متعلقہ ڈیٹا پر گرفت شروع کرنے کے لئے اقدامات کا منصوبہ بنانا ہے۔

2. ڈیٹا سے چلنے والی ثقافت فراہم کریں

ایک بار جب ایک تنظیم ایک خاص سائز میں بڑھ جاتی ہے تو وہ خالصتا “" آنت کے احساس "پر انحصار نہیں کرسکتی ہیں۔ فیصلے کو ڈیٹا پر مبنی ہونا چاہئے اور یہ ڈیٹا ہر سطح پر دستیاب ہونا ضروری ہے۔

کیا ملازمین ڈیٹا اور میٹرکس تک رسائی حاصل کرسکتے ہیں یا وہ سیکیورٹی اور ریڈ ٹیپ کی بڑی تہوں کے پیچھے ہیں؟ ملازمین کو ڈیٹاسیٹس (جس کو خفیہ رکھنا چاہئے اور رازداری کا احترام کرنے کے ل sec محفوظ ہونا چاہئے) پر ڈیٹا ایکسپلوریشن کرنے کا اختیار ہونا چاہئے۔ اس کے لئے اندرون خانہ سیلف سروس اینالٹکس پلیٹ فارم مثالی ہے۔ یہ کام کھلے اور شفاف ہونے کی ضرورت ہے۔ کام کو ڈیش بورڈ پر رکھنا اور اس کی تنظیم کو وسیع پیمانے پر بانٹنا ضروری ہے۔

تنظیموں کو اس قسم کے کام کے لئے اعانت ، حوصلہ افزائی اور وسائل فراہم کرنے کی ضرورت ہے۔ اس کا مطلب ہے وقت اور رقم ، اگرچہ ڈیٹا سے چلنے والی ثقافت زیادہ باخبر فیصلے کو فروغ دیتی ہے۔

3. ڈیٹا انجینئرز کی خدمات حاصل کریں

اعداد و شمار کے سائنسدانوں کی خدمات حاصل کرنا ڈیٹا سائنسدانوں کی خدمات حاصل کرنا تنظیموں کا معمول کا فقدان ہے۔ ڈیٹا سائنس دان بالکل تنقیدی ہیں ، وہ اعداد و شمار میں نمونہ تلاش کرسکتے ہیں ، نتائج کی پیش گوئی کرسکتے ہیں اور ایسے ماڈل لکھ سکتے ہیں جو اپنے آپ کو بہتر بنانا سیکھیں۔ انتباہ یہ ہے کہ یہ سب معیار کے اعداد و شمار پر منحصر ہے۔ ڈیٹا جو صرف بڑے ڈیٹا انفراسٹرکچر ، ETL اور پروگرامنگ خودکار ورک فلو کے ذریعے بازیافت کیا جاسکتا ہے۔ یہ عام طور پر ڈیٹا انجینئر کا کردار ہے۔ کام لوگوں کو دیں جو اس کے لئے اہل ہیں اور زیادہ اہم بات یہ ہے کہ اس سے لطف اٹھائیں۔

4. چھوٹے اور سستے شروع کریں

بڑی ڈیٹا ہائپ ٹرین پر کودنا ، ڈیٹا سائنس ٹیم تشکیل دینا ، انٹرپرائز تجزیاتی سافٹ ویئر خریدنا اور اس کے لئے بہت کم رقم خرچ کرنے کے لئے بہت کم فتنہ ہوسکتا ہے۔ ایک بہت بڑی سرمایہ کاری کرنے سے پہلے بہت کچھ کیا جاسکتا ہے۔ یہاں کچھ ٹولز ہیں جو کوئی بھی تنظیم استعمال کرسکتی ہے۔

  • جاوا اسکرپٹ کے تجزیاتی لیبز جیسے مکسپانیل یا طول و عرض۔ یہ ماہانہ صارفین کی ایک مقررہ رقم تک مفت ہے۔
  • خود کار طریقے سے ورک فلو نظم و نسق کے لئے ہوا کا بہاؤ۔ ایئر بی این بی کے ذریعہ تخلیق کیا گیا ہے اور اپاچی سافٹ ویئر فاؤنڈیشن میں تیار کیا گیا ہے ، یہ اوپن سورس اور ڈیٹا انجینئرز کے لئے ایک فیکٹو معیاری ہے۔
  • سپرشٹ (بھی اپاچی کے ذریعہ) کے ساتھ ڈیش بورڈز ، چارٹس اور ڈیٹا کی تلاش۔ ڈیٹا بیس بھی ایک اچھا متبادل ہے اور دونوں ہی اوپن سورس ہیں۔
  • ڈیٹا بکس کمیونٹی ایڈیشن اور کاگل۔ دونوں کو کلاؤڈ پر اور مفت میں ڈیٹا سائنس کے عمل کے ل. استعمال کیا جاسکتا ہے۔
  • ایمیزون ویب سروسز S3۔ مفت نہیں لیکن یہاں شامل ہے کیونکہ آج جس ٹکنالوجی کی تیاری کی جارہی ہے اس کے ساتھ ہمیشہ اعداد و شمار کے گودام کا ہونا ضروری نہیں ہوتا ہے۔ ذخیرہ سستا ہے اور خدمات جیسے ڈیٹا بریفس ، مونگو ڈی بی ڈیٹا لیک ، اے ڈبلیو ایس ایتینا کا مطلب ہے کہ آپ اپنے ڈیٹا جھیل سے براہ راست پڑھ سکتے ہیں۔

یہ خیالات کسی تنظیم کو صحیح اعداد و شمار کی گرفتاری اور اس کی اہمیت کا ادراک کرنے کے ل to ایک اچھی بنیاد فراہم کریں گے۔