✅
12 نکته مهم در مورد «علم داده» که در هیچ دورهای به شما یاد نمی دهند!🔥
1⃣ مشاغل زیادی در زمینه علم داده وجود دارد، (تحلیلگر داده، مهندس یادگیری ماشین، دانشمند داده و...) اما متقاضیان زیادی نیز وجود دارند و
فرآیند مصاحبه و استخدام یک بازی با اطلاعات نامتقارن عظیم است. صبور باشید، فرصتها پیش خواهند آمد، اما بیشتر از آن چه که همیشه فکر می کنید طول می کشد.
2⃣ اگر کنجکاو و عاشق یادگیری هستید، باید بدانید که
هرگز هر چیزی را که دوست دارید در Data Science بدانید، نخواهید دانست. علم داده یک زمینه بسیار گسترده است و زمان و دانش شما هم اندک. پس از این که همه چیز را نمیدانید ناامید نشوید.
3⃣
هر دانشمند داده داستان خود را دارد، پس خود را با دیگران مقایسه نکنید. اگر همکار شما در مورد سریهای زمانی - یا هر موضوع دیگری، بیشتر از شما میداند، نیاز نیست خود را با او مقایسه کنید. زیرا او همیشه با این ابزار کار کرده است، مطالعاتش در این زمینه بوده و تجربه بیشتری دارد. پس اگر دقیقتر نگاه کنید، میبینید که در موضوعات دیگر از او بهتر هستید (شاید برنامهنویس بهتری باشید یا دانش آماری و ریاضیات بیشتری بدانید).
4⃣
درباره محصول/ محصولاتی کسب و کاری که فرآیند آنالیز داده را انجام میدهید، بیاموزید. هیچ مدیر سطح A واقعاً به الگوریتمها، مقادیر p، دقت، AUC یا امتیاز f1 اهمیت نمیدهد. آنها می خواهند بدانند که کدام مشکل در حال حل شدن است و درآمد (یا پس اندازی) که از انجام پروژه شرکت توسط شما بدست میآورند چقدر است. پس
بهترین مدل، مدلی است که مشکل پروژه را حل کند؛ مدیران این را میخواهند.
5⃣ مدل های یادگیری ماشین تنها بخش بسیار کوچکی از وظایف روزانه ما هستند.
شما در پروژههای خود زمان بیشتری را صرف پاکسازی داده ها و جمع آوری اطلاعات خواهید کرد.
6⃣
برخی از تکنیک ها در آموزشهای تئوری و دورههایی که میگذرانید به خوبی کار می کنند، اما در داده های واقعی تقریباً بی فایده هستند. من دوست دارم از SMOTE به عنوان مثال استفاده کنم. در Medium، این تکنیک بی عیب و نقص به نظر می رسد، در حالی که در دنیای واقعی ممکن است کاملاً ناکارآمد باشد (البته نه به طور کامل).
7⃣ احتمالاً برخی از مفاهیم نشت داده ها و اعتبار سنجی را در طول تحصیل از دست دادهاید. این به این معنی است که شما تنها زمانی که برخی از مدل ها در حال تولید هستند، از کار افتادن آن ها را تجربه خواهید کرد. یعنی
بعضی مفاهیم را تنها در زمان کار بر روی پروژه یاد خواهید گرفت. پس مطمئن شوید که برای جلوگیری از یک حادثه بزرگ، برای نظارت بر مدلهای خود زمان صرف میکنید و یادگیری را ادامه میدهید!
8⃣
همه شرکتها دوست دارند بگویند که دادهمحور هستند، اما تعداد بسیار کمی از آنها واقعاً از این فرهنگ استقبال میکنند. بدتر از آن، این است که شما همیشه رهبران را در کنار خود در این مبارزه نخواهید داشت.
9⃣
تفاوت بین استنتاج و پیش بینی را بدانید. یک الگوریتم ممکن است بسته به موقعیت، مفروضات و خطرات متفاوتی داشته باشد.
🔟
ابزارهای Tensorflow، Pycaret، Catboost و دیگر کتابخانهها ذهن شما را متحیر خواهند کرد. میدانم، من هم از آنها استفاده کردهام.
اما هرگز قدرت Numpy، Pandas و Scikit-Learn را دست کم نگیرید. با استفاده از این سه کتابخانه، راه حلهای باورنکردنی خواهید ساخت.
1⃣1⃣
افتضاح است که ساعت ها (یا حتی روزها) را برای مطالعه صرف کنید و بعداً متوجه شوید که در مورد داده ها سوء تفاهم وجود دارد یا اشتباهی وجود دارد که متوجه نشده اید. این تجربه وحشتناک است، اما برای همه اتفاق می افتد. خودتان را سرزنش نکنید و صبوری خود را در مواجهه با همکارانتان از دست ندهید. آنچه را که باید یاد بگیرید، بیاموزید و همیشه به جلو حرکت کنید!
2⃣1⃣ همیشه شرکتها به هر کسی که موفق میشد نوعی از pd.merge() یا هر چیزی را با پایتون اجرا کند، هزینه زیادی پرداخت میکردند. اما الان این فاکتور تغییر کرده است. علم داده در حال تکامل است و امروزه تقاضاها بیشتر شده است.
فضای ابری، دانش مهندسی داده، اینترنت اشیا، علیت و مهارت های دیگر برخی از پیش نیازهایی هستند که ممکن است امروزه در موقعیت های شغلی جدید با آنها روبرو شوید.
✍🏼 یوکیو / دانشمند داده، کارشناس ارشد اقتصاد
#️⃣ #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📎 @DataScience_ir