مهندسی داده و امالآپس 🚀
Відкрити в Telegram
✅ دنیای مهندسی داده و امالآپس 🟢 ارتباط با ما https://www.m-fozouni.ir/contact-me 🔵 دورهی آموزشی مهندسی داده https://www.m-fozouni.ir/de7 🔴 یوتیوب https://youtube.com/c/ElmeDade 🟤 مشاوره با دکتر فزونی https://www.m-fozouni.ir/consult
Показати більше3 159
Підписники
-124 години
+127 днів
+1530 день
Архів дописів
تابحال به این فکر کردید که آیا میشه روی دیتاهای رمز شده، تحلیل دیتا انجام داد؟
در دنیای رمزنگاری، یکی از چالشهای بزرگ این بود: «آیا میتوان روی دادههای رمز شده محاسبات ریاضی انجام داد؟» این سوال بنیادین برای اولین بار در سال ۱۹۷۸ توسط ران ریوست (از خالقان RSA)، لن ادلمن و مایکل درتوزوس (اسامی افراد به انگلیسی در ادامه)
Ron Rivest, Len Adleman and Michael Dertouzos
مطرح شد. آنها این مفهوم را «همومورفیسم خصوصی» نامیدند و پرسیدند که آیا میتوان عملیات ریاضی مانند جمع و ضرب را بر روی متنهای رمز شده انجام داد بدون اینکه آنها را رمزگشایی کرد.
پاسخ به این سوال باز، بیش از ۳۰ سال بعد، در سال ۲۰۰۹ توسط کریگ جنتری در پایاننامه دکترای خود در دانشگاه استنفورد ارائه شد. او اولین طرح عملی برای «رمزنگاری کاملن همومورفیک» (Fully Homomorphic Encryption) را ارائه کرد و ثابت نمود که این رویا به واقعیت تبدیل شدنی است. این کشف، تحولی عظیم در حوزهی امنیت ابری و حفظ حریم خصوصی ایجاد کرد.
منابع:
- پایاننامه دکترای کریگ جنتری:
Gentry, C. (2009) "A Fully Homomorphic Encryption Scheme" Ph.D. Dissertation, Stanford University.
- کسب جایزهی رساله برتر در دانشگاه استنفورد (این جایزه یکی از معتبرترین جوایز در حوزهی علوم کامپیوتر محسوب میشود)
https://engineering.stanford.edu/news/craig-gentry-wins-dissertation-award
پینوشت: به پیوست تصویر دانشگاههایی که کریگ در اونجا تحصیل کرده رو میبینیم. خدائیش در محیطهای بزرگ بودن، اولین فایدهاش اینه که غولها رو میبینیم. سپس با بهترین سئوالات برای کار پژوهشی آشنا خواهیم شد. شاید در چنین محیطهایی بشه ایمان آورد که درس خوندن کار اشتباهی نیست 😎. انسانها تلاش میکنند تا برخی از رویاها به واقعیت تبدیل شوند.
.
@elmedadeir
+2
از لیسانس ریاضی تا دکتری کامپیوتر از استنفورد و در نهایت پاسخ به یک سوال باز 30 ساله.
@elmedadeir
در این کانال که برای یکی از عزیزان هست، شخص، باتی نوشته که هر یکساعت بهترین پروکسیها که پینگ بالا دارند رو جمع کرده و پست کند. بنظرم خیلی کار ساده، خوب و کاربردی هست. استفاده کنید
👉👉👉 @mtproxystation
.
@elmedadeir
حتی مدلهای یادگیری ماشین نیز به واترمارک نیاز دارند:
در دنیای در حال گسترش هوش مصنوعی، نیاز به تأیید اصالت و مالکیت مدلهای یادگیری ماشین رو به افزایش است. واترمارکینگ (نشانهگذاری) مانند امضای یک نقاش روی اثر هنری عمل میکند و به مهندسان یادگیری ماشین اجازه میدهد تا یک «امضای نامرئی» در مدل خود قرار دهند. این کار به اثبات تألیف، تأیید اصالت مدل و جلوگیری از استفادهی غیرمجاز کمک میکند.
در ایــــــــــن مقالــــــــــــــــــــه نویسنده با مثالهای عملی (کدهای پایتون) بما موارد زیر را نشان میدهد:
1- چگونگی انجام واترمارکینگ در پارامترهای مدل.
2- چگونگی انجام واترمارکینگ در خروجی مدل.
3- و در نهایت واترمارکینگ در دادههای آموزشی.
نکتهی مهم: هیچ روشی صددرصد شکستناپذیر نیست و همیشه نقطهی تعادلی بین عملکرد و امنیت وجود دارد. واترمارک ممکنه عملکرد مدل رو کمی کاهش بده و مهاجمان حرفهای نیز ممکن است بتونن اون رو حذف کنن. پس باید بهترین حالت ممکن برای انجام چنین اقداماتی رو خودمون تعیین کنیم.
.
#MLSecOps
.
@elmedadeir
🤔 واقعن چـــــرا؟
پس دو تا سوال رو شخص مطرح کردن؛
۱- چرا دیگران دیر یاد میگیرند؟
۲- چرا منی که اینقدر بلدم، کمتر پول در میارم؟
.
@elmedadeir
تعدادی از دورههای آموزشی مجموعه:
1- MLSecOps in Action (24 تیرماه 1405)
2- مهندسی داده (کد هفتم)
3- مهندسی داده مقدماتی (کد سوم)
4- آموزش زبان برنامهنویسی راست (با تمرکز بر مهندسی داده)
.
@elmedadeir
دام سنیوریتی!
بنظرم توی حوزه داده، خیلی درباره مسیر رشد از کارشناس به ارشد صحبت شده. از توسعه و اهمیت مهارت های نرم زیاد شنیدیم ولی کمتر درباره این صحبت میشه که از اون مقطع به بالاتر چطور باید پیش رفت. من اسم این رو میذارم "دام سنیوریتی".
دوتا نکته که به تجربه بهم ثابت شده و بنظرم مهمه رو اینجا میارم، امیدوارم کمک کننده باشه:
۱ - اولین و مهمترین نکته اینه که شما به عنوان سنیور با خودت روراست باشی و از خودت بپرسی که واقعا علاقمند هستم وارد فضای مدیریتی بشم؟ هر روز با افرادی صحبت کنم که هیچ ایده ای از فضای تخصصی دیتا ندارند؟ چطوری مسئله های کسب و کار رو به مسئله تحلیلی تبدیل کنم، چطور توی فضای فوق العاده پر ابهام، برنامه ریزی و تصمیم گیری کنم و چطور نتایج تحلیلی تیمم رو به "ارزش" کسب و کاری تبدیل کنم؟ آیا آماده ام مسئولیت خروجی تیمم رو بر عهده بگیرم؟ آیا آماده هستم که درخواست های غیر منطقی تیم / واحد های دیگر رو مدیریت کنم و فشار خارجی رو به افراد تیم منتقل نکنم؟ مدیریت، "ریاست" نیست!!
۲ - دومین نکته اینه که توی مصاحبه ها بفهمید که آیا پوزیشن مورد نظرتون صرفا یه اسم هست! و در واقع باز هم یه سنیور میخوان که منتور چند نفر دیگر هم باشه. اینو با این سوالات توی مصاحبه میتونین به راحتی تشخیص بدین: مسیر ارتقای شغلی بعد از ۱۲ تا ۱۸ ماه چطور هست؟ افرادی که توی این پوزیشن بودن، الان کجا هستن؟ آیا کسی بوده مدیر یا مدیر ارشد شده باشه؟ اگر جواب اینها شفاف نباشه، به شدت به اون عنوان "لید" شک کنین.
نظر شخصی من اینه که شما به عنوان سنیور، اگر دارید بخاطر "برند" یا "عنوان" یا بدتر از اون "پول" تصمیم میگیرید که یه پوزیشن "لید" یا "منیجر" رو انتخاب کنید، این گام یه میانبر برای موفقیت نیست، این از چاله به چاه افتادن هست.
در آخر هم بگم همه اینا نظرات شخصی منه و میتونه کاملا نادرست باشه :)
نویسنده و منبع: مرتضی حاجیپور (لینکدین)
.
@elmedadeir
+2
در دنیای امنیت مدلهای یادگیری ماشین، یکی دیگر از افرادی که همیشه تحقیقاتشون مطرح میشه، آقای دکتر رضا شکری هستند.
سال 2007 از دانشگاه تهران ارشد مهندسی نرم افزار میگیرند و همین سال تشریف میبرند سوئیس دانشگاه
EPFL
تا چندی پیش دانشیار دانشگاه ملی سنگاپور بودند و در حال حاضر، گوگل ایشون رو بکار گرفتند. هم اکنون در زوریخ سوئیس با عنوان شغلی
Senior Staff Research Scientist
مشغولند.
صفحه لینکدین و پیج دانشگاهی ایشون رو در ادامه ببینید؛
https://www.linkedin.com/in/rezashokri
https://www.comp.nus.edu.sg/~reza/
.
#MLSecOps
.
@elmedadeir
یک دیتاست صنعتی جمعآوری شده در آلمان جهت تشخیص و طبقهبندی عیوب سطحی در تصاویر (شامل 30 هزار عکس)
در واقع این دیتاست بما کمک میکنه که به مورد زیر دست پیدا کنیم:
تشخیص صحیح عیوب جدی و جلوگیری از اشتباه گرفتن نواحی سالم به عنوان عیب (کاهش False Positive) در یک سیستم تولیدی واقعی از ورقههای آهنی.
وارد لینک زیر بشید، رجیستر کنید و سپس دیتاها رو دریافت کنید.
https://surfconinspect.eu/resources/
#دیتاست_واقعی_و_صنعتی
.
@elmedadeir
اگر فکر میکنید در این دنیا، ما کامل بحال خودمون رها شدیم، این مقاله رو بخونید. درسته که تمرکز این مقاله روی آمریکاست، اما بسادگی قابل تعمیم در تمام نقاط جهان هست. دنیا تبدیل شده به یک زندان سراسربین، همه چیز تحت رصد و کنترل است. نمیدونم باید خوشحال باشیم یا ناراحت. ولی بهتره واقع بین باشیم و حداقل بدونیم دور و اطرافمون چه خبره. با همین تکنیک حتی از پرزیدنت فعلی آمریکا، اطلاعاتی درز کرد. اما بسرعت کنترل شد. بهرحال تکنولوژی آسایش برامون آورد. ولی بیشک آآرامشمون رو سلب کرده و باز هم خواهد کرد. ولی چارهای نیست و دیگه باید تا تهش رفت 😎.
این مقاله برای سال 2019 است. ببینید الان دیگه چه خبره.
https://www.nytimes.com/interactive/2019/12/19/opinion/location-tracking-cell-phone.html
📝 خلاصه مقاله:
این مقاله یک تحقیق میدانی است که در سال ۲۰۱۹ منتشر شد. روزنامهنامهنگاران به یک مجموعهداده عظیم و محرمانه دسترسی پیدا کردند که شامل 50 میلیارد نقطهی موقعیتیابی از بیش از 12 میلیون تلفن همراه آمریکایی در طول چند ماه در سالهای ۲۰۱۶ و ۲۰۱۷ است. این دادهها توسط شرکتهای خصوصی که نرمافزارهای ردیاب را درون اپلیکیشنهای موبایل جاسازی میکنند، جمعآوری شده بود.
🔑 در ادامه چند بخش مهم از مقاله رو ذکر میکنم:
1. ادعای «ناشناس بودن» دروغ است:
- با دانستن محل کار و خانهی یک فرد، به سادگی میتوان او را در میان میلیونها نقطهی داده پیدا کرد.
2. مکانهای حساس کاملن آشکار میشوند:
- دادهها نشان میدهد چه کسانی به کاخ سفید، پنتاگون، استراحتگاه ترامپ، مراکز درمان اعتیاد، کلینیکهای روانپزشکی، مساجد، کلیساها، و تظاهرات رفتهاند. حتی یک افسر ارشد دفاعی را در راهپیمایی زنان دنبال کردهاند.
3. کسبوکارهای میلیاردی ردیابی:
- دهها شرکت ناشناس از طریق SDKهایی که درون اپلیکیشنهای به ظاهر بیخطر (مثل آب و هوا، کوپن، اخبار محلی) قرار میدهند، موقعیت شما را میفروشند. خریداران میتوانند بانکها، صندوقهای سرمایهگذاری، یا حتی شکارچیان جایزه باشند 🤯.
4. هیچ قانون فدرالی در آمریکا وجود ندارد:
- جمعآوری و فروش این دادهها کاملن قانونی است. در عمل، هیچ چیز جلوی سوءاستفاده کارمند یک شرکت از دادهها (مثلن تعقیب همسر سابق) را نمیگیرد.
5. آسیبپذیری جدی امنیت ملی:
- اگر یک خبرنگار بتواند مسیر تردد یک افسر اطلاعاتی را از پنتاگون تا خانهاش پیدا کند، یک سرویس جاسوسی خارجی هم به راحتی میتواند. این یعنی جاسوسی علیه آمریکا آسان شده است.
6. هیچ راه فراری نیست:
- حتی اگر شما موقعیت را خاموش کنید، بسیاری از اپلیکیشنها از روشهای دیگری (مثل وایفای و بلوتوث) شما را ردیابی میکنند. این سیستم «پیشرفتهترین سیستم نظارتی جهان» است که با پول تبلیغات ساخته شده.
💀 یک مثال تکاندهنده از مقاله
محققان بدون زحمت، یک مهندس مایکروسافت را پیدا کردند که یک روز بعدازظهر به دفتر مرکزی آمازون (رقیب مایکروسافت) رفته بود. یک ماه بعد، او در آمازون شروع به کار کرد. یعنی دادهها مصاحبه شغلی مخفیانه او را لو داده بود.
🎯 نتیجهگیری نهایی نویسندگان:
«بزرگترین شعبدهبازی شرکتهای فناوری این نبود که ما را زیر نظر گرفتند؛ بلکه این بود که کاری کردند خودمان داوطلبانه در نظارت بر خودمان مشارکت کنیم».
کلام آخر از بنده:
NO DATA IS COMPLETELY ANONYMIZED, TAKE CARE
.
@elmedadeir
جزو زبان برنامهنویسی راست (Rust) در دانشگاه شهید بهشتی
📝 مولف: میلاد وزان
.
سپاس از ایشان بابت نشر چنین جزوهای
.
@elmedadeir
پس از مدتها بالاخره تونستیم کلاینتهای پایتونی سایفر رو به راست تبدیل کنیم. الان کل پروژه
CipherMQ
با راست نوشته شده و آماده است برای رفتن روی
crates.io
با این آپدیت، ما دیگه خاطرمون از بابت کلاینتها هم بطور کامل جمع میشه که احیانن بخاطر پایتون، سرورها مشکلی نداشته باشند یا حفرهای خاصی ایجاد نشود.
هر چند چون هر پیام در هر مرحله، با دو کلید رمز میشه، یکی کلیدی که تصادفی تولید میشود و دومی کلید گیرنده؛ حتی اگر کلاینتها هم با مشکل امنیتی مواجه شوند، بسیار بعید است که مهاجمین بتوانند پیامهای قبلی رد و بدل شده را مشاهده نمایند.
🚀 CipherMQ Client Migration to Rust, Now Fully Rust-Native!
We have successfully completed one of the most significant technical upgrades for CipherMQ.
The Sender and Receiver clients, previously built in Python, have been completely rewritten in Rust.
The entire project (Server + Sender + Receiver) is now 100% Rust.
🔗Project Link: https://github.com/CipherSecurityLab/CipherMQ
@elmedadeir
بازی در دنیای مدلهای یادگیری ماشین خیلی عجیب و خوفناک شده. مهاجمین از طریق حملههای
Black-Box Attacks
یعنی، هنگامی که هیچ شناختی از معماری و ساختار و دیتایی که مدل ما با اون آموزش دیده ندارند، تنها با فهمیدن ورودی و خروجی، مدل رو بنوعی شبیهسازی میکنند تا به اهداف خودشون برسند.
در این عنوان؛
Adversarial AI Attacks, Mitigations, and Defense Strategies: A Cybersecurity Professional's Guide to AI Attacks, Threat Modeling, and Securing AI with #MLSecOps
خیلی دقیق به این مهم پرداخته شده. کتاب فوقالعادهای است. اگر امنیت مدلهای یادگیری ماشین یا استک هوش مصنوعی مجموعه براتون مهم هست، یا دنبال ارتقای مهارتی خودتون هستین، این کار رو مطالعه کنید.
دیگه فقط مدل تیون کردن و بردن به پروداکشن، مهم نیست. امنیت سرویسها بر پایهی هوش مصنوعی، اهمیت دو چندانی دارند. بخصوص اگر در محیطهای حساس کار میکنیم.
#ام_ال_سک_آپس
.
@elmedadeir
اگر کنجکاو هستید که بدونید «امالسِکآپس» یا همون
#MLSecOps
چیست، این ویدیو رو ببینید.
در این ویدیو اول یک کلیت در خصوص این فیلد میگم و اینکه چرا رفتیم سمتش. سپس یک نقشه راه معرفی میکنم و چند تا کتاب بینظیر.
اگر لینک دانلود موارد مطرح شده در ویدیو رو میخواهید فایل PDF که در پست بعدی هست رو دریافت کنید؛ تمام لینکها داخل فایل بعدی هست
👇👇👇
.
@elmedadeir
Вже доступно! Дослідження Telegram за 2025 — головні інсайти року 
