PyTorch Howsam
Открыть в Telegram
3 406
Подписчики
+724 часа
+227 дней
+4230 день
Архив постов
3 407
+1
سایت Made With ML
این سایت، یکی از منابع آموزشی خوب برای یادگیری توسعه محصول مبتنی بر یادگیری ماشین هست.
تصاویر (معرفی سایت و فهرست مطالب دوره) به اندازه کافی واضح هست. اما خود سایت میگه:
Learn how to combine machine learning with software engineering to design, develop, deploy and iterate on production ML applications.توی کتاب خانم Chip Huyen هم به عنوان منبع ذکر شده. من کورس توی این سایت رو ندیدم. اما خوب بررسی کردم. گذاشتم توی صف مطالعه. بعد از کتاب خانم Huyen میخوام این رو مطالعه کنم.
3 407
گپ دوستانه مهرزاد صمدی با امیر حرمتی
یکی از نویسندههای استاندارد جدید گوگل OKF
برای مرتب کردن داده برای LLMها
https://youtu.be/3JyKypJsFCc
3 407
کتاب جبر خطی به شیوه درست
Linear Algebra Done Right
Sheldon Axler
نسخه اصلی : (June 18 , 2026)
https://linear.axler.net/LADR4e.pdf
نسخه فارسی : (June 20 , 2026)
https://linear.axler.net/LADR4eFarsi.pdf
3 407
در راستای پست بالا، مهدی این دو تا فایل رو همراه با توضیح زیر در گروه فرستاد. من فایل بلوپرینت رو خوندم. خیلی خوب بود. دومی رو فرصت نکردم بخونم.
استک جالبی در این زمینه هست (DVC , MLflow , Evidently ai) که تا حدودی زیر رشته mlops محسوب میشه ولی برای مهندسی هوش مصنوعی در محیط پروداکشن ضروری هست در بازار مالی این مصیبت به طریق اولا وجود داره علاوه بر تغییر توزیع داده ها دچار تغییر کانسپت (تغییر معنایی ) هم هستیم یعنی خود فیچرها تغییر میکنند اونهم در مدت زمان های کوتاه مدت در حد چند روز
3 407
.
فصل هشتم کتاب Designing Machine Learning Systems از خانم Chip Huyen درباره Data Distribution Shifts and Monitoring:
بیا این فصل را با داستانی شروع کنیم که یکی از مدیران اجرایی برای من تعریف کرد؛ داستانی که شاید بسیاری از خوانندگان بتوانند با آن همذاتپنداری کنند. حدود دو سال پیش، شرکت او یک شرکت مشاوره را استخدام کرد تا یک مدل یادگیری ماشین توسعه دهد که به آنها در پیشبینی میزان نیاز هفتهی آینده به هر یک از اقلام خواربار کمک کند، تا بتوانند بر همان اساس اقلام را مجدداً موجود کنند. آن شرکت مشاوره شش ماه زمان صرف کرد تا مدل را توسعه دهد. وقتی شرکت مشاوره مدل را تحویل داد، شرکتِ این مدیر آن را مستقر (عملیاتی) کرد و از عملکردش بسیار راضی بود. آنها در نهایت میتوانستند نزد سرمایهگذاران خود پز بدهند که شرکتی مبتنی بر هوش مصنوعی هستند. با این حال، یک سال بعد، ارقام آنها افت کرد. تقاضا برای برخی اقلام بهطور مداوم بیش از حد واقعی برآورد میشد که این امر باعث فاسد شدن اقلام اضافه میشد. همزمان، تقاضا برای برخی اقلام نیز بهطور مستمر کمتر از حد واقعی برآورد میشد که به از دست رفتن فروش منجر میشد. در ابتدا، تیم انبارداری آنها پیشبینیهای مدل را بهصورت دستی تغییر میدادند تا الگوهایی را که متوجه شده بودند اصلاح کنند، اما در نهایت، پیشبینیهای مدل آنقدر بد شد که دیگر نتوانستند از آن استفاده کنند. آنها سه راه پیش رو داشتند: - پرداخت مبلغی گزاف به همان شرکت مشاوره برای بهروزرسانی مدل - پرداخت پولی حتی بیشتر به یک شرکت مشاورهی دیگر (چون این شرکت جدید برای مسلط شدن به کار نیاز به زمان داشت) - یا استخدام یک تیم داخلی برای نگهداری از مدل از آن زمان به بعد شرکت او این درس مهم را با سختی فراوان آموخت؛ درسی که بقیهی فعالان این صنعت نیز در حال کشف آن هستند: استقرار یک مدل، پایان فرآیند نیست. عملکرد یک مدل بهمرور زمان در محیط عملیاتی افت میکند. هنگامی که یک مدل مستقر شد، ما همچنان باید بهطور مداوم بر عملکرد آن نظارت کنیم تا مشکلات را شناسایی کرده و برای رفع این مشکلات، بهروزرسانیهایی را مستقر کنیم. تغییر توزیع دادهها (Data Distribution Shifts) پدیدهای است که رخ میدهد که توزیع دادهها در محیط عملیاتی، با توزیع دادههایی که مدل در طول آموزش با آنها مواجه شده، متفاوت بوده و از آن فاصله بگیرد.
3 407
برای رفع خطای Antigravity
اول به آدرس زیر برید :
https://policies.google.com/country-association-form
احتمالا در این بخش نوشته شده Iran
As shown in Google’s Terms of Service, your account is associated with: Iranکمی پایین تر باید کشور رو تغییر بدید
Which region should your account be associated with instead?طبیعتا با VPN باید این مراحل رو انجام بدید و اینکه قبل از انتخاب کشور. باید بدونید VPN شما روی چه سروری هست بهتره از این سایت لوکیشن رو چک کنید https://www.iplocation.net/ به این خاطر هست که مثلا شما از سرور آلمان دارید استفاده میکنید ولی شاید لوکیشن واقعی آلمان نباشه! وقتی لوکیشن روچک میکنید . میزنه فنلاند یا هلند یا ترکیه یا ... بعد از چک کردن لوکیشن در این بخش کشور رو انتخاب کنید
Which region should your account be associated with instead?و در قسمت پایین تر گزینه I travel often رو انتخاب کنید و بعد سابمیت. معمولا بین ۲-۳ ساعت جواب میاد. جواب ایمیل به این صورت هست :
You recently sent us a request to ... to Netherlands. Previous country: Iran Current country: Netherlands
3 407
دوستان این گفتوگوی کیانوش مختاریان رو هم توصیه کردن:
https://www.youtube.com/watch?v=a4lriEKyTjc
3 407
نکته سوم: اجبار ایجاد کن!
خیلی از ماها، دوست داریم برای پیشرفتمون و بهبود ضعفهامون، کتابی بخونیم، دورهای ببینیم، تحقیقی انجام بدیم، فریمورکی یاد بگیریم و... اما مشکل اینجاست که مشغلهها نمیذارن ما این کارهای اختیاری رو اجرایی کنیم؛ یا اینکه شروع میکنیم، ولی به اتمام نمیرسونیم.
در چنین شرایطی، من هر وقت که تونستم برنامه اختیاری رو به شکلی به حالت اجبار دربیارم، نتیجه خوبی گرفتم. یک مثال میزنم.
یکسری کار عقبافتاده در خونه داشتم که باید رسیدگی میکردم. تصمیم گرفته بودم، جمعه صبح (امروز) انجام بدم. امروز قبل شروع کار، با خودم گفتم چطوره که حین کار یه پادکستی هم گوش بدم. توی یوتوب گشتم و ویدئوی بالا رو اتفاقی دیدم و گفتم همین رو گوش میدم.
من خیلی وقت پادکست ندارم. اهلش هم نیستم. اما، وقتی این دو تا رو به هم گره زدم، هم دو ساعت کار کردم و هم پادکست رو تا آخر گوش کردم. آخرای کارم اینطوری بود که میگفتم، خب هنوز پادکست تموم نشده، این دو تا کارم انجام بدم.
حالا، یکی ممکنه وظیفهش این باشه که خواهر/برادر/بچهش رو ببره کلاس و دو ساعت بعد هم بره دنبالش. شاید بتونه این دو ساعت رو همون اطراف، پارکی، فضای مطالعهای،کافهای پیدا کنه و اون کار اختیاری رو انجام بده.
3 407
امروز، گفتوگوی دوساعته کیانوش مختاریان (مدیر سابق گوگل) رو گوش کردم. بسیار بسیار برای من آموزنده بود. کاش میتونستم نکات مثبتش رو بنویسم.
ایشون، دو سالی هست به ایران برگشته و در شرکت یکتانت مشغول بود.
https://youtu.be/eIX97y3dT9c?si=DeqHss6NeKXbPY3x
3 407
Repost from آکادمی هوشمصنوعی هُوسم
3️⃣ ویدئوی تازه منتشرشده درباره یادگیری ماشین در یوتوب 👇
1️⃣ یادگیری ماشین چیست؟ کلیک کنید!
2️⃣ پیشنیازهای یادگیری ماشین (بررسی واقعبینانه و دقیق) کلیک کنید!
3️⃣ یادگیری ماشین بدون ریاضی و کدنویسی؟! کلیک کنید!
✅ ویدئوهای بیشتری با عنوان "یادگیری ماشین به زبان ساده" در راه است...
3 407
مدل Unlimited-OCR توسط baidu منتشر شد.
مدلی که برای شبیهسازی حافظه فعال انسان در پردازش اطلاعات طراحی شده است. با در نظر گرفتن DeepSeek OCR به عنوان مدل پایه، ما تمامی لایههای توجه (Attention Layers) در بخش رمزگشا را با مکانیسم پیشنهادی خود، یعنی «توجه پنجره لغزان مرجع» (Reference Sliding Window Attention یا به اختصار R-SWA) جایگزین کردهایم.
این روش ضمن ثابت نگهداشتن حجم حافظه پنهان در تمام طول فرآیند رمزگشایی، هزینههای محاسباتی را به شکل چشمگیری کاهش میدهد.
با ترکیب نرخ فشردهسازی بالای رمزگذار (Encoder) در DeepSeek OCR و طراحی حافظه پنهان ثابت در مدل جدید، Unlimited OCR میتواند دهها صفحه سند را تنها در یک مرحله پردازش مستقیم (Single Forward Pass) و تحت حداکثر طول استاندارد ۳۲ هزار توکن (32K) به طور کامل رونویسی کند.
مهمتر از همه، R-SWA یک مکانیسم توجهِ همهمنظوره است؛ به این معنی که فراتر از کاربرد OCR، میتوان از آن به طور یکسان در حوزههای دیگری مانند تشخیص خودکار گفتار (ASR)، ترجمه ماشین و سایر موارد مشابه نیز استفاده کرد.
https://huggingface.co/baidu/Unlimited-OCR
3 407
.
فصل هفتم کتاب Designing Machine Learning Systems از خانم Chip Huyen درباره کوانتیزیشن مدل:
برخی نمایش ۱ بیتی (بجای فلوت 32 بیتی پیشفرض) را برای هر وزن امتحان کردهاند (شبکههای عصبی با وزن باینری). به عنوان مثال BinaryConnect و XNOR-Net. نویسندگان مقاله XNOR-Net شرکت نوپای Xnor.ai را تاسیس کردند، استارتاپی که بر فشردهسازی مدل تمرکز داشت. در اوایل سال ۲۰۲۰، این شرکت توسط اپل با قیمتی گزارششده در حدود ۲۰۰ میلیون دلار تصاحب شد.شاید بدونید؛ کوفاندر شرکت xnor.ai آقای علی فرهادی بود. یولو 1، 2 و 3 هم یکی دیگه از کارهای درخشان در رزومه ایشون هست. لینکدین آقای فرهادی: https://www.linkedin.com/in/ali-farhadi-098430b1
3 407
معرفی شده از طرف یکی از دوستان:
https://aiengineeringfromscratch.com/prereqs.html از محتوای این سایت خیلی خوشم اومد چند روزه دارم باهاش پیش میرم سبک جالبی از یاد دادن مفاهیم و کدنویسی مربوط به ai engineer داره
3 407
توی این بیش از یک دههای که مشغول تدریس بودم، خدا رو شکر کامنتهای مثبت بسیار بسیار زیادی دریافت کردم. بعد از اینهمه سال، هنوز برام عادی نشده و از دیدنشون خوشحال میشم. اما، بعضی کامنتها در ذهنم موندگار میشه. مدالی که بهم داد رو خیلی دوست دارم. من برای آماده کردن محتواهام مثل اسلایدها، بیش از زمان نرمال وقت میذارم و خوشحالم که برای مخاطبم انقدر ارزش داره.
3 407
نمودار بالا، هیستوگرام پهنای تصاویر در یک دیتاست تصویری رو نشون میده. به نظرت اون میله بزرگ نشونه چی هست؟
به نظرم، بدون اینکه از چتبات کمک بگیری، بهش فکر کن و دلایلت رو لیست کن. جوابم رو در ادامه بهصورت مخفی گذاشتم.
اون میله بلند میگه که یک پهنا یا یک بازهای از پهناها بسیار پرتکرارتر از بقیه هست. حدسهایی میشه زد؛ معمولا، دخالتهای انسانی در دیتاست (مثلا در اینجا ریسایز کردن تصاویر، تصاویر ساختگی و ...) خودشون رو اینطوری نشون میدن.
اما برای اینکه از حدس به دلیل اصلی مشکل برسیم، باید تصاویر مرتبط با اون میله رو از توی دیتاست پیدا کنیم. مثلا، دلیل اینجا تصاویر ساختگی بود.
3 407
.
دوستان، به مناسبت ده سالگی هوسم، روی همه دورهها 40 درصد تخفیف گذاشتیم. مهلت تخفیف 12 امشب تموم میشه.
اگر هم با من و هوسم آشنا نیستید، یک نگاهی به لینک زیر بندازید:
https://t.me/pytorch_howsam/495
محبوبترین دورههامون از نگاه مخاطبین، "یادگیری ماشین" و "یادگیری عمیق" هست.
محبوبترین دوره خودم آموزش "پردازش تصویر با OpenCV" و "یادگیری ماشین" هست.
دورههای متفاوتمون هم "دیپ کاتالیست"، "LLM" و "مسابقه Kaggle" هستن.
لینک همه دورهها توی همون لینک بالایی هست.
3 407
فصل ششم کتاب Designing Machine Learning Systems از خانم Chip Huyen:
سیستمهای ML بخشی کد هستند و بخشی داده؛ بنابراین باید نهتنها کد، بلکه دادههای خود را نیز نسخهبندی کنید. نسخهبندی کد کموبیش در صنعت به یک استاندارد تبدیل شده است. اما در حال حاضر، نسخهبندیِ داده مثلِ «نخ دندان کشیدن» است؛ همه موافقند که کارِ خوبی است، اما کمتر کسی آن را انجام میدهد.نسخهبندی داده و مدیریت تغییرات داده کار واقعا مشکلی هست.
3 407
اگر به صورت زنده
میخواید پردازش تصویر ( ترک . سگمنت و ... ) انجام بدید
استریم های این وبسایت رایگان هست با کیفیت 1080
Уже доступно! Исследование Telegram 2025 — ключевые инсайты года 
