عصر گویش | هوش مصنوعی
📈 Аналітичний огляд Telegram-каналу عصر گویش | هوش مصنوعی
Канал عصر گویش | هوش مصنوعی (@asrgooyeshpardaz) у мовному сегменті Фарсі є активним учасником. На даний момент спільнота об'єднує 102 007 підписників, посідаючи 1 222 місце в категорії Технології та додатки та 2 956 місце у регіоні Іран.
📊 Показники аудиторії та динаміка
З моменту свого створення невідомо, проект продемонстрував стрімке зростання, зібравши аудиторію у 102 007 підписників.
За останніми даними від 03 липня, 2026, канал демонструє стабільну активність. Хоча за останні 30 днів спостерігається зміна кількості учасників на -1 126, а за останні 24 години на -32, загальне охоплення залишається високим.
- Статус верифікації: Не верифікований
- Рівень залученості (ER): Середній показник залученості аудиторії становить 1.92%. Протягом перших 24 годин після публікації контент зазвичай збирає 0.98% реакцій від загальної кількості підписників.
- Охоплення публікацій: В середньому кожен допис отримує 1 962 переглядів. Протягом першої доби публікація в середньому набирає 997 переглядів.
- Реакції та взаємодія: Аудиторія активно підтримує контент: середня кількість реакцій на один пост – 10.
- Тематичні інтереси: Контент зосереджений навколо ключових тем, таких як مدل, گفتار, بهطور, عامل, ابزار.
📝 Опис та контентна політика
Автор описує ресурс як майданчик для висловлення суб'єктивної думки:
“مجله هوش مصنوعی عصر گویش
021 61931000”
Завдяки високій частоті оновлень (останні дані отримано 04 липня, 2026), канал підтримує актуальність та високий рівень охоплення публікацій. Аналітика показує, що аудиторія активно взаємодіє з контентом, що робить його важливою точкою впливу в категорії Технології та додатки.
Триває завантаження даних...
| Дата | Залучення підписників | Згадування | Канали | |
| 04 липня | 0 | |||
| 03 липня | 0 | |||
| 02 липня | +15 | |||
| 01 липня | +8 |
| 2 | 🧠 چارچوب ASPIRE: سیستمی که به رباتها یاد میدهد از تجربیات خود درس بگیرند
سیستم ASPIRE که توسط تیم تحقیقاتی انویدیا توسعه یافته، یک چارچوب خودبهبوددهنده برای برنامهنویسی رباتهاست که برخلاف روشهای سنتی، تجربیات گذشته را دور نمیریزد و آنها را به مهارتهای قابل استفاده تبدیل میکند.
---
⚙️ سه مؤلفهی اصلی:
🔹 موتور اجرای پیشرفته که هر حرکت ربات را با جزئیات کامل ثبت میکند (از تصاویر دوربین گرفته تا مسیر حرکت و نقاط تماس) تا عامل بتواند دقیقاً تشخیص دهد کدام بخش از برنامه با خطا مواجه شده است.
🔹 کتابخانهی مهارتهای پویا که تعمیرات موفق را به صورت الگوهای قابل استفاده برای کارهای آینده ذخیره میکند، درست مثل یک دفترچهی راهنما که هر بار هوشمندتر میشود.
🔹 جستجوی تکاملی که در هر مرحله چندین راهحل متفاوت را امتحان میکند و بهترینها را برای نسل بعدی انتخاب مینماید.
---
📊 عملکرد چشمگیر در تستهای استاندارد:
در بنچمارک LIBERO-Pro که شامل وظایف دستکاری با اغتشاشات مختلف است، ASPIRE موفق شد در ۹۸ درصد موارد به هدف برسد، در حالی که روش قبلی فقط ۲۲ درصد موفقیت داشت. در وظایف دو دستی رباتیک، این سیستم ۹۲ درصد موفق بود در مقابل ۲۰ درصد روش پیشین. در وظایف پیچیدهتر خانگی با افق بلندمدت، ASPIRE توانست عملکرد را تا ۳۲ درصد نسبت به بهترین روشهای قبلی بهبود بخشد.
---
🌟 نکتهی برجسته: انتقال مهارت بدون نیاز به نمونه
جالبترین دستاورد ASPIRE، توانایی آن در استفاده از مهارتهای آموختهشده برای کارهایی است که قبلاً ندیده است. با کتابخانهای شامل ۹۰ مهارت مختلف، این سیستم در وظایف طولانی و کاملاً جدید موفقیت ۳۱ درصدی داشت، در حالی که روشهای قبلی با وجود صرف زمان بیشتر برای استدلال در حین اجرا، به سختی به ۴ درصد میرسیدند.
---
🔬 از شبیهساز تا دنیای واقعی
مهارتهایی که ASPIRE در محیط شبیهسازی یاد گرفته، بهخوبی به رباتهای واقعی منتقل شدهاند. برای نمونه، مهارت برداشتن قوطی نوشابه هزینهی پردازش را حدود ۱۰ برابر کاهش داد و موفقیت را از ۱۳ به ۱۹ مورد از ۲۰ رساند. همچنین مهارت باز کردن کشو موفقیت را از صفر به ۱۱ مورد از ۲۰ افزایش داد.
---
💡 مزیت اصلی ASPIRE
این سیستم به رباتها امکان میدهد که مانند انسانها از تجربیات خود درس بگیرند؛ هر بار که یک مشکل را حل میکنند، دانش جدیدی کسب میکنند که در آینده به کارشان میآید. این رویکرد نه تنها سرعت یادگیری را افزایش میدهد، بلکه رباتها را برای مواجهه با موقعیتهای جدید آمادهتر میسازد.
---
📌 محدودیتها:
هرچند ASPIRE پیشرفت چشمگیری داشته، اما هنوز برای استفادهی کاملاً مستقل در دنیای واقعی نیاز به نظارت دارد. همچنین عملکرد آن به شدت به قدرت مدل زبانی پشت صحنه وابسته است و هنوز نمیتوان از مدلهای کوچکتر با همان کیفیت استفاده کرد.
---
🔗 اطلاعات بیشتر:
📄 مقالهی کامل:
https://arxiv.org/abs/2607.00272
🌐 صفحهی پروژه:
https://research.nvidia.com/labs/gear/aspire/
---
#ASPIRE #رباتیک #یادگیری_مستمر #هوش_مصنوعی #انویدیا
🆔 @asrgooyeshpardaz | 501 |
| 3 | 🌟 بهروزرسانی مدل Leanstral 1.5 از Mistral AI – پیشرفت در اثباتهای صوری
میسترالایآی از نسخهی جدید مدل خود برای زبان Lean 4 رونمایی کرده است. این مدل به ریاضیدانان و توسعهدهندگان کمک میکند تا اثباتهای صوری (Formal Proofs) بنویسند و آنها را بهگونهای تأیید کنند که کامپایلر Lean بپذیرد.
---
⚙️ مشخصات فنی:
- معماری Mixture of Experts (MoE) با ۱۱۹ میلیارد پارامتر کلی و ۶.۵ میلیارد پارامتر فعال
- پنجرهی متنی ۲۵۶ هزار توکنی
- قابلیت دریافت ورودی چندوجهی (Multimodal)
- مجوز Apache 2.0
---
🎯 روش آموزش پیشرفته:
نسخهی ۱.۵ در دو محیط جداگانه آموزش مرحلهای دیده است:
۱. محیط اثبات قضیه – تعامل با کامپایلر Lean برای اثبات صحیح گزارههای ریاضی
۲. محیط برنامهنویسی واقعی – شبیهسازی رفتار یک برنامهنویس در مخازن کد
---
📊 نتایج چشمگیر در بنچمارکها:
- امتیاز ۱۰۰٪ در بنچمارک miniF2F (هم در مجموعهی اعتبارسنجی و هم آزمون)
- حل ۵۸۷ از ۶۷۲ مسئله در PutnamBench
- ثبت بهترین نتایج روز در مجموعههای FATE-H و FATE-X
---
💰 مزیت هزینهای قابلتوجه:
در بنچمارک PutnamBench، Leanstral 1.5 با ۷ مسئله بیشتر از سیستم Seed-Prover 1.5 موفق عمل کرده، در حالی که هزینهی حل هر مسئله حدود ۴ دلار است (در مقابل ۳۰۰+ دلار برای رقیب).
---
🐛 کشف باگهای واقعی:
در آزمون کدنویسی روی ۵۷ مخزن نرمافزاری، این سیستم موفق به شناسایی ۴۷ نقض در ویژگیهای کد شد که از این میان:
- ۱۱ مورد خطای واقعی بودند
- ۵ مورد قبلاً ناشناخته بودند
---
🔗 لینکهای مفید:
📄 پست وبلاگ
https://mistral.ai/news/leanstral-1-5
🤖 مدل در Hugging Face
https://huggingface.co/mistralai/Leanstral-1.5
🎮 نسخهی آزمایشی
https://huggingface.co/spaces/mistralai/Leanstral-1.5
---
#MistralAI #Leanstral #Lean4 #اثبات_صوري #هوش_مصنوعي #AI #ML
🆔 @asrgooyeshpardaz | 531 |
| 4 | 🧠 آندری کارپاتی از کدنویسی با هوش مصنوعی فاصله گرفت؛ حالا با آن «مغز دوم» میسازد
کارپاتی، همبنیانگذار OpenAI و مسئول سابق هوش مصنوعی تسلا، این روزها بهجای تولید کد، از مدلهای زبانی برای ساختن یک ویکی خودنگهدارنده استفاده میکند. او در توییتی که وایرال شد، از سیستمی پرده برداشت که در آن، هر پژوهش به یک پایگاه دانش متصل و پویا تبدیل میشود.
---
🔍 چالش RAG و راهحل کارپاتی
سیستمهای RAG (بازیابی با تولید افزوده) اطلاعات را تکهتکه میکنند و در هر سؤال، از صفر جستجو میکنند. اما کارپاتی این روش را کنار گذاشته است.
در سیستم او، مدل زبانی یکبار منابع خام را میخواند و آنها را به یک ویکی ساختاریافته تبدیل میکند. این ویکی شامل مقاله، بکلینک، دستهبندی و نمایه است. نتیجه؟ پاسخی که نیازی به جستجوی دوباره در انبوه داده ندارد.
---
🏛️ معماری سهلایه
🔹 لایهی اول: منابع خام
همهی مقالات، پژوهشها و دادهها در پوشهای به نام raw/ ذخیره میشوند. این پوشه، منبع نهایی حقیقت است و مدل هرگز آن را تغییر نمیدهد.
🔹 لایهی دوم: شِما (دستورالعملها)
فایلی مثل AGENTS.md به مدل میگوید که ویکی را چگونه بسازد؛ از قالب صفحات تا نحوهی پیوندزنی. این فایل، راهنمای شغلیِ مدل است.
🔹 لایهی سوم: خود ویکی
محصول نهایی؛ مدل، منابع خام را به صفحاتی از این نوع تبدیل میکند:
- صفحات موجودیت (افراد، سازمانها، پروژهها)
- صفحات مفهوم (ایدهها، روشها، نظریهها)
- خلاصهها، صفحات مقایسهای، سنتزها، نمایه (index.md) و گزارش تغییرات (log.md)
---
⚙️ سه عملیات اصلی
- ورود (Ingest) : با افزودن منبع جدید به raw/، مدل ۱۰ تا ۱۵ صفحه از ویکی را بهروزرسانی میکند. هیچ بازسازی کاملی انجام نمیشود.
- پرسش (Query) : مدل با خواندن صفحات مرتبط، پاسخ ترکیبی و دقیق میدهد، بدون نیاز به بردارها و جستجوی شباهت.
- پالایش (Lint) : مدل بهطور دورهای ویکی را برای یافتن تناقضات، صفحات یتیم یا شکافهای اطلاعاتی بررسی و آنها را اصلاح میکند.
---
📝 خروجیهای عملی
پاسخها فقط در پنجرهی چت خلاصه نمیشوند؛ کارپاتی آنها را بهصورت زیر دریافت میکند:
- صفحات مارکدان که دوباره به ویکی بازمیگردند (دانش انباشتهشونده)
- ارائههای اسلایدی با فرمت Marp
- نمودارها و جداول مقایسهای
نتیجه: هر بار که از سیستم استفاده میکنید، هوشمندتر میشود.
---
🛠️ چطور خودتان بسازید؟
۱. ابزار موردنیاز: اپ رایگان Obsidian را نصب کنید.
۲. ساختار پوشهها: دو پوشهی raw/ و wiki/ بسازید.
۳. گیرندهی محتوای وب: افزونهی Obsidian Web Clipper را نصب کنید.
۴. جمعآوری: ۵ تا ۱۰ مقاله در raw/ ذخیره کنید.
۵. فایل ایده: از گیتهاب کارپاتی، فایل AGENTS.md را کپی کنید.
۶. اجرای اول: از مدل زبانی بخواهید که ویکی را از روی منابع بسازد.
۷. پرسش و بازخورد: سؤال بپرسید و پاسخهای خوب را دوباره به ویکی اضافه کنید.
۸. نگهداری: هر چند هفته، درخواست پالایش (Lint) دهید تا ویکی بهروز بماند.
---
💡 چرا این روش بهتر است؟
برخلاف نشانکهای مرورگر، یادداشتهای پراکنده یا تاریخچهی چت، این سیستم ارتباطات را برای شما حفظ میکند. همچنین، منبع اصلی و دانش تفسیرشده از هم جدا هستند و هیچ وابستگی به سرویس ابری خاصی وجود ندارد.
---
🌟 چشمانداز آینده
کارپاتی اشاره میکند که میتوان از این ویکی برای تولید دادههای آموزشی مصنوعی و تنظیم دقیق یک مدل کوچکتر استفاده کرد؛ مدلی که تمام دانش حوزهی شما را درون وزنهای خود دارد.
بهقول یکی از کاربران: «هر کسبوکاری یک پوشهی raw/ دارد. اما هیچکس تا حالا آن را کامپایل نکرده است. خودِ این کامپایل، محصول نهایی است.»
---
منبع:
📄 مطالعهی کامل در Neural Notions
---
#آندری_کارپاتی #مغز_دوم #مدیریت_دانش #ویکی_هوشمند #هوش_مصنوعی_در_پژوهش #یادداشتبرداری_هوشمند
🆔 @asrgooyeshpardaz | 894 |
| 5 | 💻 رقیب تازهنفس برای کرسر و کوپایلت
شرکت چینی Z.ai بهتازگی از ابزار برنامهنویسی جدید خود با نام ZCode رونمایی کرده است. این محیط توسعه که بهصورت رایگان در دسترس قرار گرفته، برای سیستمعاملهای ویندوز، مک و لینوکس عرضه شده و رسماً به رقابت با ابزارهای محبوبی همچون Cursor، Claude Code و GitHub Copilot وارد شده است.
---
⚙️ ادغام با مدل قدرتمند متنباز
ابزار ZCode بهطور عمیق با مدل زبانی GLM-5.2 ادغام شده است. این ابزار فراتر از یک تکمیلکننده ساده کد عمل میکند و کل چرخه توسعه را مدیریت میکند؛ از برنامهریزی و کدنویسی گرفته تا بررسی کد، تست و استقرار. کاربر فقط کافی است نتیجه نهایی را شرح دهد تا عامل هوش مصنوعی، خودکار وظایف را به زیروظایف کوچکتر تقسیم کرده و آنها را اجرا کند.
---
📱 کنترل پروژه از طریق پیامرسانهای موبایل
یکی از ویژگیهای منحصربهفرد ZCode، امکان مدیریت و نظارت بر پروژه از راهدور از طریق پیامرسانهایی نظیر تلگرام، ویچت و فیشو است. برنامهنویسان میتوانند در هر زمان و مکان، پیشرفت کار عامل هوش مصنوعی را زیر نظر بگیرند و حتی دستورات جدید صادر کنند.
---
🇨🇳 استقلال کامل از زیرساختهای غربی
نکته چالشبرانگیز این فناوری، وابسته نبودن آن به سختافزارهای غربی است. مدل GLM-5.2 که قلب تپنده ZCode محسوب میشود، بهطور کامل روی تراشههای هوآوی (Ascend) آموزش دیده و توسعه یافته است و در این فرایند هیچ تراشهای از انویدیا استفاده نشده است. این اتفاق درست همزمان با اعمال محدودیتهای موقت دولت آمریکا روی مدلهای شرکت آنتروپیک (سازنده Claude) رخ داده و توجه شرکتهای بزرگ را به سمت جایگزینهای مستقل و متنباز جلب کرده است.
---
💰 قیمتگذاری رقابتی
ابزار ZCode با قیمتهایی بسیار ارزانتر از رقبای غربی عرضه شده است. برای مثال، پلن لایت این ابزار با قیمت حدود ۱۶ دلار در ماه ارائه میشود که در مقایسه با پلن ۲۰ دلاری کرسر، بهصرفهتر است. پلن مکس نیز با قیمت ۱۴۴ دلار در برابر پلن ۲۰۰ دلاری کرسر اولترا عرضه شده و گزینهی جذابی برای تیمهای حرفهای محسوب میشود. همچنین کاربران میتوانند از کلید API مدلهای دیگر مانند کلود و جمینی نیز در این ابزار استفاده کنند.
---
منبع: وبسایت رسمی ZCode
🆔 @asrgooyeshpardaz | 997 |
| 6 | 🌐اخبار هوش مصنوعی
🏛️ پیشنهاد جنجالی OpenAI: ۵٪ سهام به دولت آمریکا
سم آلتمن به دولت پیشنهاد داده که ۵ درصد از سهام OpenAI را به دولت واگذار کند تا صندوق ملی هوش مصنوعی تشکیل شود. این طرح شامل سهمهایی از سایر شرکتهای آمریکایی نیز هست.
مدل آن، صندوق دائمی آلاسکا است؛ درآمدهای حاصل از هوش مصنوعی مستقیماً به جیب شهروندان عادی خواهد رفت. اما منتقدان میگویند این اقدام، نوعی بیمهی ناگفتهی دولتی در برابر ورشکستگی احتمالی است.
اجرای این طرح، به تأیید کنگره نیاز دارد.
🔗 ft.com
---
📚 مخزن arXiv پس از ۲۵ سال از دانشگاه کرنل جدا شد
از اول ژوئیه، مخزن پیشچاپهای علمی arXiv به یک سازمان غیرانتفاعی مستقل تبدیل شده است. این استقلال، انعطافپذیری مدیریتی را افزایش میدهد، اما دسترسی رایگان و بدون تغییر باقی میماند.
بهزودی، سیاست جدید سانسور (مدراسیون) برای مقالات هوش مصنوعی اعلام خواهد شد. همچنین arXiv از مرز ۳ میلیون مقاله عبور کرده است.
🔗 arxiv.org
---
🎬 نوتبوکالام ویدیوهای عمودی کوتاه میسازد
ابزار هوش مصنوعی گوگل، قابلیت تولید خودکار ویدیوهای ۶۰ ثانیهای به سبک تیکتاک را اضافه کرده است. با تحلیل منابع کاربر، یک خلاصهی تصویری از موضوع موردنظر ساخته میشود.
این قابلیت ابتدا برای کاربران پلنهای Pro و Ultra در دسترس است و بهزودی برای حسابهای رایگان نیز فعال خواهد شد.
🔗 NotebookLM در شبکهی اجتماعی X
---
💼 مایکروسافت با سرمایهی ۲.۵ میلیارد دلار، یکپارچهساز هوش مصنوعی میسازد
شرکت جدید Frontier Company با ۶۰۰۰ مهندس و کارشناس، قرار است هوش مصنوعی را به فرایندهای کسبوکارها تزریق کند. برخلاف رقبا، این تیم به مدلهای خاصی وابسته نیست و ROI محور اصلی آن است.
مایکروسافت این واحد را بهعنوان یک پیمانکار مستقل معرفی کرده و از همکاری با غولهایی نظیر Accenture و PwC خبر داده است.
🔗 microsoft.com
---
🤖 ربات خانهدار Isaac 1 رونمایی شد
استارتاپ Weave Robotics از رباتی با قابلیتهای جمعآوری وسایل، تا کردن لباس، مرتبکردن تخت و بارزدن ماشین لباسشویی پرده برداشته است.
این ربات روی چرخ حرکت میکند، قدش تا اندازهی انسان بلند میشود و پوشش پارچهای دارد تا در برخورد با افراد ایمن باشد.
قیمت آن ۷۹۹۹ دلار یا ۴۴۹ دلار بهصورت ماهانه است و از پاییز در کالیفرنیا عرضه میشود.
🔗 weaverobotics.com
---
#OpenAI #arXiv #NotebookLM #Microsoft #ربات_هوشمند #AI #اخبار_فناوری
🆔 @asrgooyeshpardaz | 1 058 |
| 7 | اگر چپ در این میدان غایب باشد، سرمایهداری دیجیتال نه تنها به انباشت افسارگسیختۀ ثروت ادامه میدهد، بلکه نحوۀ تفکر نسلهای آینده را نیز برنامهمحور، در جهت منافع خود، مهندسی خواهد کرد.
زمان آن رسیده که چپ مدرن، «تسلط بر دژ» را در دستور کار قرار دهد؛ نه با ترس از فناوری، بلکه با تصاحب آن برای ساختن آیندهای انسانیتر و سوسیالیستیتر.
---
📎 منبع اصلی:
BreakThrough News
✍️ نویسنده: رزگار اکراوی (پژوهشگر و نظریهپرداز «چپ الکترونیک»)
🆔 @asrgooyeshpardaz | 32 |
| 8 | فراخوان چپ برای فتح «دژ دیجیتال» سرمایهداری
*مروری بر مقالۀ رزگار اکراوی، نظریهپرداز «چپ الکترونیک» (منتشرشده در BreakThrough News - اول ژوئیه ۲۰۲۶)*
---
۱. معمای بزرگ قرن بیستویکم
اگر چپ همچنان با تاکتیکهای خیابانی و شعارهای قرن بیستم به میدان بیاید، در برابر سرمایهداری هوشمند قرن بیستویکم حرفی برای گفتن نخواهد داشت. امروز الگوریتمها هستند که رسانه را میسازند، هوش مصنوعی است که بازار کار و آموزش را بازتعریف میکند، و دادههای کلان هستند که سیاستهای اقتصادی را تدوین میکنند.
پرسش وجودی این است: جامعهای که هنوز با ساختارهای سنتی سازماندهی میشود، چگونه میتواند با سیستمی بجنگد که سلاحهایش را از «ابررایانهها» گرفته است؟
۲. شکاف فنی نیست؛ شکاف «درک راهبردی» است
بسیاری تصور میکنند مشکل چپ، «نبودِ برنامهنویس» یا «ضعف تکنولوژیک» است؛ اما عمیقتر از این حرفهاست. مسئله این است که هنوز فضای دیجیتال را بهعنوان یک «میدانِ نبردِ طبقاتی» نمیشناسیم. سرمایهداری در این فضا، ذهنها را هدایت، رفتارها را استاندارد و نیروی کار را تحت سلطه میگیرد، در حالی که چپ همچون تماشاگری حاشیهنشین، فقط از بیرون نق میزند. پر کردن این خلأ، دیگر یک «امتیاز» نیست؛ شرط بقای چپ است.
۳. فناوری، سدی در برابر بحرانهای سرمایهداری
سرمایهداری هر بار که به زمین میخورد، از علم و فناوری بهعنوان «عصای جادویی» استفاده میکند تا خود را نجات دهد، بیآنکه به هستۀ استثماریاش دست بزند:
- بحران ۲۰۰۸: با تکنیکهای مالی پیچیده، بانکها نجات یافتند، اما هزینۀ ورشکستگی بر دوش کارگران ماند.
- پاندمی ۲۰۲۰: با اتوماسیون و دورکاری، خط تولید بدون توقف به کار خود ادامه داد، سود شرکتها چند برابر شد، اما میلیونها کارگر با امنیت شغلی متزلزل مواجه شدند.
- اوجگیری هوش مصنوعی (۲۰۲۳ به بعد): بازاریابی برای حذف مشاغل و تمرکز ثروت در دستان چند ابرشرکت؛ این بار، هوش مصنوعی جانشین نیروی انسانی میشود تا سود بیشتری انباشته شود.
جالب اینجاست که در مواقع بحران، سرمایهداری حتی ایدههای سوسیالیستی مثل «دولت مداخلهگر» را قرض میگیرد، اما به محض عبور از بحران، از آن عقبنشینی کرده و سلطه را با لباسی مدرنتر از سر میگیرد.
۴. انحصار بزرگتر از دولتها
قدرت دیجیتال امروز در انحصار معدود غولهایی است که زیرساختهای ابری، دادههای جهانی و موتورهای جستوجو را قبضه کردهاند. این شرکتها، قدرتی فراتر از بسیاری از دولتهای ملی پیدا کردهاند. آنها نه تنها بر اقتصاد، که بر فرهنگ، آموزش و حتی حافظۀ تاریخی جوامع تسلط دارند.
۵. از «کاربر منفعل» به «تولیدکنندۀ جایگزین» برسیم
نسل جوان امروز در دل همین فناوری رشد کرده است. اگر چپ نتواند با زبان و ابزار این نسل حرف بزند، بهطور طبیعی طرد خواهد شد. سرمایهگذاری روی ابزارهای علمی، بهمعنای همذاتپنداری با ارزشهای سرمایهداری نیست؛ بلکه تاکتیکی برای تغییر موازنۀ قدرت است.
ما باید از حالت «کاربری که قوانین پلتفرمها را میپذیرد» خارج شده و به «تولیدکنندۀ جایگزین» تبدیل شویم؛ یعنی:
- هوش مصنوعی مردمی با نظارت اجتماعی بهجای هوش مصنوعی انحصاری.
- تعاونیهای دیجیتال که در آنها داده و دانش، کالای عمومی است، نه ابزار سوداگری.
- پلتفرمهای متنباز که الگوریتمهایشان در شفافیت کامل قرار دارد و در خدمت نیازهای واقعی انسانهاست، نه هوسهای بازار و نظامیگری.
۶. «دژ» را بشکنیم؛ نه اینکه پشت دیوارهایش بنشینیم و فریاد بزنیم
نویسنده بهصراحت هشدار میدهد: ایستادن در بیرون دژ دیجیتال و فریاد زدن بر سر استثمار، هیچ تغییری ایجاد نمیکند و چپ را در «گتوهای فکری» کهنه منزوی خواهد کرد.
درست همانطور که مارکس و انگلس فلسفه و علم اقتصاد زمان خود را از یک توجیهگر وضع موجود، به «سلاح تئوریک» برای کارگران تبدیل کردند، امروز نیز وظیفه داریم وارد قلب الگوریتمها شویم، منطقشان را بفهمیم، آنها را بر هم بزنیم و از نَظَر تا به عمل، بازسازیاش کنیم.
۷. هشدار؛ فناوری جای سازماندهی انسانی را نمیگیرد
بله، هوش مصنوعی ابزاری کارآمد برای تحلیل، هماهنگی و روشنگری است. اما هرگز جای «همبستگی انسانی» و «کار مردمی» را که موتور اصلی تغییرات اجتماعی است، نخواهد گرفت. قدرت واقعی در «انسانِ سازمانیافته» نهفته است که میتواند این ابزارها را در مسیر رهایی بهکار گیرد.
---
📌 خلاصه و جمعبندی:
نبردی که امروز در الگوریتمها جریان دارد، تنها بر سر «تکنولوژی» نیست؛ این نبرد بر سر آیندۀ کار، دموکراسی، فرهنگ و عدالت اجتماعی است. | 1 014 |
| 9 | 🧠 روش AutoMem: یادگیری خودکار حافظه بهعنوان یک مهارت شناختی
عاملهای هوش مصنوعی در وظایف بلندمدت (Long-Horizon) معمولاً به دلیل ضعف در مدیریت حافظه شکست میخورند، نه به خاطر ناتوانی در استدلال. مقالهی جدیدی از دانشگاه استنفورد با رویکردی تازه این مشکل را حل کرده است.
---
⚡ نتیجهی کلیدی:
مدل ۳۲ میلیارد پارامتری با استفاده از AutoMem، ۲ تا ۴ برابر سریعتر عمل کرده و به عملکردی در سطح مدلهای پیشروی اختصاصی مانند Claude Opus 4.5 و Gemini 3.1 Pro Thinking رسیده است.
---
🔧 ایدهی اصلی:
بهجای اینکه همهچیز را در پنجرهی متن (Context) بریزد، عامل یاد میگیرد که:
• چه چیزی را ذخیره کند
• چطور آن را کدگذاری نماید
• کی دادهی موردنیاز را بازیابی کند
• چطور ساختار حافظه را پس از تجربه تغییر دهد
---
🔄 روش AutoMem در دو حلقه:
۱. بهبود ساختار حافظه – یک مدل قوی، مسیرهای اجرایی را مرور کرده و ساختار فایلها، پرامپتها و منطق حافظه را بهصورت خودکار بازنویسی میکند.
۲. بهبود مهارت حافظه – تصمیمهای خوب حافظه از میان هزاران مرحله شناسایی شده و بهعنوان دادهی آموزشی برای مدل استفاده میشوند.
---
🎮 آزمایش روی بازیهای پیچیده:
این روش روی سه محیط بازی Crafter، MiniHack و NetHack آزمایش شده است:
• عامل با استفاده از سیستم فایل بهعنوان حافظهی خارجی عمل میکند
• عملیات ثبت (LOG) و برنامهریزی (PLAN) را در کنار اقدامات اصلی انجام میدهد
• هر تصمیم حافظه، قابل ردیابی و بهینهسازی است
---
💡 چرا مهم است؟
بسیاری از وظایف بلندمدت نه به دلیل ضعف استدلال، بلکه به دلیل حافظهی ضعیف شکست میخورند. عامل یا زمینه را فراموش میکند، دادههای زائد ذخیره میکند، یا نمیتواند بهموقع اطلاعات موردنیاز را بازیابی کند. AutoMem این گلوگاه را بدون نیاز به آموزش مجدد کامل برای هر وظیفه، برطرف میکند.
---
📄 مقاله:
https://arxiv.org/abs/2607.01224
🌐 پروژه:
https://autolearnmem.github.io/
---
#AutoMem #پژوهش_هوش_مصنوعی #عامل_هوشمند #مدیریت_حافظه #یادگیری_تقویتی
🆔 @asrgooyeshpardaz | 1 105 |
| 10 | ⚡️ مدل Claude Sonnet 5: هزینهی نهایی بالاتر، با وجود قیمت پایینتر هر توکن
مدل جدید آنتروپیک با وجود قیمت تبلیغاتی مناسب، به دلیل مصرف توکن بسیار بیشتر، هزینهی نهایی هر وظیفه را نسبت به Sonnet 4.6 حدود ۲ برابر و نسبت به Opus 4.8 حدود ۱۵٪ افزایش داده است.
---
💰 قیمتگذاری (تا ۳۱ آگوست ۲۰۲۶):
ورودی: ۲ دلار | خروجی: ۱۰ دلار به ازای هر میلیون توکن
(از ۱ سپتامبر: ۳ دلار ورودی و ۱۵ دلار خروجی)
---
⚠️ محدودیت دسترسی کاربران ایرانی:
همزمان با عرضهی این مدل، حسابهای کلود بسیاری از کاربران ایرانی مسدود شده و روند تشخیص و برخورد با اکانتهای ایرانی بهشدت تشدید یافته است. این در حالی است که مدل Fable 5 نیز که دسترسی عمومی آن مجدداً باز شده، با محدودیتهای مشابهی برای کاربران ایرانی روبهرو بوده است.
---
#Claude #Anthropic #هزینه_هوش_مصنوعی #محدودیت_دسترسی
🆔 @asrgooyeshpardaz | 1 189 |
| 11 | 🌐اخبار هوش مصنوعی
⚡️ بهینهسازی استنتاج ChatGPT؛ هزینهها بیش از نصف کاهش پیدا کرد
اوپنایآی هزینهی استنتاج (Inference) نسخهی تحتوب ChatGPT را برای کاربران بدون حساب کاربری بیش از دو برابر کاهش داده. جالب اینکه برای پردازش کل ترافیک مهمان، فقط به چند صد GPU انویدیا نیاز است.
این جلسات بدون حساب، از قابلیتهای محدود برخوردارند و هنوز مشخص نیست که این بهینهسازی به کاربران احرازهویتشده هم تعمیم پیدا میکند یا خیر. جزئیات فنی نیز فاش نشده است.
🔗 theinformation.com
---
☁️ متا خوشههای هوش مصنوعی خود را اجاره میدهد
متا قصد دارد مانند اسپیسایکس که GPUهای ایکسآیرا به انتروپیک و گوگل اجاره میدهد، دسترسی به خوشههای ابری و مدلهای مستقرشدهاش را به مشتریان خارجی ارائه کند.
بودجهی زیرساختی امسال این شرکت ۱۴۵ میلیارد دلار است و برای تأمین منابع، پیشتر تعدیل نیرو انجام داده است. این حرکت نشان میدهد که آموزش داخلی مدلها، دیگر ۱۰۰٪ ظرفیت را مصرف نمیکند.
🔗 bloomberg.com
---
📱 ایلان ماسک گوشی هوشمند میسازد
اسپیسایکس از نمونهی اولیهی گوشی هوشمندی رونمایی کرده که از پردازندهی کوالکام اسنپدراگون با یکپارچگی سیستمی مدلهای xAI استفاده میکند و روی سیستمعامل اختصاصی خودش اجرا میشود.
هدف از این کار، اجرای ابربرنامهای (سوپر اپ) به سبک ویچت و دورزدن انحصار اپل و گوگل است. سیستمعامل اختصاصی به ماسک امکان کنترل مستقیم توزیع و کسب درآمد از محصولات موبایل xAI را میدهد. این پروژه در مراحل اولیه قرار دارد.
🔗 wsj.com
---
🖥️ پلتفرم Base44 مدل اختصاصی خود را روی لاگهای توسعه آموزش داد
پلتفرم Base44 که متعلق به ویکس است، مدل Base 1 را بر پایهی تلمتری و لاگهای داخلی توسعه آموزش داده و در محیط تولید مستقر کرده است.
این مدل در بحثهای منطقی مشارکت میکند، اقدامات کاربر را پیشبینی مینماید و راهحلهای بنبست معماری را فیلتر میکند. پلتفرم از مسیریابی خودکار برای توزیع درخواستها بین Base 1 و سایر مدلها بر اساس نوع وظیفه استفاده میکند.
دادههای آموزشی شامل دهها میلیون جلسه شامل پرامپتهای اولیه، کد تولیدشده، خطاهای زمان اجرا، اصلاحات دستی و نشانههای استقرار موفق است. معماری و نتایج بنچمارکها در هفتههای آینده منتشر خواهد شد.
🔗 base44.com
---
🏠 رونق هوش مصنوعی هزینههای زندگی در سانفرانسیسکو را نجومی کرد
قیمت متوسط هر خانه در سانفرانسیسکو به ۱٫۷ میلیون دلار و اجارهی ماهانه به ۳٬۸۲۷ دلار رسیده است. در نتیجه، متخصصان با درآمد زیر ۲۰۰ هزار دلار در حال ترک این شهر هستند.
نمونهی بارز: زوجی با درآمد ترکیبی ۳۶۵ هزار دلار، پس از سه ماه نتوانستند آپارتمانی با اجارهی زیر ۵٬۰۰۰ دلار پیدا کنند. در نهایت مهندس به منطقهی دریاچهی تاهو و همسرش (مسئول جذب نیرو) به یک اتاق ۱٬۶۵۰ دلاری نقل مکان کردند.
در سیلیکون ولی، گروهی ۱۰ هزار نفره با ثروتی بیش از ۲۰ میلیون دلار شکل گرفته است. فروش ثانویهی سهام نیز بر قیمتها تأثیر گذاشته، بهطوری که ۷۵ کارمند اوپنایآی در پاییز گذشته بهطور میانگین ۳۰ میلیون دلار از این راه به دست آوردند.
کارشناسان پیشبینی میکنند که عرضهی اولیه (IPO) اوپنایآی و انتروپیک، افزایش بیشتر قیمت مسکن در این منطقه را به دنبال خواهد داشت.
🔗 nytimes.com
---
#هوش_مصنوعی #اقتصاد_هوش_مصنوعی #اوپن_ای_آی #متا #ایلان_ماسک #هزینه_زندگی #اخبار_فناوری
🆔 @asrgooyeshpardaz | 1 090 |
| 12 | ✅ معماری جدید Cognition هزینهٔ کدنویسی رو ۳۵٪ کاهش داده است
آزمایشگاه آمریکایی هوش مصنوعی کاربردی، از معماری ترکیبی Devin Fusion برای خودکارسازی کدنویسی رونمایی کرده است.
این سیستم در بنچمارک FrontierCode، بدون افت کیفیت، هزینهٔ تولید کد رو ۳۵٪ پایین میآورد.
---
🧠 مکانیزم کار Devin Fusion:
از دو مؤلفهٔ کلیدی استفاده میکنه: مسیریابی پویا و همنشینی هوشمند.
سیستم بهصورت لحظهای پیچیدگی تسک رو ارزیابی میکنه و درخواستها رو بین مدلهای سنگین و سبک جابهجا میکنه؛ همزمان با فشردهسازی متن (Context Compression).
· مدل سنگین (LLM بزرگ) مسئولیت برنامهریزی معماری، شفافسازی نیازمندیها و انجام بازبینی (Review) رو بر عهده داره.
· عامل سبک (Agent کوچک) کد پایه رو مینویسه، تستها رو مینویسه و خروجیها رو اعتبارسنجی میکنه.
برای جلوگیری از تداخل، هر مدل از کش مجزای متن استفاده میکنه.
---
📊 آمار و ارقام:
· در ترکیب با GPT-5.5 و Claude 4.8 Opus، این معماری بیش از یکسوم منابع رو ذخیره میکنه.
· با Fable 5 این صرفهجویی به ۴۱٪ هم میرسه.
· داخل خود Cognition، این مسیریابی ترکیبی، ۸۸٪ از Pull Requestهای موفق رو پوشش داده.
---
⚠️ محدودیتها:
· در پروژههایی با منطق پیچیدهٔ کسبوکاری (مثل ترکیب React/Redux) عملکرد سیستم محدود میشه.
· واگذاری بیشازحد تسکهای چندفایلی به مدل کوچکتر، کارایی رو نزدیک به نصف کاهش میده.
---
🔗 Devin Fusion فقط روی پلتفرم Cognition دردسترسه.
---
#news #ai #ml #DevinFusion #کدنویسی_هوشمند
---
🆔 @asrgooyeshpardaz | 1 025 |
| 13 | 🔥 سری جدید مدلهای ASR فارسی از Reza2kn منتشر شد!
یک مجموعه کامل شامل مدل، دیتاست و بنچمارک برای پردازش گفتار فارسی، روانهٔ Hugging Face شد.
---
🎙️ خانوادهٔ مدلهای Shenava-1 (با معماری FastConformer Hybrid RNNT/CTC)
خانوادهٔ شنوا در سه سایز طراحی شده تا هم کیفیت و هم سرعت را پوشش بدهد:
· مدل Koochik با ۱۱۴ میلیون پارامتر، پرچمدار این مجموعه است. این مدل با WER معادل ۷.۴۹٪ و CER برابر ۲.۳۰٪ روی دیتاست golden-6669، موفق شده رتبهٔ #۲ را در بنچمارک عمومی کسب کند و فقط از مدل ابری Gemini عقبتر است.
· مدل Rizeh با ۳۲ میلیون پارامتر، گزینهٔ میانی محسوب میشود و عملکرد بسیار خوبی با WER برابر ۱۲.۱۱٪ و CER معادل ۳.۹۴٪ ارائه میدهد.
· مدل Rizeh-Pizeh با تنها ۶.۹ میلیون پارامتر، فوقکوچک و فوقسریع است. با وجود اندازهٔ جیبی، WER آن ۲۴.۵۵٪ و CER آن ۸.۸۹٪ است و بهصورت Real-Time روی پردازندهٔ Cortex-A7 هم اجرا میشود.
✅ جالب اینجاست که مدل Koochik v1.0 با تنها ۱/۱۳ حجم مدل ۱.۵ میلیاردی Whisper-Persian، توانسته آن را با بیش از ۲ برابر WER بهتر شکست بدهد و به بهترین مدل on-device فارسی تبدیل شود.
---
📊 دیتاستهای منتشر شده:
🔹 persian-asr-relabeled-gemini
یک دیتاست شامل بازبرچسبزنی حرفهای دیتاستهای موجود ASR فارسی با استفاده از Gemini 3.5-flash که کیفیت برچسبها را به طرز چشمگیری بالا برده است.
🔹 persian-asr-text-2.69M-deduped
یک منبع عظیم شامل ۲.۶۹ میلیون جملهٔ فارسی کاملاً منحصربهفرد (بدون هیچ تکراری) که برای آموزش و فاینتیون مدلهای زبانی و گفتاری بسیار ارزشمند است.
---
🏆 بنچمارک تخصصی:
Persian ASR Double-Benchmark
یک محیط استاندارد و منصفانه برای مقایسهٔ مدلهای مختلف ASR فارسی که فرآیند نرمالسازی اعداد و ITN را هم پوشش میدهد.
---
🔗 لینکهای دسترسی مستقیم:
📌 مدلها:
https://huggingface.co/Reza2kn/Shenava-Koochik-v1.0
https://huggingface.co/Reza2kn/Shenava-Rizeh-v1.0
https://huggingface.co/Reza2kn/Shenava-Rizeh-Pizeh-v1.0
📌 دیتاستها:
https://huggingface.co/datasets/Reza2kn/persian-asr-relabeled-gemini
https://huggingface.co/datasets/Reza2kn/persian-asr-text-2.69M-deduped
📌 بنچمارک:
https://huggingface.co/spaces/Reza2kn/persian-asr-double-benchmark
---
#پردازش_گفتار #ASR #هوش_مصنوعی #پایتون #NLP #PersianASR #Shenava
🆔 @asrgooyeshpardaz | 962 |
| 14 | ⚡️ آمریکا محدودیتهای صادراتی مدلهای Fable 5 و Mythos 5 را لغو کرد
وزارت بازرگانی ایالات متحده بهطور رسمی محدودیتهای اعمالشده بر روی Claude Fable 5 و Mythos 5 را برداشته است.
شرکت Anthropic تأیید کرده که دسترسی کامل به این مدلها از فردا برای کاربران آزاد میشود.
تیم سازنده نیز از شکیبایی کاربران در دوران توقف اجباری خدمات تشکر کرده و از تمام متخصصانی که در راهاندازی مجدد سیستمها همکاری داشتند، قدردانی نموده است.
پیشبینی میشود بهزودی پچنوتهایی با اطلاعات تکمیلی منتشر شده و برنامههای آیندهی این خانواده از مدلها اعلام شود.
---
#Anthropic #Claude #هوش_مصنوعی #اخبار_فناوری #آزادسازی_مدل
🆔 @asrgooyeshpardaz | 805 |
| 15 | ⚡️ آمریکا محدودیتهای صادراتی مدلهای Fable 5 و Mythos 5 را لغو کرد
وزارت بازرگانی ایالات متحده بهطور رسمی محدودیتهای اعمالشده بر روی Claude Fable 5 و Mythos 5 را برداشته است.
شرکت Anthropic تأیید کرده که دسترسی کامل به این مدلها از فردا برای کاربران آزاد میشود.
تیم سازنده نیز از شکیبایی کاربران در دوران توقف اجباری خدمات تشکر کرده و از تمام متخصصانی که در راهاندازی مجدد سیستمها همکاری داشتند، قدردانی نموده است.
پیشبینی میشود بهزودی پچنوتهایی با اطلاعات تکمیلی منتشر شده و برنامههای آیندهی این خانواده از مدلها اعلام شود.
---
#Anthropic #Claude #هوش_مصنوعی #اخبار_فناوری #آزادسازی_مدل
🆔 @asrgooyeshpardaz | 4 |
| 16 | 📉 اوپنایآی هزینههای استنتاج را به بیش از نصف کاهش داد
طبق گزارش The Information، اوپنایآی موفق شده هزینهی استنتاج (Inference) برخی مدلهای موجود خود را بیش از دو برابر کاهش دهد. نکتهی جالبتر اینکه ترافیک ChatGPT بدون نیاز به ورود به حساب کاربری، تنها با چند صد GPU انویدیا مدیریت میشده است.
---
⚙️ محتملترین روشهای بهینهسازی:
🔹 کوانتیزاسیون – کاهش دقت اعداد برای مصرف کمتر حافظه
🔹 بهبود در KV-Cache – مدیریت بهینهتر حافظهی نهان
🔹 بچینگ (Batching) – پردازش همزمان چندین درخواست
🔹 رمزگشایی پیشبینیکننده (Speculative Decoding) – تولید سریعتر توکنها
🔹 مسیریابی هوشمند – ارسال درخواستهای ساده به مدلهای ارزانتر
---
💰 اهمیت استراتژیک:
اگر این گزارش صحت داشته باشد، اوپنایآی به ابزاری رقابتی قدرتمند دست یافته است. هزینهی کمتر یعنی:
- حاشیهی سود بالاتر
- امکان افزایش محدودیتهای استفاده برای کاربران
- کاهش فشار بر قیمتگذاری API و ارائهی تعرفههای رقابتیتر
---
📊 نگاه به اعداد:
حاشیهی سود ناخالص تعدیلشدهی اوپنایآی از ۴۰٪ در سال ۲۰۲۴ به ۳۳٪ در سال ۲۰۲۵ کاهش یافته بود (پس از چهار برابر شدن هزینههای استنتاج). اما در سهماههی اول ۲۰۲۶، این رقم به ۳۹٪ رسیده و هدف شرکت رسیدن به ۵۲٪ تا پایان سال است.
در سوی مقابل، Anthropic حاشیهی سودی حدود ۴۴٪ دارد. یعنی هر دو لابراتوار پیشروی هوش مصنوعی، هنوز با اقتصاد نرمافزارهای بالغ فاصلهی قابلتوجهی دارند.
---
📌 نکتهی کلیدی:
بهینهسازی هزینهی استنتاج، یکی از مهمترین نبردهای رقابت در بازار هوش مصنوعی است. شرکتی که بتواند همان کیفیت را با هزینهی کمتر ارائه دهد، هم در جذب کاربران و هم در سودآوری پیروز میدان خواهد بود.
---
🔗 منبع: The Information
---
#اوپنایآی #بهینهسازی_هزینه #هوش_مصنوعی #استنتاج #رقابت_در_هوش_مصنوعی
🆔 @asrgooyeshpardaz | 776 |
| 17 | اخبار هوش مصنوعی
⌨️ اوپنایآی از کیبورد اختصاصی برای Codex رونمایی میکند
اوپنایآی بههمراه شرکت تولیدکنندهی تجهیزات جانبی Work Louder، کیبوردی مخصوص توسعهدهندگان به نام Codex تولید میکند. معرفی رسمی و انتشار مشخصات فنی آن برای ۱۵ ژوئیه برنامهریزی شده است.
بر اساس تصویر منتشرشده، این کیبورد بر پایهی مدل مینیاتوری Creator Micro 2 ساخته شده. نسخهی پایه دارای ۱۳ کلید مکانیکی، یک جویاستیک آنالوگ و پنلهای لمسی برای تنظیم ماکروها و دستورات سریع است.
پیشبینی میشود این دستگاه با مدلهای اوپنایآی یکپارچگی سختافزاری داشته باشد و امکان تولید کد و فراخوانی دستیارهای هوش مصنوعی را با یک فشار کلید فراهم کند.
🔗 صفحه OpenAI Developers در شبکهی اجتماعی X
---
🔬 انتروپیک از محیط محاسبات علمی Claude Science رونمایی کرد
محیط Claude Science یک محیط هوش مصنوعی برای پژوهشهای علمی است که بیش از ۶۰ مهارت تخصصی در حوزههای ژنومیک، پروتئومیک و شیمیاطلاعات ارائه میدهد.
این پلتفرم با Nvidia BioNeMo یکپارچه شده و به مدلهایی مانند Evo 2، Boltz-2 و OpenFold3 دسترسی دارد. Claude Science امکان تحلیل مقالات، مصورسازی دادهها و نگارش پیشنویس مقاله را فراهم میکند و یک عامل تأییدکننده، صحت محاسبات و ارجاعات را بررسی میکند.
این برنامه بهصورت محلی روی macOS یا لینوکس اجرا شده و به سرورهای راهدور متصل میشود. دادههای حساس در زیرساخت داخلی باقی میمانند و فقط زمینهی ضروری به مدل ابری ارسال میشود. بار پردازشی از یک تا صدها GPU قابل مقیاسسازی است.
نسخهی بتا برای کاربران پلنهای Pro، Max، Team و Enterprise در دسترس است. انتروپیک تا ۱۵ ژوئیه، ۵۰ کمکهزینهی ۳۰٬۰۰۰ دلاری بهصورت اعتبار محاسباتی توزیع میکند.
🔗 anthropic.com
---
🇨🇳 عرضهی LongCat-2.0: اولین مدل زبانی آموزشدیده روی تراشههای چینی
شرکت چینی Meituan از مدلی با ۱٫۶ تریلیون پارامتر و پنجرهی متنی ۱ میلیون توکن رونمایی کرده است. چرخهی کامل پیشآموزش و استنتاج این مدل روی خوشهای از ۵۰٬۰۰۰ تراشهی بومی ASIC انجام شده است.
تأمینکنندهی شتابدهندهها فاش نشده، اما استفاده از کتابخانهی HCCL به معماری Huawei اشاره دارد. پیشتر از سختافزار محلی بیشتر برای استنتاج استفاده میشد و آموزش، نقطهی ضعف محسوب میگشت.
بر اساس آزمونها، LongCat-2.0 در کدنویسی و سناریوهای عاملمحور از Gemini 3.1 Pro پیشی گرفته و در بنچمارکهای Terminal-Bench 2.1 و SWE-Bench Pro عملکرد بهتری دارد. این مدل همچنان از GPT-5.5 و Claude 4.8 Opus عقبتر است.
سرویس LongCat-2.0 از طریق API Meituan و OpenRouter قابل دسترس است و وزن مدل بهزودی روی Hugging Face منتشر خواهد شد.
🔗 longcatai.org
---
🎨 تولید تصویر در Gemini برای کاربران آمریکایی رایگان شد
گوگل دسترسی رایگان به تولید تصویر شخصیسازیشده در Gemini را برای کاربران عادی در ایالات متحده باز کرده است. پیشتر این ابزار که بر پایهی موتور Nano Banana کار میکرد، فقط برای پلنهای Plus، Pro و Ultra در دسترس بود.
برای درک زمینه، Gemini دادههای Gmail، YouTube، تاریخچهی جستجو و Google Photos را تحلیل میکند. این سیستم بهطور مستقیم تصاویر کاربر را از فضای ابری دریافت میکند و نیاز به بارگذاری دستی را برطرف میسازد.
این قابلیت در چارچوب ابزار Personal Intelligence اجرا میشود که از بهار امسال در حال گسترش است. کاربر خودش مشخص میکند که چه برنامههایی با دستیار یکپارچه شوند.
🔗 blog.google
---
🚗 فورد ۳۰۰ مهندس را پس از شکست در پیادهسازی هوش مصنوعی به کار بازگرداند
فورد پس از اجرای ناموفق سیستم بازرسی کیفیت خودکار، ۳۰۰ مهندس QA را دوباره به کار گرفته است. این شرکت پیشتر صدها دوربین بیناییماشین برای بررسی قطعات تولیدی نصب کرده بود تا انطباق آنها با الزامات طراحی را تأیید کند.
سیستمهای بیناییماشین به دادههای کافی دربارهی نقصهای واقعی و خاص دسترسی نداشتند. بیشتر متخصصان باتجربه پیش از آنکه تخصصشان مستند شده و به مجموعههای آموزشی منتقل شود، فورد را ترک کرده بودند.
اکنون مهندسان بازگشته مشغول جمعآوری داده، بازآموزی الگوریتمهای بیناییماشین و مربیگری کارکنان تازهکار هستند.
🔗 bbc.com
---
#هوش_مصنوعی #اخبار_فناوری #OpenAI #Anthropic #Meituan #Google #Ford #پیشرفت_هوش_مصنوعی | 714 |
| 18 | 🧩 راهنمای عملی الگوهای ترکیبی مدلهای زبانی (محلی + ابری)
دیگه لازم نیست بین استفاده از مدلهای محلی و ابری یکی رو انتخاب کنی! هر دو رو کنار هم قرار بده.
---
چالش اصلی کجاست؟
- مدلهای ابری قدرت استدلال بالایی دارند، اما حریم خصوصی را به خطر میاندازند.
- مدلهای محلی حریم خصوصی را حفظ میکنند، اما در پردازش وظایف پیچیده ضعیفتر عمل میکنند.
---
سه محور کلیدی در طراحی ترکیبی:
۱. جهت (Direction) – کدام مدل اول اقدام میکند؟ محلی یا ابری؟
۲. محرک (Trigger) – چه زمانی مدل ابری فراخوانی میشود؟ همیشه یا مشروط؟
۳. هدف (Purpose) – چرا جریان را تقسیم میکنیم؟ (حریم خصوصی، هزینه، تأخیر، قابلیت اطمینان)
---
۵ الگوی رایج ترکیبی:
۱. پالایش و حل (Sanitize‑and‑Solve) – محلی اطلاعات حساس را پاکسازی میکند، ابری مشکل انتزاعی را حل میکند.
۲. برنامهریزی و اجرا (Plan‑then‑Ground) – ابری برنامهی کلی میدهد، محلی روی دادههای واقعی اجرا میکند.
۳. ارجاع در کارهای سخت (Escalate‑on‑Hard) – محلی کارهای ساده را انجام میدهد، فقط کارهای پیچیده به ابری ارجاع میشود.
۴. پیشنویس و بازبینی (Draft‑then‑Refine) – محلی پاسخ سریع میدهد، ابری در پسزمینه آن را بهبود میبخشد.
۵. بازبینی متقابل (Cross‑Check) – هر دو مدل پاسخ میدهند و تطابق یا عدم تطابق آنها، تصمیمساز میشود.
---
مطالعهی موردی: ماشینظرفشویی را الان روشن کنم یا بعد؟
دادههای خصوصی (نامها، عادات خانوادگی، تعرفههای برق) در خانه نگهداری میشوند.
جریان کار سهمرحلهای:
۱. مرحلهی محلی (پالایش) – مدل Gemma 4 اطلاعات خصوصی را به یک مسئلهی برنامهریزی بینام تبدیل میکند (بدون نام دستگاه، افراد یا جزئیات خانه).
۲. مرحلهی ابری (استدلال) – مدل GPT-5.4 مسئلهی بینام را دریافت کرده و برنامهی زمانبندی را محاسبه میکند.
۳. مرحلهی محلی (زمینهسازی) – Gemma 4 نتیجه را به زبان خانگی برمیگرداند و پاسخ نهایی را به کاربر ارائه میدهد.
نتیجهی نهایی برای کاربر:
"ماشینظرفشویی را دیرتر روشن کن. برای صرفهجویی در هزینه، تا ساعت ۸ امشب صبر کن. شارژر برق خودرو نیز برای نیمهشب برنامهریزی شده تا از کمترین نرخ برق استفاده کند."
---
نکتهی مهم: برای مدلهای کوچکتر، اعمال خروجی ساختاریافتهی سخت میتواند به صحت پاسخ آسیب بزند (مشکل «مالیات محدودیت»). بنابراین بهتر است با راهنمایی در سطح پرامپت شروع کنید.
---
جمعبندی نهایی:
مدلهای محلی و ابری را بهعنوان انتخابهای متقابل نبینید. در بسیاری از کاربردها، هر کدام نقش متفاوتی ایفا میکنند. این رویکرد ترکیبی، نه یک مصالحه، بلکه انعطافپذیری بیشتر در طراحی سیستم است.
---
📄 مطالعهی کامل:
مقاله در Towards Data Science
---
#مدل_های_زبانی #هوش_مصنوعی_ترکیبی #حریم_خصوصی #مهندسی_هوش_مصنوعی #آموزش_هوش_مصنوعی
🆔 @asrgooyeshpardaz | 970 |
| 19 | 🧬 جزئیترین مدل سهبعدی از سلول انسانی ساخته شد – ترکیبی از هنر و علم
این تصویر، یک عکس معمولی نیست؛ بلکه حاصل تلفیق دادههای کریستالوگرافی اشعهی ایکس، طیفبندی تشدید مغناطیسی هستهای (NMR) و میکروسکوپ الکترونی برودتی (Cryo-EM) است.
---
🔬 دنیای شگفتانگیز درون یک سلول (به اندازهی ۰٫۰۵ میلیمتر):
▫️ حدود ۶۰ میلیارد پروتئین
▫️ حدود ۲ تریلیون مولکول لیپید (چربی)
▫️ حدود ۵ تریلیون مولکول قند و اسید آمینه
▫️ حدود ۶۰ میلیارد مولکول RNA
همهی این اجزا با هم همکاری میکنند تا زندگی را ممکن سازند.
---
🎨 این مدل چیست و چه کاربردی دارد؟
این مدل توسط تیم Digizyme (وابسته به هاروارد) ساخته شده و نشان میدهد که مولکولها چگونه در یک محیط شلوغ و بههمپیوسته با هم تعامل دارند.
این مدل متعلق به یک سلول خاص نیست؛ بلکه یک صحنهی نمایشی برای مطالعهی فرآیندهای متعدد است: از سنتز پروتئین و مسیرهای سیگنالدهی گرفته تا اندوسیتوز، آپوپتوز (مرگ برنامهریزیشدهی سلول)، و ..
منبع | 2 381 |
| 20 | 🔬 تازههای مایکروسافت در بازشناسی گفتار؛ وقتی LLM از قدرت «فکر کردن» برای بازشناسی گفتار استفاده میکند
اخیراً مقالهای از تیم تحقیقاتی مایکروسافت (با نویسندگی Keqi Deng و همکاران) روی arXiv منتشر شده که در آن روشی جدید برای بهبود بازشناسی خودکار گفتار (ASR) معرفی شده است. نکته جالب توجه این است که دقت این روش جدید، در محدوده مدل معروف Whisper Large v3 قرار دارد. اما تفاوت اصلی در «چگونگی» انجام کار است.
🔴 مشکل اصلی از نظر محققان چیست؟
مدلهای زبانی بزرگ (LLM) مانند GPT توانایی بالایی در درک مفاهیم و تحلیل بافت متن دارند. اما وقتی از این مدلها برای تشخیص گفتار استفاده میشود، عملاً تنها کار «نگاشت مستقیم صدا به متن» را انجام میدهند. به عبارت فنیتر، استفاده از دانش غنی و درک زمینهای این مدلها در چنین کاری اصلاً ساده نیست، چون خودِ ذات بازشناسی گفتار، یک تبدیل خطی (صدا 👈 کلمه) محسوب میشود و مدل فرصتی برای بهکارگیری استدلال خود پیدا نمیکند.
✅ راهکار جدید: CoT-ASR (بازشناسی گفتار مبتنی بر زنجیرهای از تفکر)
برای حل این معضل، محققان مفهومی به نام زنجیرهای از تفکر (Chain-of-Thought) را به فرایند تشخیص گفتار اضافه کردهاند. در روش جدید که CoT-ASR نام دارد، مدل زبانی کار را در دو گام (اما در یک پاس پردازشی واحد) انجام میدهد:
۱. تحلیل و استدلال زمینهای: مدل ابتدا ورودی صوتی را تحلیل میکند و یک «تحلیل زمینهای» از محتوای گفتار تولید میکند. یعنی پیش از نوشتن متن، درباره چیزی که شنیده، فکر میکند.
۲. رونویسی هوشمندانه: پس از تولید این زنجیره استدلال، مدل با آگاهی بیشتری اقدام به بازشناسی و نوشتن متن نهایی میکند.
این روش باعث میشود مدل از تمام قابلیتهای زایشی و استنتاجی خود برای افزایش دقت تشخیص استفاده کند.
🎯 یک قابلیت کاربردی ویژه
از ویژگیهای جالب این رویکرد، پشتیبانی از رونویسی راهنماییشده توسط کاربر است. یعنی اگر کاربر اطلاعات زمینهای یا سرنخی درباره موضوع فایل صوتی در اختیار مدل بگذارد، مدل میتواند از آن اطلاعات برای دقیقتر کردن خروجی نهایی بهره ببرد. البته ساختار اصلی روش به گونهای طراحی شده که خودِ مدل، به صورت خودکار این تحلیل زمینهای را تولید کند.
📊 جمعبندی عملکرد
بر اساس یافتههای این مقاله، مدل CoT-ASR در مقایسه با مدلهای پایهای LLM که صرفاً به نگاشت صدا به متن اکتفا میکنند، عملکرد بهتری در بازشناسی گفتار از خود نشان داده و دقت آن در حد Whisper Large v3 ارزیابی شده است. این پژوهش نشان میدهد که حتی در وظایف به ظاهر سادهای مثل تشخیص گفتار، فعالسازی توانایی «استدلال» در مدلهای زبانی بزرگ، میتواند افقهای جدیدی را بگشاید.
---
📎 لینک مقاله:
https://arxiv.org/abs/2604.00610
🆔 @asrgooyeshpardaz | 1 533 |
Вже доступно! Дослідження Telegram за 2025 — головні інсайти року 
