uk
Feedback
عصر گویش | هوش مصنوعی

عصر گویش | هوش مصنوعی

Відкрити в Telegram

مجله هوش مصنوعی عصر گویش 021 61931000

Показати більше

📈 Аналітичний огляд Telegram-каналу عصر گویش | هوش مصنوعی

Канал عصر گویش | هوش مصنوعی (@asrgooyeshpardaz) у мовному сегменті Фарсі є активним учасником. На даний момент спільнота об'єднує 102 045 підписників, посідаючи 1 225 місце в категорії Технології та додатки та 2 960 місце у регіоні Іран.

📊 Показники аудиторії та динаміка

З моменту свого створення невідомо, проект продемонстрував стрімке зростання, зібравши аудиторію у 102 045 підписників.

За останніми даними від 02 липня, 2026, канал демонструє стабільну активність. Хоча за останні 30 днів спостерігається зміна кількості учасників на -1 147, а за останні 24 години на -25, загальне охоплення залишається високим.

  • Статус верифікації: Не верифікований
  • Рівень залученості (ER): Середній показник залученості аудиторії становить 1.90%. Протягом перших 24 годин після публікації контент зазвичай збирає 1.02% реакцій від загальної кількості підписників.
  • Охоплення публікацій: В середньому кожен допис отримує 1 942 переглядів. Протягом першої доби публікація в середньому набирає 1 040 переглядів.
  • Реакції та взаємодія: Аудиторія активно підтримує контент: середня кількість реакцій на один пост – 7.
  • Тематичні інтереси: Контент зосереджений навколо ключових тем, таких як مدل, گفتار, به‌طور, عامل, ابزار.

📝 Опис та контентна політика

Автор описує ресурс як майданчик для висловлення суб'єктивної думки:
مجله هوش مصنوعی عصر گویش 021 61931000

Завдяки високій частоті оновлень (останні дані отримано 03 липня, 2026), канал підтримує актуальність та високий рівень охоплення публікацій. Аналітика показує, що аудиторія активно взаємодіє з контентом, що робить його важливою точкою впливу в категорії Технології та додатки.

102 045
Підписники
-2524 години
-327 днів
-1 14730 день
Залучення підписників
липень '26
липень '26
+23
в 0 каналах
червень '26
+169
в 1 каналах
Get PRO
травень '260
в 0 каналах
Get PRO
квітень '260
в 0 каналах
Get PRO
березень '260
в 0 каналах
Get PRO
лютий '260
в 0 каналах
Get PRO
січень '260
в 2 каналах
Get PRO
грудень '25
+1
в 4 каналах
Get PRO
листопад '250
в 7 каналах
Get PRO
жовтень '250
в 6 каналах
Get PRO
вересень '250
в 5 каналах
Get PRO
серпень '250
в 5 каналах
Get PRO
липень '250
в 1 каналах
Get PRO
червень '250
в 4 каналах
Get PRO
травень '25
+2
в 1 каналах
Get PRO
квітень '250
в 1 каналах
Get PRO
березень '250
в 0 каналах
Get PRO
лютий '250
в 0 каналах
Get PRO
січень '250
в 0 каналах
Get PRO
грудень '24
+352
в 1 каналах
Get PRO
листопад '24
+588
в 0 каналах
Get PRO
жовтень '24
+53
в 4 каналах
Get PRO
вересень '24
+65
в 5 каналах
Get PRO
серпень '24
+14
в 6 каналах
Get PRO
липень '24
+317
в 6 каналах
Get PRO
червень '24
+490
в 5 каналах
Get PRO
травень '240
в 4 каналах
Get PRO
квітень '24
+452
в 4 каналах
Get PRO
березень '24
+2 402
в 5 каналах
Get PRO
лютий '24
+5 784
в 9 каналах
Get PRO
січень '24
+8 641
в 14 каналах
Get PRO
грудень '23
+17 410
в 7 каналах
Get PRO
листопад '23
+7 494
в 9 каналах
Get PRO
жовтень '23
+10 370
в 8 каналах
Get PRO
вересень '23
+14 111
в 0 каналах
Get PRO
серпень '23
+5 803
в 0 каналах
Get PRO
липень '23
+5 026
в 0 каналах
Get PRO
червень '23
+7 915
в 0 каналах
Get PRO
травень '23
+21 355
в 0 каналах
Get PRO
квітень '23
+43 552
в 0 каналах
Get PRO
березень '23
+59 493
в 0 каналах
Get PRO
лютий '23
+3 388
в 0 каналах
Get PRO
січень '23
+1 433
в 0 каналах
Get PRO
грудень '22
+517
в 0 каналах
Get PRO
листопад '22
+498
в 0 каналах
Get PRO
жовтень '22
+274
в 0 каналах
Get PRO
вересень '22
+464
в 0 каналах
Get PRO
серпень '22
+721
в 0 каналах
Get PRO
липень '22
+599
в 0 каналах
Get PRO
червень '22
+1 527
в 0 каналах
Get PRO
травень '22
+2 541
в 0 каналах
Get PRO
квітень '22
+1 061
в 0 каналах
Get PRO
березень '22
+1 666
в 0 каналах
Get PRO
лютий '22
+2 147
в 0 каналах
Get PRO
січень '22
+6 134
в 0 каналах
Get PRO
грудень '21
+4 172
в 0 каналах
Get PRO
листопад '21
+4 271
в 0 каналах
Get PRO
жовтень '21
+4 181
в 0 каналах
Get PRO
вересень '21
+1 061
в 0 каналах
Get PRO
серпень '21
+13 231
в 0 каналах
Get PRO
липень '21
+5 069
в 0 каналах
Get PRO
червень '21
+2 973
в 0 каналах
Get PRO
травень '21
+3 700
в 0 каналах
Get PRO
квітень '21
+5 497
в 0 каналах
Get PRO
березень '21
+9 553
в 0 каналах
Get PRO
лютий '21
+5 411
в 0 каналах
Get PRO
січень '21
+3 903
в 0 каналах
Get PRO
грудень '20
+46 342
в 0 каналах
Дата
Залучення підписників
Згадування
Канали
03 липня0
02 липня+15
01 липня+8
Дописи каналу
🌐اخبار هوش مصنوعی 🏛️ پیشنهاد جنجالی OpenAI: ۵٪ سهام به دولت آمریکا سم آلتمن به دولت پیشنهاد داده که ۵ درصد از سهام OpenAI را به دولت واگذار کند تا صندوق ملی هوش مصنوعی تشکیل شود. این طرح شامل سهم‌هایی از سایر شرکت‌های آمریکایی نیز هست. مدل آن، صندوق دائمی آلاسکا است؛ درآمدهای حاصل از هوش مصنوعی مستقیماً به جیب شهروندان عادی خواهد رفت. اما منتقدان می‌گویند این اقدام، نوعی بیمه‌ی ناگفته‌ی دولتی در برابر ورشکستگی احتمالی است. اجرای این طرح، به تأیید کنگره نیاز دارد. 🔗 ft.com --- 📚 مخزن arXiv پس از ۲۵ سال از دانشگاه کرنل جدا شد از اول ژوئیه، مخزن پیش‌چاپ‌های علمی arXiv به یک سازمان غیرانتفاعی مستقل تبدیل شده است. این استقلال، انعطاف‌پذیری مدیریتی را افزایش می‌دهد، اما دسترسی رایگان و بدون تغییر باقی می‌ماند. به‌زودی، سیاست جدید سانسور (مدراسیون) برای مقالات هوش مصنوعی اعلام خواهد شد. همچنین arXiv از مرز ۳ میلیون مقاله عبور کرده است. 🔗 arxiv.org --- 🎬 نوت‌بوک‌ال‌ام ویدیوهای عمودی کوتاه می‌سازد ابزار هوش مصنوعی گوگل، قابلیت تولید خودکار ویدیوهای ۶۰ ثانیه‌ای به سبک تیک‌تاک را اضافه کرده است. با تحلیل منابع کاربر، یک خلاصه‌ی تصویری از موضوع موردنظر ساخته می‌شود. این قابلیت ابتدا برای کاربران پلن‌های Pro و Ultra در دسترس است و به‌زودی برای حساب‌های رایگان نیز فعال خواهد شد. 🔗 NotebookLM در شبکه‌ی اجتماعی X --- 💼 مایکروسافت با سرمایه‌ی ۲.۵ میلیارد دلار، یکپارچه‌ساز هوش مصنوعی می‌سازد شرکت جدید Frontier Company با ۶۰۰۰ مهندس و کارشناس، قرار است هوش مصنوعی را به فرایندهای کسب‌وکارها تزریق کند. برخلاف رقبا، این تیم به مدل‌های خاصی وابسته نیست و ROI محور اصلی آن است. مایکروسافت این واحد را به‌عنوان یک پیمانکار مستقل معرفی کرده و از همکاری با غول‌هایی نظیر Accenture و PwC خبر داده است. 🔗 microsoft.com --- 🤖 ربات خانه‌دار Isaac 1 رونمایی شد استارتاپ Weave Robotics از رباتی با قابلیت‌های جمع‌آوری وسایل، تا کردن لباس، مرتب‌کردن تخت و بارزدن ماشین لباس‌شویی پرده برداشته است. این ربات روی چرخ حرکت می‌کند، قدش تا اندازه‌ی انسان بلند می‌شود و پوشش پارچه‌ای دارد تا در برخورد با افراد ایمن باشد. قیمت آن ۷۹۹۹ دلار یا ۴۴۹ دلار به‌صورت ماهانه است و از پاییز در کالیفرنیا عرضه می‌شود. 🔗 weaverobotics.com --- #OpenAI #arXiv #NotebookLM #Microsoft #ربات_هوشمند #AI #اخبار_فناوری 🆔 @asrgooyeshpardaz

2
اگر چپ در این میدان غایب باشد، سرمایه‌داری دیجیتال نه تنها به انباشت افسارگسیختۀ ثروت ادامه می‌دهد، بلکه نحوۀ تفکر نسل‌های آینده را نیز برنامه‌محور، در جهت منافع خود، مهندسی خواهد کرد. زمان آن رسیده که چپ مدرن، «تسلط بر دژ» را در دستور کار قرار دهد؛ نه با ترس از فناوری، بلکه با تصاحب آن برای ساختن آینده‌ای انسانی‌تر و سوسیالیستی‌تر. --- 📎 منبع اصلی: BreakThrough News ✍️ نویسنده: رزگار اکراوی (پژوهشگر و نظریه‌پرداز «چپ الکترونیک») 🆔 @asrgooyeshpardaz
32
3
فراخوان چپ برای فتح «دژ دیجیتال» سرمایه‌داری *مروری بر مقالۀ رزگار اکراوی، نظریه‌پرداز «چپ الکترونیک» (منتشرشده در BreakThrough News - اول ژوئیه ۲۰۲۶)* --- ۱. معمای بزرگ قرن بیست‌ویکم اگر چپ همچنان با تاکتیک‌های خیابانی و شعارهای قرن بیستم به میدان بیاید، در برابر سرمایه‌داری هوشمند قرن بیست‌ویکم حرفی برای گفتن نخواهد داشت. امروز الگوریتم‌ها هستند که رسانه را می‌سازند، هوش مصنوعی است که بازار کار و آموزش را بازتعریف می‌کند، و داده‌های کلان هستند که سیاست‌های اقتصادی را تدوین می‌کنند. پرسش وجودی این است: جامعه‌ای که هنوز با ساختارهای سنتی سازماندهی می‌شود، چگونه می‌تواند با سیستمی بجنگد که سلاح‌هایش را از «ابررایانه‌ها» گرفته است؟ ۲. شکاف فنی نیست؛ شکاف «درک راهبردی» است بسیاری تصور می‌کنند مشکل چپ، «نبودِ برنامه‌نویس» یا «ضعف تکنولوژیک» است؛ اما عمیق‌تر از این حرف‌هاست. مسئله این است که هنوز فضای دیجیتال را به‌عنوان یک «میدانِ نبردِ طبقاتی» نمی‌شناسیم. سرمایه‌داری در این فضا، ذهن‌ها را هدایت، رفتارها را استاندارد و نیروی کار را تحت سلطه می‌گیرد، در حالی که چپ همچون تماشاگری حاشیه‌نشین، فقط از بیرون نق می‌زند. پر کردن این خلأ، دیگر یک «امتیاز» نیست؛ شرط بقای چپ است. ۳. فناوری، سدی در برابر بحران‌های سرمایه‌داری سرمایه‌داری هر بار که به زمین می‌خورد، از علم و فناوری به‌عنوان «عصای جادویی» استفاده می‌کند تا خود را نجات دهد، بی‌آنکه به هستۀ استثماری‌اش دست بزند: - بحران ۲۰۰۸: با تکنیک‌های مالی پیچیده، بانک‌ها نجات یافتند، اما هزینۀ ورشکستگی بر دوش کارگران ماند. - پاندمی ۲۰۲۰: با اتوماسیون و دورکاری، خط تولید بدون توقف به کار خود ادامه داد، سود شرکت‌ها چند برابر شد، اما میلیون‌ها کارگر با امنیت شغلی متزلزل مواجه شدند. - اوج‌گیری هوش مصنوعی (۲۰۲۳ به بعد): بازاریابی برای حذف مشاغل و تمرکز ثروت در دستان چند ابرشرکت؛ این بار، هوش مصنوعی جانشین نیروی انسانی می‌شود تا سود بیشتری انباشته شود. جالب اینجاست که در مواقع بحران، سرمایه‌داری حتی ایده‌های سوسیالیستی مثل «دولت مداخله‌گر» را قرض می‌گیرد، اما به محض عبور از بحران، از آن عقب‌نشینی کرده و سلطه را با لباسی مدرن‌تر از سر می‌گیرد. ۴. انحصار بزرگ‌تر از دولت‌ها قدرت دیجیتال امروز در انحصار معدود غول‌هایی است که زیرساخت‌های ابری، داده‌های جهانی و موتورهای جست‌وجو را قبضه کرده‌اند. این شرکت‌ها، قدرتی فراتر از بسیاری از دولت‌های ملی پیدا کرده‌اند. آنها نه تنها بر اقتصاد، که بر فرهنگ، آموزش و حتی حافظۀ تاریخی جوامع تسلط دارند. ۵. از «کاربر منفعل» به «تولیدکنندۀ جایگزین» برسیم نسل جوان امروز در دل همین فناوری رشد کرده است. اگر چپ نتواند با زبان و ابزار این نسل حرف بزند، به‌طور طبیعی طرد خواهد شد. سرمایه‌گذاری روی ابزارهای علمی، به‌معنای هم‌ذات‌پنداری با ارزش‌های سرمایه‌داری نیست؛ بلکه تاکتیکی برای تغییر موازنۀ قدرت است. ما باید از حالت «کاربری که قوانین پلتفرم‌ها را می‌پذیرد» خارج شده و به «تولیدکنندۀ جایگزین» تبدیل شویم؛ یعنی: - هوش مصنوعی مردمی با نظارت اجتماعی به‌جای هوش مصنوعی انحصاری. - تعاونی‌های دیجیتال که در آنها داده و دانش، کالای عمومی است، نه ابزار سوداگری. - پلتفرم‌های متن‌باز که الگوریتم‌هایشان در شفافیت کامل قرار دارد و در خدمت نیازهای واقعی انسان‌هاست، نه هوس‌های بازار و نظامی‌گری. ۶. «دژ» را بشکنیم؛ نه اینکه پشت دیوارهایش بنشینیم و فریاد بزنیم نویسنده به‌صراحت هشدار می‌دهد: ایستادن در بیرون دژ دیجیتال و فریاد زدن بر سر استثمار، هیچ تغییری ایجاد نمی‌کند و چپ را در «گتوهای فکری» کهنه منزوی خواهد کرد. درست همان‌طور که مارکس و انگلس فلسفه و علم اقتصاد زمان خود را از یک توجیه‌گر وضع موجود، به «سلاح تئوریک» برای کارگران تبدیل کردند، امروز نیز وظیفه داریم وارد قلب الگوریتم‌ها شویم، منطق‌شان را بفهمیم، آنها را بر هم بزنیم و از نَظَر تا به عمل، بازسازی‌اش کنیم. ۷. هشدار؛ فناوری جای سازماندهی انسانی را نمی‌گیرد بله، هوش مصنوعی ابزاری کارآمد برای تحلیل، هماهنگی و روشنگری است. اما هرگز جای «همبستگی انسانی» و «کار مردمی» را که موتور اصلی تغییرات اجتماعی است، نخواهد گرفت. قدرت واقعی در «انسانِ سازمان‌یافته» نهفته است که می‌تواند این ابزارها را در مسیر رهایی به‌کار گیرد. --- 📌 خلاصه و جمع‌بندی: نبردی که امروز در الگوریتم‌ها جریان دارد، تنها بر سر «تکنولوژی» نیست؛ این نبرد بر سر آیندۀ کار، دموکراسی، فرهنگ و عدالت اجتماعی است.
632
4
🧠 روش AutoMem: یادگیری خودکار حافظه به‌عنوان یک مهارت شناختی عامل‌های هوش مصنوعی در وظایف بلندمدت (Long-Horizon) معمولاً به دلیل ضعف در مدیریت حافظه شکست می‌خورند، نه به خاطر ناتوانی در استدلال. مقاله‌ی جدیدی از دانشگاه استنفورد با رویکردی تازه این مشکل را حل کرده است. --- ⚡ نتیجه‌ی کلیدی: مدل ۳۲ میلیارد پارامتری با استفاده از AutoMem، ۲ تا ۴ برابر سریع‌تر عمل کرده و به عملکردی در سطح مدل‌های پیشروی اختصاصی مانند Claude Opus 4.5 و Gemini 3.1 Pro Thinking رسیده است. --- 🔧 ایده‌ی اصلی: به‌جای اینکه همه‌چیز را در پنجره‌ی متن (Context) بریزد، عامل یاد می‌گیرد که: • چه چیزی را ذخیره کند • چطور آن را کدگذاری نماید • کی داده‌ی موردنیاز را بازیابی کند • چطور ساختار حافظه را پس از تجربه تغییر دهد --- 🔄 روش AutoMem در دو حلقه: ۱. بهبود ساختار حافظه – یک مدل قوی، مسیرهای اجرایی را مرور کرده و ساختار فایل‌ها، پرامپت‌ها و منطق حافظه را به‌صورت خودکار بازنویسی می‌کند. ۲. بهبود مهارت حافظه – تصمیم‌های خوب حافظه از میان هزاران مرحله شناسایی شده و به‌عنوان داده‌ی آموزشی برای مدل استفاده می‌شوند. --- 🎮 آزمایش روی بازی‌های پیچیده: این روش روی سه محیط بازی Crafter، MiniHack و NetHack آزمایش شده است: • عامل با استفاده از سیستم فایل به‌عنوان حافظه‌ی خارجی عمل می‌کند • عملیات ثبت (LOG) و برنامه‌ریزی (PLAN) را در کنار اقدامات اصلی انجام می‌دهد • هر تصمیم حافظه، قابل ردیابی و بهینه‌سازی است --- 💡 چرا مهم است؟ بسیاری از وظایف بلندمدت نه به دلیل ضعف استدلال، بلکه به دلیل حافظه‌ی ضعیف شکست می‌خورند. عامل یا زمینه را فراموش می‌کند، داده‌های زائد ذخیره می‌کند، یا نمی‌تواند به‌موقع اطلاعات موردنیاز را بازیابی کند. AutoMem این گلوگاه را بدون نیاز به آموزش مجدد کامل برای هر وظیفه، برطرف می‌کند. --- 📄 مقاله: https://arxiv.org/abs/2607.01224 🌐 پروژه: https://autolearnmem.github.io/ --- #AutoMem #پژوهش_هوش_مصنوعی #عامل_هوشمند #مدیریت_حافظه #یادگیری_تقویتی 🆔 @asrgooyeshpardaz
900
5
⚡️ مدل Claude Sonnet 5: هزینه‌ی نهایی بالاتر، با وجود قیمت پایین‌تر هر توکن مدل جدید آنتروپیک با وجود قیمت تبلیغاتی مناسب، به دلیل مصرف توکن بسیار بیشتر، هزینه‌ی نهایی هر وظیفه را نسبت به Sonnet 4.6 حدود ۲ برابر و نسبت به Opus 4.8 حدود ۱۵٪ افزایش داده است. --- 💰 قیمت‌گذاری (تا ۳۱ آگوست ۲۰۲۶): ورودی: ۲ دلار | خروجی: ۱۰ دلار به ازای هر میلیون توکن (از ۱ سپتامبر: ۳ دلار ورودی و ۱۵ دلار خروجی) --- ⚠️ محدودیت دسترسی کاربران ایرانی: هم‌زمان با عرضه‌ی این مدل، حساب‌های کلود بسیاری از کاربران ایرانی مسدود شده و روند تشخیص و برخورد با اکانت‌های ایرانی به‌شدت تشدید یافته است. این در حالی است که مدل Fable 5 نیز که دسترسی عمومی آن مجدداً باز شده، با محدودیت‌های مشابهی برای کاربران ایرانی روبه‌رو بوده است. --- #Claude #Anthropic #هزینه_هوش_مصنوعی #محدودیت_دسترسی 🆔 @asrgooyeshpardaz
1 070
6
🌐اخبار هوش مصنوعی ⚡️ بهینه‌سازی استنتاج ChatGPT؛ هزینه‌ها بیش از نصف کاهش پیدا کرد اوپن‌ای‌آی هزینه‌ی استنتاج (Inference) نسخه‌ی تحت‌وب ChatGPT را برای کاربران بدون حساب کاربری بیش از دو برابر کاهش داده. جالب اینکه برای پردازش کل ترافیک مهمان، فقط به چند صد GPU انویدیا نیاز است. این جلسات بدون حساب، از قابلیت‌های محدود برخوردارند و هنوز مشخص نیست که این بهینه‌سازی به کاربران احرازهویت‌شده هم تعمیم پیدا می‌کند یا خیر. جزئیات فنی نیز فاش نشده است. 🔗 theinformation.com --- ☁️ متا خوشه‌های هوش مصنوعی خود را اجاره می‌دهد متا قصد دارد مانند اسپیس‌ایکس که GPUهای ایکس‌آی‌را به انتروپیک و گوگل اجاره می‌دهد، دسترسی به خوشه‌های ابری و مدل‌های مستقرشده‌اش را به مشتریان خارجی ارائه کند. بودجه‌ی زیرساختی امسال این شرکت ۱۴۵ میلیارد دلار است و برای تأمین منابع، پیش‌تر تعدیل نیرو انجام داده است. این حرکت نشان می‌دهد که آموزش داخلی مدل‌ها، دیگر ۱۰۰٪ ظرفیت را مصرف نمی‌کند. 🔗 bloomberg.com --- 📱 ایلان ماسک گوشی هوشمند می‌سازد اسپیس‌ایکس از نمونه‌ی اولیه‌ی گوشی هوشمندی رونمایی کرده که از پردازنده‌ی کوالکام اسنپدراگون با یکپارچگی سیستمی مدل‌های xAI استفاده می‌کند و روی سیستم‌عامل اختصاصی خودش اجرا می‌شود. هدف از این کار، اجرای ابربرنامه‌ای (سوپر اپ) به سبک وی‌چت و دورزدن انحصار اپل و گوگل است. سیستم‌عامل اختصاصی به ماسک امکان کنترل مستقیم توزیع و کسب درآمد از محصولات موبایل xAI را می‌دهد. این پروژه در مراحل اولیه قرار دارد. 🔗 wsj.com --- 🖥️ پلتفرم Base44 مدل اختصاصی خود را روی لاگ‌های توسعه آموزش داد پلتفرم Base44 که متعلق به ویکس است، مدل Base 1 را بر پایه‌ی تلمتری و لاگ‌های داخلی توسعه آموزش داده و در محیط تولید مستقر کرده است. این مدل در بحث‌های منطقی مشارکت می‌کند، اقدامات کاربر را پیش‌بینی می‌نماید و راه‌حل‌های بن‌بست معماری را فیلتر می‌کند. پلتفرم از مسیریابی خودکار برای توزیع درخواست‌ها بین Base 1 و سایر مدل‌ها بر اساس نوع وظیفه استفاده می‌کند. داده‌های آموزشی شامل ده‌ها میلیون جلسه شامل پرامپت‌های اولیه، کد تولیدشده، خطاهای زمان اجرا، اصلاحات دستی و نشانه‌های استقرار موفق است. معماری و نتایج بنچمارک‌ها در هفته‌های آینده منتشر خواهد شد. 🔗 base44.com --- 🏠 رونق هوش مصنوعی هزینه‌های زندگی در سان‌فرانسیسکو را نجومی کرد قیمت متوسط هر خانه در سان‌فرانسیسکو به ۱٫۷ میلیون دلار و اجاره‌ی ماهانه به ۳٬۸۲۷ دلار رسیده است. در نتیجه، متخصصان با درآمد زیر ۲۰۰ هزار دلار در حال ترک این شهر هستند. نمونه‌ی بارز: زوجی با درآمد ترکیبی ۳۶۵ هزار دلار، پس از سه ماه نتوانستند آپارتمانی با اجاره‌ی زیر ۵٬۰۰۰ دلار پیدا کنند. در نهایت مهندس به منطقه‌ی دریاچه‌ی تاهو و همسرش (مسئول جذب نیرو) به یک اتاق ۱٬۶۵۰ دلاری نقل مکان کردند. در سیلیکون ولی، گروهی ۱۰ هزار نفره با ثروتی بیش از ۲۰ میلیون دلار شکل گرفته است. فروش ثانویه‌ی سهام نیز بر قیمت‌ها تأثیر گذاشته، به‌طوری که ۷۵ کارمند اوپن‌ای‌آی در پاییز گذشته به‌طور میانگین ۳۰ میلیون دلار از این راه به دست آوردند. کارشناسان پیش‌بینی می‌کنند که عرضه‌ی اولیه (IPO) اوپن‌ای‌آی و انتروپیک، افزایش بیشتر قیمت مسکن در این منطقه را به دنبال خواهد داشت. 🔗 nytimes.com --- #هوش_مصنوعی #اقتصاد_هوش_مصنوعی #اوپن_ای_آی #متا #ایلان_ماسک #هزینه_زندگی #اخبار_فناوری 🆔 @asrgooyeshpardaz
980
7
✅ معماری جدید Cognition هزینهٔ کدنویسی رو ۳۵٪ کاهش داده است آزمایشگاه آمریکایی هوش مصنوعی کاربردی، از معماری ترکیبی Devin Fusion برای خودکارسازی کدنویسی رونمایی کرده است. این سیستم در بنچمارک FrontierCode، بدون افت کیفیت، هزینهٔ تولید کد رو ۳۵٪ پایین می‌آورد. --- 🧠 مکانیزم کار Devin Fusion: از دو مؤلفهٔ کلیدی استفاده میکنه: مسیریابی پویا و همنشینی هوشمند. سیستم به‌صورت لحظه‌ای پیچیدگی تسک رو ارزیابی میکنه و درخواست‌ها رو بین مدل‌های سنگین و سبک جابه‌جا میکنه؛ همزمان با فشرده‌سازی متن (Context Compression). · مدل سنگین (LLM بزرگ) مسئولیت برنامه‌ریزی معماری، شفاف‌سازی نیازمندی‌ها و انجام بازبینی (Review) رو بر عهده داره. · عامل سبک (Agent کوچک) کد پایه رو مینویسه، تست‌ها رو مینویسه و خروجی‌ها رو اعتبارسنجی میکنه. برای جلوگیری از تداخل، هر مدل از کش مجزای متن استفاده میکنه. --- 📊 آمار و ارقام: · در ترکیب با GPT-5.5 و Claude 4.8 Opus، این معماری بیش از یک‌سوم منابع رو ذخیره میکنه. · با Fable 5 این صرفه‌جویی به ۴۱٪ هم می‌رسه. · داخل خود Cognition، این مسیریابی ترکیبی، ۸۸٪ از Pull Requestهای موفق رو پوشش داده. --- ⚠️ محدودیت‌ها: · در پروژه‌هایی با منطق پیچیدهٔ کسب‌وکاری (مثل ترکیب React/Redux) عملکرد سیستم محدود میشه. · واگذاری بیش‌ازحد تسک‌های چندفایلی به مدل کوچک‌تر، کارایی رو نزدیک به نصف کاهش میده. --- 🔗 Devin Fusion فقط روی پلتفرم Cognition دردسترسه. --- #news #ai #ml #DevinFusion #کدنویسی_هوشمند --- 🆔 @asrgooyeshpardaz
960
8
🔥 سری جدید مدل‌های ASR فارسی از Reza2kn منتشر شد! یک مجموعه کامل شامل مدل، دیتاست و بنچمارک برای پردازش گفتار فارسی، روانهٔ Hugging Face شد. --- 🎙️ خانوادهٔ مدل‌های Shenava-1 (با معماری FastConformer Hybrid RNNT/CTC) خانوادهٔ شنوا در سه سایز طراحی شده تا هم کیفیت و هم سرعت را پوشش بدهد: · مدل Koochik با ۱۱۴ میلیون پارامتر، پرچمدار این مجموعه است. این مدل با WER معادل ۷.۴۹٪ و CER برابر ۲.۳۰٪ روی دیتاست golden-6669، موفق شده رتبهٔ #۲ را در بنچمارک عمومی کسب کند و فقط از مدل ابری Gemini عقب‌تر است. · مدل Rizeh با ۳۲ میلیون پارامتر، گزینهٔ میانی محسوب می‌شود و عملکرد بسیار خوبی با WER برابر ۱۲.۱۱٪ و CER معادل ۳.۹۴٪ ارائه می‌دهد. · مدل Rizeh-Pizeh با تنها ۶.۹ میلیون پارامتر، فوق‌کوچک و فوق‌سریع است. با وجود اندازهٔ جیبی، WER آن ۲۴.۵۵٪ و CER آن ۸.۸۹٪ است و به‌صورت Real-Time روی پردازندهٔ Cortex-A7 هم اجرا می‌شود. ✅ جالب اینجاست که مدل Koochik v1.0 با تنها ۱/۱۳ حجم مدل ۱.۵ میلیاردی Whisper-Persian، توانسته آن را با بیش از ۲ برابر WER بهتر شکست بدهد و به بهترین مدل on-device فارسی تبدیل شود. --- 📊 دیتاست‌های منتشر شده: 🔹 persian-asr-relabeled-gemini یک دیتاست شامل بازبرچسب‌زنی حرفه‌ای دیتاست‌های موجود ASR فارسی با استفاده از Gemini 3.5-flash که کیفیت برچسب‌ها را به طرز چشمگیری بالا برده است. 🔹 persian-asr-text-2.69M-deduped یک منبع عظیم شامل ۲.۶۹ میلیون جملهٔ فارسی کاملاً منحصربه‌فرد (بدون هیچ تکراری) که برای آموزش و فاین‌تیون مدل‌های زبانی و گفتاری بسیار ارزشمند است. --- 🏆 بنچمارک تخصصی: Persian ASR Double-Benchmark یک محیط استاندارد و منصفانه برای مقایسهٔ مدل‌های مختلف ASR فارسی که فرآیند نرمال‌سازی اعداد و ITN را هم پوشش می‌دهد. --- 🔗 لینک‌های دسترسی مستقیم: 📌 مدل‌ها: https://huggingface.co/Reza2kn/Shenava-Koochik-v1.0 https://huggingface.co/Reza2kn/Shenava-Rizeh-v1.0 https://huggingface.co/Reza2kn/Shenava-Rizeh-Pizeh-v1.0 📌 دیتاست‌ها: https://huggingface.co/datasets/Reza2kn/persian-asr-relabeled-gemini https://huggingface.co/datasets/Reza2kn/persian-asr-text-2.69M-deduped 📌 بنچمارک: https://huggingface.co/spaces/Reza2kn/persian-asr-double-benchmark --- #پردازش_گفتار #ASR #هوش_مصنوعی #پایتون #NLP #PersianASR #Shenava 🆔 @asrgooyeshpardaz
867
9
⚡️ آمریکا محدودیت‌های صادراتی مدل‌های Fable 5 و Mythos 5 را لغو کرد وزارت بازرگانی ایالات متحده به‌طور رسمی محدودیت‌های اعمال
⚡️ آمریکا محدودیت‌های صادراتی مدل‌های Fable 5 و Mythos 5 را لغو کرد وزارت بازرگانی ایالات متحده به‌طور رسمی محدودیت‌های اعمال‌شده بر روی Claude Fable 5 و Mythos 5 را برداشته است. شرکت Anthropic تأیید کرده که دسترسی کامل به این مدل‌ها از فردا برای کاربران آزاد می‌شود. تیم سازنده نیز از شکیبایی کاربران در دوران توقف اجباری خدمات تشکر کرده و از تمام متخصصانی که در راه‌اندازی مجدد سیستم‌ها همکاری داشتند، قدردانی نموده است. پیش‌بینی می‌شود به‌زودی پچ‌نوت‌هایی با اطلاعات تکمیلی منتشر شده و برنامه‌های آیندهی این خانواده از مدل‌ها اعلام شود. ---   #Anthropic #Claude #هوش_مصنوعی #اخبار_فناوری #آزادسازی_مدل 🆔 @asrgooyeshpardaz
742
10
⚡️ آمریکا محدودیت‌های صادراتی مدل‌های Fable 5 و Mythos 5 را لغو کرد وزارت بازرگانی ایالات متحده به‌طور رسمی محدودیت‌های اعمال‌شده بر روی Claude Fable 5 و Mythos 5 را برداشته است. شرکت Anthropic تأیید کرده که دسترسی کامل به این مدل‌ها از فردا برای کاربران آزاد می‌شود. تیم سازنده نیز از شکیبایی کاربران در دوران توقف اجباری خدمات تشکر کرده و از تمام متخصصانی که در راه‌اندازی مجدد سیستم‌ها همکاری داشتند، قدردانی نموده است. پیش‌بینی می‌شود به‌زودی پچ‌نوت‌هایی با اطلاعات تکمیلی منتشر شده و برنامه‌های آیندهی این خانواده از مدل‌ها اعلام شود. --- #Anthropic #Claude #هوش_مصنوعی #اخبار_فناوری #آزادسازی_مدل 🆔 @asrgooyeshpardaz
4
11
📉 اوپن‌ای‌آی هزینه‌های استنتاج را به بیش از نصف کاهش داد طبق گزارش The Information، اوپن‌ای‌آی موفق شده هزینه‌ی استنتاج (Inference) برخی مدل‌های موجود خود را بیش از دو برابر کاهش دهد. نکته‌ی جالب‌تر اینکه ترافیک ChatGPT بدون نیاز به ورود به حساب کاربری، تنها با چند صد GPU انویدیا مدیریت می‌شده است. --- ⚙️ محتمل‌ترین روش‌های بهینه‌سازی: 🔹 کوانتیزاسیون – کاهش دقت اعداد برای مصرف کمتر حافظه 🔹 بهبود در KV-Cache – مدیریت بهینه‌تر حافظه‌ی نهان 🔹 بچینگ (Batching) – پردازش همزمان چندین درخواست 🔹 رمزگشایی پیش‌بینی‌کننده (Speculative Decoding) – تولید سریع‌تر توکن‌ها 🔹 مسیریابی هوشمند – ارسال درخواست‌های ساده به مدل‌های ارزان‌تر --- 💰 اهمیت استراتژیک: اگر این گزارش صحت داشته باشد، اوپن‌ای‌آی به ابزاری رقابتی قدرتمند دست یافته است. هزینه‌ی کمتر یعنی: - حاشیه‌ی سود بالاتر - امکان افزایش محدودیت‌های استفاده برای کاربران - کاهش فشار بر قیمت‌گذاری API و ارائه‌ی تعرفه‌های رقابتی‌تر --- 📊 نگاه به اعداد: حاشیه‌ی سود ناخالص تعدیل‌شده‌ی اوپن‌ای‌آی از ۴۰٪ در سال ۲۰۲۴ به ۳۳٪ در سال ۲۰۲۵ کاهش یافته بود (پس از چهار برابر شدن هزینه‌های استنتاج). اما در سه‌ماهه‌ی اول ۲۰۲۶، این رقم به ۳۹٪ رسیده و هدف شرکت رسیدن به ۵۲٪ تا پایان سال است. در سوی مقابل، Anthropic حاشیه‌ی سودی حدود ۴۴٪ دارد. یعنی هر دو لابراتوار پیشروی هوش مصنوعی، هنوز با اقتصاد نرم‌افزارهای بالغ فاصله‌ی قابل‌توجهی دارند. --- 📌 نکته‌ی کلیدی: بهینه‌سازی هزینه‌ی استنتاج، یکی از مهم‌ترین نبردهای رقابت در بازار هوش مصنوعی است. شرکتی که بتواند همان کیفیت را با هزینه‌ی کمتر ارائه دهد، هم در جذب کاربران و هم در سودآوری پیروز میدان خواهد بود. --- 🔗 منبع: The Information --- #اوپن‌ای‌آی #بهینه‌سازی_هزینه #هوش_مصنوعی #استنتاج #رقابت_در_هوش_مصنوعی 🆔 @asrgooyeshpardaz
725
12
اخبار هوش مصنوعی ⌨️ اوپن‌ای‌آی از کیبورد اختصاصی برای Codex رونمایی می‌کند اوپن‌ای‌آی به‌همراه شرکت تولیدکننده‌ی تجهیزات جانبی Work Louder، کیبوردی مخصوص توسعه‌دهندگان به نام Codex تولید می‌کند. معرفی رسمی و انتشار مشخصات فنی آن برای ۱۵ ژوئیه برنامه‌ریزی شده است. بر اساس تصویر منتشرشده، این کیبورد بر پایه‌ی مدل مینیاتوری Creator Micro 2 ساخته شده. نسخه‌ی پایه دارای ۱۳ کلید مکانیکی، یک جوی‌استیک آنالوگ و پنل‌های لمسی برای تنظیم ماکروها و دستورات سریع است. پیش‌بینی می‌شود این دستگاه با مدل‌های اوپن‌ای‌آی یکپارچگی سخت‌افزاری داشته باشد و امکان تولید کد و فراخوانی دستیارهای هوش مصنوعی را با یک فشار کلید فراهم کند. 🔗 صفحه OpenAI Developers در شبکه‌ی اجتماعی X --- 🔬 انتروپیک از محیط محاسبات علمی Claude Science رونمایی کرد محیط Claude Science یک محیط هوش مصنوعی برای پژوهش‌های علمی است که بیش از ۶۰ مهارت تخصصی در حوزه‌های ژنومیک، پروتئومیک و شیمی‌اطلاعات ارائه می‌دهد. این پلتفرم با Nvidia BioNeMo یکپارچه شده و به مدل‌هایی مانند Evo 2، Boltz-2 و OpenFold3 دسترسی دارد. Claude Science امکان تحلیل مقالات، مصورسازی داده‌ها و نگارش پیش‌نویس مقاله را فراهم می‌کند و یک عامل تأییدکننده، صحت محاسبات و ارجاعات را بررسی می‌کند. این برنامه به‌صورت محلی روی macOS یا لینوکس اجرا شده و به سرورهای راه‌دور متصل می‌شود. داده‌های حساس در زیرساخت داخلی باقی می‌مانند و فقط زمینه‌ی ضروری به مدل ابری ارسال می‌شود. بار پردازشی از یک تا صدها GPU قابل مقیاس‌سازی است. نسخه‌ی بتا برای کاربران پلن‌های Pro، Max، Team و Enterprise در دسترس است. انتروپیک تا ۱۵ ژوئیه، ۵۰ کمک‌هزینه‌ی ۳۰٬۰۰۰ دلاری به‌صورت اعتبار محاسباتی توزیع می‌کند. 🔗 anthropic.com --- 🇨🇳 عرضه‌ی LongCat-2.0: اولین مدل زبانی آموزش‌دیده روی تراشه‌های چینی شرکت چینی Meituan از مدلی با ۱٫۶ تریلیون پارامتر و پنجره‌ی متنی ۱ میلیون توکن رونمایی کرده است. چرخه‌ی کامل پیش‌آموزش و استنتاج این مدل روی خوشه‌ای از ۵۰٬۰۰۰ تراشه‌ی بومی ASIC انجام شده است. تأمین‌کننده‌ی شتاب‌دهنده‌ها فاش نشده، اما استفاده از کتابخانه‌ی HCCL به معماری Huawei اشاره دارد. پیش‌تر از سخت‌افزار محلی بیشتر برای استنتاج استفاده می‌شد و آموزش، نقطه‌ی ضعف محسوب می‌گشت. بر اساس آزمون‌ها، LongCat-2.0 در کدنویسی و سناریوهای عامل‌محور از Gemini 3.1 Pro پیشی گرفته و در بنچمارک‌های Terminal-Bench 2.1 و SWE-Bench Pro عملکرد بهتری دارد. این مدل همچنان از GPT-5.5 و Claude 4.8 Opus عقب‌تر است. سرویس LongCat-2.0 از طریق API Meituan و OpenRouter قابل دسترس است و وزن مدل به‌زودی روی Hugging Face منتشر خواهد شد. 🔗 longcatai.org --- 🎨 تولید تصویر در Gemini برای کاربران آمریکایی رایگان شد گوگل دسترسی رایگان به تولید تصویر شخصی‌سازی‌شده در Gemini را برای کاربران عادی در ایالات متحده باز کرده است. پیش‌تر این ابزار که بر پایه‌ی موتور Nano Banana کار می‌کرد، فقط برای پلن‌های Plus، Pro و Ultra در دسترس بود. برای درک زمینه، Gemini داده‌های Gmail، YouTube، تاریخچه‌ی جستجو و Google Photos را تحلیل می‌کند. این سیستم به‌طور مستقیم تصاویر کاربر را از فضای ابری دریافت می‌کند و نیاز به بارگذاری دستی را برطرف می‌سازد. این قابلیت در چارچوب ابزار Personal Intelligence اجرا می‌شود که از بهار امسال در حال گسترش است. کاربر خودش مشخص می‌کند که چه برنامه‌هایی با دستیار یکپارچه شوند. 🔗 blog.google --- 🚗 فورد ۳۰۰ مهندس را پس از شکست در پیاده‌سازی هوش مصنوعی به کار بازگرداند فورد پس از اجرای ناموفق سیستم بازرسی کیفیت خودکار، ۳۰۰ مهندس QA را دوباره به کار گرفته است. این شرکت پیش‌تر صدها دوربین بینایی‌ماشین برای بررسی قطعات تولیدی نصب کرده بود تا انطباق آن‌ها با الزامات طراحی را تأیید کند. سیستم‌های بینایی‌ماشین به داده‌های کافی درباره‌ی نقص‌های واقعی و خاص دسترسی نداشتند. بیشتر متخصصان باتجربه پیش از آنکه تخصص‌شان مستند شده و به مجموعه‌های آموزشی منتقل شود، فورد را ترک کرده بودند. اکنون مهندسان بازگشته مشغول جمع‌آوری داده، بازآموزی الگوریتم‌های بینایی‌ماشین و مربیگری کارکنان تازه‌کار هستند. 🔗 bbc.com --- #هوش_مصنوعی #اخبار_فناوری #OpenAI #Anthropic #Meituan #Google #Ford #پیشرفت_هوش_مصنوعی
660
13
🧩 راهنمای عملی الگوهای ترکیبی مدل‌های زبانی (محلی + ابری) دیگه لازم نیست بین استفاده از مدل‌های محلی و ابری یکی رو انتخاب کنی! هر دو رو کنار هم قرار بده. --- چالش اصلی کجاست؟ - مدل‌های ابری قدرت استدلال بالایی دارند، اما حریم خصوصی را به خطر می‌اندازند. - مدل‌های محلی حریم خصوصی را حفظ می‌کنند، اما در پردازش وظایف پیچیده ضعیف‌تر عمل می‌کنند. --- سه محور کلیدی در طراحی ترکیبی: ۱. جهت (Direction) – کدام مدل اول اقدام می‌کند؟ محلی یا ابری؟ ۲. محرک (Trigger) – چه زمانی مدل ابری فراخوانی می‌شود؟ همیشه یا مشروط؟ ۳. هدف (Purpose) – چرا جریان را تقسیم می‌کنیم؟ (حریم خصوصی، هزینه، تأخیر، قابلیت اطمینان) --- ۵ الگوی رایج ترکیبی: ۱. پالایش و حل (Sanitize‑and‑Solve) – محلی اطلاعات حساس را پاک‌سازی می‌کند، ابری مشکل انتزاعی را حل می‌کند. ۲. برنامه‌ریزی و اجرا (Plan‑then‑Ground) – ابری برنامه‌ی کلی می‌دهد، محلی روی داده‌های واقعی اجرا می‌کند. ۳. ارجاع در کارهای سخت (Escalate‑on‑Hard) – محلی کارهای ساده را انجام می‌دهد، فقط کارهای پیچیده به ابری ارجاع می‌شود. ۴. پیش‌نویس و بازبینی (Draft‑then‑Refine) – محلی پاسخ سریع می‌دهد، ابری در پس‌زمینه آن را بهبود می‌بخشد. ۵. بازبینی متقابل (Cross‑Check) – هر دو مدل پاسخ می‌دهند و تطابق یا عدم تطابق آن‌ها، تصمیم‌ساز می‌شود. --- مطالعه‌ی موردی: ماشین‌ظرفشویی را الان روشن کنم یا بعد؟ داده‌های خصوصی (نام‌ها، عادات خانوادگی، تعرفه‌های برق) در خانه نگهداری می‌شوند. جریان کار سه‌مرحله‌ای: ۱. مرحله‌ی محلی (پالایش) – مدل Gemma 4 اطلاعات خصوصی را به یک مسئله‌ی برنامه‌ریزی بی‌نام تبدیل می‌کند (بدون نام دستگاه، افراد یا جزئیات خانه). ۲. مرحله‌ی ابری (استدلال) – مدل GPT-5.4 مسئله‌ی بی‌نام را دریافت کرده و برنامه‌ی زمان‌بندی را محاسبه می‌کند. ۳. مرحله‌ی محلی (زمینه‌سازی) – Gemma 4 نتیجه را به زبان خانگی برمی‌گرداند و پاسخ نهایی را به کاربر ارائه می‌دهد. نتیجه‌ی نهایی برای کاربر: "ماشین‌ظرفشویی را دیرتر روشن کن. برای صرفه‌جویی در هزینه، تا ساعت ۸ امشب صبر کن. شارژر برق خودرو نیز برای نیمه‌شب برنامه‌ریزی شده تا از کم‌ترین نرخ برق استفاده کند." --- نکته‌ی مهم: برای مدل‌های کوچک‌تر، اعمال خروجی ساختاریافته‌ی سخت می‌تواند به صحت پاسخ آسیب بزند (مشکل «مالیات محدودیت»). بنابراین بهتر است با راهنمایی در سطح پرامپت شروع کنید. --- جمع‌بندی نهایی: مدل‌های محلی و ابری را به‌عنوان انتخاب‌های متقابل نبینید. در بسیاری از کاربردها، هر کدام نقش متفاوتی ایفا می‌کنند. این رویکرد ترکیبی، نه یک مصالحه، بلکه انعطاف‌پذیری بیشتر در طراحی سیستم است. --- 📄 مطالعه‌ی کامل: مقاله در Towards Data Science --- #مدل_های_زبانی #هوش_مصنوعی_ترکیبی #حریم_خصوصی #مهندسی_هوش_مصنوعی #آموزش_هوش_مصنوعی 🆔 @asrgooyeshpardaz
860
14
🧬 جزئی‌ترین مدل سه‌بعدی از سلول انسانی ساخته شد – ترکیبی از هنر و علم این تصویر، یک عکس معمولی نیست؛ بلکه حاصل تلفیق داده‌ها
🧬 جزئی‌ترین مدل سه‌بعدی از سلول انسانی ساخته شد – ترکیبی از هنر و علم این تصویر، یک عکس معمولی نیست؛ بلکه حاصل تلفیق داده‌های کریستال‌وگرافی اشعه‌ی ایکس، طیف‌بندی تشدید مغناطیسی هسته‌ای (NMR) و میکروسکوپ الکترونی برودتی (Cryo-EM) است. --- 🔬 دنیای شگفت‌انگیز درون یک سلول (به اندازه‌ی ۰٫۰۵ میلی‌متر): ▫️ حدود ۶۰ میلیارد پروتئین ▫️ حدود ۲ تریلیون مولکول لیپید (چربی) ▫️ حدود ۵ تریلیون مولکول قند و اسید آمینه ▫️ حدود ۶۰ میلیارد مولکول RNA همه‌ی این اجزا با هم همکاری می‌کنند تا زندگی را ممکن سازند. --- 🎨 این مدل چیست و چه کاربردی دارد؟ این مدل توسط تیم Digizyme (وابسته به هاروارد) ساخته شده و نشان می‌دهد که مولکول‌ها چگونه در یک محیط شلوغ و به‌هم‌پیوسته با هم تعامل دارند. این مدل متعلق به یک سلول خاص نیست؛ بلکه یک صحنه‌ی نمایشی برای مطالعه‌ی فرآیندهای متعدد است: از سنتز پروتئین و مسیرهای سیگنال‌دهی گرفته تا اندوسیتوز، آپوپتوز (مرگ برنامه‌ریزی‌شده‌ی سلول)، و .. منبع
2 160
15
🔬 تازه‌های مایکروسافت در بازشناسی گفتار؛ وقتی LLM از قدرت «فکر کردن» برای بازشناسی گفتار استفاده می‌کند اخیراً مقاله‌ای از تیم تحقیقاتی مایکروسافت (با نویسندگی Keqi Deng و همکاران) روی arXiv منتشر شده که در آن روشی جدید برای بهبود بازشناسی خودکار گفتار (ASR) معرفی شده است. نکته جالب توجه این است که دقت این روش جدید، در محدوده مدل معروف Whisper Large v3 قرار دارد. اما تفاوت اصلی در «چگونگی» انجام کار است. 🔴 مشکل اصلی از نظر محققان چیست؟ مدل‌های زبانی بزرگ (LLM) مانند GPT توانایی بالایی در درک مفاهیم و تحلیل بافت متن دارند. اما وقتی از این مدل‌ها برای تشخیص گفتار استفاده می‌شود، عملاً تنها کار «نگاشت مستقیم صدا به متن» را انجام می‌دهند. به عبارت فنی‌تر، استفاده از دانش غنی و درک زمینه‌ای این مدل‌ها در چنین کاری اصلاً ساده نیست، چون خودِ ذات بازشناسی گفتار، یک تبدیل خطی (صدا 👈 کلمه) محسوب می‌شود و مدل فرصتی برای به‌کارگیری استدلال خود پیدا نمی‌کند. ✅ راهکار جدید: CoT-ASR (بازشناسی گفتار مبتنی بر زنجیره‌ای از تفکر) برای حل این معضل، محققان مفهومی به نام زنجیره‌ای از تفکر (Chain-of-Thought) را به فرایند تشخیص گفتار اضافه کرده‌اند. در روش جدید که CoT-ASR نام دارد، مدل زبانی کار را در دو گام (اما در یک پاس پردازشی واحد) انجام می‌دهد: ۱. تحلیل و استدلال زمینه‌ای: مدل ابتدا ورودی صوتی را تحلیل می‌کند و یک «تحلیل زمینه‌ای» از محتوای گفتار تولید می‌کند. یعنی پیش از نوشتن متن، درباره چیزی که شنیده، فکر می‌کند. ۲. رونویسی هوشمندانه: پس از تولید این زنجیره استدلال، مدل با آگاهی بیشتری اقدام به بازشناسی و نوشتن متن نهایی می‌کند. این روش باعث می‌شود مدل از تمام قابلیت‌های زایشی و استنتاجی خود برای افزایش دقت تشخیص استفاده کند. 🎯 یک قابلیت کاربردی ویژه از ویژگی‌های جالب این رویکرد، پشتیبانی از رونویسی راهنمایی‌شده توسط کاربر است. یعنی اگر کاربر اطلاعات زمینه‌ای یا سرنخی درباره موضوع فایل صوتی در اختیار مدل بگذارد، مدل می‌تواند از آن اطلاعات برای دقیق‌تر کردن خروجی نهایی بهره ببرد. البته ساختار اصلی روش به گونه‌ای طراحی شده که خودِ مدل، به صورت خودکار این تحلیل زمینه‌ای را تولید کند. 📊 جمع‌بندی عملکرد بر اساس یافته‌های این مقاله، مدل CoT-ASR در مقایسه با مدل‌های پایه‌ای LLM که صرفاً به نگاشت صدا به متن اکتفا می‌کنند، عملکرد بهتری در بازشناسی گفتار از خود نشان داده و دقت آن در حد Whisper Large v3 ارزیابی شده است. این پژوهش نشان می‌دهد که حتی در وظایف به ظاهر ساده‌ای مثل تشخیص گفتار، فعال‌سازی توانایی «استدلال» در مدل‌های زبانی بزرگ، می‌تواند افق‌های جدیدی را بگشاید. --- 📎 لینک مقاله:  https://arxiv.org/abs/2604.00610 🆔 @asrgooyeshpardaz
1 346
16
✔️ گوگل تیم تخصصی کدنویسی با هوش مصنوعی را بازسازی می‌کند گوگل تصمیم گرفته تیم توسعه‌ی هوش مصنوعی برای کدنویسی را به ساختاری دائمی تبدیل کند. این واحد جدید میان مراحل پیش‌آموزش و پس‌آموزش قرار می‌گیرد و مسئولیت تقویت توانمندی برنامه‌نویسی مدل‌ها را بر عهده خواهد داشت. --- 🔍 علت اصلی این تغییر چیست؟ عقب‌ماندگی از Anthropic در حوزه‌ی کدنویسی با هوش مصنوعی. گوگل پیش‌تر تصور می‌کرد که مدل‌های زبانی بزرگ به‌خودی‌خود و بدون نیاز به آموزش جداگانه، مهارت برنامه‌نویسی را فرا می‌گیرند؛ اما این فرضیه اشتباه از آب درآمد. --- ⚠️ نتیجه‌ی این اشتباه چه بود؟ - ابزار Antigravity با مشکلات متعددی مواجه شد - توسعه‌دهندگان از Gemini 3.5 Flash به خاطر قیمت بالا انتقاد کردند - عرضه‌ی نسخه‌ی پرچم‌دار Gemini 3.5 Pro همچنان به تعویق افتاده است --- به نظر می‌رسد گوگل با این بازسازی، قصد جبران عقب‌ماندگی خود در رقابت با Anthropic را داشته باشد و می‌خواهد با تمرکز جدی‌تر روی قابلیت‌های کدنویسی، جایگاه خود را در این حوزه مستحکم کند. --- #اخبار_هوش_مصنوعی #گوگل #کدنویسی_با_هوش_مصنوعی #Gemini #Anthropic 🆔 @asrgooyeshpardaz
1 175
17
🧠 متا از Brain2Qwerty v2 رونمایی کرد – خواندن متن از مغز بدون جراحی آی‌ای متا نسخه‌ی دوم از سیستم Brain2Qwerty را معرفی کرده که می‌تونه متن تایپ‌شده رو مستقیماً از سیگنال‌های مغزی، بدون نیاز به کاشت الکترود در مغز، بازیابی کنه. --- 🔬 نسخه‌ی اول (v1) چطور کار می‌کرد؟ مدل حروف رو یکی‌یکی و بر اساس سیگنال MEG (مگنتوانسفالوگرافی) حدس می‌زد. --- 🚀 نسخه‌ی دوم (v2) چه فرقی داره؟ نسخه v2 دیگه حروف رو تک‌تک رمزگشایی نمی‌کنه؛ بلکه معنا و مفهوم جملات رو به‌صورت بلادرنگ و سرتاسر از سیگنال خام استخراج می‌کنه. این یه پرش کیفی محسوب میشه، نه فقط یه بهبود کوچیک تو دقت. --- 📊 اعداد و ارقام مهم: - دقت مدل در سطح کلمات به ۶۱٪ رسیده که نسبت به روش‌های غیرتهاجمی قبلی (با دقت ۸٪) پیشرفت چشمگیری داره. - برای بهترین شرکت‌کننده، دقت به ۷۸٪ رسیده؛ یعنی بیش از نیمی از جملات با یک اشتباه یا کمتر رمزگشایی شدن. - مدل روی ۲۲٬۰۰۰ جمله از ۹ داوطلب آموزش دیده که هرکدوم ۱۰ ساعت با دستگاه MEG تایپ کردن. --- ⚠️ محدودیت اصلی کجاست؟ دقت بالا وابسته به دستگاه MEG هست که: - گرونقیمته (هزینه‌اش مثل یه خونه‌ست!) - به اتاق محافظ‌شده نیاز داره - باید سر کاملاً ثابت بمونه با EEG (که قابل‌حمل و ارزونه) دقت هنوز ۶۷٪ خطا داره و عملاً قابل‌استفاده نیست. --- 🎯 مخاطب اصلی کیست؟ افرادی که بر اثر آسیب مغزی یا بیماری‌های عصبی، توانایی صحبت کردن رو از دست دادن. حتی یه راه ارتباطی ناقص و غیرتهاجمی براشون می‌تونه زندگی‌ساز باشه. --- 📝 نکته‌ی مهم: متا هنوز اطلاعات دقیقی از v2 منتشر نکرده؛ مثل دقت نهایی، سرعت تایپ، حجم دایره‌ی واژگان و اینکه آیا این روش همچنان محدود به MEG هست یا نه. --- 🔗 لینک مطلب: https://ai.meta.com/blog/brain2qwerty-brain-ai-human-communication/ --- #متا #مغز_و_هوش_مصنوعی #پردازش_سیگنال_مغزی #فناوری_عصبی #اخبار_هوش_مصنوعی 🆔 @asrgooyeshpardaz
1 209
18
ممنون از حمایت شما همراهان گرامی مجله خبری لطفاً مطالب کانال را با دوستان خود به اشتراک بگذارید. قلب و ستاره فراموش نشود ❤️⭐️
ممنون از حمایت شما همراهان گرامی مجله خبری لطفاً مطالب کانال را با دوستان خود به اشتراک بگذارید. قلب و ستاره فراموش نشود ❤️⭐️
1 267
19
🚀 شرکت DeepSeek از DSpark رونمایی کرد: شتابدهنده هوشمند مدل‌های زبانی بزرگ شرکت DeepSeek از فریم‌ورک جدید خود به نام DSpark پرده برداشته. این فریم‌ورک از روش رمزگشایی پیش‌بینانه استفاده می‌کند تا کارایی مدل‌های زبانی بزرگ رو در شرایط واقعی به طرز چشمگیری بالا ببره. DSpark با حذف گزینه‌های کم‌احتمال در تولید متن، بار اضافی روی GPU رو کاهش میده. --- ⚙️ فناوری پشت پرده: 🔹 نیمه‌خودرگرسیون: ترکیبی از پردازش موازی و یک ماژول سبک وابستگی‌ها. این کار کیفیت خروجی‌های اولیه رو بالا می‌بره و در عین حال سرعت رو حفظ میکنه. 🔹 تأیید هوشمند: یک برنامه‌ریز، شانس موفقیت هر توکن رو ارزیابی میکنه و به‌صورت پویا، حجم فرآیند تأیید رو با توجه به بار سیستم تنظیم میکنه. --- 📊 ارقام کلیدی: 📈 سرعت تولید متن در مدل DeepSeek-V4 بین ۶۰ تا ۸۵ درصد افزایش پیدا کرده. 🎯 کارایی DSpark حدود ۳۰ درصد بهتر از رقیب مشابه یعنی Eagle3 هست. 📂 این پروژه متن‌باز هست و چک‌پوینت‌ها و کدهای DeepSpec به‌صورت عمومی در دسترس قرار گرفته. --- با DSpark، هوش مصنوعی می‌تونه بدون افت کیفیت، حتی در زمان هجوم سنگین کاربران، سریع‌تر کار کنه 🌐🤖 🔗 لینک مقاله: https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf --- #DeepSeek #DSpark #هوش_مصنوعی #پردازش_زبان_طبیعی #بهینه‌سازی 🆔 @asrgooyeshpardaz
1 303
20
🧠 چرا لابراتوارهای بزرگ هوش مصنوعی فیلسوف استخدام می‌کنند؟ ده سال پیش، به دانشجویان علوم انسانی و هنر گفته می‌شد که اگر خواهان شغلی مطمئن هستند، «برنامه‌نویسی یاد بگیرند». اما امروز، این برنامه‌نویسان هستند که از تصاحب شغل‌شان توسط هوش مصنوعی هراس دارند. تغییر بزرگ: شرکت‌های پیشروی هوش مصنوعی مانند OpenAI، DeepMind و Anthropic به‌شدت به دنبال جذب فیلسوفان هستند. چرا؟ چون فناوری هوش مصنوعی مملو از مسائل پیچیده‌ی اخلاقی، معرفت‌شناختی و فلسفی است؛ همان نوع مسائلی که فیلسوفان برای حل‌کردنشان آموزش دیده‌اند. --- 🎯 فیلسوفان چه کمکی به هوش مصنوعی می‌کنند؟ ۱. تدوین اصول اخلاقی: تعیین مرزهای اخلاقی برای رفتار مدل‌های هوش مصنوعی در موقعیت‌های حساس و دوسر‌دشوار. ۲. شفاف‌سازی مفاهیم: کمک به تعریف دقیق مفاهیمی مانند «هوش»، «آگاهی»، «عامل‌بودن» و «مسئولیت» که در قلب توسعه‌ی هوش مصنوعی قرار دارند. ۳. مدیریت ریسک‌های وجودی: تحلیل سناریوهای بلندمدت و خطرات احتمالی هوش مصنوعی برای بشریت و ارائه‌ی چارچوب‌هایی برای مهار آنها. ۴. بهبود قضاوت اخلاقی مدل‌ها: طراحی چارچوب‌های استدلال اخلاقی برای مدل‌ها تا در موقعیت‌های مبهم، تصمیمات بهتری بگیرند. --- 💡 نکته‌ی کلیدی هوش مصنوعی فقط یک مسئله‌ی مهندسی نیست؛ بلکه عمیقاً یک مسئله‌ی فلسفی است. اینکه چگونه یک مدل باید تصمیم بگیرد، چه ارزش‌هایی را اولویت دهد و چگونه با ابهامات اخلاقی کنار بیاید، سوالاتی هستند که مهندسان به‌تنهایی نمی‌توانند به آنها پاسخ دهند. اینجاست که فیلسوفان وارد می‌شوند. پس شاید بهترین توصیه‌ی شغلی برای دهه‌ی آینده این باشد: فلسفه بخوانید! --- 📚 منبع: مقالۀ اکونومیست 📅 تاریخ انتشار: ۲۴ ژوئن ۲۰۲۶ https://www.economist.com/science-and-technology/2026/06/24/why-big-ai-labs-are-hiring-so-many-philosophers --- #هوش_مصنوعی #فلسفه #اخلاق_هوش_مصنوعی #آینده_کار #اخبار_فناوری 🆔 @asrgooyeshpardaz
1 442