uk
Feedback
عصر گویش | هوش مصنوعی

عصر گویش | هوش مصنوعی

Відкрити в Telegram

مجله هوش مصنوعی عصر گویش 021 61931000

Показати більше

📈 Аналітичний огляд Telegram-каналу عصر گویش | هوش مصنوعی

Канал عصر گویش | هوش مصنوعی (@asrgooyeshpardaz) у мовному сегменті Фарсі є активним учасником. На даний момент спільнота об'єднує 102 049 підписників, посідаючи 1 230 місце в категорії Технології та додатки та 2 941 місце у регіоні Іран.

📊 Показники аудиторії та динаміка

З моменту свого створення невідомо, проект продемонстрував стрімке зростання, зібравши аудиторію у 102 049 підписників.

За останніми даними від 29 червня, 2026, канал демонструє стабільну активність. Хоча за останні 30 днів спостерігається зміна кількості учасників на -1 350, а за останні 24 години на -1, загальне охоплення залишається високим.

  • Статус верифікації: Не верифікований
  • Рівень залученості (ER): Середній показник залученості аудиторії становить 2.10%. Протягом перших 24 годин після публікації контент зазвичай збирає 1.10% реакцій від загальної кількості підписників.
  • Охоплення публікацій: В середньому кожен допис отримує 2 146 переглядів. Протягом першої доби публікація в середньому набирає 1 124 переглядів.
  • Реакції та взаємодія: Аудиторія активно підтримує контент: середня кількість реакцій на один пост – 4.
  • Тематичні інтереси: Контент зосереджений навколо ключових тем, таких як مدل, گفتار, به‌طور, عامل, ابزار.

📝 Опис та контентна політика

Автор описує ресурс як майданчик для висловлення суб'єктивної думки:
مجله هوش مصنوعی عصر گویش 021 61931000

Завдяки високій частоті оновлень (останні дані отримано 30 червня, 2026), канал підтримує актуальність та високий рівень охоплення публікацій. Аналітика показує, що аудиторія активно взаємодіє з контентом, що робить його важливою точкою впливу в категорії Технології та додатки.

102 049
Підписники
-124 години
-1967 днів
-1 35030 день

Триває завантаження даних...

Залучення підписників
червень '26
червень '26
+149
в 1 каналах
травень '260
в 0 каналах
Get PRO
квітень '260
в 0 каналах
Get PRO
березень '260
в 0 каналах
Get PRO
лютий '260
в 0 каналах
Get PRO
січень '260
в 2 каналах
Get PRO
грудень '25
+1
в 4 каналах
Get PRO
листопад '250
в 7 каналах
Get PRO
жовтень '250
в 6 каналах
Get PRO
вересень '250
в 5 каналах
Get PRO
серпень '250
в 5 каналах
Get PRO
липень '250
в 1 каналах
Get PRO
червень '250
в 4 каналах
Get PRO
травень '25
+2
в 1 каналах
Get PRO
квітень '250
в 1 каналах
Get PRO
березень '250
в 0 каналах
Get PRO
лютий '250
в 0 каналах
Get PRO
січень '250
в 0 каналах
Get PRO
грудень '24
+352
в 1 каналах
Get PRO
листопад '24
+588
в 0 каналах
Get PRO
жовтень '24
+53
в 4 каналах
Get PRO
вересень '24
+65
в 5 каналах
Get PRO
серпень '24
+14
в 6 каналах
Get PRO
липень '24
+317
в 6 каналах
Get PRO
червень '24
+490
в 5 каналах
Get PRO
травень '240
в 4 каналах
Get PRO
квітень '24
+452
в 4 каналах
Get PRO
березень '24
+2 402
в 5 каналах
Get PRO
лютий '24
+5 784
в 9 каналах
Get PRO
січень '24
+8 641
в 14 каналах
Get PRO
грудень '23
+17 410
в 7 каналах
Get PRO
листопад '23
+7 494
в 9 каналах
Get PRO
жовтень '23
+10 370
в 8 каналах
Get PRO
вересень '23
+14 111
в 0 каналах
Get PRO
серпень '23
+5 803
в 0 каналах
Get PRO
липень '23
+5 026
в 0 каналах
Get PRO
червень '23
+7 915
в 0 каналах
Get PRO
травень '23
+21 355
в 0 каналах
Get PRO
квітень '23
+43 552
в 0 каналах
Get PRO
березень '23
+59 493
в 0 каналах
Get PRO
лютий '23
+3 388
в 0 каналах
Get PRO
січень '23
+1 433
в 0 каналах
Get PRO
грудень '22
+517
в 0 каналах
Get PRO
листопад '22
+498
в 0 каналах
Get PRO
жовтень '22
+274
в 0 каналах
Get PRO
вересень '22
+464
в 0 каналах
Get PRO
серпень '22
+721
в 0 каналах
Get PRO
липень '22
+599
в 0 каналах
Get PRO
червень '22
+1 527
в 0 каналах
Get PRO
травень '22
+2 541
в 0 каналах
Get PRO
квітень '22
+1 061
в 0 каналах
Get PRO
березень '22
+1 666
в 0 каналах
Get PRO
лютий '22
+2 147
в 0 каналах
Get PRO
січень '22
+6 134
в 0 каналах
Get PRO
грудень '21
+4 172
в 0 каналах
Get PRO
листопад '21
+4 271
в 0 каналах
Get PRO
жовтень '21
+4 181
в 0 каналах
Get PRO
вересень '21
+1 061
в 0 каналах
Get PRO
серпень '21
+13 231
в 0 каналах
Get PRO
липень '21
+5 069
в 0 каналах
Get PRO
червень '21
+2 973
в 0 каналах
Get PRO
травень '21
+3 700
в 0 каналах
Get PRO
квітень '21
+5 497
в 0 каналах
Get PRO
березень '21
+9 553
в 0 каналах
Get PRO
лютий '21
+5 411
в 0 каналах
Get PRO
січень '21
+3 903
в 0 каналах
Get PRO
грудень '20
+46 342
в 0 каналах
Дата
Залучення підписників
Згадування
Канали
30 червня0
29 червня0
28 червня+20
27 червня+12
26 червня+5
25 червня0
24 червня0
23 червня+3
22 червня+4
21 червня+4
20 червня+23
19 червня+15
18 червня0
17 червня+36
16 червня+27
15 червня0
14 червня0
13 червня0
12 червня0
11 червня0
10 червня0
09 червня0
08 червня0
07 червня0
06 червня0
05 червня0
04 червня0
03 червня0
02 червня0
01 червня0
Дописи каналу
🧬 جزئی‌ترین مدل سه‌بعدی از سلول انسانی ساخته شد – ترکیبی از هنر و علم این تصویر، یک عکس معمولی نیست؛ بلکه حاصل تلفیق داده‌های کریستال‌وگرافی اشعه‌ی ایکس، طیف‌بندی تشدید مغناطیسی هسته‌ای (NMR) و میکروسکوپ الکترونی برودتی (Cryo-EM) است. --- 🔬 دنیای شگفت‌انگیز درون یک سلول (به اندازه‌ی ۰٫۰۵ میلی‌متر): ▫️ حدود ۶۰ میلیارد پروتئین ▫️ حدود ۲ تریلیون مولکول لیپید (چربی) ▫️ حدود ۵ تریلیون مولکول قند و اسید آمینه ▫️ حدود ۶۰ میلیارد مولکول RNA همه‌ی این اجزا با هم همکاری می‌کنند تا زندگی را ممکن سازند. --- 🎨 این مدل چیست و چه کاربردی دارد؟ این مدل توسط تیم Digizyme (وابسته به هاروارد) ساخته شده و نشان می‌دهد که مولکول‌ها چگونه در یک محیط شلوغ و به‌هم‌پیوسته با هم تعامل دارند. این مدل متعلق به یک سلول خاص نیست؛ بلکه یک صحنه‌ی نمایشی برای مطالعه‌ی فرآیندهای متعدد است: از سنتز پروتئین و مسیرهای سیگنال‌دهی گرفته تا اندوسیتوز، آپوپتوز (مرگ برنامه‌ریزی‌شده‌ی سلول)، و .. منبع

2
🔬 تازه‌های مایکروسافت در بازشناسی گفتار؛ وقتی LLM از قدرت «فکر کردن» برای بازشناسی گفتار استفاده می‌کند اخیراً مقاله‌ای از تیم تحقیقاتی مایکروسافت (با نویسندگی Keqi Deng و همکاران) روی arXiv منتشر شده که در آن روشی جدید برای بهبود بازشناسی خودکار گفتار (ASR) معرفی شده است. نکته جالب توجه این است که دقت این روش جدید، در محدوده مدل معروف Whisper Large v3 قرار دارد. اما تفاوت اصلی در «چگونگی» انجام کار است. 🔴 مشکل اصلی از نظر محققان چیست؟ مدل‌های زبانی بزرگ (LLM) مانند GPT توانایی بالایی در درک مفاهیم و تحلیل بافت متن دارند. اما وقتی از این مدل‌ها برای تشخیص گفتار استفاده می‌شود، عملاً تنها کار «نگاشت مستقیم صدا به متن» را انجام می‌دهند. به عبارت فنی‌تر، استفاده از دانش غنی و درک زمینه‌ای این مدل‌ها در چنین کاری اصلاً ساده نیست، چون خودِ ذات بازشناسی گفتار، یک تبدیل خطی (صدا 👈 کلمه) محسوب می‌شود و مدل فرصتی برای به‌کارگیری استدلال خود پیدا نمی‌کند. ✅ راهکار جدید: CoT-ASR (بازشناسی گفتار مبتنی بر زنجیره‌ای از تفکر) برای حل این معضل، محققان مفهومی به نام زنجیره‌ای از تفکر (Chain-of-Thought) را به فرایند تشخیص گفتار اضافه کرده‌اند. در روش جدید که CoT-ASR نام دارد، مدل زبانی کار را در دو گام (اما در یک پاس پردازشی واحد) انجام می‌دهد: ۱. تحلیل و استدلال زمینه‌ای: مدل ابتدا ورودی صوتی را تحلیل می‌کند و یک «تحلیل زمینه‌ای» از محتوای گفتار تولید می‌کند. یعنی پیش از نوشتن متن، درباره چیزی که شنیده، فکر می‌کند. ۲. رونویسی هوشمندانه: پس از تولید این زنجیره استدلال، مدل با آگاهی بیشتری اقدام به بازشناسی و نوشتن متن نهایی می‌کند. این روش باعث می‌شود مدل از تمام قابلیت‌های زایشی و استنتاجی خود برای افزایش دقت تشخیص استفاده کند. 🎯 یک قابلیت کاربردی ویژه از ویژگی‌های جالب این رویکرد، پشتیبانی از رونویسی راهنمایی‌شده توسط کاربر است. یعنی اگر کاربر اطلاعات زمینه‌ای یا سرنخی درباره موضوع فایل صوتی در اختیار مدل بگذارد، مدل می‌تواند از آن اطلاعات برای دقیق‌تر کردن خروجی نهایی بهره ببرد. البته ساختار اصلی روش به گونه‌ای طراحی شده که خودِ مدل، به صورت خودکار این تحلیل زمینه‌ای را تولید کند. 📊 جمع‌بندی عملکرد بر اساس یافته‌های این مقاله، مدل CoT-ASR در مقایسه با مدل‌های پایه‌ای LLM که صرفاً به نگاشت صدا به متن اکتفا می‌کنند، عملکرد بهتری در بازشناسی گفتار از خود نشان داده و دقت آن در حد Whisper Large v3 ارزیابی شده است. این پژوهش نشان می‌دهد که حتی در وظایف به ظاهر ساده‌ای مثل تشخیص گفتار، فعال‌سازی توانایی «استدلال» در مدل‌های زبانی بزرگ، می‌تواند افق‌های جدیدی را بگشاید. --- 📎 لینک مقاله:  https://arxiv.org/abs/2604.00610 🆔 @asrgooyeshpardaz
714
3
✔️ گوگل تیم تخصصی کدنویسی با هوش مصنوعی را بازسازی می‌کند گوگل تصمیم گرفته تیم توسعه‌ی هوش مصنوعی برای کدنویسی را به ساختاری دائمی تبدیل کند. این واحد جدید میان مراحل پیش‌آموزش و پس‌آموزش قرار می‌گیرد و مسئولیت تقویت توانمندی برنامه‌نویسی مدل‌ها را بر عهده خواهد داشت. --- 🔍 علت اصلی این تغییر چیست؟ عقب‌ماندگی از Anthropic در حوزه‌ی کدنویسی با هوش مصنوعی. گوگل پیش‌تر تصور می‌کرد که مدل‌های زبانی بزرگ به‌خودی‌خود و بدون نیاز به آموزش جداگانه، مهارت برنامه‌نویسی را فرا می‌گیرند؛ اما این فرضیه اشتباه از آب درآمد. --- ⚠️ نتیجه‌ی این اشتباه چه بود؟ - ابزار Antigravity با مشکلات متعددی مواجه شد - توسعه‌دهندگان از Gemini 3.5 Flash به خاطر قیمت بالا انتقاد کردند - عرضه‌ی نسخه‌ی پرچم‌دار Gemini 3.5 Pro همچنان به تعویق افتاده است --- به نظر می‌رسد گوگل با این بازسازی، قصد جبران عقب‌ماندگی خود در رقابت با Anthropic را داشته باشد و می‌خواهد با تمرکز جدی‌تر روی قابلیت‌های کدنویسی، جایگاه خود را در این حوزه مستحکم کند. --- #اخبار_هوش_مصنوعی #گوگل #کدنویسی_با_هوش_مصنوعی #Gemini #Anthropic 🆔 @asrgooyeshpardaz
707
4
🧠 متا از Brain2Qwerty v2 رونمایی کرد – خواندن متن از مغز بدون جراحی آی‌ای متا نسخه‌ی دوم از سیستم Brain2Qwerty را معرفی کرده که می‌تونه متن تایپ‌شده رو مستقیماً از سیگنال‌های مغزی، بدون نیاز به کاشت الکترود در مغز، بازیابی کنه. --- 🔬 نسخه‌ی اول (v1) چطور کار می‌کرد؟ مدل حروف رو یکی‌یکی و بر اساس سیگنال MEG (مگنتوانسفالوگرافی) حدس می‌زد. --- 🚀 نسخه‌ی دوم (v2) چه فرقی داره؟ نسخه v2 دیگه حروف رو تک‌تک رمزگشایی نمی‌کنه؛ بلکه معنا و مفهوم جملات رو به‌صورت بلادرنگ و سرتاسر از سیگنال خام استخراج می‌کنه. این یه پرش کیفی محسوب میشه، نه فقط یه بهبود کوچیک تو دقت. --- 📊 اعداد و ارقام مهم: - دقت مدل در سطح کلمات به ۶۱٪ رسیده که نسبت به روش‌های غیرتهاجمی قبلی (با دقت ۸٪) پیشرفت چشمگیری داره. - برای بهترین شرکت‌کننده، دقت به ۷۸٪ رسیده؛ یعنی بیش از نیمی از جملات با یک اشتباه یا کمتر رمزگشایی شدن. - مدل روی ۲۲٬۰۰۰ جمله از ۹ داوطلب آموزش دیده که هرکدوم ۱۰ ساعت با دستگاه MEG تایپ کردن. --- ⚠️ محدودیت اصلی کجاست؟ دقت بالا وابسته به دستگاه MEG هست که: - گرونقیمته (هزینه‌اش مثل یه خونه‌ست!) - به اتاق محافظ‌شده نیاز داره - باید سر کاملاً ثابت بمونه با EEG (که قابل‌حمل و ارزونه) دقت هنوز ۶۷٪ خطا داره و عملاً قابل‌استفاده نیست. --- 🎯 مخاطب اصلی کیست؟ افرادی که بر اثر آسیب مغزی یا بیماری‌های عصبی، توانایی صحبت کردن رو از دست دادن. حتی یه راه ارتباطی ناقص و غیرتهاجمی براشون می‌تونه زندگی‌ساز باشه. --- 📝 نکته‌ی مهم: متا هنوز اطلاعات دقیقی از v2 منتشر نکرده؛ مثل دقت نهایی، سرعت تایپ، حجم دایره‌ی واژگان و اینکه آیا این روش همچنان محدود به MEG هست یا نه. --- 🔗 لینک مطلب: https://ai.meta.com/blog/brain2qwerty-brain-ai-human-communication/ --- #متا #مغز_و_هوش_مصنوعی #پردازش_سیگنال_مغزی #فناوری_عصبی #اخبار_هوش_مصنوعی 🆔 @asrgooyeshpardaz
750
5
ممنون از حمایت شما همراهان گرامی مجله خبری لطفاً مطالب کانال را با دوستان خود به اشتراک بگذارید. قلب و ستاره فراموش نشود ❤️⭐️
ممنون از حمایت شما همراهان گرامی مجله خبری لطفاً مطالب کانال را با دوستان خود به اشتراک بگذارید. قلب و ستاره فراموش نشود ❤️⭐️
990
6
🚀 شرکت DeepSeek از DSpark رونمایی کرد: شتابدهنده هوشمند مدل‌های زبانی بزرگ شرکت DeepSeek از فریم‌ورک جدید خود به نام DSpark پرده برداشته. این فریم‌ورک از روش رمزگشایی پیش‌بینانه استفاده می‌کند تا کارایی مدل‌های زبانی بزرگ رو در شرایط واقعی به طرز چشمگیری بالا ببره. DSpark با حذف گزینه‌های کم‌احتمال در تولید متن، بار اضافی روی GPU رو کاهش میده. --- ⚙️ فناوری پشت پرده: 🔹 نیمه‌خودرگرسیون: ترکیبی از پردازش موازی و یک ماژول سبک وابستگی‌ها. این کار کیفیت خروجی‌های اولیه رو بالا می‌بره و در عین حال سرعت رو حفظ میکنه. 🔹 تأیید هوشمند: یک برنامه‌ریز، شانس موفقیت هر توکن رو ارزیابی میکنه و به‌صورت پویا، حجم فرآیند تأیید رو با توجه به بار سیستم تنظیم میکنه. --- 📊 ارقام کلیدی: 📈 سرعت تولید متن در مدل DeepSeek-V4 بین ۶۰ تا ۸۵ درصد افزایش پیدا کرده. 🎯 کارایی DSpark حدود ۳۰ درصد بهتر از رقیب مشابه یعنی Eagle3 هست. 📂 این پروژه متن‌باز هست و چک‌پوینت‌ها و کدهای DeepSpec به‌صورت عمومی در دسترس قرار گرفته. --- با DSpark، هوش مصنوعی می‌تونه بدون افت کیفیت، حتی در زمان هجوم سنگین کاربران، سریع‌تر کار کنه 🌐🤖 🔗 لینک مقاله: https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf --- #DeepSeek #DSpark #هوش_مصنوعی #پردازش_زبان_طبیعی #بهینه‌سازی 🆔 @asrgooyeshpardaz
966
7
🧠 چرا لابراتوارهای بزرگ هوش مصنوعی فیلسوف استخدام می‌کنند؟ ده سال پیش، به دانشجویان علوم انسانی و هنر گفته می‌شد که اگر خواهان شغلی مطمئن هستند، «برنامه‌نویسی یاد بگیرند». اما امروز، این برنامه‌نویسان هستند که از تصاحب شغل‌شان توسط هوش مصنوعی هراس دارند. تغییر بزرگ: شرکت‌های پیشروی هوش مصنوعی مانند OpenAI، DeepMind و Anthropic به‌شدت به دنبال جذب فیلسوفان هستند. چرا؟ چون فناوری هوش مصنوعی مملو از مسائل پیچیده‌ی اخلاقی، معرفت‌شناختی و فلسفی است؛ همان نوع مسائلی که فیلسوفان برای حل‌کردنشان آموزش دیده‌اند. --- 🎯 فیلسوفان چه کمکی به هوش مصنوعی می‌کنند؟ ۱. تدوین اصول اخلاقی: تعیین مرزهای اخلاقی برای رفتار مدل‌های هوش مصنوعی در موقعیت‌های حساس و دوسر‌دشوار. ۲. شفاف‌سازی مفاهیم: کمک به تعریف دقیق مفاهیمی مانند «هوش»، «آگاهی»، «عامل‌بودن» و «مسئولیت» که در قلب توسعه‌ی هوش مصنوعی قرار دارند. ۳. مدیریت ریسک‌های وجودی: تحلیل سناریوهای بلندمدت و خطرات احتمالی هوش مصنوعی برای بشریت و ارائه‌ی چارچوب‌هایی برای مهار آنها. ۴. بهبود قضاوت اخلاقی مدل‌ها: طراحی چارچوب‌های استدلال اخلاقی برای مدل‌ها تا در موقعیت‌های مبهم، تصمیمات بهتری بگیرند. --- 💡 نکته‌ی کلیدی هوش مصنوعی فقط یک مسئله‌ی مهندسی نیست؛ بلکه عمیقاً یک مسئله‌ی فلسفی است. اینکه چگونه یک مدل باید تصمیم بگیرد، چه ارزش‌هایی را اولویت دهد و چگونه با ابهامات اخلاقی کنار بیاید، سوالاتی هستند که مهندسان به‌تنهایی نمی‌توانند به آنها پاسخ دهند. اینجاست که فیلسوفان وارد می‌شوند. پس شاید بهترین توصیه‌ی شغلی برای دهه‌ی آینده این باشد: فلسفه بخوانید! --- 📚 منبع: مقالۀ اکونومیست 📅 تاریخ انتشار: ۲۴ ژوئن ۲۰۲۶ https://www.economist.com/science-and-technology/2026/06/24/why-big-ai-labs-are-hiring-so-many-philosophers --- #هوش_مصنوعی #فلسفه #اخلاق_هوش_مصنوعی #آینده_کار #اخبار_فناوری 🆔 @asrgooyeshpardaz
1 138
8
🔍فرض کنید یک مدل زبانی بزرگ را تازه روی سیستم خودتان نصب کرده‌اید. بعد از چند تا گفت‌وگوی معمولی، این سوال برایتان پیش می‌آید: «به جز چت کردن، چه کار دیگری می‌توانم با این مدل بکنم؟» پاسخ این است: با اضافه کردن قابلیت عاملیت (Agentic) و اتصال به ابزارهای بیرونی، می‌توانید از آن یک دستیار پژوهشی یا اجرایی بسازید که برایتان جستجو کند، اطلاعات را جمع‌آوری کند و پاسخ مستند تحویل دهد. --- 🛠️ ابزارهای کلیدی پروژه برای ساختن این عامل هوشمند محلی به چهار جزء نیاز داریم. اول، Ollama که مدل را روی سیستم اجرا می‌کند. دوم، مدل Gemma 4 در نسخه‌ی سبک E4B که مخصوص پردازش‌های عامل (Agentic) طراحی شده؛ اگر سخت‌افزار محدودتری دارید، نسخه‌ی E2B هم گزینه‌ی مناسبی است. سوم، کتابخانه‌ی OpenAI Agents SDK که حلقه‌های تصمیم‌گیری و اجرای عامل را مدیریت می‌کند. چهارم، سرویس جستجوی Tavily MCP که از طریق پروتکل MCP در اختیار عامل قرار می‌گیرد. نکته‌ی جالب اینکه همه‌ی این ابزارها به‌صورت محلی یا با کلید اختصاصی شما اجرا می‌شوند و نیازی به ارسال داده به سرورهای بیرونی نیست. --- ⚙️ راه‌اندازی و پیکربندی ابتدا Ollama را نصب کرده و مدل را با دستور ollama pull gemma4:e4b دریافت کنید. سپس کتابخانه‌های openai-agents و openai را نصب کنید. هرچند از کتابخانه‌ی openai استفاده می‌کنیم، اما آن را به آدرس محلی http://localhost:11434/v1 متصل می‌کنیم تا کاملاً آفلاین و مستقل کار کند. برای ابزار جستجو، در سایت Tavily ثبت‌نام کرده، کلید دریافت کنید و لینک MCP را به فرم https://mcp.tavily.com/mcp/?tavilyApiKey=<کلید-شما> بسازید. در مرحله‌ی بعد، با کمک OpenAI Agents SDK، مدل را درون یک عامل قرار می‌دهیم. به عامل دستورالعمل می‌دهیم که برای پاسخ به سوالات، اول یک جستجوی هدفمند انجام بدهد، اگر نتایج اولیه ناقص یا متناقض بود جستجوهای تکمیلی کند، و در نهایت فقط بر اساس شواهد معتبر پاسخ بدهد و حتماً منبع هر ادعای مهم را ذکر کند. در کد، ابزار جستجوی Tavily را از طریق پروتکل MCP به این عامل متصل می‌کنیم تا بتواند به‌صورت خودکار از وب اطلاعات بگیرد. --- 🌐 یک مثال عملی فرض کنید از عامل می‌پرسیم: *«جدیدترین رویکردها برای افزایش دقت مدل‌های زبانی کوچک در کاربردهای تحلیلی چیست؟»* عامل دقیقاً مطابق دستورالعملی که دادیم، کار را شروع می‌کند. ابتدا یک عبارت جستجوی مناسب تولید می‌کند و آن را از طریق ابزار Tavily به وب می‌فرستد. بعد از دریافت نتایج، اگر اطلاعات برای پاسخ‌دهی کافی باشد، همان یک دور جستجو کافی است و پاسخ نهایی را با ذکر لینک منابع معتبر تولید می‌کند. اگر سوال پیچیده‌تر باشد (مثلاً نیاز به مقایسه یا بررسی چندین گزینه داشته باشد)، خودِ عامل تشخیص می‌دهد که باید جستجوهای بعدی انجام دهد تا به یک جمع‌بندی مستند برسد. این معماری به‌خوبی از چندین دور جستجو و استدلال پشتیبانی می‌کند. --- ✨ جمع‌بندی نهایی یک مدل محلی فقط یک چت‌بات ساده نیست. با قرار دادن آن درون یک چارچوب عامل و متصل کردن ابزارهای مبتنی بر پروتکل MCP، می‌توانید از آن یک دستیار پژوهشی، جستجوگر هوشمند یا حتی یک مجری وظایف خاص بسازید. الگوی معرفی‌شده در این پروژه کاملاً قابل تعمیم است؛ یعنی به‌جای جستجوی وب، می‌توانید ابزارهای MCP دیگر را جایگزین کنید و برای کاربردهای متنوعی از آن استفاده نمایید. --- 📄 مطالعه‌ی مطلب کامل: From Local LLM to Tool-Using Agent 🆔 @asrgooyeshpardaz
919
9
📊 مطالعه MIT: هوش مصنوعی کد بیشتر می‌نویسد، اما محصول نهایی را به همان نسبت رشد نمی‌دهد پژوهشی تازه از مؤسسه‌ی فناوری ماساچوست، واقعیتی را درباره‌ی تأثیر هوش مصنوعی بر توسعه‌ی نرم‌افزار آشکار کرده است: کدهای بسیار بیشتری نوشته می‌شود، اما محصول نهایی به همان اندازه افزایش نمی‌یابد. محققان با بررسی بیش از ۱۰۰٬۰۰۰ توسعه‌دهنده در گیت‌هاب، تأثیر ابزارهای مختلف کدنویسی مبتنی بر هوش مصنوعی را مقایسه کرده‌اند؛ از تکمیل‌کننده‌های خودکار (Autocomplete) گرفته تا عامل‌های خودمختار (Autonomous Agents). --- 📈 آمار رشد - تکمیل‌کننده‌های خودکار: ۴۰٪ افزایش در تعداد ارسال‌ها (Commits) - عامل‌های تعاملی کدنویسی: ۱۴۰٪ افزایش - عامل‌های خودمختار کدنویسی: ۱۸۰٪ افزایش اما در ادامه، تصویر تغییر می‌کند: - رشد ۱۸۰٪ در Commitها، به تنها ۵۰٪ رشد در تعداد پروژه‌ها انجامیده است. - و این رشد ۵۰٪ نیز به ۳۰٪ افزایش در انتشار نسخه‌های واقعی (Releases) محدود شده است. --- ⚙️ علت چیست؟ تولید نرم‌افزار، چیزی فراتر از تایپ خطوط کد است. کد نوشته‌شده باید: - بررسی و بازبینی شود - با محصول نهایی هماهنگ گردد - آزمون‌های گوناگون را پشت سر بگذارد - در معماری کلی سیستم جای بگیرد - موارد مرزی (Edge Cases) در آن پردازش شود - بسته‌بندی و منتشر گردد - و در نهایت، کاربران آن را بپذیرند و به کار گیرند هوش مصنوعی در بخش «نوشتن کد» درخشان عمل می‌کند، اما گره‌های کور فرآیند توسعه، همچنان پابرجا هستند. --- 📱 بازار اپلیکیشن‌ها هم این روند را تأیید می‌کند بررسی بازارهای اپلیکیشن نشان می‌دهد که هرچند تعداد برنامه‌های جدید افزایش یافته، استفاده‌ی کلی از آنها رشد چشمگیری نداشته است. تولید نرم‌افزار بیشتر، لزوماً به معنای پذیرش بیشتر توسط کاربران نیست. --- 🎯 پیام اصلی این پژوهش، ضربه‌ی محکمی است به این باور ساده‌انگارانه که «هوش مصنوعی جای توسعه‌دهندگان را می‌گیرد، چون کد را سریع‌تر می‌نویسد». هوش مصنوعی کدنویسی را شتاب می‌بخشد؛ بله. اما مسیر کامل از ایده تا محصول نهایی را - هنوز - نمی‌تواند جایگزین کند. --- 📚 منبع مقاله در پایگاه SSRN منتشر شده است: 📄https://papers.ssrn.com/sol3/papers.cfm?abstract_id=6859839 --- #پژوهش_هوش_مصنوعی #توسعه_نرم_افزار #کدنویسی_با_هوش_مصنوعی #MIT #آینده_کار #AI #ML 🆔 @asrgooyeshpardaz
977
10
🌐اخبار هوش مصنوعی 🌍 اتحادیه اروپا در مسیر خودکفایی فناورانه؛ مدل زبانی بزرگ متن‌باز توسعه می‌دهد شرکت ایتالیایی دامین (که پیشتر با نام آی‌جینیوس شناخته می‌شد)، با همکاری کنسرسیوم یوروپا و پشتیبانی کمیسیون اروپا، مدلی ۴۰۰ میلیارد پارامتری را طی یک سال آینده روانه‌ی بازار خواهد کرد. این مدل از صفر آموزش داده می‌شود و داده‌های آموزشی آن با همکاری دولت‌های اروپایی گردآوری می‌گردد. پروژه کاملاً متن‌باز خواهد بود و امکان استقرار آن روی سرورهای سازمانی و دولتی فراهم است. پشت‌پرده‌ی این ابتکار، محدودیت‌های نظارتی و چالش‌های ژئوپلیتیکی است؛ ایتالیا و جمهوری چک پیش‌تر استفاده‌ی ابری از مدل‌های دیپ‌سیک را ممنوع کرده و فقط میزبانی محلی را مجاز دانسته‌اند. همچنین کسب‌وکارهای اروپایی با اعمال کنترل صادراتی آمریکا دست‌به‌گریبان‌اند. 🔗 reuters.com 🔲 کوالکام پا به عرصه‌ی دیتاسنترها می‌گذارد غول چیپ‌سازی موبایل، از پردازنده‌ی سروری جدید خود با نام Dragonfly C1000 پرده برداشته و هم‌زمان استارتاپ مودولار را به بهای ۴ میلیارد دلار تصاحب کرده است. این پردازنده به‌گونه‌ای طراحی شده که عامل‌های هوش مصنوعی را با بیشترین بهره‌وری انرژی پشتیبانی کند. مارک زاکربرگ به‌عنوان نخستین مشتری کلان، قصد دارد زیرساخت خود را تا سال ۲۰۲۸ بر پایه‌ی این تراشه‌ها بازطراحی کند. خرید مودولار نیز به کوالکام امکان می‌دهد تا لایه‌ی نرم‌افزاری خود را تقویت کند؛ چراکه این استارتاپ نرم‌افزاری برای اجرای مدل‌ها روی معماری‌های گوناگون سخت‌افزاری توسعه داده است. 🔗 cnbc.com ☕️ شبیه‌سازی نوین ساکانا برای سنجش مهارت‌های اقتصادی مدل‌های زبانی استارتاپ ژاپنی ساکانا به همراه کی‌پی‌ام‌جی، شبیه‌سازی به نام کافی‌بنچ را طراحی کرده که زنجیره‌ی تأمین قهوه را بازآفرینی می‌کند تا توانمندی‌های اقتصادی عامل‌های هوش مصنوعی را ارزیابی نماید. در این شبیه‌سازی، مدلِ تحت‌آزمایش نقش یک برشته‌کننده‌ی قهوه را ایفا می‌کند و سایر عوامل بازار (کشاورزان و خرده‌فروشان) توسط مدل Sonnet 4.6 هدایت می‌شوند. این عامل در بازه‌ی ۹۰ روز مجازی، باید دادوستد کند، صورتحساب‌ها را پرداخت و اعتبارات را مدیریت نماید. هزینه‌های روزانه، مدل را ناچار به معاملاتی پویا می‌کند تا از ورشکستگی بگریزد. نتایج جالب بوده است: GPT-5.5 و Opus 4.7 فروش خود را با جدیت گسترش دادند؛ Gemini 3.1 Pro رویکردی منفعلانه در پیش گرفت؛ Kimi K2.6 دست به معاملات زیان‌ده زد و Haiku 4.5 بر اثر اهمال‌کاری و به‌تعویق‌انداختن مداوم اقدامات، ورشکست شد. کد منبع پروژه و گزارش‌های آزمون به‌صورت عمومی در دسترس بوده و این دستاورد در کنفرانس ICML 2026 پذیرفته شده است. 🔗 sakana.ai | GitHub: SakanaAI/CoffeeBench 🛡 ائتلافی از غول‌های فناوری برای حراست از متن‌باز در برابر حملات هوش مصنوعی بنیاد لینوکس، ابتکار Akrites را برای حفاظت از پروژه‌های متن‌باز در برابر تهدیدات نوین هوش مصنوعی کلید زده است. بیش از ۲۰ شرکت از جمله آمازون، گوگل، مایکروسافت، اوپن‌ایآی و انتروپیک به این پیمان پیوسته‌اند. هدف، کشف و رفع آسیب‌پذیری‌های نرم‌افزارهای حیاتی پیش از آنکه توسط هوش مصنوعی کشف شوند است. هسته‌ی اصلی پروژه، گروه واکنش سریع به حوادث خواهد بود که گزارش‌های خطا را پالایش، وصله‌های امنیتی را هماهنگ و به‌عنوان مرجع تماس برای نگهدارندگان پروژه عمل می‌کند. ارزیابی آسیب‌پذیری‌ها و تبادل اطلاعات بر پایه‌ی استانداردهای CVE، CVSS و پروتکل TLP انجام می‌شود. گزارش‌ها تا زمان انتشار وصله، کاملاً محرمانه باقی می‌مانند. اگر بسته‌ی نرم‌افزاری مهمی توسط توسعه‌دهنده‌ی اصلی رها شده باشد، تیم Akrites خود به‌روزرسانی را منتشر خواهد کرد. 🔗 akrites.org 📊 کالیفرنیا نخستین ردیاب بیکاری ناشی از هوش مصنوعی را راه‌اندازی کرد اداره‌ی توسعه‌ی اشتغال کالیفرنیا به همراه دانشگاه UCLA، نخستین ابزار در آمریکا را برای ردیابی اخراج‌های ناشی از هوش مصنوعی عرضه کرده است. این سامانه، ماهانه آمار درخواست‌های بیمه‌ی بیکاری را در مشاغلی که در معرض خطر بالای خودکارسازی قرار دارند، واکاوی می‌کند. داده‌های حاصل برای طراحی برنامه‌های بازآموزی و یاری‌رسانی به جویندگان کار به‌کار گرفته خواهد شد. داشبورد هنوز اخراج گسترده در سطح ایالت را نشان نمی‌دهد، اما آمار گویای افزایش شمار بیکاران دارای تحصیلات عالی پس از انتشار ChatGPT در سال ۲۰۲۲ است؛ روندی که در سان‌فرانسیسکو آشکارتر به نظر می‌رسد. 🔗 gov.ca.gov | دسترسی به ردیاب: capolicylab.org #هوش_مصنوعی #اخبار_فناوری #AI #ML #استقلال_فناوری #کوالکام #ساکانا #متن_باز #بیکاری_هوش_مصنوعی 🆔 @asrgooyeshpardaz
1 476
11
🚀 معرفی GPT-5.6 Sol – نسل جدید مدل‌های OpenAI شرکت OpenAI از خانواده‌ی جدید مدل‌های GPT-5.6 رونمایی کرده که شامل سه نسخه است: - مدلSol – پرچم‌دار و قدرتمندترین مدل، متمرکز بر وظایف پیچیده‌ی عامل‌محور، کدنویسی، زیست‌شناسی و امنیت سایبری - مدل Terra – مدلی متعادل برای کارهای روزمره با عملکرد رقابتی با GPT-5.5 و هزینه‌ی نصف - مدل Luna – گزینه‌ای سریع و مقرون‌به‌صرفه با کمترین قیمت --- ⚡ حالت‌های جدید استدلال - حالت max – زمان بیشتری برای استدلال عمیق‌تر در اختیار مدل قرار می‌دهد - حالت ultra – با استفاده از زیرعامل‌ها (subagents) کارهای پیچیده را شتاب می‌بخشد و فراتر از یک عامل واحد عمل می‌کند --- 📊 عملکرد در بنچمارک‌ها مدل Sol در بنچمارک Terminal‑Bench 2.1 (که وظایف خط‌فرمان با نیاز به برنامه‌ریزی و هماهنگی ابزارها را می‌سنجد) به رکورد جدیدی دست یافته است. در حوزه‌ی زیست‌شناسی، روی بنچمارک GeneBench v1 نتایج بهتری نسبت به GPT-5.5 نشان داده در حالی که توکن‌های کمتری مصرف می‌کند. در حوزه‌ی امنیت سایبری، Sol در بنچمارک ExploitBench² با تنها یک‌سوم توکن‌های خروجی، عملکردی رقابتی با مدل Mythos Preview داشته است. همچنین در بنچمارک ExploitGym (که توسط محققان UC Berkeley با همکاری OpenAI طراحی شده)، هر سه مدل بهبود چشمگیری در قابلیت‌های سایبری با افزایش سطح استدلال نشان داده‌اند. --- 🛡️ لایه‌های ایمنی پیشرفته شرکت OpenAI برای این مدل‌ها قوی‌ترین لایه‌های ایمنی خود را پیاده‌سازی کرده است: - محافظت‌های سطح مدل – آموزش‌دیده برای امتناع از کمک‌های مخرب سایبری، حتی در صورت تلاش برای فریب یا جیلبریک - طبقه‌بندی‌کننده‌های بلادرنگ – بررسی خروجی هنگام تولید و توقف در صورت تشخیص نقض - بررسی سطح حساب – تحلیل الگوهای رفتار مشکوک در چندین مکالمه - آزمایش فشار گسترده – بیش از ۷۰۰٬۰۰۰ ساعت معادل A100 برای یافتن جیلبریک‌های همگانی صرف شده است --- 💰 قیمت‌گذاری قیمت هر میلیون توکن ورودی و خروجی برای سه مدل به این ترتیب است: مدل Sol با قیمت ۵ دلار برای ورودی و ۳۰ دلار برای خروجی، گران‌ترین گزینه محسوب می‌شود. مدل Terra با قیمت ۲٫۵۰ دلار ورودی و ۱۵ دلار خروجی، گزینه‌ی متعادل‌تری است و مدل Luna با قیمت ۱ دلار ورودی و ۶ دلار خروجی، مقرون‌به‌صرفه‌ترین انتخاب خواهد بود. همچنین کش پرامپت با حداقل عمر ۳۰ دقیقه و پشتیبانی از نقاط شکست صریح معرفی شده است. --- 🔮 دسترسی و آینده در حال حاضر مدل‌های GPT-5.6 فقط به‌صورت پیش‌نمایش محدود از طریق API و Codex برای گروهی از شرکای معتمد در دسترس هستند. عرضه‌ی گسترده‌تر به ChatGPT، Codex و API در هفته‌های آینده انجام خواهد شد. همکاری با دولت آمریکا باعث شده این نسخه با تأخیر و محدودیت بیشتری منتشر شود، اما OpenAI تأکید کرده که این روند نباید به‌عنوان رویه‌ی دائمی ادامه یابد. 🔗 لینک اطلاعیه: https://openai.com/index/previewing-gpt-5-6-sol/ --- #OpenAI #GPT5_6 #AI #LLM #پیشرفت_هوش_مصنوعی 🆔 @asrgooyeshpardaz
1 245
12
🦅 معرفی Ornith-1.0 – مدل هوش مصنوعی برای برنامه‌نویسی عامل‌محور شرکت DeepReinforce AI خانواده‌ی مدل‌های متن‌باز Ornith-1.0 را در ابعاد مختلف از ۹ میلیارد تا ۳۹۷ میلیارد پارامتر روانه‌ی بازار کرده. نسخه‌ی ۳۵ میلیاردی این خانواده به‌گونه‌ای طراحی شده که به‌راحتی روی یک کارت گرافیک اجرا می‌شود و برای بسیاری از کاربران گزینه‌ای ایده‌آل محسوب می‌شود. --- 🤖 ویژگی‌های برجسته - یادگیری خودبهبوددهنده از طریق تقویت (RL) – این مدل فقط کد نهایی تولید نمی‌کند؛ بلکه اسکافولد (همان ساختار و منطق هدایت‌کننده‌ی جستجو) را هم خودش می‌سازد. این قابلیت به مدل کمک می‌کند تا مسیرهای هوشمندانه‌تری برای حل مسئله پیدا کند و در نهایت راه‌حل‌های باکیفیت‌تری تحویل دهد. - مجوز MIT – یعنی کاملاً رایگان و متن‌باز برای همه، بدون هیچ محدودیت منطقه‌ای یا تجاری. - پنجره‌ی متنی بزرگ – مدل قادر است همزمان تا ۲۶۲ هزار توکن را پردازش کند که برای پروژه‌های بزرگ کدنویسی بسیار کاربردی است. --- 📊 عملکرد در بنچمارک‌های معتبر نسخه‌ی ۳۵ میلیاردی Ornith در مقایسه با مدل هم‌رده‌ی Qwen3.5-35B عملکرد بسیار بهتری داشته: - در بنچمارک Terminal-Bench 2.1 امتیاز ۶۴.۲ را کسب کرده در حالی که رقیب به ۴۱.۴ رسیده. - در SWE-bench Verified با ۷۵.۶ در مقابل ۷۰.۰ موفق‌تر عمل کرده. - در نسخه‌ی چندزبانه‌ی همین بنچمارک، امتیاز ۶۹.۳ در برابر ۶۰.۳ را ثبت کرده. - در NL2Repo اختلاف چشمگیرتر است: ۳۴.۶ در برابر ۲۰.۵. - و در میانگین بنچمارک Claw-eval نیز با ۶۹.۸ از رقیب خود با امتیاز ۶۵.۴ پیشی گرفته است. --- 🔥 نسخه‌ی غول‌پیکر ۳۹۷ میلیاردی این نسخه حتی فراتر رفته و در بنچمارک Terminal-Bench 2.1 به امتیاز ۷۸.۲ دست یافته که از مدل بسته و مطرح Claude Opus 4.7 با امتیاز ۶۹.۷ بهتر عمل کرده. یعنی یک مدل متن‌باز توانسته از یکی از بهترین مدل‌های تجاری سبقت بگیرد. --- 🔗 لینک دسترسی مجموعه‌ی کامل این مدل‌ها در Hugging Face در دسترس است: https://huggingface.co/collections/deepreinforce-ai/ornith-10 --- #AI #DeepReinforce #LLM #MoE #برنامه‌نویسی_عامل‌محور 🆔 @asrgooyeshpardaz
1 270
13
🧠 رمزگشایی از مغز دوزبانه‌ها در سطح نورون‌های منفرد برای افراد دوزبانه، جابه‌جایی بین دو زبان کاری کاملاً طبیعی و بی‌دردسر است. اما مغز انسان دقیقاً چطور این کار را انجام می‌دهد؟ مدتها این یک راز باقی مانده بود، تا اینکه مطالعه‌ای پیشگامانه در مجله Cell منتشر شد و این رمز را در سطح نورون‌های منفرد شکست. --- 🔬 روش مطالعه محققان با چهار فرد دوزبانه‌ی انگلیسی-اسپانیایی همکاری کردند که از کودکی به هر دو زبان مسلط بوده‌اند. این افراد به دلیل درمان صرع، الکترودهایی در مغزشان کار گذاشته شده بود و تیم تحقیقاتی توانست فعالیت نورون‌های هیپوکامپ (ناحیه‌ی کلیدی حافظه) را در لحظه ثبت کند، در حالی که شرکت‌کنندگان به دو زبان گوش می‌دادند، می‌خواندند و صحبت می‌کردند. --- 🧩 یافته‌های کلیدی ۱. نقشه‌ی معنایی مشترک، مستقل از زبان مغز دوزبانه‌ها، واژگان را بر اساس معنا روی یک نقشه‌ی جهانی سازمان‌دهی می‌کند. کلماتی که از نظر مفهومی نزدیک هستند (مثل «سگ» و «گرگ») در این نقشه در کنار هم قرار می‌گیرند، فارغ از اینکه به چه زبانی باشند. این ساختار برای هر دو زبان یکسان است. ۲. نورون‌ها اختصاصی زبان هستند، اما گروهی عمل می‌کنند برخلاف انتظار، تنها تعداد کمی از نورون‌ها به کلمه‌ی مشابه در دو زبان (مثلاً «dog» و «perro») پاسخ یکسانی دادند. یعنی نورون‌های منفرد عمدتاً اختصاصی زبان هستند. اما راه‌حل مغز هوشمندانه‌تر است: گروه‌هایی از نورون‌ها با تنظیم الگوی فعالیت خود، الگوی مشابهی برای کلمات هم‌معنا در دو زبان ایجاد می‌کنند. ۳. پیش‌بینی دقیق موقعیت کلمات محققان با تحلیل نحوه‌ی چینش مفاهیم اطراف کلمه‌ی «dog» در نقشه‌ی انگلیسی، توانستند موقعیت دقیق کلمه‌ی معادل آن («perro») را در نقشه‌ی اسپانیایی پیش‌بینی کنند. این نشان می‌دهد که هر دو زبان از یک زیرساخت مشترک استفاده می‌کنند. --- 🤖 شباهت با مدل‌های زبانی هوش مصنوعی ساختار سازمان‌یافته‌ی هیپوکامپ انسان، شباهت زیادی به مدل‌های زبانی بزرگ چندزبانه مانند mBERT دارد که بیش از ۱۰۰ زبان را با استفاده از فضاهای مفهومی مشترک نقشه‌برداری می‌کنند. --- 🌟 پیامدهای مهم این یافته‌ها نشان می‌دهد که مغز انسان به‌طور طبیعی برای چندزبانه‌بودن سیم‌کشی شده است. زمانی که مغز نقشه‌ی روابط بین مفاهیم را می‌سازد، برای یادگیری یک زبان جدید نیازی به بازسازی این نقشه ندارد؛ کافی است همان ساختار را روی واژگان جدید اعمال کند. به عبارت دیگر، همۀ ما ظرفیت ذاتی دوزبانه یا حتی سه‌زبانه شدن را داریم. --- 📚 منبع مقاله‌ی اصلی با دسترسی آزاد در مجله‌ی Cell منتشر شده است: 📄 Shared neural geometries for bilingual semantic representations in human hippocampal neurons --- #علوم_اعصاب #زبانشناسی #مغز_دوزبانه #نوروساینس #اخبار_علمی 🆔 @asrgooyeshpardaz
1 274
14
🎵 معرفی SPEAR XLarge v2 – رمزگذار متن‌باز پیشرفته برای گفتار و صدا مدل SPEAR XLarge v2 به‌عنوان پرچم‌دار رمزگذارهای متن‌باز SPEAR، برای یادگیری یکپارچه‌ی بازنمایی گفتار و صداهای عمومی طراحی شده. این نسخه‌ی پذیرفته‌شده در کنفرانس ICML 2026 بوده و نسبت به نسخه‌ی قبلی (v1)، با افزودن Token Mixing برای صحنه‌های آکوستیک پیچیده بهینه‌تر شده و عملکرد بهتری در گفتار هم‌پوشان، صداهای نویزی و ترکیب‌های صوتی دنیای واقعی ارائه می‌دهد. --- ⚙️ مشخصات فنی - پشتیبان (Backbone): Zipformer با حدود ۶۰۰ میلیون پارامتر و ۱۳ پشته‌ی Zipformer - خروجی: بازنمایی‌های سطح فریم با ابعاد ۱۲۸۰ و نرخ تقریباً ۵۰ هرتز از شکل‌موجهای ۱۶ کیلوهرتز --- 📊 داده‌های پیش‌آموزش مدل روی ۱۹۷٬۰۰۰ ساعت داده‌ی ترکیبی آموزش دیده است: - ۱۸۴٬۰۰۰ ساعت داده‌ی گفتاری شامل دیتاست‌های Libriheavy (~۵۰k ساعت)، Gigaspeech (~۱۰k)، VoxPopuli (~۲۴k) و yodas-granary (~۱۰۰k ساعت) - ۱۳٬۰۰۰ ساعت داده‌ی صوتی عمومی شامل AudioSet (~۵k)، Freesound (~۲.۸k)، Music4all (~۱k)، VGGSound (~۵۰۰) و MTG-Jamendo (~۳.۸k ساعت) --- 🏆 عملکرد درخشان این مدل در هر دو معیار اصلی SUPERB (ارزیابی بازنمایی گفتار) و HEAR (ارزیابی بازنمایی صدای عمومی) به نتایج پیشرو (SOTA) دست یافته است. نتایج تنظیم دقیق روی LibriSpeech (تشخیص خودکار گفتار): - با داده‌ی LS960، نرخ خطای کلمه (WER) در مجموعه‌ی test-clean به ۱٫۶٪ و در test-other به ۲٫۹٪ رسیده است. نتایج تنظیم دقیق روی AudioSet (برچسب‌گذاری صوتی): - با داده‌ی AudioSet Balanced، امتیاز mAP برابر ۳۹٫۴ و با داده‌ی Full به ۵۰٫۰ دست یافته است. --- 📄 درباره‌ی مقاله نویسندگان: Xiaoyu Yang, Yifan Yang, Zengrui Jin, Ziyun Cui, Wen Wu, Baoxiang Li, Chao Zhang, Phil Woodland ایده‌ی اصلی: بیشتر مدل‌های SSL موجود یا برای گفتار بهینه‌سازی شده‌اند یا برای صداهای عمومی، اما SPEAR این شکاف را با تقطیر دانش مکمل از دو معلم SSL (یکی متمرکز بر گفتار و دیگری بر صدای عمومی) در یک مدل یکپارچه پر می‌کند. استفاده از کوانتیزاسیون برداری با چند کدبوک باعث تولید توکن‌های گسسته‌ای می‌شود که هم اطلاعات معنایی و هم آکوستیک را در بر دارند. --- 📜 مجوز: Apache-2.0 🔗 لینک مدل: https://huggingface.co/marcoyang/spear-xlarge-speech-audio-v2 --- #اخبار_هوش_مصنوعی #AI #ML #SPEAR #ICML2026 #پردازش_گفتار #صدا 🆔 @asrgooyeshpardaz
1 625
15
صدای مجری مشهور آمریکایی هم از جنایت ارتش ایالات متحده درآمد 🔹بازیکنان تیم ملی ایران در آخرین یادداشت خود دوباره از کودکان م
صدای مجری مشهور آمریکایی هم از جنایت ارتش ایالات متحده درآمد 🔹بازیکنان تیم ملی ایران در آخرین یادداشت خود دوباره از کودکان میناب یاد کردند 🔹شرم بر ما که پس از کشتار این کودکان توسط ارتش آمریکا هنوز سکوت کرده‌‌ایم... @isna94
2 418
16
مدل Qwen-AgentWorld از Claude Opus و GPT-5.4 در بنچمارک جدید عامل‌ها پیشی گرفت. شرکت Qwen مدل‌های open-weight جدیدی را منتشر
مدل Qwen-AgentWorld از Claude Opus و GPT-5.4 در بنچمارک جدید عامل‌ها پیشی گرفت. شرکت Qwen مدل‌های open-weight جدیدی را منتشر کرده است که محیط‌های واقعی برای عامل‌ها را شبیه‌سازی می‌کنند: وب، ترمینال، برنامه‌نویسی، جستجو، سیستم‌عامل و اندروید. نکات اصلی: • مدل 397B امتیاز 58.71 کسب کرد و از Opus 4.8 / GPT-5.4 پیشی گرفت • مدل 35B MoE از Sonnet 4.6 پیشی گرفت • افزایش قابل توجه در وظایف برنامه‌نویسی، وب و ترمینال • وزن‌ها هم‌اکنون در Hugging Face در دسترس هستند مقاله: https://arxiv.org/abs/2606.24597 وبلاگ: https://qwen.ai/blog?id=qwen-agentworld گیت‌هاب: https://github.com/QwenLM/Qwen-AgentWorld HuggingFace: https://huggingface.co/collections/Qwen/qwen-agentworld ModelScope: https://modelscope.cn/collections/Qwen/Qwen-AgentWorld
2 684
17
📌 وال استریت ژورنال: قراردادهای تجاری OpenAI با رشد سرمایه‌گذاری شخصی سم آلتمن گره خورده است روزنامه وال استریت ژورنال با استناد به اسناد دادگاه پرونده «ایلان ماسک علیه OpenAI»، از ارتباط نزدیک قراردادهای این شرکت با افزایش ثروت شخصی مدیرعامل آن خبر داده است. جالب اینجاست که خود آلتمن سهمی در مالکیت OpenAI ندارد و درآمدش به شدت به سرمایه‌گذاری‌های خارجی وابسته است. 🟡 مکانیزم اثرگذاری شرکت OpenAI با یک استارتاپ قرارداد همکاری می‌بندد و باعث افزایش ارزش آن می‌شود. در ادامه، سهام‌داران بزرگی مثل Thrive Capital یا شرکای تجاری مثل SoftBank سهام آن استارتاپ را می‌خرند. از آنجایی که آلتمن شخصاً در آن استارتاپ‌ها سرمایه‌گذاری کرده، ثروتش به طور غیرمستقیم افزایش پیدا می‌کند. 🟡 بررسی سه مورد عینی 🔹 هلیون (Helion): در سال ۲۰۲۵، آلتمن پیشنهاد سرمایه‌گذاری ۵۰۰ میلیون دلاری OpenAI در این استارتاپ همجوشی هسته‌ای را داد (که با نگرانی کارکنان مواجه شد). در مارس ۲۰۲۶ قرارداد همکاری جدیدی بستند و او برای رفع تعارض منافع از هیئت مدیره کنار رفت. نهایتاً در ژوئن ۲۰۲۶، ارزش هلیون به ۱۵.۵ میلیارد دلار رسید و سهام آلتمن حداقل ۴.۱ میلیارد دلار ارزش پیدا کرد. 🔹 سربراس (Cerebras): پس از دریافت تعهد خرید از سوی OpenAI و انجام عرضه اولیه (IPO)، ارزش سهام آلتمن در این شرکت تراشه‌سازی نسبت به دسامبر ۲۰۲۵، بیش از ۶ برابر افزایش یافت. 🔹 رترو بایوساینسز (Retro Biosciences): پس از امضای قرارداد همکاری علمی با OpenAI، سهام آلتمن در این شرکت فعال در حوزه افزایش عمر، تا دسامبر ۲۰۲۵ به ۲۵۸ میلیون دلار رسید. 📊 طبق گزارش WSJ، حداقل ۱۰ شرکت در پرتفوی سرمایه‌گذاری آلتمن با OpenAI قرارداد تجاری دارند. 🏛️ واکنش نهادهای نظارتی کمیته نظارت مجلس نمایندگان آمریکا تحقیق رسمی را آغاز کرده و دادستان‌های چند ایالت از کمیسیون بورس و اوراق بهادار (SEC) خواسته‌اند تا پیش از عرضه اولیه سهام OpenAI، این موضوع را بررسی کنند. البته خود آلتمن و مقامات شرکت‌های مربوطه معتقدند که این نوع همکاری‌ها، رویه‌ای کاملاً عادی و رایج در دنیای تجارت است. #اخبار_هوش_مصنوعی #AI #ML 🆔 @asrgooyeshpardaz
2 114
18
🦾 یونیتری R1 | قیمت از ۴۹۰۰ دلار.
🦾 یونیتری R1 | قیمت از ۴۹۰۰ دلار.
1 738
19
ایلان ماسک، نماد شکست یک سیستم ایلان ماسک، نخستین تریلیونر تاریخ شد. ثروتی که از دارایی نیمی از جمعیت زمین بیشتر است. اما این
ایلان ماسک، نماد شکست یک سیستم ایلان ماسک، نخستین تریلیونر تاریخ شد. ثروتی که از دارایی نیمی از جمعیت زمین بیشتر است. اما این ثروت افسانه‌ای، نه زاییده‌ی نبوغ فردی، که محصول میلیاردها دلار یارانه و قرارداد دولتی است؛ پولی که از جیب مالیات‌دهندگان تأمین شد تا امپراتوری او را از ورشکستگی نجات دهد. ماسک اما از یک یارانه‌بگیر به یک جنگ‌افروز تبدیل شده است. هوش مصنوعی او اهداف بمباران آمریکا در ایران را انتخاب می‌کند و استارلینک، ستون فقرات عملیاتی این جنگ است. بهای این فناوری «پیشرفته» چه بود؟ بمباران مدرسه‌ی دخترانه‌ی شجره‌ی طیبه در میناب و کشته شدن دست‌کم ۱۵۶ دانش‌آموز بی‌گناه. در سرمایه‌داری امروز، دولت با پول مردم، میلیاردرها را تغذیه می‌کند و آنها نیز با مکیدن خونِ ملت‌ها، ثروت بیشتری انباشت می‌کنند. ماسک، دیگر فقط یک تریلیونرِ یارانه‌بگیر نیست؛ او نماد زنده‌ی سیستمی است که جنگ، فقر و نابرابری را به سودِ معدودی، به‌قیمتِ جانِ بسیاری، مدیریت می‌کند. https://telegra.ph/investigation-06-24-4 🆔 @asrgooyeshpardaz
1 973
20
ایلان ماسک، نماد شکست یک سیستم ایلان ماسک، نخستین تریلیونر تاریخ شد؛ ثروتی که از دارایی نیمی از انسان‌های این سیاره بیشتر است
ایلان ماسک، نماد شکست یک سیستم ایلان ماسک، نخستین تریلیونر تاریخ شد؛ ثروتی که از دارایی نیمی از انسان‌های این سیاره بیشتر است. اما این ثروت افسانه‌ای، نه حاصل نبوغ فردی، که محصول میلیاردها دلار یارانه و قرارداد دولتی است. اما ماسک حالا از یک یارانه‌بگیر به یک جنگ‌افروز تبدیل شده: هوش مصنوعی او اهداف بمباران آمریکا در ایران را انتخاب می‌کند و استارلینک، ستون فقرات عملیاتی جنگ است. بهای این فناوری «پیشرفته» چیست؟ بمباران مدرسه دخترانه شجره طیبه میناب و کشته شدن ۱۵۶ دانش‌آموز. در سرمایه‌داری امروز، دولت با پول مالیات‌دهندگان، میلیاردرها را پشتیبانی می‌کند تا با مکیدن خون مردم عادی، ثروت بیشتری انباشت کنند. https://telegra.ph/investigation-06-24-4
222