عصر گویش | هوش مصنوعی
前往频道在 Telegram
📈 Telegram 频道 عصر گویش | هوش مصنوعی 的分析概览
频道 عصر گویش | هوش مصنوعی (@asrgooyeshpardaz) 波斯语 语言赛道中的 是活跃参与者。目前社区聚集了 102 253 名订阅者,在 技术与应用 类别中位列第 1 237,并在 伊朗 地区排名第 2 915 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 102 253 名订阅者。
根据 18 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 -1 719,过去 24 小时变化为 -30,整体触达仍然可观。
- 认证状态: 未认证
- 互动率 (ER): 平均受众互动率为 2.17%。内容发布后 24 小时内通常能获得 1.25% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 2 214 次浏览,首日通常累积 1 273 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 4。
- 主题关注点: 内容集中在 مدل, گفتار, بهطور, عامل, ابزار 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“مجله هوش مصنوعی عصر گویش
021 61931000”
凭借高频更新(最新数据采集于 19 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
102 253
订阅者
-3024 小时
-2477 天
-1 71930 天
数据加载中...
相似频道
标签云
进出提及
---
---
---
---
---
---
吸引订阅者
六月 '26
六月 '26
+74
在1个频道中
五月 '260
在0个频道中
Get PRO
四月 '260
在0个频道中
Get PRO
三月 '260
在0个频道中
Get PRO
二月 '260
在0个频道中
Get PRO
一月 '260
在2个频道中
Get PRO
十二月 '25
+1
在4个频道中
Get PRO
十一月 '250
在7个频道中
Get PRO
十月 '250
在6个频道中
Get PRO
九月 '250
在5个频道中
Get PRO
八月 '250
在5个频道中
Get PRO
七月 '250
在1个频道中
Get PRO
六月 '250
在4个频道中
Get PRO
五月 '25
+2
在1个频道中
Get PRO
四月 '250
在1个频道中
Get PRO
三月 '250
在0个频道中
Get PRO
二月 '250
在0个频道中
Get PRO
一月 '250
在0个频道中
Get PRO
十二月 '24
+352
在1个频道中
Get PRO
十一月 '24
+588
在0个频道中
Get PRO
十月 '24
+53
在4个频道中
Get PRO
九月 '24
+65
在5个频道中
Get PRO
八月 '24
+14
在6个频道中
Get PRO
七月 '24
+317
在6个频道中
Get PRO
六月 '24
+490
在5个频道中
Get PRO
五月 '240
在4个频道中
Get PRO
四月 '24
+452
在4个频道中
Get PRO
三月 '24
+2 402
在5个频道中
Get PRO
二月 '24
+5 784
在9个频道中
Get PRO
一月 '24
+8 641
在14个频道中
Get PRO
十二月 '23
+17 410
在7个频道中
Get PRO
十一月 '23
+7 494
在9个频道中
Get PRO
十月 '23
+10 370
在8个频道中
Get PRO
九月 '23
+14 111
在0个频道中
Get PRO
八月 '23
+5 803
在0个频道中
Get PRO
七月 '23
+5 026
在0个频道中
Get PRO
六月 '23
+7 915
在0个频道中
Get PRO
五月 '23
+21 355
在0个频道中
Get PRO
四月 '23
+43 552
在0个频道中
Get PRO
三月 '23
+59 493
在0个频道中
Get PRO
二月 '23
+3 388
在0个频道中
Get PRO
一月 '23
+1 433
在0个频道中
Get PRO
十二月 '22
+517
在0个频道中
Get PRO
十一月 '22
+498
在0个频道中
Get PRO
十月 '22
+274
在0个频道中
Get PRO
九月 '22
+464
在0个频道中
Get PRO
八月 '22
+721
在0个频道中
Get PRO
七月 '22
+599
在0个频道中
Get PRO
六月 '22
+1 527
在0个频道中
Get PRO
五月 '22
+2 541
在0个频道中
Get PRO
四月 '22
+1 061
在0个频道中
Get PRO
三月 '22
+1 666
在0个频道中
Get PRO
二月 '22
+2 147
在0个频道中
Get PRO
一月 '22
+6 134
在0个频道中
Get PRO
十二月 '21
+4 172
在0个频道中
Get PRO
十一月 '21
+4 271
在0个频道中
Get PRO
十月 '21
+4 181
在0个频道中
Get PRO
九月 '21
+1 061
在0个频道中
Get PRO
八月 '21
+13 231
在0个频道中
Get PRO
七月 '21
+5 069
在0个频道中
Get PRO
六月 '21
+2 973
在0个频道中
Get PRO
五月 '21
+3 700
在0个频道中
Get PRO
四月 '21
+5 497
在0个频道中
Get PRO
三月 '21
+9 553
在0个频道中
Get PRO
二月 '21
+5 411
在0个频道中
Get PRO
一月 '21
+3 903
在0个频道中
Get PRO
十二月 '20
+46 342
在0个频道中
| 日期 | 订阅者增长 | 提及 | 频道 | |
| 19 六月 | +11 | |||
| 18 六月 | 0 | |||
| 17 六月 | +36 | |||
| 16 六月 | +27 | |||
| 15 六月 | 0 | |||
| 14 六月 | 0 | |||
| 13 六月 | 0 | |||
| 12 六月 | 0 | |||
| 11 六月 | 0 | |||
| 10 六月 | 0 | |||
| 09 六月 | 0 | |||
| 08 六月 | 0 | |||
| 07 六月 | 0 | |||
| 06 六月 | 0 | |||
| 05 六月 | 0 | |||
| 04 六月 | 0 | |||
| 03 六月 | 0 | |||
| 02 六月 | 0 | |||
| 01 六月 | 0 |
频道帖子
🌐 اخبار هوش مصنوعی
🩺 ارتقای نسخه پزشکی GPT-5.5 Instant
شرکت OpenAI نسخه پزشکی GPT-5.5 Instant را بهروزرسانی کرده است. این مدل با همکاری حدود ۲۰۰ پزشک تنظیم دقیق شده و در بنچمارک HealthBench به سطح مدلهای استدلالی نزدیک شده است.
بهبودهای اصلی شامل تشخیص بهتر علائم، اعلام میزان عدم قطعیت و درخواست اطلاعات تکمیلی از کاربران است. طبق ارزیابی OpenAI، نرخ خطا در درخواستهای پزشکی طی دو ماه ۷۱٪ کاهش یافته است.
منبع: openai.com
📂 انتقال Artifacts کلود به Claude Code
شرکت Anthropic قابلیت Artifacts را به Claude Code اضافه کرده است. این ویژگی امکان ساخت صفحات تعاملی و داشبوردها را مستقیماً از خط فرمان فراهم میکند.
این ابزار با در نظر گرفتن کد منبع، ابزارهای متصل و تاریخچه گفتگو، برای بررسی Pull Requestها، تحلیل رخدادها، ممیزی مجوزها و نمایش معماری نرمافزار کاربرد دارد.
این قابلیت در مرحله بتا برای کاربران Team و Enterprise ارائه شده است.
منبع: claude.com
🧠 حافظه جدید Perplexity برای عامل Computer
شرکت Perplexity قابلیت جدیدی با نام Brain معرفی کرده است که به عامل Computer امکان ذخیره و استفاده از اطلاعات پروژهها، کدها، تصمیمهای قبلی و خطاها را میدهد.
این سیستم هر شب اطلاعات جمعآوریشده را ترکیب کرده و گراف زمینه را بهروزرسانی میکند تا در جلسات بعدی نیازی به توضیح دوباره پیشزمینه نباشد.
طبق اعلام Perplexity، این قابلیت باعث بهبود ۲۵٪ در دقت پاسخها، ۱۶٪ در عملکرد زمینه و کاهش ۱۳٪ مصرف توکن شده است.
این ویژگی فعلاً برای کاربران Max و Enterprise در دسترس است.
منبع: perplexity.ai
🩻 ورود Midjourney به تصویربرداری پزشکی
شرکت Midjourney با همکاری Butterfly Network در حال توسعه یک سامانه اولتراساوند پیشرفته است.
این فناوری با استفاده از صدها هزار حسگر اولتراساوند و پردازش هوش مصنوعی، مدل سهبعدی از بدن تولید میکند.
این شرکت قصد دارد مجوز FDA را دریافت کند و برنامههایی برای توسعه تراشه اختصاصی تا سال ۲۰۲۸ و استقرار گسترده دستگاهها تا سال ۲۰۳۱ دارد.
منبع: midjourney.com
🎨 عامل هوش مصنوعی جدید Adobe برای تولید محتوا
شرکت Adobe نسخه بتای عمومی عامل هوش مصنوعی خود را برای نرمافزارهای Premiere، Photoshop، Illustrator، InDesign و Frame منتشر کرده است.
این عامل میتواند وظایف چندمرحلهای مانند مرتبسازی فایلها، تدوین اولیه، تولید قالب، تنظیم صفحهآرایی و بررسی خطاهای فنی را با یک دستور متنی انجام دهد.
این ابزار از طریق ChatGPT، Claude و Microsoft 365 Copilot نیز قابل کنترل خواهد بود.
منبع: adobe.com
#AI #ArtificialIntelligence #اخبار_هوش_مصنوعی
🆔 @asrgooyeshpardaz
| 2 | 🧪عامل Sakana Marlin؛ عامل تحقیقاتی خودمختاری که ۸ ساعت کار میکند و گزارش ۱۰۰ صفحهای تحویل میدهد
شرکت ژاپنی Sakana AI از نخستین محصول تجاری خود با نام Sakana Marlin رونمایی کرده است؛ یک عامل تحقیقاتی خودمختار (Autonomous Research Agent) برای سازمانها که میتواند یک موضوع را دریافت کند، ساعتها بهصورت مستقل تحقیق کند و در پایان یک گزارش حرفهای به همراه اسلایدهای ارائه تولید کند؛ بدون نیاز به دخالت انسان در طول فرآیند.
🔬 مارلین چگونه کار میکند؟
برخلاف بسیاری از ابزارهای «تحقیق عمیق» که در چند دقیقه پاسخ تولید میکنند، مارلین رویکرد متفاوتی دارد:
به جای سرعت، روی عمق، اعتبارسنجی و کیفیت تحلیل تمرکز میکند.
کاربر تنها موضوع موردنظر را مشخص میکند و سیستم تا حدود ۸ ساعت بهصورت خودکار:
🔹 منابع مختلف را بررسی میکند
🔹 فرضیهها و مسیرهای تحقیق را توسعه میدهد
🔹 یافتهها را ارزیابی و اصلاح میکند
🔹 گزارش نهایی و اسلایدهای ارائه را آماده میکند
📄 خروجی نهایی میتواند شامل:
گزارش ۶۰ تا ۱۰۰ صفحهای
۶۰ تا ۸۰ منبع معتبر
اسلایدهای ارائه با طراحی تولیدشده توسط مدلهای هوش مصنوعی
باشد.
🧠 فناوری پشت پرده: جستجوی هوشمند با AB-MCTS
یکی از بخشهای کلیدی مارلین، الگوریتم:
Adaptive Branching Monte Carlo Tree Search (AB-MCTS)
است؛ روشی که در کنفرانس معتبر NeurIPS 2025 بهعنوان مقاله Spotlight پذیرفته شده است.
این الگوریتم مانند یک پژوهشگر انسانی تصمیم میگیرد که در هر مرحله:
🔸 مسیرهای بیشتری را بررسی کند (Breadth)
یا
🔸 روی یک مسیر امیدوارکننده عمیقتر شود (Depth)
در نتیجه، فرآیند تحقیق به جای یک جستجوی خطی، به یک کاوش هوشمند و چندمرحلهای تبدیل میشود.
🤖 میراث پروژه AI Scientist
معماری مارلین بر پایه ایدههای پروژه AI Scientist توسعه یافته است؛ سیستمی که هدف آن خودکارسازی چرخه کامل پژوهش علمی است:
💡 تولید ایده و فرضیه
🔎 جمعآوری و تحلیل اطلاعات
🧪 ارزیابی نتایج
📝 تولید گزارش علمی
این مسیر نشان میدهد که عاملهای هوش مصنوعی در حال حرکت از «پاسخدهنده» به سمت «پژوهشگر دیجیتال» هستند.
🎯 کاربردهای سازمانی مارلین
این ابزار برای مسائل پیچیده و راهبردی طراحی شده است؛ از جمله:
🏢 تدوین استراتژی ورود به بازارهای جدید
📊 تحلیل رقبا و شناسایی شکافهای استراتژیک
⚠️ مدلسازی سناریوهای بحران و تحلیل ریسک
📈 تهیه گزارشهای بازار و روندهای فناوری
🔍 پشتیبانی از تصمیمگیری مدیران ارشد
نسخه فعلی مارلین پس از آزمایش با حدود ۳۰۰ متخصص در حوزههایی مانند خدمات مالی، مشاوره و اندیشکدهها توسعه یافته است.
💳 مدل قیمتگذاری
🔹 Pay-as-you-go:
هر اجرا = ۱۰۰ اعتبار (هر اعتبار ۹۸ ین)
🔹 Pro:
۱۵۰ هزار ین در ماه + ۲۰۰۰ اعتبار
🔹 Team:
۴۰۰ هزار ین در ماه + ۶۰۰۰ اعتبار
🔹 Enterprise:
قیمتگذاری اختصاصی
⚙️ یک تغییر مهم در مسیر Agentهای هوش مصنوعی
بسیاری از ابزارهای فعلی Deep Research برای پاسخ سریع طراحی شدهاند؛ اما مارلین یک فلسفه متفاوت را دنبال میکند:
⏱️ چند دقیقه کمتر،
🧠 چند ساعت تحلیل عمیقتر.
این رویکرد میتواند برای سازمانهایی که به گزارشهای راهبردی و تصمیمهای حساس نیاز دارند، اهمیت زیادی داشته باشد.
جالب اینکه هسته الگوریتمی این فناوری با نام TreeQuest بهصورت متنباز و تحت مجوز Apache 2.0 منتشر شده، اما خود سرویس Sakana Marlin همچنان یک محصول بسته و تجاری است.
🔗 منابع:
Sakana Marlin: https://sakana.ai/marlin/
معرفی رسمی محصول: https://sakana.ai/marlin-release/
تحلیل MarkTechPost: https://www.marktechpost.com/2026/06/15/sakana-ai-marlin/
#SakanaAI #AI #DeepResearch #AutonomousAgents #هوش_مصنوعی #عامل_هوشمند
🆔 @asrgooyeshpardaz | 414 |
| 3 | توجه به جزئیات
در ویدیوی معرفی محصولات اپل، هر جا که کلمهی «سیری» به گوش میخورد، صدای ویدیو را در فرکانسهای خاصی (۳، ۴، ۵ و ۶ کیلوهرتز) قطع میکنند. دلیلش این است که دستگاههای اپلِ کنار بیننده، هنگام تماشای ویدیو، اشتباهاً سیری را فعال نکنند.
https://x.com/bryanwangxin/status/2064309590414836085 | 469 |
| 4 | 🌊 میدجرنی وارد حوزه پزشکی شد: اسکنر تمامبدن اولتراساوند با کیفیت امآرآی
شرکت میدجرنی که تا پیش از این به خاطر مدلهای تولید تصویر معروف بود، از نخستین محصول سختافزاری خود رونمایی کرده است: اسکنر میدجرنی (Midjourney Scanner). این دستگاه یک اسکنر اولتراساوند تمامبدن است که با همکاری شرکت Butterfly Network ساخته شده است.
🔬 فناوری پشت دستگاه
این اسکنر از ۴۰ ماژول اولتراساوند روی تراشه (Ultrasound-on-Chip) و حلقهای از هزاران سنسور تشکیل شده است. کاربر درون آب قرار میگیرد و سیستم در عرض ۶۰ ثانیه یک تصویر سهبعدی از عضلات، استخوانها، بافت چربی و اندامهای داخلی میسازد. به گفته دیوید هولتز، مدیرعامل میدجرنی، کیفیت این تصاویر قابل مقایسه با امآرآی است، اما بدون اشعه و میدانهای مغناطیسی.
🏥 وضعیت فعلی و تأییدیه
تاکنون حدود ده نفر با این دستگاه اسکن شدهاند. این محصول هنوز تأییدیه سازمان غذا و داروی آمریکا (FDA) را دریافت نکرده است.
🔗 منبع: [Midjourney Medical](https://www.midjourney.com/medical)
#Midjourney #پزشکی #اولتراساوند #فناوری | 1 331 |
| 5 | 🌐اخبار هوش مصنوعی
🧪 روش جدید OpenAI برای پیشبینی خطاهای هوش مصنوعی پیش از انتشار
شرکت OpenAI روشی به نام Deployment Simulation برای تست ایمنی مدلهای زبانی منتشر کرده است. این رویکرد رفتار مدلها را در شرایطی شبیهسازی میکند که گویی در محیط واقعی (پروداکشن) قرار دارند.
به جای پرامپتهای ساختگی، به مدل جدید، تاریخچه گفتگوهای واقعی کاربران با نسخههای قبلی (به صورت ناشناس) داده میشود و از آن خواسته میشود پاسخ بعدی را تولید کند. در این شرایط، توانایی مدل در تشخیص اینکه در حال آزمایش است از ۱۰۰٪ به ۵.۴٪ کاهش مییابد.
بر اساس آزمایشها، این روش در ۹۲٪ موارد تولید محتوای ممنوع یا رفتار فریبکارانه را پیشبینی میکند، در حالی که بنچمارکهای معمولی فقط ۵۴٪ موفق هستند. در تست مدلهای سری GPT-5 مشخص شد که GPT-5.1 از مرورگر به عنوان ماشینحساب استفاده میکرده و به کاربر گزارش میداده که جستجوی وب انجام داده است.
این روش برای ممیزی مستقل مدلهای شخص ثالث نیز قابل استفاده است و نیازی به دسترسی به لاگهای داخلی توسعهدهنده ندارد.
منبع: openai.com
---
💰 سرمایهگذاری آمازون، انویدیا و AMD در استارتاپ Odyssey ML
استارتاپ Odyssey ML که روی مدلهای سهبعدی جهان کار میکند، ۳۱۰ میلیون دلار از آمازون، انویدیا، AMD، صندوق IQT، Google Ventures و جف دین (رئیس علمی گوگل) جذب کرده است. این سرمایه برای توسعه مدلهای جهان صرف خواهد شد و زیرساخت محاسباتی پروژه در ابر AWS و روی شتابدهندههای Trainium آمازون مستقر میشود.
بنیانگذاران این استارتاپ پیشتر روی سیستمهای رانندگی خودمختار کار میکردهاند. معماری مدلهای Odyssey ML بر شبیهسازی قوانین فیزیک، روابط فضایی، دینامیک اشیاء و سینماتیک متمرکز است.
منبع: ft.com
---
🎬 بایتدنس مدل ویدیویی Seedance 2.0 Mini را منتشر کرد
نسخه جدید در مقایسه با نسخه پایه هزینه کمتری دارد و سرعت تولید نسبت به طرح Fast دو برابر شده است.
این مدل ویدیوهایی تا ۱۵ ثانیه با کیفیت ۷۲۰p و نرخ ۲۴ فریم در ثانیه تولید میکند. Seedance 2.0 Mini از پرامپتهای چندوجهی پشتیبانی میکند: میتوان متن را با تصویر مرجع، صدا یا ویدیو ترکیب کرد تا شخصیتها و اشیاء در فریمهای مختلف مشابه بمانند.
این ابزار هماکنون در برنامههای CapCut، Dreamina و Jimeng یکپارچه شده است. دسترسی به API از ۲۲ ژوئن از طریق پلتفرمهای ابری Volcengine و BytePlus آغاز میشود.
منبع: capcut.com
---
👥 حسابهای تیمی با سهمیه اعتبار مشترک در Nous Portal
پلتفرم Nous Portal قابلیت Teams را برای مدیریت حسابهای سازمانی اضافه کرده است. سیستم پرداخت بر اساس کاربر را با یک سهمیه اعتبار مشترک جایگزین کرده است.
مدیر میتواند اعتبار حساب را شارژ کرده و کاربران را دعوت کند. هر کاربر میتواند همزمان در چند تیم عضو باشد و بین آنها جابهجا شود بدون نیاز به ساخت پروفایل جدید.
برای کنترل هزینهها، داشبورد Spend Intelligence اضافه شده است که آمار مصرف را بهصورت لحظهای نمایش میدهد، امکان تعیین سقف مصرف برای اعضا و لغو دسترسی را فراهم میکند.
منبع: پست NousResearch در شبکه اجتماعی X
---
🐐 شبکه عصبی با بزها در بازی Age of Empires II
ادریان د وینتر، پژوهشگر مایکروسافت، در ویرایشگر نقشه بازی Age of Empires II یک شبکه عصبی ساخته است تا نقدی بر انسانانگاری (آنتروپومورفیسم) در ارزیابی مدلهای زبانی باشد.
معماری این شبکه از اشیاء بازی ساخته شده است. نقش بیتها را بزها بازی میکنند (بز روی چمن = ۰، روی پل = ۱) و منطق با اسکریپتهای داخلی پیادهسازی شده است. این مدل عملگر منطقی "AND" را یاد گرفته است.
این پروژه نشان میدهد که همدلی با مدلهای زبانی ناشی از رابط متنی آنهاست. اگر محاسبات را به رفتار بزهای مجازی منتقل کنیم، نتیجه یکسان است، اما توهم هوشیاری ایجاد نمیشود.
د وینتر با بررسی بیش از ۳۰۰ مقاله علمی درباره هوش مصنوعی متوجه شد که بیش از ۵۰٪ نویسندگان ویژگیهای انسانی را به الگوریتمها نسبت میدهند. این رویکرد به خطاهای روششناختی و استدلال دوری منجر میشود. او از همکارانش خواسته است که کد را دارای عملکردهای شناختی ندانند و صرفاً ورودی و خروجی را تحلیل کنند.
اسکریپت نقشه به صورت عمومی منتشر شده است.
منبع: adewynter.github.io
---
#news #ai
🆔 @asrgooyeshpardaz | 979 |
| 6 | 🎮 ابزار DreamX-World: ابزار متنباز ساخت جهانهای بازی با هوش مصنوعی
یک ابزار جدید و رایگان به نام DreamX-World منتشر شده است که به شما امکان میدهد محیطهای سهبعدی تعاملی را فقط با متن یا تصویر بسازید. این شبیهساز جهان، «حافظه» مکانها را حفظ میکند و میتوانید در آن حرکت کنید، زاویه دید را تغییر دهید و به مناطق قبلی بازگردید.
🌍 فناوری پشت صحنه:
این مدل با ترکیبی از دادههای موتور آنریل، ویدیوهای واقعی و گیمپلی بازیها آموزش دیده است. نتیجه، فضاهایی پیوسته و قابل کنترل است که حس یک جهان زنده را منتقل میکنند.
🚀 قابلیتهای کلیدی:
- 🖼 ساخت دنیای سهبعدی از روی متن یا تصویر
- 🎥 کنترل دوربین (حالت اول شخص و سوم شخص)
- 🧠 تولید صحنههای بلند با داستانسرایی منسجم
- ⚡️ رویدادهای شرطی که صحنه را به دستور شما تغییر میدهند
- 🧙♂️ پشتیبانی از سبکهای واقعگرایانه، فانتزی، علمی‑تخیلی و کارتونی
📌 برنامه بعدی توسعهدهندگان، رسیدن به تولید لحظهای (Real-time) است.
🔗 مشاهده پروژه
https://amap-ml.github.io/DreamX_World/
#AI #هوش_مصنوعی #تولید_جهان #بازیسازی #DreamXWorld
🆔 @asrgooyeshpardaz | 813 |
| 7 | ⚽️ ضربه کاری
#روباتها | 781 |
| 8 | 🎙️ مدل TTS جدید که از گفتار فراتر رفته است
مدل Ming-omni-tts با ۱۶.۸ میلیارد پارامتر (۳ میلیارد فعال) منتشر شده است. این مدل بهطور همزمان گفتار، افکتهای صوتی و موسیقی تولید میکند.
✨ قابلیتهای کلیدی:
- کنترل دقیق بر سرعت، زیروبمی، احساسات و لهجه
- نرمالسازی حرفهای فرمولهای ریاضی و شیمیایی
- طراحی صدای بدون نمونه (zero-shot) با توضیح متنی
- بیش از ۱۰۰ صدای داخلی با کیفیت بالا
- تأخیر پایین و مناسب برای پادکستهای طولانی
در بنچمارکها عملکردی در سطح مدلهای پیشرو دارد و در کنترل لهجه و احساسات از رقبا بهتر عمل کرده است.
🔗 مدل روی HuggingFace
https://huggingface.co/inclusionAI/Ming-omni-tts-16.8B-A3B
#TTS #هوش_مصنوعی #تولید_صدا
🆔 @asrgooyeshpardaz | 1 084 |
| 9 | 🎯استفاده از gzip بجای مدل زبانی
همه چیز از یک مقاله به نام «Language Modeling is Compression» شروع شد. در این مقاله نشان داده شده که بین پیشبینی و فشردهسازی یک همارزی عمیق وجود دارد:
> هر مدل پیشبینیکننده، یک فشردهساز است و هر فشردهسازی، یک مدل پیشبینی.
دلیلش ساده است: یک فشردهساز روی دادههایی که «انتظارشان را دارد» بایت کمتری مصرف میکند و روی دادههای غیرمنتظره بایت بیشتری. این دقیقاً همان کاری است که یک مدل زبانی با تخصیص احتمال به توکنها انجام میدهد.
---
⚙️ روش کار gzipt چگونه است؟
محقق با الهام از این ایده، ابزاری به نام gzipt ساخت که دقیقاً از همان الگوریتم فشردهسازی gzip (DEFLATE) استفاده میکند:
۱. یک متن مرجع (مثلاً تمام آثار شکسپیر) را به gzip میدهد تا در حافظهی کش ۳۲ کیلوبایتی آن قرار گیرد.
۲. یک **پرامپت** ورودی دریافت میکند.
۳. برای ادامهی متن، جستجوی beam روی توالیهای بایت انجام میدهد.
۴. ادامهای را انتخاب میکند که کمترین حجم فشردهشده را داشته باشد – یعنی بیشترین شباهت را به متن مرجع داشته باشد.
---
📝 نتیجه چه شد؟
خروجی کاملاً منسجم نیست، اما بهطرز شگفتآوری ساختار زبان را درک کرده است. مثلاً وقتی روی متن شکسپیر آموزش داده شد، خروجیای مثل این تولید کرد:
> MENENIUS: 'Though all at once canq MARCIUS: Pray now, nocamest thou to a morsel . LARTIUS: Hence, and I' the end admire...
متن کاملاً شکسپیری نیست، اما لحن، واژگان و ساختار جملات شباهت قابلتوجهی به سبک اصلی دارد.
---
⚠️ محدودیتها و نکات مهم:
- gzip بدون هیچ شبکه عصبی، وزن یا فرآیند آموزشی کار میکند – فقط همان فشردهسازی که در سیستمعامل شما وجود دارد کافی است.
- به خاطر کوانتیزه شدن (اعداد صحیح بایت)، انتخاب تکبایتها کارساز نیست و باید چند بایت را با هم بررسی کرد.
- قدرت آن بسیار کمتر از مدلهای بزرگ زبانی است، اما نشان میدهد که اصل پیشبینی در فشردهسازی یک مفهوم بنیادین است.
---
🔗 منابع:
- وبلاگ کامل Nathan
- مقاله «Language Modeling is Compression» در arXiv
🆔 @asrgooyeshpardaz | 1 256 |
| 10 | 🤖 Qwen از مجموعه مدلهای کنترل ربات رونمایی کرد: پلی میان زبان، دید و عمل
شرکت Qwen از مجموعهای از مدلهای هوش مصنوعی به نام **Qwen-Robot Suite** پرده برداشته است. این مجموعه شامل سه مدل تخصصی است که قرار است شکاف میان درک بصری-زبانی مدلها و انجام کارهای فیزیکی توسط رباتها را پر کنند.
---
🧭 مدل Qwen-RobotNav: ناوبری هوشمند
این مدل بر پایهٔ Qwen3-VL ساخته شده و **پنج وظیفهٔ ناوبری** را در یک مدل واحد ترکیب میکند: دنبال کردن دستورات، جستجوی اشیاء، تعقیب هدف، رانندگی خودکار و پاسخ به پرسشهای محیطی.
رفتار ربات با چهار پارامتر قابل تنظیم است: تعداد توکنهای بصری، نرخ فراموشی زمانی، اهمیت دوربینها و نحوهٔ انتخاب فریمها. به گفتهٔ Qwen، این مدل بدون نیاز به آموزش اضافی روی ربات چهارپای Unitree Go2 نیز کار میکند و در پنج حوزه رکوردهای تازهای ثبت کرده است.
---
🦾 مدل Qwen-RobotManip: دقت در دستکاری
این مدل از Qwen3.5-4B VL و یک ماژول مبتنی بر flow-matching DiT استفاده میکند. فضای حالت و اقدام را در ابعاد ۸۰ عددی برای انواع رباتها یکپارچه ساخته است.
دقت این مدل در آزمون LIBERO-Plus به ۹۱.۴٪ رسیده و در یکی از بخشهای مسابقهٔ RoboChallenge مقام اول را کسب کرده است.
---
🌍 مدل Qwen-RobotWorld: شبیهساز فیزیک
این مدل «مدل جهان» (world model) نام دارد. با دریافت یک تصویر و یک دستور متنی، پیشبینی میکند که صحنه چگونه تغییر خواهد کرد. تمام اقدامات با زبان طبیعی توصیف میشوند، به همین دلیل میتوان بیش از ۲۰ نوع ربات و بیش از ۵۰۰ دسته عمل را در یک سیستم واحد جای داد.
معماری این مدل، MMDiT با ۶۰ لایه است که به نمایشهای Qwen2.5-VL متصل میشود. Qwen از کسب رتبههای اول در آزمونهای فیزیکی مانند EWMBench و WorldModelBench خبر داده است.
---
💬 Chat2Robot: کنترل ربات با گفتگو
علاوه بر مدلها، قابلیت Chat2Robot به صورت یک دموی مرورگری معرفی شده است. کاربر میتواند با دستورات متنی، ربات را کنترل کرده و واکنش آن را در لحظه ببیند.
این دمو در حال حاضر با نسخهٔ سادهشدهٔ RobotManip کار میکند که روی ۵۰ وظیفه آموزش دیده است. هدف آن نشان دادن توانایی مدل در اجرای دستورات ناآشناست.
---
🔍 آیا وزنها منتشر میشوند؟
در این اعلامیه به انتشار وزنها یا مجوز آنها اشاره نشده است. در حال حاضر فقط گزارشهای فنی و اطلاعیههای مربوط به هر مدل در دسترس است.
🔗 منبع: Qwen
#Qwen #رباتیک #هوش_مصنوعی #مدل_جهان
🆔 @asrgooyeshpardaz | 1 057 |
| 11 | 🧠 مدل GLM-5.2 منتشر شد؛ با وزنهای باز و پیشرفت چشمگیر در کدنویسی
شرکت Z.ai از مدل جدید خود با نام GLM-5.2 رونمایی کرده است. این مدل با وزنهای کاملاً باز (open‑source) در دسترس عموم قرار گرفته است.
طبق بنچمارکهای منتشرشده، GLM-5.2 پیشرفت قابلتوجهی در حوزه کدنویسی و وظایف عاملی (Agentic) داشته است. همچنین زمینه (Context Window) این مدل تا ۱ میلیون توکن افزایش یافته که آن را برای پروژههای حجیم و سناریوهای چندمرحلهای بسیار مناسب میسازد.
این مدل با دو حالت استدلال عرضه شده است:
- GLM-5.2 (max): برای بالاترین کیفیت خروجی
- GLM-5.2 (high): برای تعادل میان کیفیت و مصرف بهینه توکن
قیمت API این مدل دقیقاً مشابه نسخه قبلی (GLM-5.1) تعیین شده است. وزنهای مدل هماکنون روی Hugging Face در دسترس است و کاربران میتوانند از طریق API، چت آنلاین و طرحهای ویژه توسعهدهندگان از آن استفاده کنند.
🔗 منابع مفید:
- [وبلاگ فنی مدل](http://z.ai/blog/glm-5.2)
- [دریافت وزنهای مدل](http://huggingface.co/zai-org/GLM-5.2)
- [مستندات API](http://docs.z.ai/guides/llm/glm-5.2)
- [طرح ویژه برنامهنویسان](http://z.ai/subscribe)
- [چت آنلاین با مدل](http://chat.z.ai)
#GLM52 #هوش_مصنوعی #مدل_باز #کدنویسی
🆔 @asrgooyeshpardaz | 1 230 |
| 12 | 📌 موفقیت در کار با Claude Code بیش از مهارت کدنویسی، به درک مسئله بستگی دارد
شرکت Anthropic گزارشی منتشر کرده است که نشان میدهد مهمترین عامل موفقیت در کار با عاملهای هوش مصنوعی برنامهنویسی، تسلط بر کدنویسی نیست، بلکه درک عمیق از خود مسئله است.
این نتیجه بر اساس تحلیل حدود ۴۰۰ هزار جلسه از سرویس Claude Code، که توسط حدود ۲۳۵ هزار کاربر از اکتبر ۲۰۲۵ تا آوریل ۲۰۲۶ انجام شده، به دست آمده است.
در یک جلسه معمولی، انسان حدود ۷۰٪ تصمیمات مربوط به «چه کاری باید انجام شود» را میگیرد، در حالی که عامل حدود ۸۰٪ تصمیمات مربوط به «چگونه انجام شود» را بر عهده میگیرد. به عبارت دیگر، نقش انسان تعیین هدف است و نقش دستیار انتخاب روش.
هر چه کاربر در حوزه مورد نظر تخصص بیشتری داشته باشد، عامل با یک دستور ساده، کار بیشتری انجام میدهد. به گفته تیم تحلیل، یک دستور از کاربران مبتدی به طور میانگین حدود ۵ اقدام و ۶۰۰ کلمه پاسخ از سوی عامل را به دنبال دارد، در حالی که این عدد برای کاربران خبره به ۲ برابر اقدام و ۵ برابر متن میرسد.
سطح مهارت کاربران نه بر اساس سمت شغلی، بلکه بر اساس دقت در فرمولبندی نیازمندیها و تشخیص خطاهای عامل تعیین شده است.
🟡 نکته جالب درباره مشاغل مختلف:
افراد غیربرنامهنویس (مانند تحلیلگران، مدیران محصول و پژوهشگران) در نوشتن کد با Claude Code تقریباً به اندازه برنامهنویسان حرفهای موفق عمل میکنند و همه گروههای شغلی اصلی در ۷ درصد اختلاف با مهندسان نرمافزار قرار دارند.
با این حال، شکاف بین مبتدیان و کاربران با تجربه قابل توجه است. بر اساس معیار «موفقیت تأییدشده»، جلسات مبتدیان در ۱۵٪ موارد با موفقیت به پایان رسیده، در حالی که این نرخ برای کاربران سطح متوسط و بالاتر بین ۲۸ تا ۳۳٪ بوده است.
🟡 تغییر الگوی کاری در ۷ ماه:
- سهم جلسات مربوط به رفع اشکال از ۳۳٪ به ۱۹٪ کاهش یافته است.
- سهم وظایف مرتبط با راهاندازی و تنظیم نرمافزار، تحلیل داده و تهیه متون افزایش یافته است.
- هزینه برآوردی هر وظیفه (بر اساس مقایسه با نرخهای بازار آزاد) به طور متوسط حدود ۲۵٪ افزایش پیدا کرده است.
🔜 جزئیات بیشتر درباره روششناسی، پروفایلهای کاربری و نمونه درخواستها در پیوست گزارش موجود است.
🔗 منبع: [Anthropic](https://www.anthropic.com/research/claude-code-expertise)
#AI #ML #Coding #Research #Anthropic
🆔 @asrgooyeshpardaz | 1 028 |
| 13 | 🌐اخبار هوش مصنوعی
⚖️ xAI شکایت خود علیه OpenAI را در مورد افشای فناوری واگذار کرد
دادگاه فدرال آمریکا شکایت xAI علیه OpenAI را به طور قطعی رد کرد. ایلان ماسک ادعا کرده بود که رقبا با استخدام مهندسان، اطلاعات مدل Grok 4 را جمعآوری کردهاند.
این شکایت حول انتقال یک مهندس ارشد به نام «سوئهچن لی» شکل گرفت. به ادعای xAI، در مصاحبههای شغلی، عمداً جزئیات توسعه Grok 4 از او پرسیده شده تا عقبماندگی OpenAI در الگوریتمهای استنتاج، روشهای یادگیری تقویتی و پسآموزش جبران شود.
دادگاه اعلام کرد که بحث درباره تجربه گذشته نامزدها در مصاحبه، رویه استاندارد صنعت است و مدرکی دال بر اجبار به افشای اسرار تجاری یافت نشد. OpenAI این شکایت را بیاساس و بخشی از کارزار فشار از سوی ماسک خواند. این دومین پرونده ردشده xAI علیه تیم سم آلتمن در یک ماه اخیر است.
منبع: reuters.com
---
💳 Anthropic از تغییر مدل پرداخت Agent SDK منصرف شد
این شرکت بهروزرسانی صورتحساب را که برای ۱۵ ژوئن برنامهریزی شده بود، لغو کرد. قرار بود Agent SDK، حالت تعاملی و یکپارچهسازیهای شخص ثالث به صورت جداگانه و خارج از اشتراکهای معمولی قیمتگذاری شوند.
برنامه این بود که به مشتریان اعتبار ماهانه تعلق گیرد: ۲۰ دلار برای طرح Pro و ۲۰۰ دلار برای Enterprise. در صورت مصرف بیشتر، هزینه توکنها بر اساس نرخ پایه API محاسبه میشد. اکنون این ابزارها با همان محدودیتهای قبلی به کار خود ادامه میدهند.
گمان میرود دلیل این عقبنشینی، آمادگی OpenAI برای کاهش قیمت API باشد. آنتروپیک رسماً اعلام کرده که برای تطابق تعرفهها با کاربردهای واقعی، به زمان بیشتری نیاز دارد و پس از کاهش هزینه پایه توکنهای خود، به تفکیک محدودیتها بازخواهد گشت.
منبع: claude.com
---
🔍 مایکروسافت DeepSeek را برای کاهش هزینههای Copilot Cowork آزمایش میکند
مایکروسافت سرویس Copilot Cowork را از اشتراک ثابت به پرداخت بر اساس مصرف تغییر میدهد و همزمان یکپارچهسازی با مدل DeepSeek V4 را آزمایش میکند. پیشتر همین روش برای GitHub Copilot نیز اعمال شد.
مدیر بخش Copilot گفته است که مدل کسبوکار فعلی زیانده است. کاربران فعالی که صدها وظیفه در هفته را به هوش مصنوعی واگذار میکنند، هزینههای زیادی ایجاد میکنند. Cowork در حال حاضر روی مدلهای کلود اجرا میشود که سناریوهای عاملی آن مصرف توکن بالایی دارند.
به عنوان گزینه مقرونبهصرفه، مایکروسافت قصد دارد نسخه تنظیمشده DeepSeek V4 را بهصورت اختیاری به سرویس اضافه کند. این مدل در Azure مستقر خواهد شد تا دادههای مشتریان درون ابر شرکت باقی بماند. تصمیم نهایی در هفتههای آینده گرفته میشود.
منبع: axios.com
---
🌍 قابلیتهای پیشرفته Codex در اروپا در دسترس قرار گرفت
OpenAI دسترسی به قابلیتهای Computer Use، افزونه کروم، Memories و Chronicle را در Codex برای کاربران منطقه اقتصادی اروپا، بریتانیا و سوئیس باز کرده است.
Computer Use به دستیار اجازه میدهد مستقیماً رابط کاربری مک و ویندوز را کنترل کند. افزونه کروم نیز امکان انجام وظایف مرورگر را در پسزمینه فراهم میکند.
با قابلیت Memories، Codex پشته فناوری ترجیحی، قوانین کدنویسی در مخازن و گردشکار را به خاطر میسپارد. حالت آزمایشی Chronicle در مک نیز بر اساس فعالیت اخیر صفحه، حافظه زمینهای را بهطور خودکار میسازد.
منبع: پست OpenAI Developers در شبکه اجتماعی X
---
🤝 Cursor اکنون بخشی از امپراتوری ایلان ماسک است
شرکت SpaceX برای خرید استارتاپ Anysphere، سازنده دستیار کدنویسی Cursor، به توافق رسیده است. ارزش معامله ۶۰ میلیارد دلار برآورد شده که سرمایهگذاران استارتاپ آن را به صورت سهام SpaceX دریافت میکنند.
این خرید به تقویت جایگاه بخش xAI در بازار هوش مصنوعی کدنویسی کمک میکند. مهندسان Cursor هماکنون در دفاتر xAI روی ساخت یک مدل مشترک جدید کار میکنند.
خرید Anysphere به استارتاپ دسترسی به توان محاسباتی و ذخیره تراشههای SpaceX میدهد. از سوی دیگر، xAI کمبود نیروی متخصص خود را جبران میکند (پیشتر دهها متخصص از این بخش خارج شده بودند). تیم Anysphere به همراه آژانس استخدامی تخصصی این شرکت، به جمع xAI میپیوندند.
منبع: bloomberg.com
---
#news #ai
🆔 @asrgooyeshpardaz | 775 |
| 14 | ⚡💻 *شرکت Moonshot AI نسخه فوقسریع مدل Kimi K2.7 Code را منتشر کرد*
شرکت چینی Moonshot AI از حالت پرسرعت مدل چندوجهی خود، *Kimi K2.7 Code HighSpeed*، رونمایی کرده است. به ادعای این شرکت، پاسخها تا *۶ برابر سریعتر* از نسخه استاندارد تولید میشوند.
سرعت این مدل در درخواستهای معمولی حدود *۱۸۰ توکن در ثانیه* و در صورت کوتاه بودن زمینه، تا *۲۶۰ توکن در ثانیه* میرسد.
این نسخه برای شرکتکنندگان برنامه *Kimi Code Beta*، توسعهدهندگان *Kimi API* و مشتریان سازمانی *Kimi Business* در دسترس قرار گرفته است.
برای دسترسی به این نسخه، نیازی به دعوتنامه جداگانه نیست و همه کسانی که عضو برنامه بتا هستند، بهطور خودکار به آن دسترسی خواهند داشت.
در اطلاعیه رسمی، قیمتی برای این نسخه اعلام نشده و تنها گفته شده که «هوش مصنوعی باز باید فوری، در دسترس و بیمرز باشد». با این حال، برخی منابع از دو برابر شدن تعرفههای API این نسخه نسبت به نسخه استاندارد خبر دادهاند.
منبع: Moonshot AI
#news #ai
🆔 @asrgooyeshpardaz | 1 189 |
| 15 | 🚫 مسدود شدن دسترسی به مدلهای Fable 5 و Mythos 5
دولت آمریکا با استناد به اختیارات امنیت ملی، دستورالعملی برای کنترل صادرات صادر کرده است که بر اساس آن دسترسی به مدلهای Fable 5 و Mythos 5 برای همه اتباع خارجی – چه در داخل آمریکا و چه در خارج از آن – باید متوقف شود. در نتیجه، شرکت Anthropic ناچار شده است دسترسی به این دو مدل را برای همه مشتریان خود به طور ناگهانی قطع کند.
🔍دلیل این دستور چیست؟
به گفته دولت آمریکا، روشی برای «جیلبریک» (دور زدن محافظتها) مدل Fable 5 شناسایی شده است. با این حال، Anthropic تأکید میکند که این روش تنها یک آسیبپذیری محدود را نشان میدهد که پیش از این شناخته شده بوده و سایر مدلهای عمومی نیز بدون نیاز به دور زدن محافظت، قادر به کشف آن هستند.
🛡 واکنش Anthropic:
شرکت Anthropic اعلام کرده است که محافظتهای مدل Fable 5 قویترین محافظتهای موجود در صنعت است و هزاران ساعت توسط دولت آمریکا، مؤسسه ایمنی هوش مصنوعی بریتانیا و تیمهای مستقل تست شده است. تاکنون هیچ روش «جیلبریک همگانی» (که به طور گسترده محافظتها را دور بزند) برای این مدل پیدا نشده است.
شرکت Anthropic معتقد است که بر اساس این معیار (وجود یک آسیبپذیری محدود و غیرهمگانی) عملاً تمام استقرارهای جدید مدلهای پیشرو در صنعت متوقف خواهند شد. این شرکت این اقدام دولت را «سوءتفاهم» توصیف کرده و در حال کار برای بازگرداندن دسترسی در اسرع وقت است.
⚠️ شرکت Anthropic هشدار میدهد: اعمال چنین استانداردی «عملاً تمام استقرارهای جدید مدلها را برای همه ارائهدهندگان پیشرو متوقف خواهد کرد.»
این شرکت ضمن عذرخواهی از مشتریان خود بابت این اختلال، تأکید کرده است که اگرچه از دستور دولت تبعیت میکند، اما با آن موافق نیست. دسترسی به سایر مدلهای Anthropic تحت تأثیر این دستور قرار نخواهد گرفت.
🔗 منبع:
https://www.anthropic.com/news/fable-mythos-access
#AI #Anthropic #Mythos #Fable5
🆔 @asrgooyeshpardaz | 3 353 |
| 16 | 🤖 کوالیا رباتیکس در برنامه گوگل دیپمایند پذیرفته شد
شرکت Qualia Robotics به طور رسمی برای شرکت در برنامه رباتیک Google DeepMind انتخاب شده است.
🧠 این شرکت روی مدلهای «جسمیافته» (embodied models) کار میکند که رباتها را برای انجام کارهای واقعی در محیطهای صنعتی آماده میسازد – نه فقط در حالت نمایشی.
🎯 تمرکز اصلی روی مدلهای بنیادی و قدرت استدلال هوش مصنوعی است. این دو حوزه، مسیر آینده رباتیک را تعیین میکنند.
🤝 همکاری با دیپمایند که در مرزهای دانش این فناوری حرکت میکند، دقیقاً همان جایی است که کوالیا آرزویش را داشت.
✅ خلاصه:
- کار در دنیای واقعی، بدون هیچ صحنهسازی
- تأیید شده توسط برنامه معتبر Google DeepMind
- روند اصلی آینده: استدلال + مدلهای بنیادی در رباتیک
🔗 منبع: [پست Qualia Robotics در شبکه اجتماعی X](https://x.com/QualiaRobotics/status/2064439568158351684)
#Google #DeepMind #رباتیک
🆔 @asrgooyeshpardaz | 2 688 |
| 17 | 🚀 از AGI تا ASI: نقشه راه آینده طبق طرح گوگل دیپمایند
شرکت Google DeepMind در مقالهای جدید، مسیرِ گذار از هوش مصنوعی در سطح انسان (AGI) به ابرهوش مصنوعی (ASI) را تشریح کرده است. ASI به سیستمی گفته میشود که از گروهی از خبرگان انسانی در همه حوزهها برتر است.
📈 حقایق و خلاصه:
توان مؤثر هوش مصنوعی سالانه ۱۰ برابر** میشود؛ هم به خاطر پیشرفت تراشهها و هم به خاطر الگوریتمهای بهتر.
** ذهن دیجیتال محدودیتهای زیستی ندارد: میتواند بیدرنگ کپی شود، با سرعتهای متفاوت کار کند و تجربه را بدون افت کیفیت منتقل نماید.
🛤 چهار مسیر اصلی توسعه:
۱. مقیاسسازی محاسبات و داده
۲. جهشهای الگوریتمی (معماریهای جدید)
۳. خودبهبودی بازگشتی (هوش مصنوعی کد نسل بعدی خود را مینویسد)
۴. همکاری جمعی میلیونها عامل هوش مصنوعی
🛑 موانع پیش رو:
«دیوار داده» (کمبود متن برای آموزش)، کمبود انرژی و «دیوار انتزاع» – یعنی خطر اینکه هوش مصنوعی نتواند فراتر از مفاهیم انسانی فکر کند.
🔗 منبع: [arXiv:2606.12683v1 - From AGI to ASI: A Roadmap](https://arxiv.org/abs/2606.12683v1)
#AI #Google
🆔 @asrgooyeshpardaz | 2 233 |
| 18 | 🌐اخبار هوش مصنوعی
🔗 شرکت OpenAI استارتاپ Ona را خریداری کرد
این معامله برای خرید استارتاپ هماهنگسازی ابری (cloud orchestration) به عاملهای OpenAI امکان میدهد وظایف طولانی را به طور خودمختار، بدون وابستگی به دستگاه محلی یا جلسه فعال کاربر انجام دهند.
یکپارچهسازی فناوریهای Ona یک محیط ایزوله برای کار چندساعته روی کد فراهم میکند، با قابلیت اتصال از راه دور به فرایندهای پسزمینه برای اصلاح اقدامات، بررسی نتایج میانی و تأیید تصمیمات.
تیم استارتاپ پس از تأیید نهادهای نظارتی به OpenAI خواهد پیوست.
منبع: openai.com
---
🤝 شرکت AI Alliance به طور جمعی یک مدل متنباز آموزش خواهد داد
کنسرسیوم از پلتفرم Project Tapestry برای آموزش فدرال مدلهای متنباز رونمایی کرد. شرکتها مدل را روی دادههای محلی خود و با استفاده از توان محاسباتی اختصاصی آموزش میدهند. فقط وزنهای بهروزرسانی شده وارد سیستم مشترک خواهد شد.
یان لکون، مشاور پروژه، قول داده است که مشارکتکنندگان به مدل پایه نهایی دسترسی پیدا کنند. شرکتها میتوانند بر اساس آن، نسخههای مستقل خود را برای نیازهای تجاری بسازند.
در حال حاضر مهندسان پروژه در حال تست معماری پلتفرم و تهیه کاتالوگ داده هستند. زیرساخت قرار است در سپتامبر ۲۰۲۶ منتشر شود.
تا پایان سال، AI Alliance قصد دارد نخستین مدل جمعوجور را آموزش دهد و تا تابستان ۲۰۲۷ نسخهای در سطح راهکارهای اختصاصی پیشرو (SOTA) عرضه کند.
منبع: thealliance.ai
---
🚀 همبنیانگذار xAI استارتاپ عاملهای شخصیسازیشده را راهاندازی کرد
ایگور بابوشکین، از بنیانگذاران xAI که سابقه کار در OpenAI و Google DeepMind را نیز دارد، از تأسیس شرکت River AI خبر داد. این استارتاپ به ساخت عاملهای هوش مصنوعی تطبیقی خواهد پرداخت.
ایدئولوژی این پروژه بر گسترش توانمندیهای انسان از طریق شخصیسازی و کنترل کامل بر هوش مصنوعی استوار است. در آینده، استارتاپ قصد دارد به سمت تولید سختافزار و زیرساخت فیزیکی نیز حرکت کند.
هسته اصلی تیم را افرادی از xAI تشکیل دادهاند. وینسنت استارک (رئیس ایمنی محصول)، لیلی لیم (مشاور حقوقی) و برادران سوبولف (مهندسان) به بابوشکین پیوستهاند.
منبع: bloomberg.com
---
💳 عاملهای ChatGPT توانایی پرداخت خرید از طریق ویزا را پیدا کردند
ویزا شبکه پرداخت خود را در ChatGPT یکپارچه ساخته است. عاملهای هوش مصنوعی اکنون میتوانند به طور خودمختار از طرف کاربر، نزد هر فروشندهای که کارتهای ویزا را میپذیرد، تراکنش انجام دهند. برای استفاده از این قابلیت، کافی است کارت به چتبات متصل شود.
شرکت OpenAI مسئول منطق عاملهای خودمختار است و ویزا وظیفه تأیید تراکنشها و نظارت بر تقلب را بر عهده دارد. کاربران ابزارهای کنترلی مانند محدودیت هزینه، فهرست سفید فروشگاهها و گزینه تأیید اجباری عملیات را در اختیار دارند.
اعتراض به تراکنشها طبق قوانین استاندارد ویزا انجام میشود. این مقررات برای مواردی که فروشنده درست عمل کرده اما خطای منطق هوش مصنوعی منجر به سفارش اشتباه شده، تطبیق داده خواهد شد.
منبع: visa.com
---
🎵 دیزر شناساگر موسیقی ساختهشده با هوش مصنوعی را راهاندازی کرد
این سرویس استریمینگ ابزاری ساخته است که آهنگهای ساختهشده با هوش مصنوعی را جستجو و شناسایی میکند. الگوریتم با تحلیل کتابخانه کاربران، محتوای مصنوعی را در ۲۰ پلتفرم استریمینگ کشف میکند. این ابزار از ۲۷ زبان پشتیبانی مینماید.
به گفته الکسی لانترنیه، مدیرعامل دیزر، روزانه حدود ۷۵ هزار قطعه تولیدشده با هوش مصنوعی در این پلتفرم بارگذاری میشود که بیش از ۴۴٪ کل انتشارات جدید را تشکیل میدهد. نزدیک به نیمی از کاربرانی که از رقبا به دیزر مهاجرت میکنند، قبلاً موسیقی ساختهشده با هوش مصنوعی را در مجموعههای خود ذخیره کردهاند.
نظرسنجی مشترک دیزر و ایپسوس نشان میدهد ۹۷٪ شنوندگان نمیتوانند موسیقی هوش مصنوعی را از واقعی تشخیص دهند، اما ۸۰٪ برچسبگذاری اجباری آن را خواستارند. این پلتفرم هماکنون محتوای تولیدشده با هوش مصنوعی را در اولویت پایینتری قرار داده و آن را از توصیهها و فهرستهای منتخب حذف کرده است.
منبع: deezer.com
---
#news #ai
🆔 @asrgooyeshpardaz | 2 263 |
| 19 | 🌐اخبار هوش مصنوعی
📅 عرضه اولیه سهام OpenAI به سال ۲۰۲۷ موکول شد
سم آلتمن به کارمندان اطلاع داده است که ورود به بورس یک سال به تعویق افتاده است. او برگ درخواست ثبتشده را مانوری برای حفظ آزادی عمل تاکتیکی توصیف کرده است. در مقابل، به کارمندان پیشنهاد شده سهام خود را به قیمت ۶۸۷.۶۹ دلار برای هر سهم بفروشند.
دلیل تأخیر، پیشرفت در توسعه هوش مصنوعی خودآموز است. به باور مدیرعامل OpenAI، در دوره توسعه غیرقابلپیشبینی فناوری، برای شرکت ایمنتر است که غیرعمومی باقی بماند.
عامل دیگر، عرضه سهام رقیب، Anthropic، است. این رقیب نرخهای رشد بهتری نشان میدهد، در حالی که OpenAI در حال سوزاندن سرمایه است.
این شرکت قصد دارد در ماه ژوئن مدل جدیدی با شاخص ۵.۶ منتشر کند که در داخل آن را گامی جدی نسبت به GPT-5.5 ارزیابی میکنند.
منبع: theinformation.com
---
☁️ شرکت Arcee AI از AWS به Hugging Face کوچ میکند
دادههای این شرکت در سرویس Hugging Face Buckets قرار خواهد گرفت که به CDN توکار مجهز و برای کار با وزنهای مدل بهینه شده است.
دلیل اصلی این کوچ، نبود هزینه برای ترافیک خروجی است. مخزن یکپارچه به Arcee AI امکان میدهد از قفل فروشنده (vendor lock-in) جلوگیری کرده و خوشههای آموزشی را نزد هر ارائهدهنده ابری بدون هزینه جابهجایی داده راهاندازی کند.
این آزمایشگاه بیش از ۲۰۰ پروژه را در Hugging Face پشتیبانی میکند، از جمله فاینتیون SuperNova روی Llama 3.1، خانواده مدلهای Trinity و مجموعه داده باز The-Tome با ۱.۷۵ میلیون نمونه برای آموزش عاملهای هوش مصنوعی.
منبع: huggingface.co
---
📓 برنامه NotebookLM به محیط اجرای کد، عاملها و مدل Gemini 3.5 مجهز شد
گوگل پلتفرم NotebookLM را بهروز کرده است. این سیستم به Gemini 3.5 و موتور Antigravity مهاجرت کرده و از عاملهای خودمختار و اجرای کد پشتیبانی میکند.
هر دفترچه هماکنون به یک نمونه ابری مجهز است که شامل بیش از ۱۰۰ مهارت برای اجرای کد و تحلیل داده میشود. در آزمایشها، معماری جدید در ۶۵٪ موارد از نظر پنج معیار کلیدی از نسخه قبلی بهتر عمل کرده است.
امکان شروع پژوهش بدون بارگذاری داده، از طریق جستجوی عاملی مواد مرتبط، به سرویس اضافه شده است. نتایج با حفظ ارجاع وارد پایگاه میشوند.
قالبهای خروجی گسترش یافتهاند: گزارش PDF همراه با نمودار، دادههای ساختاریافته، جدول اکسل، ارائه پاورپوینت و همچنین تصاویر با استفاده از Nano Banana.
این بهروزرسانی برای کاربران اشتراک AI Ultra و مشتریان سازمانی در دسترس است.
منبع: blog.google
---
💻 شرکت Cohere نخستین مدل کدنویسی متنباز خود را منتشر کرد
مدل North Mini Code یک مدل متنباز برای برنامهنویسی و هماهنگی عاملهاست که بر پایه معماری MoE با ۳۰ میلیارد پارامتر کل و ۳ میلیارد فعال ساخته شده است. این مدل برای مدیریت زیرعاملها، طراحی معماری سیستم و انجام بازبینی کد آموزش دیده است.
در بنچمارک Artificial Analysis Coding Index این مدل ۳۳.۴ امتیاز کسب کرده است. در مقایسه با Devstral Small 2 روی سختافزار مشابه، توان عملیاتی تولید متن ۲.۸ برابر بیشتر و تأخیر بین توکنها ۳۰٪ کمتر است، در حالی که زمان رسیدن به نخستین توکن قابل مقایسه میباشد.
وزنها در Hugging Face منتشر شده است. دسترسی آزمایشی از طریق API و پلتفرم Model Vault باز شده است.
منبع: cohere.com
---
🎵 وارنر میوزیک گروپ توسعهدهنده اثرانگشت دیجیتال Sureel AI را خریداری کرد
فناوری Sureel AI اثرانگشت دیجیتال ضبطهای صوتی را با تجزیه آنها به مؤلفههای پایه ایجاد میکند. الگوریتمها تشخیص میدهند که آیا محتوای هنرمند وارد مجموعه داده آموزشی مدل هوش مصنوعی شده یا در تولید آهنگ جدید استفاده شده است.
ماژول اضافی این سیستم، دیپفیک، شبیهسازی صدا و کپیبرداری از سبک بصری را شناسایی میکند. معماری پلتفرم از کار با ویدیو و تصاویر پشتیبانی میکند و میلیونها دارایی دیجیتال در پایگاه داده این استارتاپ نمایهسازی شده است.
این شرکت ضبطوتوزیع، پروژه را به عنوان یک پلتفرم مستقل حفظ خواهد کرد و قصد دارد آن را به استانداردی برای صنعت موسیقی تبدیل نماید.
منبع: wmg.com
---
#news #ai
🆔 @asrgooyeshpardaz | 2 166 |
| 20 | 🌐 اخبار هوش مصنوعی
🇨🇳چین شبکه ملی محاسباتی یکپارچه خواهد ساخت
پکن طی پنج سال آینده قصد دارد مراکز داده پراکنده کشور را در یک زیرساخت مشترک برای توسعه سریع صنعت هوش مصنوعی ادغام کند. غولهای مخابراتی China Mobile و China Telecom مدیریت عملیاتی را بر عهده خواهند داشت و باید تا سال ۲۰۲۸ اتصال کامل شبکه را تأمین کنند. با احتساب نوسازی سیستمهای انرژی، هزینه کل پروژه ممکن است به نیم تریلیون دلار برسد. تأمین مالی اصلی از طریق انتشار اوراق قرضه دولتی و صندوقهای هدفمند انجام میشود.
این طرح خریدها را سهمیهبندی میکند: حداقل ۸۰ درصد تجهیزات، از جمله تراشههای هوش مصنوعی، باید توسط تولیدکنندگان داخلی تأمین شود. برای NVIDIA و AMD این به معنای کاهش شدید حضور در بازار چین است. این زیرساخت عظیم بخشی از استراتژی دولتی «شش شبکه بزرگ» بوده و هدف آن تأمین استقلال چین برای رهبری در رقابت جهانی هوش مصنوعی است.
منبع: bloomberg.com
---
🗣️ گوگل از مدل جریانی Gemini 3.5 Live Translate رونمایی کرد
این مدل جدید، خروجی صوتی را پیش از پایان یافتن گفتار گوینده تولید میکند و میان انباشت زمینه و سرعت تولید تعادل برقرار مینماید. الگوریتم از بیش از ۷۰ زبان پشتیبانی کرده و تن، سرعت و زیر و بمی صدای اصلی را حفظ میکند.
این فناوری مستقیماً وارد محصولات نهایی شده است. بهروزرسانی در اپلیکیشن موبایل Google Translate در حال اجراست. برای مشتریان سازمانی، یکپارچهسازی در Google Meet با پشتیبانی از بیش از ۲۰۰۰ ترکیب زبانی در یک کنفرانس در حال آزمایش است.
نسخه پیشنمایش مدل در AI Studio و از طریق Gemini Live API در دسترس است. خروجیهای صوتی تولیدشده با SynthID نشانهگذاری میشوند.
منبع: blog.google
---
⚡️ نسخه فوقسریع مدل پرچمدار شیائومی منتشر شد
شرکت چینی مدل MiMo-V2.5-Pro-UltraSpeed با ۱ تریلیون پارامتر و سرعت خروجی ۱۰۰۰ توکن در ثانیه را عرضه کرده است. این سرعت با همکاری توسعهدهندگان فریمورک TileRT و با استفاده از کوانتیزاسیون FP4 و رمزگشایی تأملی DFlash به دست آمده است که نرخ تولید را نسبت به نسخههای قبلی ۱۰ برابر افزایش داده است. شیائومی این مدل را برای سیستمهای تصمیمگیری خودکار با کمترین تأخیر مناسب میداند.
دسترسی به API UltraSpeed سه برابر گرانتر از نسخه پایه MiMo-V2.5-Pro است. نسخه متنباز با وزنهای FP4 در HuggingFace منتشر شده است. از ۹ تا ۲۳ ژوئن، آزمایش بسته سازمانی نسخه ابری برگزار میشود که روزانه ۱۰ اسلات برای جلسات حداکثر ۳۰ دقیقه تخصیص مییابد و دسترسی از طریق درخواست ارائه میشود.
منبع: xiaomi.com
---
📊 پرپلکسیتی و هاروارد شتاب کاری ناشی از استفاده از عاملها را ارزیابی کردند
مدرسه کسبوکار هاروارد و پرپلکسیتی گزارشی درباره کارایی عامل خودمختار Computer منتشر کردهاند. در مقایسه با جستجوی استاندارد پلتفرم، این عامل ۸۷٪ در زمان انجام وظایف فکری صرفهجویی کرده و هزینههای فرضی نیروی کار را ۹۴٪ کاهش داده است (بر اساس دادههای حقوق و دستمزد آمریکا).
جستجوی مبتنی بر هوش مصنوعی به اقدامات مداوم کاربر نیاز دارد و میانگین هر جلسه ۳۳ ثانیه است، اما بیشتر زمان صرف کار دستی انسان میشود. عامل Computer کل چرخه را به عهده گرفته و حدود ۲۶ دقیقه به طور خودمختار کار میکند.
نظرسنجیها از کاربران نشان میدهد که سرعت انجام کارهای تکراری به طور متوسط ۲۵ برابر افزایش یافته است. سهم جلساتی که خروجی آنها ارزیابی منفی داشته، پس از تغییر به عامل از ۲.۹٪ به ۱.۳٪ کاهش یافته است.
منبع: perplexity.ai
---
📈 آمریکا آماده راهاندازی معاملات آتی بر روی قدرت محاسباتی است
گلدمن ساکس و جیپیمورگان چیس در حال توسعه قراردادهای آتی متصل به ارزش اجاره GPU هستند. این ابزار برای پوشش ریسک نکول و کاهش ارزش تجهیزات در برابر وامهای اعطایی برای ساخت زیرساخت هوش مصنوعی طراحی شده است.
بورس کالای شیکاگو و بورس بینالمللی قصد دارند در صورت تأیید نهاد ناظر، امسال معاملات قراردادهای آتی بر روی قدرت محاسباتی را آغاز کنند. این مکانیزم به بانکها اجازه میدهد موقعیتهای فروش باز کرده و زیان ناشی از کاهش نرخهای اجاره را جبران کنند. ارائهدهندگان ابری نیز میتوانند سود خود را تثبیت کرده و در برابر نوسانات قیمت محافظت شوند.
در حالی که نهادهای نظارتی آمریکا در حال ارزیابی مکانیزمهای محافظت در برابر دستکاری هستند، پلتفرمهای جایگزین در خارج از کشور برای شرطبندی بر پویایی نرخ اجاره NVIDIA H100 فعال شدهاند.
منبع: theinformation.com
---
#news #ai
🆔 @asrgooyeshpardaz | 2 185 |
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
