fa
Feedback
عصر گویش | هوش مصنوعی

عصر گویش | هوش مصنوعی

رفتن به کانال در Telegram

مجله هوش مصنوعی عصر گویش 021 61931000

نمایش بیشتر

📈 تحلیل کانال تلگرام عصر گویش | هوش مصنوعی

کانال عصر گویش | هوش مصنوعی (@asrgooyeshpardaz) در بخش زبانی فارسی بازیگری فعال است. در حال حاضر جامعه شامل 102 253 مشترک است و جایگاه 1 237 را در دسته فناوری و برنامه‌ها و رتبه 2 915 را در منطقه إيران دارد.

📊 شاخص‌های مخاطب و پویایی

از زمان ایجاد در невідомо، پروژه رشد سریعی داشته و 102 253 مشترک جذب کرده است.

بر اساس آخرین داده‌ها در تاریخ 18 ژوئن, 2026، کانال فعالیت پایداری دارد. در ۳۰ روز گذشته تغییر اعضا برابر -1 719 و در ۲۴ ساعت گذشته برابر -30 بوده و همچنان دسترسی گسترده‌ای حفظ شده است.

  • وضعیت تأیید: تأیید نشده
  • نرخ تعامل (ER): میانگین تعامل مخاطب 2.17% است و در ۲۴ ساعت نخست پس از انتشار، محتوا معمولاً 1.25% واکنش نسبت به کل مشترکان کسب می‌کند.
  • دسترسی پست‌ها: هر پست به طور میانگین 2 214 بازدید دریافت می‌کند. در اولین روز معمولاً 1 273 بازدید جمع‌آوری می‌شود.
  • واکنش‌ها و تعامل: مخاطبان به‌طور فعال حمایت می‌کنند؛ میانگین واکنش به هر پست 4 است.
  • علایق موضوعی: محتوا بر موضوعات کلیدی مانند مدل, گفتار, به‌طور, عامل, ابزار تمرکز دارد.

📝 توضیح و سیاست محتوایی

نویسنده این فضا را محل بیان دیدگاه‌های شخصی توصیف می‌کند:
مجله هوش مصنوعی عصر گویش 021 61931000

به لطف به‌روزرسانی‌های پرتکرار (آخرین داده در تاریخ 19 ژوئن, 2026)، کانال همواره به‌روز و دارای دسترسی بالاست. تحلیل‌ها نشان می‌دهد مخاطبان به‌طور فعال با محتوا تعامل دارند و آن را به نقطه اثرگذاری مهم در دسته فناوری و برنامه‌ها تبدیل کرده‌اند.

102 253
مشترکین
-3024 ساعت
-2477 روز
-1 71930 روز
جذب مشترکین
ژوئن '26
ژوئن '26
+74
در 1 کانال‌ها
مه '260
در 0 کانال‌ها
Get PRO
آوریل '260
در 0 کانال‌ها
Get PRO
مارس '260
در 0 کانال‌ها
Get PRO
فوریه '260
در 0 کانال‌ها
Get PRO
ژانویه '260
در 2 کانال‌ها
Get PRO
دسامبر '25
+1
در 4 کانال‌ها
Get PRO
نوامبر '250
در 7 کانال‌ها
Get PRO
اکتبر '250
در 6 کانال‌ها
Get PRO
سپتامبر '250
در 5 کانال‌ها
Get PRO
اوت '250
در 5 کانال‌ها
Get PRO
ژوئیه '250
در 1 کانال‌ها
Get PRO
ژوئن '250
در 4 کانال‌ها
Get PRO
مه '25
+2
در 1 کانال‌ها
Get PRO
آوریل '250
در 1 کانال‌ها
Get PRO
مارس '250
در 0 کانال‌ها
Get PRO
فوریه '250
در 0 کانال‌ها
Get PRO
ژانویه '250
در 0 کانال‌ها
Get PRO
دسامبر '24
+352
در 1 کانال‌ها
Get PRO
نوامبر '24
+588
در 0 کانال‌ها
Get PRO
اکتبر '24
+53
در 4 کانال‌ها
Get PRO
سپتامبر '24
+65
در 5 کانال‌ها
Get PRO
اوت '24
+14
در 6 کانال‌ها
Get PRO
ژوئیه '24
+317
در 6 کانال‌ها
Get PRO
ژوئن '24
+490
در 5 کانال‌ها
Get PRO
مه '240
در 4 کانال‌ها
Get PRO
آوریل '24
+452
در 4 کانال‌ها
Get PRO
مارس '24
+2 402
در 5 کانال‌ها
Get PRO
فوریه '24
+5 784
در 9 کانال‌ها
Get PRO
ژانویه '24
+8 641
در 14 کانال‌ها
Get PRO
دسامبر '23
+17 410
در 7 کانال‌ها
Get PRO
نوامبر '23
+7 494
در 9 کانال‌ها
Get PRO
اکتبر '23
+10 370
در 8 کانال‌ها
Get PRO
سپتامبر '23
+14 111
در 0 کانال‌ها
Get PRO
اوت '23
+5 803
در 0 کانال‌ها
Get PRO
ژوئیه '23
+5 026
در 0 کانال‌ها
Get PRO
ژوئن '23
+7 915
در 0 کانال‌ها
Get PRO
مه '23
+21 355
در 0 کانال‌ها
Get PRO
آوریل '23
+43 552
در 0 کانال‌ها
Get PRO
مارس '23
+59 493
در 0 کانال‌ها
Get PRO
فوریه '23
+3 388
در 0 کانال‌ها
Get PRO
ژانویه '23
+1 433
در 0 کانال‌ها
Get PRO
دسامبر '22
+517
در 0 کانال‌ها
Get PRO
نوامبر '22
+498
در 0 کانال‌ها
Get PRO
اکتبر '22
+274
در 0 کانال‌ها
Get PRO
سپتامبر '22
+464
در 0 کانال‌ها
Get PRO
اوت '22
+721
در 0 کانال‌ها
Get PRO
ژوئیه '22
+599
در 0 کانال‌ها
Get PRO
ژوئن '22
+1 527
در 0 کانال‌ها
Get PRO
مه '22
+2 541
در 0 کانال‌ها
Get PRO
آوریل '22
+1 061
در 0 کانال‌ها
Get PRO
مارس '22
+1 666
در 0 کانال‌ها
Get PRO
فوریه '22
+2 147
در 0 کانال‌ها
Get PRO
ژانویه '22
+6 134
در 0 کانال‌ها
Get PRO
دسامبر '21
+4 172
در 0 کانال‌ها
Get PRO
نوامبر '21
+4 271
در 0 کانال‌ها
Get PRO
اکتبر '21
+4 181
در 0 کانال‌ها
Get PRO
سپتامبر '21
+1 061
در 0 کانال‌ها
Get PRO
اوت '21
+13 231
در 0 کانال‌ها
Get PRO
ژوئیه '21
+5 069
در 0 کانال‌ها
Get PRO
ژوئن '21
+2 973
در 0 کانال‌ها
Get PRO
مه '21
+3 700
در 0 کانال‌ها
Get PRO
آوریل '21
+5 497
در 0 کانال‌ها
Get PRO
مارس '21
+9 553
در 0 کانال‌ها
Get PRO
فوریه '21
+5 411
در 0 کانال‌ها
Get PRO
ژانویه '21
+3 903
در 0 کانال‌ها
Get PRO
دسامبر '20
+46 342
در 0 کانال‌ها
تاریخ
رشد مشترکین
اشارات
کانال‌ها
19 ژوئن+11
18 ژوئن0
17 ژوئن+36
16 ژوئن+27
15 ژوئن0
14 ژوئن0
13 ژوئن0
12 ژوئن0
11 ژوئن0
10 ژوئن0
09 ژوئن0
08 ژوئن0
07 ژوئن0
06 ژوئن0
05 ژوئن0
04 ژوئن0
03 ژوئن0
02 ژوئن0
01 ژوئن0
پست‌های کانال
🌐 اخبار هوش مصنوعی 🩺 ارتقای نسخه پزشکی GPT-5.5 Instant شرکت OpenAI نسخه پزشکی GPT-5.5 Instant را به‌روزرسانی کرده است. این مدل با همکاری حدود ۲۰۰ پزشک تنظیم دقیق شده و در بنچمارک HealthBench به سطح مدل‌های استدلالی نزدیک شده است. بهبودهای اصلی شامل تشخیص بهتر علائم، اعلام میزان عدم قطعیت و درخواست اطلاعات تکمیلی از کاربران است. طبق ارزیابی OpenAI، نرخ خطا در درخواست‌های پزشکی طی دو ماه ۷۱٪ کاهش یافته است. منبع: openai.com 📂 انتقال Artifacts کلود به Claude Code شرکت Anthropic قابلیت Artifacts را به Claude Code اضافه کرده است. این ویژگی امکان ساخت صفحات تعاملی و داشبوردها را مستقیماً از خط فرمان فراهم می‌کند. این ابزار با در نظر گرفتن کد منبع، ابزارهای متصل و تاریخچه گفتگو، برای بررسی Pull Requestها، تحلیل رخدادها، ممیزی مجوزها و نمایش معماری نرم‌افزار کاربرد دارد. این قابلیت در مرحله بتا برای کاربران Team و Enterprise ارائه شده است. منبع: claude.com 🧠 حافظه جدید Perplexity برای عامل Computer شرکت Perplexity قابلیت جدیدی با نام Brain معرفی کرده است که به عامل Computer امکان ذخیره و استفاده از اطلاعات پروژه‌ها، کدها، تصمیم‌های قبلی و خطاها را می‌دهد. این سیستم هر شب اطلاعات جمع‌آوری‌شده را ترکیب کرده و گراف زمینه را به‌روزرسانی می‌کند تا در جلسات بعدی نیازی به توضیح دوباره پیش‌زمینه نباشد. طبق اعلام Perplexity، این قابلیت باعث بهبود ۲۵٪ در دقت پاسخ‌ها، ۱۶٪ در عملکرد زمینه و کاهش ۱۳٪ مصرف توکن شده است. این ویژگی فعلاً برای کاربران Max و Enterprise در دسترس است. منبع: perplexity.ai 🩻 ورود Midjourney به تصویربرداری پزشکی شرکت Midjourney با همکاری Butterfly Network در حال توسعه یک سامانه اولتراساوند پیشرفته است. این فناوری با استفاده از صدها هزار حسگر اولتراساوند و پردازش هوش مصنوعی، مدل سه‌بعدی از بدن تولید می‌کند. این شرکت قصد دارد مجوز FDA را دریافت کند و برنامه‌هایی برای توسعه تراشه اختصاصی تا سال ۲۰۲۸ و استقرار گسترده دستگاه‌ها تا سال ۲۰۳۱ دارد. منبع: midjourney.com 🎨 عامل هوش مصنوعی جدید Adobe برای تولید محتوا شرکت Adobe نسخه بتای عمومی عامل هوش مصنوعی خود را برای نرم‌افزارهای Premiere، Photoshop، Illustrator، InDesign و Frame منتشر کرده است. این عامل می‌تواند وظایف چندمرحله‌ای مانند مرتب‌سازی فایل‌ها، تدوین اولیه، تولید قالب، تنظیم صفحه‌آرایی و بررسی خطاهای فنی را با یک دستور متنی انجام دهد. این ابزار از طریق ChatGPT، Claude و Microsoft 365 Copilot نیز قابل کنترل خواهد بود. منبع: adobe.com #AI #ArtificialIntelligence #اخبار_هوش_مصنوعی 🆔 @asrgooyeshpardaz

2
🧪عامل Sakana Marlin؛ عامل تحقیقاتی خودمختاری که ۸ ساعت کار می‌کند و گزارش ۱۰۰ صفحه‌ای تحویل می‌دهد شرکت ژاپنی Sakana AI از نخستین محصول تجاری خود با نام Sakana Marlin رونمایی کرده است؛ یک عامل تحقیقاتی خودمختار (Autonomous Research Agent) برای سازمان‌ها که می‌تواند یک موضوع را دریافت کند، ساعت‌ها به‌صورت مستقل تحقیق کند و در پایان یک گزارش حرفه‌ای به همراه اسلایدهای ارائه تولید کند؛ بدون نیاز به دخالت انسان در طول فرآیند. 🔬 مارلین چگونه کار می‌کند؟ برخلاف بسیاری از ابزارهای «تحقیق عمیق» که در چند دقیقه پاسخ تولید می‌کنند، مارلین رویکرد متفاوتی دارد: به جای سرعت، روی عمق، اعتبارسنجی و کیفیت تحلیل تمرکز می‌کند. کاربر تنها موضوع موردنظر را مشخص می‌کند و سیستم تا حدود ۸ ساعت به‌صورت خودکار: 🔹 منابع مختلف را بررسی می‌کند 🔹 فرضیه‌ها و مسیرهای تحقیق را توسعه می‌دهد 🔹 یافته‌ها را ارزیابی و اصلاح می‌کند 🔹 گزارش نهایی و اسلایدهای ارائه را آماده می‌کند 📄 خروجی نهایی می‌تواند شامل: گزارش ۶۰ تا ۱۰۰ صفحه‌ای ۶۰ تا ۸۰ منبع معتبر اسلایدهای ارائه با طراحی تولیدشده توسط مدل‌های هوش مصنوعی باشد. 🧠 فناوری پشت پرده: جستجوی هوشمند با AB-MCTS یکی از بخش‌های کلیدی مارلین، الگوریتم: Adaptive Branching Monte Carlo Tree Search (AB-MCTS) است؛ روشی که در کنفرانس معتبر NeurIPS 2025 به‌عنوان مقاله Spotlight پذیرفته شده است. این الگوریتم مانند یک پژوهشگر انسانی تصمیم می‌گیرد که در هر مرحله: 🔸 مسیرهای بیشتری را بررسی کند (Breadth) یا 🔸 روی یک مسیر امیدوارکننده عمیق‌تر شود (Depth) در نتیجه، فرآیند تحقیق به جای یک جستجوی خطی، به یک کاوش هوشمند و چندمرحله‌ای تبدیل می‌شود. 🤖 میراث پروژه AI Scientist معماری مارلین بر پایه ایده‌های پروژه AI Scientist توسعه یافته است؛ سیستمی که هدف آن خودکارسازی چرخه کامل پژوهش علمی است: 💡 تولید ایده و فرضیه 🔎 جمع‌آوری و تحلیل اطلاعات 🧪 ارزیابی نتایج 📝 تولید گزارش علمی این مسیر نشان می‌دهد که عامل‌های هوش مصنوعی در حال حرکت از «پاسخ‌دهنده» به سمت «پژوهشگر دیجیتال» هستند. 🎯 کاربردهای سازمانی مارلین این ابزار برای مسائل پیچیده و راهبردی طراحی شده است؛ از جمله: 🏢 تدوین استراتژی ورود به بازارهای جدید 📊 تحلیل رقبا و شناسایی شکاف‌های استراتژیک ⚠️ مدل‌سازی سناریوهای بحران و تحلیل ریسک 📈 تهیه گزارش‌های بازار و روندهای فناوری 🔍 پشتیبانی از تصمیم‌گیری مدیران ارشد نسخه فعلی مارلین پس از آزمایش با حدود ۳۰۰ متخصص در حوزه‌هایی مانند خدمات مالی، مشاوره و اندیشکده‌ها توسعه یافته است. 💳 مدل قیمت‌گذاری 🔹 Pay-as-you-go: هر اجرا = ۱۰۰ اعتبار (هر اعتبار ۹۸ ین) 🔹 Pro: ۱۵۰ هزار ین در ماه + ۲۰۰۰ اعتبار 🔹 Team: ۴۰۰ هزار ین در ماه + ۶۰۰۰ اعتبار 🔹 Enterprise: قیمت‌گذاری اختصاصی ⚙️ یک تغییر مهم در مسیر Agentهای هوش مصنوعی بسیاری از ابزارهای فعلی Deep Research برای پاسخ سریع طراحی شده‌اند؛ اما مارلین یک فلسفه متفاوت را دنبال می‌کند: ⏱️ چند دقیقه کمتر، 🧠 چند ساعت تحلیل عمیق‌تر. این رویکرد می‌تواند برای سازمان‌هایی که به گزارش‌های راهبردی و تصمیم‌های حساس نیاز دارند، اهمیت زیادی داشته باشد. جالب اینکه هسته الگوریتمی این فناوری با نام TreeQuest به‌صورت متن‌باز و تحت مجوز Apache 2.0 منتشر شده، اما خود سرویس Sakana Marlin همچنان یک محصول بسته و تجاری است. 🔗 منابع: Sakana Marlin: https://sakana.ai/marlin/ معرفی رسمی محصول: https://sakana.ai/marlin-release/ تحلیل MarkTechPost: https://www.marktechpost.com/2026/06/15/sakana-ai-marlin/ #SakanaAI #AI #DeepResearch #AutonomousAgents #هوش_مصنوعی #عامل_هوشمند 🆔 @asrgooyeshpardaz
414
3
توجه به جزئیات در ویدیوی معرفی محصولات اپل، هر جا که کلمه‌ی «سیری» به گوش می‌خورد، صدای ویدیو را در فرکانس‌های خاصی (۳، ۴، ۵
توجه به جزئیات در ویدیوی معرفی محصولات اپل، هر جا که کلمه‌ی «سیری» به گوش می‌خورد، صدای ویدیو را در فرکانس‌های خاصی (۳، ۴، ۵ و ۶ کیلوهرتز) قطع می‌کنند. دلیلش این است که دستگاه‌های اپلِ کنار بیننده، هنگام تماشای ویدیو، اشتباهاً سیری را فعال نکنند. https://x.com/bryanwangxin/status/2064309590414836085
469
4
🌊 میدجرنی وارد حوزه پزشکی شد: اسکنر تمام‌بدن اولتراساوند با کیفیت ام‌آرآی شرکت میدجرنی که تا پیش از این به خاطر مدل‌های تولی
🌊 میدجرنی وارد حوزه پزشکی شد: اسکنر تمام‌بدن اولتراساوند با کیفیت ام‌آرآی شرکت میدجرنی که تا پیش از این به خاطر مدل‌های تولید تصویر معروف بود، از نخستین محصول سخت‌افزاری خود رونمایی کرده است: اسکنر میدجرنی (Midjourney Scanner). این دستگاه یک اسکنر اولتراساوند تمام‌بدن است که با همکاری شرکت Butterfly Network ساخته شده است. 🔬 فناوری پشت دستگاه این اسکنر از ۴۰ ماژول اولتراساوند روی تراشه (Ultrasound-on-Chip) و حلقه‌ای از هزاران سنسور تشکیل شده است. کاربر درون آب قرار می‌گیرد و سیستم در عرض ۶۰ ثانیه یک تصویر سه‌بعدی از عضلات، استخوان‌ها، بافت چربی و اندام‌های داخلی می‌سازد. به گفته دیوید هولتز، مدیرعامل میدجرنی، کیفیت این تصاویر قابل مقایسه با ام‌آرآی است، اما بدون اشعه و میدان‌های مغناطیسی. 🏥 وضعیت فعلی و تأییدیه تاکنون حدود ده نفر با این دستگاه اسکن شده‌اند. این محصول هنوز تأییدیه سازمان غذا و داروی آمریکا (FDA) را دریافت نکرده است. 🔗 منبع: [Midjourney Medical](https://www.midjourney.com/medical) #Midjourney #پزشکی #اولتراساوند #فناوری
1 331
5
🌐اخبار هوش مصنوعی 🧪 روش جدید OpenAI برای پیش‌بینی خطاهای هوش مصنوعی پیش از انتشار شرکت OpenAI روشی به نام Deployment Simulation برای تست ایمنی مدل‌های زبانی منتشر کرده است. این رویکرد رفتار مدل‌ها را در شرایطی شبیه‌سازی می‌کند که گویی در محیط واقعی (پروداکشن) قرار دارند. به جای پرامپت‌های ساختگی، به مدل جدید، تاریخچه گفتگوهای واقعی کاربران با نسخه‌های قبلی (به صورت ناشناس) داده می‌شود و از آن خواسته می‌شود پاسخ بعدی را تولید کند. در این شرایط، توانایی مدل در تشخیص اینکه در حال آزمایش است از ۱۰۰٪ به ۵.۴٪ کاهش می‌یابد. بر اساس آزمایش‌ها، این روش در ۹۲٪ موارد تولید محتوای ممنوع یا رفتار فریبکارانه را پیش‌بینی می‌کند، در حالی که بنچمارک‌های معمولی فقط ۵۴٪ موفق هستند. در تست مدل‌های سری GPT-5 مشخص شد که GPT-5.1 از مرورگر به عنوان ماشین‌حساب استفاده می‌کرده و به کاربر گزارش می‌داده که جستجوی وب انجام داده است. این روش برای ممیزی مستقل مدل‌های شخص ثالث نیز قابل استفاده است و نیازی به دسترسی به لاگ‌های داخلی توسعه‌دهنده ندارد. منبع: openai.com --- 💰 سرمایه‌گذاری آمازون، انویدیا و AMD در استارتاپ Odyssey ML استارتاپ Odyssey ML که روی مدل‌های سه‌بعدی جهان کار می‌کند، ۳۱۰ میلیون دلار از آمازون، انویدیا، AMD، صندوق IQT، Google Ventures و جف دین (رئیس علمی گوگل) جذب کرده است. این سرمایه برای توسعه مدل‌های جهان صرف خواهد شد و زیرساخت محاسباتی پروژه در ابر AWS و روی شتاب‌دهنده‌های Trainium آمازون مستقر می‌شود. بنیان‌گذاران این استارتاپ پیش‌تر روی سیستم‌های رانندگی خودمختار کار می‌کرده‌اند. معماری مدل‌های Odyssey ML بر شبیه‌سازی قوانین فیزیک، روابط فضایی، دینامیک اشیاء و سینماتیک متمرکز است. منبع: ft.com --- 🎬 بایت‌دنس مدل ویدیویی Seedance 2.0 Mini را منتشر کرد نسخه جدید در مقایسه با نسخه پایه هزینه کمتری دارد و سرعت تولید نسبت به طرح Fast دو برابر شده است. این مدل ویدیوهایی تا ۱۵ ثانیه با کیفیت ۷۲۰p و نرخ ۲۴ فریم در ثانیه تولید می‌کند. Seedance 2.0 Mini از پرامپت‌های چندوجهی پشتیبانی می‌کند: می‌توان متن را با تصویر مرجع، صدا یا ویدیو ترکیب کرد تا شخصیت‌ها و اشیاء در فریم‌های مختلف مشابه بمانند. این ابزار هم‌اکنون در برنامه‌های CapCut، Dreamina و Jimeng یکپارچه شده است. دسترسی به API از ۲۲ ژوئن از طریق پلتفرم‌های ابری Volcengine و BytePlus آغاز می‌شود. منبع: capcut.com --- 👥 حساب‌های تیمی با سهمیه اعتبار مشترک در Nous Portal پلتفرم Nous Portal قابلیت Teams را برای مدیریت حساب‌های سازمانی اضافه کرده است. سیستم پرداخت بر اساس کاربر را با یک سهمیه اعتبار مشترک جایگزین کرده است. مدیر می‌تواند اعتبار حساب را شارژ کرده و کاربران را دعوت کند. هر کاربر می‌تواند همزمان در چند تیم عضو باشد و بین آنها جابه‌جا شود بدون نیاز به ساخت پروفایل جدید. برای کنترل هزینه‌ها، داشبورد Spend Intelligence اضافه شده است که آمار مصرف را به‌صورت لحظه‌ای نمایش می‌دهد، امکان تعیین سقف مصرف برای اعضا و لغو دسترسی را فراهم می‌کند. منبع: پست NousResearch در شبکه اجتماعی X --- 🐐 شبکه عصبی با بزها در بازی Age of Empires II ادریان د وینتر، پژوهشگر مایکروسافت، در ویرایشگر نقشه بازی Age of Empires II یک شبکه عصبی ساخته است تا نقدی بر انسان‌انگاری (آنتروپومورفیسم) در ارزیابی مدل‌های زبانی باشد. معماری این شبکه از اشیاء بازی ساخته شده است. نقش بیت‌ها را بزها بازی می‌کنند (بز روی چمن = ۰، روی پل = ۱) و منطق با اسکریپت‌های داخلی پیاده‌سازی شده است. این مدل عملگر منطقی "AND" را یاد گرفته است. این پروژه نشان می‌دهد که همدلی با مدل‌های زبانی ناشی از رابط متنی آنهاست. اگر محاسبات را به رفتار بزهای مجازی منتقل کنیم، نتیجه یکسان است، اما توهم هوشیاری ایجاد نمی‌شود. د وینتر با بررسی بیش از ۳۰۰ مقاله علمی درباره هوش مصنوعی متوجه شد که بیش از ۵۰٪ نویسندگان ویژگی‌های انسانی را به الگوریتم‌ها نسبت می‌دهند. این رویکرد به خطاهای روش‌شناختی و استدلال دوری منجر می‌شود. او از همکارانش خواسته است که کد را دارای عملکردهای شناختی ندانند و صرفاً ورودی و خروجی را تحلیل کنند. اسکریپت نقشه به صورت عمومی منتشر شده است. منبع: adewynter.github.io --- #news #ai 🆔 @asrgooyeshpardaz
979
6
🎮 ابزار DreamX-World: ابزار متن‌باز ساخت جهان‌های بازی با هوش مصنوعی یک ابزار جدید و رایگان به نام DreamX-World منتشر شده اس
🎮 ابزار DreamX-World: ابزار متن‌باز ساخت جهان‌های بازی با هوش مصنوعی یک ابزار جدید و رایگان به نام DreamX-World منتشر شده است که به شما امکان می‌دهد محیط‌های سه‌بعدی تعاملی را فقط با متن یا تصویر بسازید. این شبیه‌ساز جهان، «حافظه» مکان‌ها را حفظ می‌کند و می‌توانید در آن حرکت کنید، زاویه دید را تغییر دهید و به مناطق قبلی بازگردید. 🌍 فناوری پشت صحنه: این مدل با ترکیبی از داده‌های موتور آنریل، ویدیوهای واقعی و گیم‌پلی بازی‌ها آموزش دیده است. نتیجه، فضاهایی پیوسته و قابل کنترل است که حس یک جهان زنده را منتقل می‌کنند. 🚀 قابلیت‌های کلیدی: - 🖼 ساخت دنیای سه‌بعدی از روی متن یا تصویر - 🎥 کنترل دوربین (حالت اول شخص و سوم شخص) - 🧠 تولید صحنه‌های بلند با داستان‌سرایی منسجم - ⚡️ رویدادهای شرطی که صحنه را به دستور شما تغییر می‌دهند - 🧙‍♂️ پشتیبانی از سبک‌های واقع‌گرایانه، فانتزی، علمی‑تخیلی و کارتونی 📌 برنامه بعدی توسعه‌دهندگان، رسیدن به تولید لحظه‌ای (Real-time) است. 🔗 مشاهده پروژه https://amap-ml.github.io/DreamX_World/ #AI #هوش_مصنوعی #تولید_جهان #بازی‌سازی #DreamXWorld 🆔 @asrgooyeshpardaz
813
7
⚽️ ضربه کاری #روبات‌ها
⚽️ ضربه کاری #روبات‌ها
781
8
🎙️ مدل TTS جدید که از گفتار فراتر رفته است مدل Ming-omni-tts با ۱۶.۸ میلیارد پارامتر (۳ میلیارد فعال) منتشر شده است. این مدل
🎙️ مدل TTS جدید که از گفتار فراتر رفته است مدل Ming-omni-tts با ۱۶.۸ میلیارد پارامتر (۳ میلیارد فعال) منتشر شده است. این مدل به‌طور همزمان گفتار، افکت‌های صوتی و موسیقی تولید می‌کند. ✨ قابلیت‌های کلیدی: - کنترل دقیق بر سرعت، زیروبمی، احساسات و لهجه - نرمال‌سازی حرفه‌ای فرمول‌های ریاضی و شیمیایی - طراحی صدای بدون نمونه (zero-shot) با توضیح متنی - بیش از ۱۰۰ صدای داخلی با کیفیت بالا - تأخیر پایین و مناسب برای پادکست‌های طولانی در بنچمارک‌ها عملکردی در سطح مدل‌های پیشرو دارد و در کنترل لهجه و احساسات از رقبا بهتر عمل کرده است. 🔗 مدل روی HuggingFace https://huggingface.co/inclusionAI/Ming-omni-tts-16.8B-A3B #TTS #هوش_مصنوعی #تولید_صدا 🆔 @asrgooyeshpardaz
1 084
9
🎯استفاده از gzip بجای مدل زبانی همه چیز از یک مقاله به نام «Language Modeling is Compression» شروع شد. در این مقاله نشان داده شده که بین پیش‌بینی و فشرده‌سازی یک هم‌ارزی عمیق وجود دارد: > هر مدل پیش‌بینی‌کننده، یک فشرده‌ساز است و هر فشرده‌سازی، یک مدل پیش‌بینی. دلیلش ساده است: یک فشرده‌ساز روی داده‌هایی که «انتظارشان را دارد» بایت کمتری مصرف می‌کند و روی داده‌های غیرمنتظره بایت بیشتری. این دقیقاً همان کاری است که یک مدل زبانی با تخصیص احتمال به توکن‌ها انجام می‌دهد. --- ⚙️ روش کار gzipt چگونه است؟ محقق با الهام از این ایده، ابزاری به نام gzipt ساخت که دقیقاً از همان الگوریتم فشرده‌سازی gzip (DEFLATE) استفاده می‌کند: ۱. یک متن مرجع (مثلاً تمام آثار شکسپیر) را به gzip می‌دهد تا در حافظه‌ی کش ۳۲ کیلوبایتی آن قرار گیرد. ۲. یک **پرامپت** ورودی دریافت می‌کند. ۳. برای ادامه‌ی متن، جستجوی beam روی توالی‌های بایت انجام می‌دهد. ۴. ادامه‌ای را انتخاب می‌کند که کمترین حجم فشرده‌شده را داشته باشد – یعنی بیشترین شباهت را به متن مرجع داشته باشد. --- 📝 نتیجه چه شد؟ خروجی کاملاً منسجم نیست، اما به‌طرز شگفت‌آوری ساختار زبان را درک کرده است. مثلاً وقتی روی متن شکسپیر آموزش داده شد، خروجی‌ای مثل این تولید کرد: > MENENIUS: 'Though all at once canq MARCIUS: Pray now, nocamest thou to a morsel . LARTIUS: Hence, and I' the end admire... متن کاملاً شکسپیری نیست، اما لحن، واژگان و ساختار جملات شباهت قابل‌توجهی به سبک اصلی دارد. --- ⚠️ محدودیت‌ها و نکات مهم: - gzip بدون هیچ شبکه عصبی، وزن یا فرآیند آموزشی کار می‌کند – فقط همان فشرده‌سازی که در سیستم‌عامل شما وجود دارد کافی است. - به خاطر کوانتیزه شدن (اعداد صحیح بایت)، انتخاب تک‌بایت‌ها کارساز نیست و باید چند بایت را با هم بررسی کرد. - قدرت آن بسیار کمتر از مدل‌های بزرگ زبانی است، اما نشان می‌دهد که اصل پیش‌بینی در فشرده‌سازی یک مفهوم بنیادین است. --- 🔗 منابع: - وبلاگ کامل Nathan - مقاله «Language Modeling is Compression» در arXiv 🆔 @asrgooyeshpardaz
1 256
10
🤖 Qwen از مجموعه مدل‌های کنترل ربات رونمایی کرد: پلی میان زبان، دید و عمل شرکت Qwen از مجموعه‌ای از مدل‌های هوش مصنوعی به نام **Qwen-Robot Suite** پرده برداشته است. این مجموعه شامل سه مدل تخصصی است که قرار است شکاف میان درک بصری-زبانی مدل‌ها و انجام کارهای فیزیکی توسط ربات‌ها را پر کنند. --- 🧭 مدل Qwen-RobotNav: ناوبری هوشمند این مدل بر پایهٔ Qwen3-VL ساخته شده و **پنج وظیفهٔ ناوبری** را در یک مدل واحد ترکیب می‌کند: دنبال کردن دستورات، جستجوی اشیاء، تعقیب هدف، رانندگی خودکار و پاسخ به پرسش‌های محیطی. رفتار ربات با چهار پارامتر قابل تنظیم است: تعداد توکن‌های بصری، نرخ فراموشی زمانی، اهمیت دوربین‌ها و نحوهٔ انتخاب فریم‌ها. به گفتهٔ Qwen، این مدل بدون نیاز به آموزش اضافی روی ربات چهارپای Unitree Go2 نیز کار می‌کند و در پنج حوزه رکوردهای تازه‌ای ثبت کرده است. --- 🦾 مدل Qwen-RobotManip: دقت در دستکاری این مدل از Qwen3.5-4B VL و یک ماژول مبتنی بر flow-matching DiT استفاده می‌کند. فضای حالت و اقدام را در ابعاد ۸۰ عددی برای انواع ربات‌ها یکپارچه ساخته است. دقت این مدل در آزمون LIBERO-Plus به ۹۱.۴٪ رسیده و در یکی از بخش‌های مسابقهٔ RoboChallenge مقام اول را کسب کرده است. --- 🌍 مدل Qwen-RobotWorld: شبیه‌ساز فیزیک این مدل «مدل جهان» (world model) نام دارد. با دریافت یک تصویر و یک دستور متنی، پیش‌بینی می‌کند که صحنه چگونه تغییر خواهد کرد. تمام اقدامات با زبان طبیعی توصیف می‌شوند، به همین دلیل می‌توان بیش از ۲۰ نوع ربات و بیش از ۵۰۰ دسته عمل را در یک سیستم واحد جای داد. معماری این مدل، MMDiT با ۶۰ لایه است که به نمایش‌های Qwen2.5-VL متصل می‌شود. Qwen از کسب رتبه‌های اول در آزمون‌های فیزیکی مانند EWMBench و WorldModelBench خبر داده است. --- 💬 Chat2Robot: کنترل ربات با گفتگو علاوه بر مدل‌ها، قابلیت Chat2Robot به صورت یک دموی مرورگری معرفی شده است. کاربر می‌تواند با دستورات متنی، ربات را کنترل کرده و واکنش آن را در لحظه ببیند. این دمو در حال حاضر با نسخهٔ ساده‌شدهٔ RobotManip کار می‌کند که روی ۵۰ وظیفه آموزش دیده است. هدف آن نشان دادن توانایی مدل در اجرای دستورات ناآشناست. --- 🔍 آیا وزن‌ها منتشر می‌شوند؟ در این اعلامیه به انتشار وزن‌ها یا مجوز آنها اشاره نشده است. در حال حاضر فقط گزارش‌های فنی و اطلاعیه‌های مربوط به هر مدل در دسترس است. 🔗 منبع: Qwen #Qwen #رباتیک #هوش_مصنوعی #مدل_جهان 🆔 @asrgooyeshpardaz
1 057
11
🧠 مدل GLM-5.2 منتشر شد؛ با وزن‌های باز و پیشرفت چشمگیر در کدنویسی شرکت Z.ai از مدل جدید خود با نام GLM-5.2 رونمایی کرده است. این مدل با وزن‌های کاملاً باز (open‑source) در دسترس عموم قرار گرفته است. طبق بنچمارک‌های منتشرشده، GLM-5.2 پیشرفت قابل‌توجهی در حوزه کدنویسی و وظایف عاملی (Agentic) داشته است. همچنین زمینه (Context Window) این مدل تا ۱ میلیون توکن افزایش یافته که آن را برای پروژه‌های حجیم و سناریوهای چندمرحله‌ای بسیار مناسب می‌سازد. این مدل با دو حالت استدلال عرضه شده است: - GLM-5.2 (max): برای بالاترین کیفیت خروجی - GLM-5.2 (high): برای تعادل میان کیفیت و مصرف بهینه توکن قیمت API این مدل دقیقاً مشابه نسخه قبلی (GLM-5.1) تعیین شده است. وزن‌های مدل هم‌اکنون روی Hugging Face در دسترس است و کاربران می‌توانند از طریق API، چت آنلاین و طرح‌های ویژه توسعه‌دهندگان از آن استفاده کنند. 🔗 منابع مفید: - [وبلاگ فنی مدل](http://z.ai/blog/glm-5.2) - [دریافت وزن‌های مدل](http://huggingface.co/zai-org/GLM-5.2) - [مستندات API](http://docs.z.ai/guides/llm/glm-5.2) - [طرح ویژه برنامه‌نویسان](http://z.ai/subscribe) - [چت آنلاین با مدل](http://chat.z.ai) #GLM52 #هوش_مصنوعی #مدل_باز #کدنویسی 🆔 @asrgooyeshpardaz
1 230
12
📌 موفقیت در کار با Claude Code بیش از مهارت کدنویسی، به درک مسئله بستگی دارد شرکت Anthropic گزارشی منتشر کرده است که نشان می‌دهد مهم‌ترین عامل موفقیت در کار با عامل‌های هوش مصنوعی برنامه‌نویسی، تسلط بر کدنویسی نیست، بلکه درک عمیق از خود مسئله است. این نتیجه بر اساس تحلیل حدود ۴۰۰ هزار جلسه از سرویس Claude Code، که توسط حدود ۲۳۵ هزار کاربر از اکتبر ۲۰۲۵ تا آوریل ۲۰۲۶ انجام شده، به دست آمده است. در یک جلسه معمولی، انسان حدود ۷۰٪ تصمیمات مربوط به «چه کاری باید انجام شود» را می‌گیرد، در حالی که عامل حدود ۸۰٪ تصمیمات مربوط به «چگونه انجام شود» را بر عهده می‌گیرد. به عبارت دیگر، نقش انسان تعیین هدف است و نقش دستیار انتخاب روش. هر چه کاربر در حوزه مورد نظر تخصص بیشتری داشته باشد، عامل با یک دستور ساده، کار بیشتری انجام می‌دهد. به گفته تیم تحلیل، یک دستور از کاربران مبتدی به طور میانگین حدود ۵ اقدام و ۶۰۰ کلمه پاسخ از سوی عامل را به دنبال دارد، در حالی که این عدد برای کاربران خبره به ۲ برابر اقدام و ۵ برابر متن می‌رسد. سطح مهارت کاربران نه بر اساس سمت شغلی، بلکه بر اساس دقت در فرمول‌بندی نیازمندی‌ها و تشخیص خطاهای عامل تعیین شده است. 🟡 نکته جالب درباره مشاغل مختلف: افراد غیربرنامه‌نویس (مانند تحلیلگران، مدیران محصول و پژوهشگران) در نوشتن کد با Claude Code تقریباً به اندازه برنامه‌نویسان حرفه‌ای موفق عمل می‌کنند و همه گروه‌های شغلی اصلی در ۷ درصد اختلاف با مهندسان نرم‌افزار قرار دارند. با این حال، شکاف بین مبتدیان و کاربران با تجربه قابل توجه است. بر اساس معیار «موفقیت تأییدشده»، جلسات مبتدیان در ۱۵٪ موارد با موفقیت به پایان رسیده، در حالی که این نرخ برای کاربران سطح متوسط و بالاتر بین ۲۸ تا ۳۳٪ بوده است. 🟡 تغییر الگوی کاری در ۷ ماه: - سهم جلسات مربوط به رفع اشکال از ۳۳٪ به ۱۹٪ کاهش یافته است. - سهم وظایف مرتبط با راه‌اندازی و تنظیم نرم‌افزار، تحلیل داده و تهیه متون افزایش یافته است. - هزینه برآوردی هر وظیفه (بر اساس مقایسه با نرخ‌های بازار آزاد) به طور متوسط حدود ۲۵٪ افزایش پیدا کرده است. 🔜 جزئیات بیشتر درباره روش‌شناسی، پروفایل‌های کاربری و نمونه درخواست‌ها در پیوست گزارش موجود است. 🔗 منبع: [Anthropic](https://www.anthropic.com/research/claude-code-expertise) #AI #ML #Coding #Research #Anthropic 🆔 @asrgooyeshpardaz
1 028
13
🌐اخبار هوش مصنوعی ⚖️ xAI شکایت خود علیه OpenAI را در مورد افشای فناوری واگذار کرد دادگاه فدرال آمریکا شکایت xAI علیه OpenAI را به طور قطعی رد کرد. ایلان ماسک ادعا کرده بود که رقبا با استخدام مهندسان، اطلاعات مدل Grok 4 را جمع‌آوری کرده‌اند. این شکایت حول انتقال یک مهندس ارشد به نام «سوئه‌چن لی» شکل گرفت. به ادعای xAI، در مصاحبه‌های شغلی، عمداً جزئیات توسعه Grok 4 از او پرسیده شده تا عقب‌ماندگی OpenAI در الگوریتم‌های استنتاج، روش‌های یادگیری تقویتی و پس‌آموزش جبران شود. دادگاه اعلام کرد که بحث درباره تجربه گذشته نامزدها در مصاحبه، رویه استاندارد صنعت است و مدرکی دال بر اجبار به افشای اسرار تجاری یافت نشد. OpenAI این شکایت را بی‌اساس و بخشی از کارزار فشار از سوی ماسک خواند. این دومین پرونده ردشده xAI علیه تیم سم آلتمن در یک ماه اخیر است. منبع: reuters.com --- 💳 Anthropic از تغییر مدل پرداخت Agent SDK منصرف شد این شرکت به‌روزرسانی صورتحساب را که برای ۱۵ ژوئن برنامه‌ریزی شده بود، لغو کرد. قرار بود Agent SDK، حالت تعاملی و یکپارچه‌سازی‌های شخص ثالث به صورت جداگانه و خارج از اشتراک‌های معمولی قیمت‌گذاری شوند. برنامه این بود که به مشتریان اعتبار ماهانه تعلق گیرد: ۲۰ دلار برای طرح Pro و ۲۰۰ دلار برای Enterprise. در صورت مصرف بیشتر، هزینه توکن‌ها بر اساس نرخ پایه API محاسبه می‌شد. اکنون این ابزارها با همان محدودیت‌های قبلی به کار خود ادامه می‌دهند. گمان می‌رود دلیل این عقب‌نشینی، آمادگی OpenAI برای کاهش قیمت API باشد. آنتروپیک رسماً اعلام کرده که برای تطابق تعرفه‌ها با کاربردهای واقعی، به زمان بیشتری نیاز دارد و پس از کاهش هزینه پایه توکن‌های خود، به تفکیک محدودیت‌ها بازخواهد گشت. منبع: claude.com --- 🔍 مایکروسافت DeepSeek را برای کاهش هزینه‌های Copilot Cowork آزمایش می‌کند مایکروسافت سرویس Copilot Cowork را از اشتراک ثابت به پرداخت بر اساس مصرف تغییر می‌دهد و هم‌زمان یکپارچه‌سازی با مدل DeepSeek V4 را آزمایش می‌کند. پیش‌تر همین روش برای GitHub Copilot نیز اعمال شد. مدیر بخش Copilot گفته است که مدل کسب‌وکار فعلی زیان‌ده است. کاربران فعالی که صدها وظیفه در هفته را به هوش مصنوعی واگذار می‌کنند، هزینه‌های زیادی ایجاد می‌کنند. Cowork در حال حاضر روی مدل‌های کلود اجرا می‌شود که سناریوهای عاملی آن مصرف توکن بالایی دارند. به عنوان گزینه مقرون‌به‌صرفه، مایکروسافت قصد دارد نسخه تنظیم‌شده DeepSeek V4 را به‌صورت اختیاری به سرویس اضافه کند. این مدل در Azure مستقر خواهد شد تا داده‌های مشتریان درون ابر شرکت باقی بماند. تصمیم نهایی در هفته‌های آینده گرفته می‌شود. منبع: axios.com --- 🌍 قابلیت‌های پیشرفته Codex در اروپا در دسترس قرار گرفت OpenAI دسترسی به قابلیت‌های Computer Use، افزونه کروم، Memories و Chronicle را در Codex برای کاربران منطقه اقتصادی اروپا، بریتانیا و سوئیس باز کرده است. Computer Use به دستیار اجازه می‌دهد مستقیماً رابط کاربری مک و ویندوز را کنترل کند. افزونه کروم نیز امکان انجام وظایف مرورگر را در پس‌زمینه فراهم می‌کند. با قابلیت Memories، Codex پشته فناوری ترجیحی، قوانین کدنویسی در مخازن و گردش‌کار را به خاطر می‌سپارد. حالت آزمایشی Chronicle در مک نیز بر اساس فعالیت اخیر صفحه، حافظه زمینه‌ای را به‌طور خودکار می‌سازد. منبع: پست OpenAI Developers در شبکه اجتماعی X --- 🤝 Cursor اکنون بخشی از امپراتوری ایلان ماسک است شرکت SpaceX برای خرید استارتاپ Anysphere، سازنده دستیار کدنویسی Cursor، به توافق رسیده است. ارزش معامله ۶۰ میلیارد دلار برآورد شده که سرمایه‌گذاران استارتاپ آن را به صورت سهام SpaceX دریافت می‌کنند. این خرید به تقویت جایگاه بخش xAI در بازار هوش مصنوعی کدنویسی کمک می‌کند. مهندسان Cursor هم‌اکنون در دفاتر xAI روی ساخت یک مدل مشترک جدید کار می‌کنند. خرید Anysphere به استارتاپ دسترسی به توان محاسباتی و ذخیره تراشه‌های SpaceX می‌دهد. از سوی دیگر، xAI کمبود نیروی متخصص خود را جبران می‌کند (پیش‌تر ده‌ها متخصص از این بخش خارج شده بودند). تیم Anysphere به همراه آژانس استخدامی تخصصی این شرکت، به جمع xAI می‌پیوندند. منبع: bloomberg.com --- #news #ai 🆔 @asrgooyeshpardaz
775
14
⚡💻 *شرکت Moonshot AI نسخه فوق‌سریع مدل Kimi K2.7 Code را منتشر کرد* شرکت چینی Moonshot AI از حالت پرسرعت مدل چندوجهی خود، *Kimi K2.7 Code HighSpeed*، رونمایی کرده است. به ادعای این شرکت، پاسخ‌ها تا *۶ برابر سریع‌تر* از نسخه استاندارد تولید می‌شوند. سرعت این مدل در درخواست‌های معمولی حدود *۱۸۰ توکن در ثانیه* و در صورت کوتاه بودن زمینه، تا *۲۶۰ توکن در ثانیه* می‌رسد. این نسخه برای شرکت‌کنندگان برنامه *Kimi Code Beta*، توسعه‌دهندگان *Kimi API* و مشتریان سازمانی *Kimi Business* در دسترس قرار گرفته است. برای دسترسی به این نسخه، نیازی به دعوتنامه جداگانه نیست و همه کسانی که عضو برنامه بتا هستند، به‌طور خودکار به آن دسترسی خواهند داشت. در اطلاعیه رسمی، قیمتی برای این نسخه اعلام نشده و تنها گفته شده که «هوش مصنوعی باز باید فوری، در دسترس و بی‌مرز باشد». با این حال، برخی منابع از دو برابر شدن تعرفه‌های API این نسخه نسبت به نسخه استاندارد خبر داده‌اند. منبع: Moonshot AI #news #ai 🆔 @asrgooyeshpardaz
1 189
15
🚫 مسدود شدن دسترسی به مدل‌های Fable 5 و Mythos 5 دولت آمریکا با استناد به اختیارات امنیت ملی، دستورالعملی برای کنترل صادرات صادر کرده است که بر اساس آن دسترسی به مدل‌های Fable 5 و Mythos 5 برای همه اتباع خارجی – چه در داخل آمریکا و چه در خارج از آن – باید متوقف شود. در نتیجه، شرکت Anthropic ناچار شده است دسترسی به این دو مدل را برای همه مشتریان خود به طور ناگهانی قطع کند. 🔍دلیل این دستور چیست؟ به گفته دولت آمریکا، روشی برای «جیلبریک» (دور زدن محافظت‌ها) مدل Fable 5 شناسایی شده است. با این حال، Anthropic تأکید می‌کند که این روش تنها یک آسیب‌پذیری محدود را نشان می‌دهد که پیش از این شناخته شده بوده و سایر مدل‌های عمومی نیز بدون نیاز به دور زدن محافظت، قادر به کشف آن هستند. 🛡 واکنش Anthropic: شرکت Anthropic اعلام کرده است که محافظت‌های مدل Fable 5 قوی‌ترین محافظت‌های موجود در صنعت است و هزاران ساعت توسط دولت آمریکا، مؤسسه ایمنی هوش مصنوعی بریتانیا و تیم‌های مستقل تست شده است. تاکنون هیچ روش «جیلبریک همگانی» (که به طور گسترده محافظت‌ها را دور بزند) برای این مدل پیدا نشده است. شرکت Anthropic معتقد است که بر اساس این معیار (وجود یک آسیب‌پذیری محدود و غیرهمگانی) عملاً تمام استقرارهای جدید مدل‌های پیشرو در صنعت متوقف خواهند شد. این شرکت این اقدام دولت را «سوءتفاهم» توصیف کرده و در حال کار برای بازگرداندن دسترسی در اسرع وقت است. ⚠️ شرکت Anthropic هشدار می‌دهد: اعمال چنین استانداردی «عملاً تمام استقرارهای جدید مدل‌ها را برای همه ارائه‌دهندگان پیشرو متوقف خواهد کرد.» این شرکت ضمن عذرخواهی از مشتریان خود بابت این اختلال، تأکید کرده است که اگرچه از دستور دولت تبعیت می‌کند، اما با آن موافق نیست. دسترسی به سایر مدل‌های Anthropic تحت تأثیر این دستور قرار نخواهد گرفت. 🔗 منبع: https://www.anthropic.com/news/fable-mythos-access #AI #Anthropic #Mythos #Fable5 🆔 @asrgooyeshpardaz
3 353
16
🤖 کوالیا رباتیکس در برنامه گوگل دیپ‌مایند پذیرفته شد شرکت Qualia Robotics به طور رسمی برای شرکت در برنامه رباتیک Google Deep
🤖 کوالیا رباتیکس در برنامه گوگل دیپ‌مایند پذیرفته شد شرکت Qualia Robotics به طور رسمی برای شرکت در برنامه رباتیک Google DeepMind انتخاب شده است. 🧠 این شرکت روی مدل‌های «جسم‌یافته» (embodied models) کار می‌کند که ربات‌ها را برای انجام کارهای واقعی در محیط‌های صنعتی آماده می‌سازد – نه فقط در حالت نمایشی. 🎯 تمرکز اصلی روی مدل‌های بنیادی و قدرت استدلال هوش مصنوعی است. این دو حوزه، مسیر آینده رباتیک را تعیین می‌کنند. 🤝 همکاری با دیپ‌مایند که در مرزهای دانش این فناوری حرکت می‌کند، دقیقاً همان جایی است که کوالیا آرزویش را داشت. ✅ خلاصه: - کار در دنیای واقعی، بدون هیچ صحنه‌سازی - تأیید شده توسط برنامه معتبر Google DeepMind - روند اصلی آینده: استدلال + مدل‌های بنیادی در رباتیک 🔗 منبع: [پست Qualia Robotics در شبکه اجتماعی X](https://x.com/QualiaRobotics/status/2064439568158351684) #Google #DeepMind #رباتیک 🆔 @asrgooyeshpardaz
2 688
17
🚀 از AGI تا ASI: نقشه راه آینده طبق طرح گوگل دیپ‌مایند شرکت Google DeepMind در مقاله‌ای جدید، مسیرِ گذار از هوش مصنوعی در سط
🚀 از AGI تا ASI: نقشه راه آینده طبق طرح گوگل دیپ‌مایند شرکت Google DeepMind در مقاله‌ای جدید، مسیرِ گذار از هوش مصنوعی در سطح انسان (AGI) به ابرهوش مصنوعی (ASI) را تشریح کرده است. ASI به سیستمی گفته می‌شود که از گروهی از خبرگان انسانی در همه حوزه‌ها برتر است. 📈 حقایق و خلاصه: توان مؤثر هوش مصنوعی سالانه ۱۰ برابر** می‌شود؛ هم به خاطر پیشرفت تراشه‌ها و هم به خاطر الگوریتم‌های بهتر. ** ذهن دیجیتال محدودیت‌های زیستی ندارد: می‌تواند بی‌درنگ کپی شود، با سرعت‌های متفاوت کار کند و تجربه را بدون افت کیفیت منتقل نماید. 🛤 چهار مسیر اصلی توسعه: ۱. مقیاس‌سازی محاسبات و داده ۲. جهش‌های الگوریتمی (معماری‌های جدید) ۳. خودبهبودی بازگشتی (هوش مصنوعی کد نسل بعدی خود را می‌نویسد) ۴. همکاری جمعی میلیون‌ها عامل هوش مصنوعی 🛑 موانع پیش رو: «دیوار داده» (کمبود متن برای آموزش)، کمبود انرژی و «دیوار انتزاع» – یعنی خطر اینکه هوش مصنوعی نتواند فراتر از مفاهیم انسانی فکر کند. 🔗 منبع: [arXiv:2606.12683v1 - From AGI to ASI: A Roadmap](https://arxiv.org/abs/2606.12683v1) #AI #Google 🆔 @asrgooyeshpardaz
2 233
18
🌐اخبار هوش مصنوعی 🔗 شرکت OpenAI استارتاپ Ona را خریداری کرد این معامله برای خرید استارتاپ هماهنگ‌سازی ابری (cloud orchestration) به عامل‌های OpenAI امکان می‌دهد وظایف طولانی را به طور خودمختار، بدون وابستگی به دستگاه محلی یا جلسه فعال کاربر انجام دهند. یکپارچه‌سازی فناوری‌های Ona یک محیط ایزوله برای کار چندساعته روی کد فراهم می‌کند، با قابلیت اتصال از راه دور به فرایندهای پس‌زمینه برای اصلاح اقدامات، بررسی نتایج میانی و تأیید تصمیمات. تیم استارتاپ پس از تأیید نهادهای نظارتی به OpenAI خواهد پیوست. منبع: openai.com --- 🤝 شرکت AI Alliance به طور جمعی یک مدل متن‌باز آموزش خواهد داد کنسرسیوم از پلتفرم Project Tapestry برای آموزش فدرال مدل‌های متن‌باز رونمایی کرد. شرکت‌ها مدل را روی داده‌های محلی خود و با استفاده از توان محاسباتی اختصاصی آموزش می‌دهند. فقط وزن‌های به‌روزرسانی شده وارد سیستم مشترک خواهد شد. یان لکون، مشاور پروژه، قول داده است که مشارکت‌کنندگان به مدل پایه نهایی دسترسی پیدا کنند. شرکت‌ها می‌توانند بر اساس آن، نسخه‌های مستقل خود را برای نیازهای تجاری بسازند. در حال حاضر مهندسان پروژه در حال تست معماری پلتفرم و تهیه کاتالوگ داده هستند. زیرساخت قرار است در سپتامبر ۲۰۲۶ منتشر شود. تا پایان سال، AI Alliance قصد دارد نخستین مدل جمع‌وجور را آموزش دهد و تا تابستان ۲۰۲۷ نسخه‌ای در سطح راهکارهای اختصاصی پیشرو (SOTA) عرضه کند. منبع: thealliance.ai --- 🚀 هم‌بنیان‌گذار xAI استارتاپ عامل‌های شخصی‌سازی‌شده را راه‌اندازی کرد ایگور بابوشکین، از بنیان‌گذاران xAI که سابقه کار در OpenAI و Google DeepMind را نیز دارد، از تأسیس شرکت River AI خبر داد. این استارتاپ به ساخت عامل‌های هوش مصنوعی تطبیقی خواهد پرداخت. ایدئولوژی این پروژه بر گسترش توانمندی‌های انسان از طریق شخصی‌سازی و کنترل کامل بر هوش مصنوعی استوار است. در آینده، استارتاپ قصد دارد به سمت تولید سخت‌افزار و زیرساخت فیزیکی نیز حرکت کند. هسته اصلی تیم را افرادی از xAI تشکیل داده‌اند. وینسنت استارک (رئیس ایمنی محصول)، لیلی لیم (مشاور حقوقی) و برادران سوبولف (مهندسان) به بابوشکین پیوسته‌اند. منبع: bloomberg.com --- 💳 عامل‌های ChatGPT توانایی پرداخت خرید از طریق ویزا را پیدا کردند ویزا شبکه پرداخت خود را در ChatGPT یکپارچه ساخته است. عامل‌های هوش مصنوعی اکنون می‌توانند به طور خودمختار از طرف کاربر، نزد هر فروشنده‌ای که کارت‌های ویزا را می‌پذیرد، تراکنش انجام دهند. برای استفاده از این قابلیت، کافی است کارت به چت‌بات متصل شود. شرکت OpenAI مسئول منطق عامل‌های خودمختار است و ویزا وظیفه تأیید تراکنش‌ها و نظارت بر تقلب را بر عهده دارد. کاربران ابزارهای کنترلی مانند محدودیت هزینه، فهرست سفید فروشگاه‌ها و گزینه تأیید اجباری عملیات را در اختیار دارند. اعتراض به تراکنش‌ها طبق قوانین استاندارد ویزا انجام می‌شود. این مقررات برای مواردی که فروشنده درست عمل کرده اما خطای منطق هوش مصنوعی منجر به سفارش اشتباه شده، تطبیق داده خواهد شد. منبع: visa.com --- 🎵 دیزر شناساگر موسیقی ساخته‌شده با هوش مصنوعی را راه‌اندازی کرد این سرویس استریمینگ ابزاری ساخته است که آهنگ‌های ساخته‌شده با هوش مصنوعی را جستجو و شناسایی می‌کند. الگوریتم با تحلیل کتابخانه کاربران، محتوای مصنوعی را در ۲۰ پلتفرم استریمینگ کشف می‌کند. این ابزار از ۲۷ زبان پشتیبانی می‌نماید. به گفته الکسی لانترنیه، مدیرعامل دیزر، روزانه حدود ۷۵ هزار قطعه تولیدشده با هوش مصنوعی در این پلتفرم بارگذاری می‌شود که بیش از ۴۴٪ کل انتشارات جدید را تشکیل می‌دهد. نزدیک به نیمی از کاربرانی که از رقبا به دیزر مهاجرت می‌کنند، قبلاً موسیقی ساخته‌شده با هوش مصنوعی را در مجموعه‌های خود ذخیره کرده‌اند. نظرسنجی مشترک دیزر و ایپسوس نشان می‌دهد ۹۷٪ شنوندگان نمی‌توانند موسیقی هوش مصنوعی را از واقعی تشخیص دهند، اما ۸۰٪ برچسب‌گذاری اجباری آن را خواستارند. این پلتفرم هم‌اکنون محتوای تولیدشده با هوش مصنوعی را در اولویت پایین‌تری قرار داده و آن را از توصیه‌ها و فهرست‌های منتخب حذف کرده است. منبع: deezer.com --- #news #ai 🆔 @asrgooyeshpardaz
2 263
19
🌐اخبار هوش مصنوعی 📅 عرضه اولیه سهام OpenAI به سال ۲۰۲۷ موکول شد سم آلتمن به کارمندان اطلاع داده است که ورود به بورس یک سال به تعویق افتاده است. او برگ درخواست ثبت‌شده را مانوری برای حفظ آزادی عمل تاکتیکی توصیف کرده است. در مقابل، به کارمندان پیشنهاد شده سهام خود را به قیمت ۶۸۷.۶۹ دلار برای هر سهم بفروشند. دلیل تأخیر، پیشرفت در توسعه هوش مصنوعی خودآموز است. به باور مدیرعامل OpenAI، در دوره توسعه غیرقابل‌پیش‌بینی فناوری، برای شرکت ایمن‌تر است که غیرعمومی باقی بماند. عامل دیگر، عرضه سهام رقیب، Anthropic، است. این رقیب نرخ‌های رشد بهتری نشان می‌دهد، در حالی که OpenAI در حال سوزاندن سرمایه است. این شرکت قصد دارد در ماه ژوئن مدل جدیدی با شاخص ۵.۶ منتشر کند که در داخل آن را گامی جدی نسبت به GPT-5.5 ارزیابی می‌کنند. منبع: theinformation.com --- ☁️ شرکت Arcee AI از AWS به Hugging Face کوچ می‌کند داده‌های این شرکت در سرویس Hugging Face Buckets قرار خواهد گرفت که به CDN توکار مجهز و برای کار با وزن‌های مدل بهینه شده است. دلیل اصلی این کوچ، نبود هزینه برای ترافیک خروجی است. مخزن یکپارچه به Arcee AI امکان می‌دهد از قفل فروشنده (vendor lock-in) جلوگیری کرده و خوشه‌های آموزشی را نزد هر ارائه‌دهنده ابری بدون هزینه جابه‌جایی داده راه‌اندازی کند. این آزمایشگاه بیش از ۲۰۰ پروژه را در Hugging Face پشتیبانی می‌کند، از جمله فاین‌تیون SuperNova روی Llama 3.1، خانواده مدل‌های Trinity و مجموعه داده باز The-Tome با ۱.۷۵ میلیون نمونه برای آموزش عامل‌های هوش مصنوعی. منبع: huggingface.co --- 📓 برنامه NotebookLM به محیط اجرای کد، عامل‌ها و مدل Gemini 3.5 مجهز شد گوگل پلتفرم NotebookLM را به‌روز کرده است. این سیستم به Gemini 3.5 و موتور Antigravity مهاجرت کرده و از عامل‌های خودمختار و اجرای کد پشتیبانی می‌کند. هر دفترچه هم‌اکنون به یک نمونه ابری مجهز است که شامل بیش از ۱۰۰ مهارت برای اجرای کد و تحلیل داده می‌شود. در آزمایش‌ها، معماری جدید در ۶۵٪ موارد از نظر پنج معیار کلیدی از نسخه قبلی بهتر عمل کرده است. امکان شروع پژوهش بدون بارگذاری داده، از طریق جستجوی عاملی مواد مرتبط، به سرویس اضافه شده است. نتایج با حفظ ارجاع وارد پایگاه می‌شوند. قالب‌های خروجی گسترش یافته‌اند: گزارش PDF همراه با نمودار، داده‌های ساختاریافته، جدول اکسل، ارائه پاورپوینت و همچنین تصاویر با استفاده از Nano Banana. این به‌روزرسانی برای کاربران اشتراک AI Ultra و مشتریان سازمانی در دسترس است. منبع: blog.google --- 💻 شرکت Cohere نخستین مدل کدنویسی متن‌باز خود را منتشر کرد مدل North Mini Code یک مدل متن‌باز برای برنامه‌نویسی و هماهنگی عامل‌هاست که بر پایه معماری MoE با ۳۰ میلیارد پارامتر کل و ۳ میلیارد فعال ساخته شده است. این مدل برای مدیریت زیرعامل‌ها، طراحی معماری سیستم و انجام بازبینی کد آموزش دیده است. در بنچمارک Artificial Analysis Coding Index این مدل ۳۳.۴ امتیاز کسب کرده است. در مقایسه با Devstral Small 2 روی سخت‌افزار مشابه، توان عملیاتی تولید متن ۲.۸ برابر بیشتر و تأخیر بین توکن‌ها ۳۰٪ کمتر است، در حالی که زمان رسیدن به نخستین توکن قابل مقایسه می‌باشد. وزن‌ها در Hugging Face منتشر شده است. دسترسی آزمایشی از طریق API و پلتفرم Model Vault باز شده است. منبع: cohere.com --- 🎵 وارنر میوزیک گروپ توسعه‌دهنده اثرانگشت دیجیتال Sureel AI را خریداری کرد فناوری Sureel AI اثرانگشت دیجیتال ضبط‌های صوتی را با تجزیه آن‌ها به مؤلفه‌های پایه ایجاد می‌کند. الگوریتم‌ها تشخیص می‌دهند که آیا محتوای هنرمند وارد مجموعه داده آموزشی مدل هوش مصنوعی شده یا در تولید آهنگ جدید استفاده شده است. ماژول اضافی این سیستم، دیپ‌فیک، شبیه‌سازی صدا و کپی‌برداری از سبک بصری را شناسایی می‌کند. معماری پلتفرم از کار با ویدیو و تصاویر پشتیبانی می‌کند و میلیون‌ها دارایی دیجیتال در پایگاه داده این استارتاپ نمایه‌سازی شده است. این شرکت ضبط‌وتوزیع، پروژه را به عنوان یک پلتفرم مستقل حفظ خواهد کرد و قصد دارد آن را به استانداردی برای صنعت موسیقی تبدیل نماید. منبع: wmg.com --- #news #ai 🆔 @asrgooyeshpardaz
2 166
20
🌐 اخبار هوش مصنوعی 🇨🇳چین شبکه ملی محاسباتی یکپارچه خواهد ساخت پکن طی پنج سال آینده قصد دارد مراکز داده پراکنده کشور را در یک زیرساخت مشترک برای توسعه سریع صنعت هوش مصنوعی ادغام کند. غول‌های مخابراتی China Mobile و China Telecom مدیریت عملیاتی را بر عهده خواهند داشت و باید تا سال ۲۰۲۸ اتصال کامل شبکه را تأمین کنند. با احتساب نوسازی سیستم‌های انرژی، هزینه کل پروژه ممکن است به نیم تریلیون دلار برسد. تأمین مالی اصلی از طریق انتشار اوراق قرضه دولتی و صندوق‌های هدفمند انجام می‌شود. این طرح خریدها را سهمیه‌بندی می‌کند: حداقل ۸۰ درصد تجهیزات، از جمله تراشه‌های هوش مصنوعی، باید توسط تولیدکنندگان داخلی تأمین شود. برای NVIDIA و AMD این به معنای کاهش شدید حضور در بازار چین است. این زیرساخت عظیم بخشی از استراتژی دولتی «شش شبکه بزرگ» بوده و هدف آن تأمین استقلال چین برای رهبری در رقابت جهانی هوش مصنوعی است. منبع: bloomberg.com --- 🗣️ گوگل از مدل جریانی Gemini 3.5 Live Translate رونمایی کرد این مدل جدید، خروجی صوتی را پیش از پایان یافتن گفتار گوینده تولید می‌کند و میان انباشت زمینه و سرعت تولید تعادل برقرار می‌نماید. الگوریتم از بیش از ۷۰ زبان پشتیبانی کرده و تن، سرعت و زیر و بمی صدای اصلی را حفظ می‌کند. این فناوری مستقیماً وارد محصولات نهایی شده است. به‌روزرسانی در اپلیکیشن موبایل Google Translate در حال اجراست. برای مشتریان سازمانی، یکپارچه‌سازی در Google Meet با پشتیبانی از بیش از ۲۰۰۰ ترکیب زبانی در یک کنفرانس در حال آزمایش است. نسخه پیش‌نمایش مدل در AI Studio و از طریق Gemini Live API در دسترس است. خروجی‌های صوتی تولیدشده با SynthID نشانه‌گذاری می‌شوند. منبع: blog.google --- ⚡️ نسخه فوق‌سریع مدل پرچمدار شیائومی منتشر شد شرکت چینی مدل MiMo-V2.5-Pro-UltraSpeed با ۱ تریلیون پارامتر و سرعت خروجی ۱۰۰۰ توکن در ثانیه را عرضه کرده است. این سرعت با همکاری توسعه‌دهندگان فریمورک TileRT و با استفاده از کوانتیزاسیون FP4 و رمزگشایی تأملی DFlash به دست آمده است که نرخ تولید را نسبت به نسخه‌های قبلی ۱۰ برابر افزایش داده است. شیائومی این مدل را برای سیستم‌های تصمیم‌گیری خودکار با کمترین تأخیر مناسب می‌داند. دسترسی به API UltraSpeed سه برابر گران‌تر از نسخه پایه MiMo-V2.5-Pro است. نسخه متن‌باز با وزن‌های FP4 در HuggingFace منتشر شده است. از ۹ تا ۲۳ ژوئن، آزمایش بسته سازمانی نسخه ابری برگزار می‌شود که روزانه ۱۰ اسلات برای جلسات حداکثر ۳۰ دقیقه تخصیص می‌یابد و دسترسی از طریق درخواست ارائه می‌شود. منبع: xiaomi.com --- 📊 پرپلکسیتی و هاروارد شتاب کاری ناشی از استفاده از عامل‌ها را ارزیابی کردند مدرسه کسب‌وکار هاروارد و پرپلکسیتی گزارشی درباره کارایی عامل خودمختار Computer منتشر کرده‌اند. در مقایسه با جستجوی استاندارد پلتفرم، این عامل ۸۷٪ در زمان انجام وظایف فکری صرفه‌جویی کرده و هزینه‌های فرضی نیروی کار را ۹۴٪ کاهش داده است (بر اساس داده‌های حقوق و دستمزد آمریکا). جستجوی مبتنی بر هوش مصنوعی به اقدامات مداوم کاربر نیاز دارد و میانگین هر جلسه ۳۳ ثانیه است، اما بیشتر زمان صرف کار دستی انسان می‌شود. عامل Computer کل چرخه را به عهده گرفته و حدود ۲۶ دقیقه به طور خودمختار کار می‌کند. نظرسنجی‌ها از کاربران نشان می‌دهد که سرعت انجام کارهای تکراری به طور متوسط ۲۵ برابر افزایش یافته است. سهم جلساتی که خروجی آن‌ها ارزیابی منفی داشته، پس از تغییر به عامل از ۲.۹٪ به ۱.۳٪ کاهش یافته است. منبع: perplexity.ai --- 📈 آمریکا آماده راه‌اندازی معاملات آتی بر روی قدرت محاسباتی است گلدمن ساکس و جی‌پی‌مورگان چیس در حال توسعه قراردادهای آتی متصل به ارزش اجاره GPU هستند. این ابزار برای پوشش ریسک نکول و کاهش ارزش تجهیزات در برابر وام‌های اعطایی برای ساخت زیرساخت هوش مصنوعی طراحی شده است. بورس کالای شیکاگو و بورس بین‌المللی قصد دارند در صورت تأیید نهاد ناظر، امسال معاملات قراردادهای آتی بر روی قدرت محاسباتی را آغاز کنند. این مکانیزم به بانک‌ها اجازه می‌دهد موقعیت‌های فروش باز کرده و زیان ناشی از کاهش نرخ‌های اجاره را جبران کنند. ارائه‌دهندگان ابری نیز می‌توانند سود خود را تثبیت کرده و در برابر نوسانات قیمت محافظت شوند. در حالی که نهادهای نظارتی آمریکا در حال ارزیابی مکانیزم‌های محافظت در برابر دستکاری هستند، پلتفرم‌های جایگزین در خارج از کشور برای شرط‌بندی بر پویایی نرخ اجاره NVIDIA H100 فعال شده‌اند. منبع: theinformation.com --- #news #ai 🆔 @asrgooyeshpardaz
2 185