عصر گویش | هوش مصنوعی
📈 Análisis del canal de Telegram عصر گویش | هوش مصنوعی
El canal عصر گویش | هوش مصنوعی (@asrgooyeshpardaz) en el segmento lingüístico de Farsi es un actor destacado. Actualmente la comunidad reúne a 102 084 suscriptores, ocupando la posición 1 229 en la categoría Tecnologías y Aplicaciones y el puesto 2 918 en la región Irán.
📊 Métricas de audiencia y dinámica
Desde su creación el невідомо, el proyecto ha mostrado un crecimiento acelerado, reuniendo a 102 084 suscriptores.
Según los últimos datos del 24 junio, 2026, el canal mantiene una actividad estable. En los últimos 30 días la variación de miembros fue de -1 657, y en las últimas 24 horas de -72, conservando un alto alcance.
- Estado de verificación: No verificado
- Tasa de interacción (ER): El promedio de interacción de la audiencia es 2.37%. Durante las primeras 24 horas tras publicar, el contenido suele obtener 1.00% de reacciones respecto al total de suscriptores.
- Alcance de las publicaciones: Cada publicación recibe en promedio 2 420 visualizaciones. En el primer día suele acumular 1 025 visualizaciones.
- Reacciones e interacción: La audiencia responde de forma activa: el promedio de reacciones por publicación es 4.
- Intereses temáticos: El contenido se centra en temas clave como مدل, گفتار, بهطور, عامل, ابزار.
📝 Descripción y política de contenido
El autor describe el recurso como un espacio para expresar opiniones subjetivas:
“مجله هوش مصنوعی عصر گویش
021 61931000”
Gracias a la alta frecuencia de actualizaciones (últimos datos recibidos el 25 junio, 2026), el canal mantiene la vigencia y un amplio alcance. La analítica demuestra que la audiencia interactúa activamente con el contenido, lo que lo convierte en un punto de referencia dentro de la categoría Tecnologías y Aplicaciones.
Carga de datos en curso...
| Fecha | Crecimiento de Suscriptores | Menciones | Canales | |
| 25 junio | 0 | |||
| 24 junio | 0 | |||
| 23 junio | +3 | |||
| 22 junio | +4 | |||
| 21 junio | +4 | |||
| 20 junio | +23 | |||
| 19 junio | +15 | |||
| 18 junio | 0 | |||
| 17 junio | +36 | |||
| 16 junio | +27 | |||
| 15 junio | 0 | |||
| 14 junio | 0 | |||
| 13 junio | 0 | |||
| 12 junio | 0 | |||
| 11 junio | 0 | |||
| 10 junio | 0 | |||
| 09 junio | 0 | |||
| 08 junio | 0 | |||
| 07 junio | 0 | |||
| 06 junio | 0 | |||
| 05 junio | 0 | |||
| 04 junio | 0 | |||
| 03 junio | 0 | |||
| 02 junio | 0 | |||
| 01 junio | 0 |
| 2 | مدل Qwen-AgentWorld از Claude Opus و GPT-5.4 در بنچمارک جدید عاملها پیشی گرفت.
شرکت Qwen مدلهای open-weight جدیدی را منتشر کرده است که محیطهای واقعی برای عاملها را شبیهسازی میکنند: وب، ترمینال، برنامهنویسی، جستجو، سیستمعامل و اندروید.
نکات اصلی:
• مدل 397B امتیاز 58.71 کسب کرد و از Opus 4.8 / GPT-5.4 پیشی گرفت
• مدل 35B MoE از Sonnet 4.6 پیشی گرفت
• افزایش قابل توجه در وظایف برنامهنویسی، وب و ترمینال
• وزنها هماکنون در Hugging Face در دسترس هستند
مقاله:
https://arxiv.org/abs/2606.24597
وبلاگ: https://qwen.ai/blog?id=qwen-agentworld
گیتهاب: https://github.com/QwenLM/Qwen-AgentWorld
HuggingFace: https://huggingface.co/collections/Qwen/qwen-agentworld
ModelScope: https://modelscope.cn/collections/Qwen/Qwen-AgentWorld | 1 804 |
| 3 | 📌 وال استریت ژورنال: قراردادهای تجاری OpenAI با رشد سرمایهگذاری شخصی سم آلتمن گره خورده است
روزنامه وال استریت ژورنال با استناد به اسناد دادگاه پرونده «ایلان ماسک علیه OpenAI»، از ارتباط نزدیک قراردادهای این شرکت با افزایش ثروت شخصی مدیرعامل آن خبر داده است.
جالب اینجاست که خود آلتمن سهمی در مالکیت OpenAI ندارد و درآمدش به شدت به سرمایهگذاریهای خارجی وابسته است.
🟡 مکانیزم اثرگذاری
شرکت OpenAI با یک استارتاپ قرارداد همکاری میبندد و باعث افزایش ارزش آن میشود. در ادامه، سهامداران بزرگی مثل Thrive Capital یا شرکای تجاری مثل SoftBank سهام آن استارتاپ را میخرند. از آنجایی که آلتمن شخصاً در آن استارتاپها سرمایهگذاری کرده، ثروتش به طور غیرمستقیم افزایش پیدا میکند.
🟡 بررسی سه مورد عینی
🔹 هلیون (Helion):
در سال ۲۰۲۵، آلتمن پیشنهاد سرمایهگذاری ۵۰۰ میلیون دلاری OpenAI در این استارتاپ همجوشی هستهای را داد (که با نگرانی کارکنان مواجه شد). در مارس ۲۰۲۶ قرارداد همکاری جدیدی بستند و او برای رفع تعارض منافع از هیئت مدیره کنار رفت. نهایتاً در ژوئن ۲۰۲۶، ارزش هلیون به ۱۵.۵ میلیارد دلار رسید و سهام آلتمن حداقل ۴.۱ میلیارد دلار ارزش پیدا کرد.
🔹 سربراس (Cerebras):
پس از دریافت تعهد خرید از سوی OpenAI و انجام عرضه اولیه (IPO)، ارزش سهام آلتمن در این شرکت تراشهسازی نسبت به دسامبر ۲۰۲۵، بیش از ۶ برابر افزایش یافت.
🔹 رترو بایوساینسز (Retro Biosciences):
پس از امضای قرارداد همکاری علمی با OpenAI، سهام آلتمن در این شرکت فعال در حوزه افزایش عمر، تا دسامبر ۲۰۲۵ به ۲۵۸ میلیون دلار رسید.
📊 طبق گزارش WSJ، حداقل ۱۰ شرکت در پرتفوی سرمایهگذاری آلتمن با OpenAI قرارداد تجاری دارند.
🏛️ واکنش نهادهای نظارتی
کمیته نظارت مجلس نمایندگان آمریکا تحقیق رسمی را آغاز کرده و دادستانهای چند ایالت از کمیسیون بورس و اوراق بهادار (SEC) خواستهاند تا پیش از عرضه اولیه سهام OpenAI، این موضوع را بررسی کنند.
البته خود آلتمن و مقامات شرکتهای مربوطه معتقدند که این نوع همکاریها، رویهای کاملاً عادی و رایج در دنیای تجارت است.
#اخبار_هوش_مصنوعی #AI #ML
🆔 @asrgooyeshpardaz | 1 490 |
| 4 | 🦾 یونیتری R1 | قیمت از ۴۹۰۰ دلار. | 1 208 |
| 5 | ایلان ماسک، نماد شکست یک سیستم
ایلان ماسک، نخستین تریلیونر تاریخ شد. ثروتی که از دارایی نیمی از جمعیت زمین بیشتر است. اما این ثروت افسانهای، نه زاییدهی نبوغ فردی، که محصول میلیاردها دلار یارانه و قرارداد دولتی است؛ پولی که از جیب مالیاتدهندگان تأمین شد تا امپراتوری او را از ورشکستگی نجات دهد.
ماسک اما از یک یارانهبگیر به یک جنگافروز تبدیل شده است. هوش مصنوعی او اهداف بمباران آمریکا در ایران را انتخاب میکند و استارلینک، ستون فقرات عملیاتی این جنگ است. بهای این فناوری «پیشرفته» چه بود؟ بمباران مدرسهی دخترانهی شجرهی طیبه در میناب و کشته شدن دستکم ۱۵۶ دانشآموز بیگناه.
در سرمایهداری امروز، دولت با پول مردم، میلیاردرها را تغذیه میکند و آنها نیز با مکیدن خونِ ملتها، ثروت بیشتری انباشت میکنند. ماسک، دیگر فقط یک تریلیونرِ یارانهبگیر نیست؛ او نماد زندهی سیستمی است که جنگ، فقر و نابرابری را به سودِ معدودی، بهقیمتِ جانِ بسیاری، مدیریت میکند.
https://telegra.ph/investigation-06-24-4
🆔 @asrgooyeshpardaz | 1 382 |
| 6 | ایلان ماسک، نماد شکست یک سیستم
ایلان ماسک، نخستین تریلیونر تاریخ شد؛ ثروتی که از دارایی نیمی از انسانهای این سیاره بیشتر است. اما این ثروت افسانهای، نه حاصل نبوغ فردی، که محصول میلیاردها دلار یارانه و قرارداد دولتی است.
اما ماسک حالا از یک یارانهبگیر به یک جنگافروز تبدیل شده: هوش مصنوعی او اهداف بمباران آمریکا در ایران را انتخاب میکند و استارلینک، ستون فقرات عملیاتی جنگ است. بهای این فناوری «پیشرفته» چیست؟ بمباران مدرسه دخترانه شجره طیبه میناب و کشته شدن ۱۵۶ دانشآموز.
در سرمایهداری امروز، دولت با پول مالیاتدهندگان، میلیاردرها را پشتیبانی میکند تا با مکیدن خون مردم عادی، ثروت بیشتری انباشت کنند.
https://telegra.ph/investigation-06-24-4 | 222 |
| 7 | 🌐اخبار هوش مصنوعی
🛡️ شرکت OpenAI حضور خود را در حوزه امنیت سایبری گسترش میدهد
این شرکت مدل تخصصی GPT-5.5-Cyber را برای کارشناسان امنیت اطلاعات و همچنین بهروزرسانی افزونه Codex Security منتشر کرده است.
دسترسی به مدل GPT-5.5-Cyber فقط برای کاربران تأییدشده فراهم است. این مدل برای کاهش موارد拒回答 در پردازش درخواستهای تخصصی امنیتی تنظیم شده است.
نسخه بهروز شده Codex Security کد را اسکن میکند، بردارهای حمله را تحلیل میکند، قابلیت دسترسی به کدهای آسیبپذیر را بررسی و برای آنها وصله (پچ) تولید میکند. این ابزار از پردازش گزارشهای باگ از اسکنرهای خارجی و خروجی داده از طریق فایلهای SARIF یا درخواستهای CodeQL پشتیبانی میکند.
همچنین همراه با HackerOne و Trail of Bits، برنامه Patch the Planet را برای محافظت خودکار از پروژههای متنباز راهاندازی کرده است. پروژههای cURL، Python و Go به این برنامه پیوستهاند.
منبع: openai.com
---
🌱 گوگل برنامه شتابدهی هوش مصنوعی برای کارمندان سابق خود راهاندازی کرد
این شرکت برنامهای برای جامعه کارمندان سابق خود که پروژههای هوش مصنوعی ایجاد میکنند، معرفی کرده است. هدف این ابتکار جلوگیری از مهاجرت استعدادها به رقبا است.
گوگل قصد دارد پروژههای جدید را در مراحل اولیه جذب کند تا رهبران آینده بازار را به زیرساخت Google Cloud متصل نگه دارد.
در مرحله اول ۱۲ هفتهای، ۱۰ تا ۲۰ تیم انتخاب خواهند شد. هر تیم تا ۱۰۰ هزار دلار بودجه مستقیم و ۳۵۰ هزار دلار اعتبار برای خدمات ابری دریافت میکند. شرکتکنندگان همچنین به مدلهای گوگل قبل از انتشار عمومی دسترسی خواهند داشت.
شرکای این پروژه شامل استودیوی سرمایهگذاری Key Studio و پلتفرم Xoogler.co (با بیش از ۳۵ هزار عضو از کارمندان سابق گوگل در سراسر جهان) هستند. مربیگری توسط مدیران ارشد با تجربه، از جمله ماریسا مایر (مدیرعامل سابق یاهو) انجام میشود.
منبع: bloomberg.com
---
🤖 انویدیا از پلتفرم ایمنی برای رباتهای فیزیکی رونمایی کرد
پلتفرمHalos for Robotics یک پلتفرم سختافزاری-نرمافزاری برای تعامل ایمن رباتهای خودمختار با انسانها در محیطهای صنعتی است.
بخش سختافزاری شامل ماژول IGX Thor و دروازه سنسور Holoscan Sensor Bridge برای پردازش دادههای حسگرها است. بخش نرمافزاری بر پایه Halos OS با هسته Halos Core ساخته شده و از سیستمهای عامل بلادرنگ تأییدشده مانند BlackBerry QNX پشتیبانی میکند.
انویدیا یک طرح مرجع متنباز برای ایمنی منتشر کرده که از دوربینهای خارجی برای نظارت بر نقاط کور ربات استفاده میکند. همچنین یک آزمایشگاه تأیید با مجوز ANSI برای تست انطباق محصولات راهاندازی کرده است.
شرکت Agility Robotics اولین یکپارچهکننده این فناوری است و قطعات Halos را در رباتهای Digit خود پیادهسازی میکند.
منبع: nvidia.com
---
📢 شرکت ElevenLabs ابزار محلیسازی تبلیغات را منتشر کرد
موتور Ads Engine موتوری برای ترجمه خودکار تبلیغات به ۵۰ زبان است. این سیستم با پنلهای تبلیغاتی یکپارچه میشود، مواد اولیه را دریافت، محلیسازی و دوباره بارگذاری میکند.
این ابزار از فناوری Dubbing V2 استفاده میکند که صدا را ترجمه و صدای گوینده را با حفظ لحن اصلی کپی میکند. همچنین ویدیو را تطبیق میدهد: زیرنویسها را ترجمه و ترکیب فریمها را تغییر میدهد.
سیستم نظارت بر عملکرد نیز تعبیه شده است که کاهش نرخ تبدیل را ردیابی کرده و در صورت نیاز به تغییر محتوا هشدار میدهد. قابلیت نظارت و بازبینی دستی در طرح Scale موجود است.
امکانات پایه Ads Engine در اشتراک Pro گنجانده شده (با محدودیت در تعداد حسابهای تبلیغاتی، زبانها و تولیدات). این ابزار فقط از طریق وب در دسترس است و API ندارد.
منبع: elevenlabs.io
---
📉 اوراکل ۲۱ هزار کارمند خود را در بحبوحه بازسازی کسبوکار حول هوش مصنوعی تعدیل کرد
این شرکت نیروی خود را ۱۳ درصد کاهش داده (از ۱۶۲ هزار به ۱۴۱ هزار نفر). بر اساس گزارش سالانه، تعدیل ۲۱ هزار نفر به دلیل پیادهسازی هوش مصنوعی در فرایندهای داخلی و تخصیص مجدد منابع است.
هزینههای پایان کار و هزینههای مرتبط به ۱.۸ میلیارد دلار رسیده که ۵ برابر بیشتر از هزینه بازسازی سال قبل است. بودجه صرفهجوییشده صرف ساخت مراکز داده جدید خواهد شد.
اوراکل به تغییر ساختار واحدهای مهندسی خود با تمرکز بر خدمات ابری و محصولات هوش مصنوعی ادامه خواهد داد.
منبع: bbc.com
---
#news #ai
🆔 @asrgooyeshpardaz | 1 476 |
| 8 | 🌐اخبار هوش مصنوعی
🎬 بهروزرسانی مدل ویدیویی HappyHorse از علیبابا
نسخه ۱.۱ این مدل با قابلیتهای جدید عرضه شده است:
- پردازش پرامپتهای بیش از ۲۵۰۰ کاراکتر
- ساخت ۶ تا ۸ صحنه متوالی از یک درخواست واحد
- تولید ویدیو با کیفیت FullHD
- هماهنگی لب و صدا به چندین زبان
۴ حالت مختلف برای تولید: از روی متن، از روی تصویر، انتقال شخصیت بر اساس نمونه و ویرایش ویدیو.
قیمتگذاری از طریق API: ۱۴ سنت به ازای هر ثانیه ویدیوی HD و ۱۸ سنت برای کیفیت ۱۰۸۰p. تا دو هفته اول ۴۰٪ تخفیف اعمال میشود.
منبع: Alibaba در X
---
🧠 همکاری آنتروپیک و مایکرون در طراحی معماری حافظه
دو شرکت برای بررسی رفتار سیستمهای حافظه در آموزش و استنتاج مدلهای زبانی بزرگ، همکاری میکنند. مایکرون حافظههای HBM، DRAM و SSD را در اختیار آنتروپیک قرار میدهد و آنتروپیک نیز مدلهای Claude را برای تولید کد و خودکارسازی فرایندهای تولید در اختیار مایکرون میگذارد.
نکتهی قابل توجه: مایکرون همزمان هم سرمایهگذار آنتروپیک است و هم تأمینکنندهی تجهیزات آن. برخی تحلیلگران این نوع قرارداد را «معاملهی دوری» مینامند که میتواند تصویر واقعی از تقاضا در بازار سختافزار هوش مصنوعی را مخدوش کند.
منبع: micron.com
---
🔌 Interactions API گوگل بهصورت عمومی منتشر شد
گوگل رابط کاربری جدیدی به نام Interactions API را جایگزین متد قبلی (generateContent) در پلتفرم Google AI Studio کرده است. در این روش جدید، نقشهای قبلی (user و model) حذف شده و هر ورودی یا فراخوانی بهعنوان یک گام مجزا ثبت میشود.
قابلیتهای جدید:
- مدیریت عاملهای هوش مصنوعی
- اجرای پسزمینهی وظایف سنگین
- یکپارچهسازی با جستجو و نقشههای گوگل
- تولید محتوای چندرسانهای
- دو حالت جدید: Flex با ۵۰٪ کاهش هزینه و Priority با حداکثر سرعت
منبع: blog.google
---
🗣️ تشخیص گفتار به اوبونتو میآید
شرکت کانونیکال قصد دارد قابلیت تبدیل گفتار به متن را با نام Myna به نسخهی دسکتاپ اوبونتو اضافه کند. این ابزار در نسخهی Ubuntu 26.10 و برای محیط GNOME در دسترس خواهد بود.
معماری Myna از سه بخش تشکیل شده: دریافت و پالایش صدا، مدیریت جلسه و پردازش در محیط ایزوله. مدل بهصورت آفلاین و پس از دانلود وزنها کار میکند، اما در نسخههای اولیه از گوشدادن پسزمینه یا ورود صوتی رمزها پشتیبانی نمیشود.
منبع: ubuntu.com
---
📸 تصاویر Getty Images به ChatGPT اضافه میشوند
طبق یک قرارداد چندساله، عکسهای کتابخانهی عظیم Getty Images در نتایج جستجوی ChatGPT نمایش داده میشوند. پیشتر گتی از استیبلدیفیوژن به دلیل استفادهی غیرمجاز از تصاویرش شکایت کرده بود، اما حالا با OpenAI همکاری میکند.
همزمان، گتی در انتظار تأیید نهادهای نظارتی برای خرید رقیب خود، Shutterstock، است. جزئیات مالی قرارداد با OpenAI و اینکه آیا این شرکت اجازهی استفاده از تصاویر گتی را برای آموزش مدلهای خود دارد، هنوز مشخص نیست.
منبع: gettyimages.com
---
#هوش_مصنوعی #اخبار_فناوری #AI
🆔 @asrgooyeshpardaz | 1 186 |
| 9 | 🔍 بایدو مدل Unlimited OCR را منتشر کرد - مدلی برای شناسایی اسناد طولانی در یک بار پردازش.
این مدل دارای 3 میلیارد پارامتر است، اما تنها 500 میلیون فعال میشوند. با این حال، نتایج جدید SOTA را در OmniDocBench نسخههای 1.5 و 1.6 نشان میدهد.
ویژگی اصلی - توجه پنجره لغزنده مرجع (Reference Sliding Window Attention) است.
مدل بر روی موارد زیر تمرکز دارد:
• سند اصلی
• زمینه اخیر
• کلمات بعدی
و همه چیز اضافی به تدریج «فراموش» میشود تا محاسبات افزایش نیابد.
به دلیل اندازه ثابت کش KV و توجه ارزانتر، Unlimited OCR میتواند بیش از 40 صفحه را در یک بار پردازش شناسایی کند، بدون از دست دادن زمینه و بدون کاهش سرعت.
گیتهاب: https://github.com/baidu/Unlimited-OCR
هاگینگ فیس: https://huggingface.co/baidu/Unlimited-OCR
#ocr #baidu | 834 |
| 10 | 📌 میسترال از OCR 4 رونمایی کرد؛ مدلی که اسناد را به ساختار تبدیل میکند
شرکت میسترال (Mistral AI) از جدیدترین نسخه مدل OCR خود با نام OCR 4 رونمایی کرده است. این مدل فراتر از تشخیص متن ساده عمل کرده و اسناد را به یک ساختار منسجم و قابل استفاده تبدیل میکند.
✨ قابلیتهای کلیدی:
- تشخیص بلوکها با جعبههای محدود (Bounding Boxes): هر عنصر سند (متن، جدول، عنوان، تصویر) با مختصات دقیق مشخص میشود.
- طبقهبندی انواع عناصر: تشخیص خودکار انواع محتوای سند شامل عنوان، زیرعنوان، جدول، فرمول، امضا و تصویر.
- نمره اطمینان در سطح صفحه و کلمه: نشاندهنده میزان اطمینان مدل در تشخیص هر بخش از سند.
- پشتیبانی از ۱۷۰ زبان: در ۱۰ گروه زبانی مختلف.
🎯 کاربرد اصلی:
هدف اصلی این مدل صرفاً «تشخیص متن» نیست، بلکه تبدیل اسناد به ساختاری است که بتوان از آن در سیستمهای RAG، جستجوی سازمانی، ویرایش و بازبینی انسانی و خطوط لوله عاملهای هوش مصنوعی استفاده کرد.
📊 عملکرد و نتایج:
در یک مقایسه کور بر روی بیش از ۶۰۰ سند واقعی، کاربران مستقل در ۷۲٪ موارد OCR 4 را به سایر سیستمهای پیشرو ترجیح دادهاند. این مدل بالاترین امتیاز (۸۵.۲۰) را در بنچمارک OlmOCRBench کسب کرده و در ارزیابی چندزبانه داخلی (Crawl Multilingual) با امتیاز ۰.۹۸ از رقبا پیشی گرفته است.
در بنچمارک OmniDocBench نیز امتیاز ۹۳.۰۷ را به دست آورده است.
🔒 امنیت و استقرار:
مدل به اندازهای جمعوجور است که در یک کانتینر واحد قابل استقرار است و امکان اجرای خودمیزبان (Self-hosted) را فراهم میکند. این ویژگی به سازمانها اجازه میدهد اسناد خود را بدون خروج از زیرساخت اختصاصی پردازش کنند و نیازهای حاکمیتی و حریم خصوصی را برآورده سازند.
🔗 اطلاعات بیشتر:
بیانیه رسمی میسترال
#MistralAI #OCR #DocumentUnderstanding #AI
🆔 @asrgooyeshpardaz | 740 |
| 11 | 🔍 مدل Unlimited-OCR از Baidu؛ یک گام فراتر از DeepSeek-OCR در پردازش اسناد طولانی
شرکت بایدو به تازگی مدل OCR جدید خود با نام مدل Unlimited-OCR را به صورت متنباز منتشر کرده است. این مدل که با هدف «پردازش یکباره اسناد طولانی» (One-shot Long-horizon Parsing) طراحی شده، با تکیه بر معماری نوین و بهرهگیری از ایدههای الهامگرفته از حافظه کاری انسان، توانسته عملکردی فراتر از مدلهای قبلی از جمله DeepSeek-OCR ارائه دهد.
---
🧠 نوآوری کلیدی: Reference Sliding Window Attention (R-SWA)
چالش اصلی مدلهای OCR مبتنی بر رمزگشای LLM، رشد خطی حافظه نهان KV با افزایش طول خروجی است که مصرف حافظه را افزایش داده و سرعت را کاهش میدهد. مدلهای قبلی برای رفع این مشکل، اسناد را صفحهبهصفحه و با حلقههای متوالی پردازش میکردند که فرایندی ناپیوسته و ناکارآمد است.
مدل Unlimited-OCR با معرفی مکانیزم توجه R-SWA این مشکل را حل کرده است. این روش، حافظه نهان KV را از رشد خطی به یک مقدار ثابت تبدیل میکند. R-SWA از دو بخش تشکیل شده است:
- بخش مرجع (Reference): شامل توکنهای بصری و پرامپت که در کل فرایند رمزگشایی ثابت و قابل مشاهده هستند.
- پنجره لغزنده (Sliding Window): شامل ۱۲۸ توکن اخیر که با تولید هر توکن جدید، قدیمیترین توکن از پنجره خارج میشود و اندازه آن ثابت میماند.
این طراحی، مشابه حافظه کاری انسان عمل میکند که اطلاعات دور را به تدریج «فراموش میکند» و تمرکز را روی بافت نزدیک حفظ میکند.
---
📊 عملکرد و نتایج
مدل Unlimited-OCR با معماری ۳ میلیارد پارامتری (۵۰۰ میلیون فعال) بر روی بنچمارک OmniDocBench به نتایج قابل توجهی دست یافته است:
- کسب امتیاز کلی ۹۳.۹۲٪ در OmniDocBench v1.6 و ثبت رکورد جدید (SOTA).
- بهبود بیش از ۶ درصد نسبت به DeepSeek-OCR در نسخه قبلی بنچمارک.
- کاهش فاصله ویرایش (Edit Distance) متن از ۰.۰۷۳ به ۰.۰۳۸ و بهبود قابل توجه در تشخیص فرمولها و جداول.
- عملکرد چشمگیر در اسناد بلند: پردازش اسناد ۲۰ صفحهای در یک بار با فاصله ویرایش ۰.۰۵۷۲ و اسناد ۴۰ صفحهای با فاصله ویرایش ۰.۱۰۶۹.
- توان عملیاتی ۵,۵۸۰ توکن در ثانیه که نسبت به DeepSeek-OCR بهبود ۱۲.۷٪ را نشان میدهد.
🔑 نکته کلیدی: در حالی که تأخیر DeepSeek-OCR با افزایش طول خروجی به طور خطی رشد میکند، تأخیر مدل Unlimited-OCR در تمام طولهای توالی ثابت باقی میماند.
---
⚙️ استقرار و دسترسی
مدل Unlimited-OCR تحت مجوز MIT منتشر شده است و از موتورهای اصلی استنتاج مانند Hugging Face Transformers، vLLM و SGLang پشتیبانی میکند. کد و وزنهای مدل در مخازن زیر در دسترس است:
- GitHub:
https://github.com/baidu/Unlimited-OCR
- Hugging Face:
https://huggingface.co/baidu/Unlimited-OCR
- ModelScope: https://modelscope.cn/models/PaddlePaddle/Unlimited-OCR
---
💎 خلاصه مطلب
مدل Unlimited-OCR با معرفی مکانیزم R-SWA، گامی اساسی در جهت حل مشکل پردازش اسناد طولانی برداشته است. این مدل با حفظ حافظه نهان KV ثابت، امکان پردازش یکباره دهها صفحه سند را با سرعت و دقت بالا فراهم میکند. R-SWA به عنوان یک مکانیزم توجه عمومی، پتانسیل کاربرد در وظایف توالی طولانی دیگر مانند بازشناسی گفتار (ASR) و ترجمه ماشینی را نیز دارد. انتشار این مدل تحت مجوز MIT، دسترسی و استفاده از آن را برای جامعه پژوهش و توسعه تسهیل کرده است.
🔗 مقاله:
https://arxiv.org/abs/2606.23050
#OCR #Baidu #DeepSeek #OpenSource
🆔 @asrgooyeshpardaz | 756 |
| 12 | 🧠 مدل VibeThinker-3B: اندازه مهم نیست، کارایی مهم است!
شرکت سینا ویبو از مدل جدید خود با نام VibeThinker-3B رونمایی کرده است. این مدل با تنها ۳ میلیارد پارامتر، در برخی از سختترین آزمونهای منطقی به پای مدلهای غولپیکری مثل Gemini 3 Pro و DeepSeek V3.2 رسیده است.
📊 عملکرد خیرهکننده
- 🔹 ریاضیات: امتیاز ۹۴.۳ در آزمون AIME26 (که با فناوری CLR به ۹۷.۱ میرسد). این یعنی این مدل کوچک در ریاضیات در سطح بهترین مدلهای دنیا قرار دارد.
- 🔹 برنامهنویسی: موفقیت ۸۰.۲٪ در بنچمارک LiveCodeBench و ۹۶.۱٪ قبولی در مسائل جدید LeetCode. این یعنی مدل حتی در مواجهه با مسائل ناآشنا و جدید، عملکرد فوقالعادهای دارد.
- 🔹 دقت در پیروی از دستورات: امتیاز ۹۳.۴ در آزمون IFEval نشان میدهد که توانایی بالای استدلال این مدل، به قیمت از دست دادن توانایی پیروی از دستورات دقیق کاربر تمام نشده است.
🤔 راز موفقیت چیست؟
تیم سازنده از رویکرد جدیدی به نام «از طیف تا سیگنال» و یک روش آموزش چندمرحلهای مبتنی بر یادگیری تقویتی استفاده کرده است. فرضیه آنها این است که هستهی منطقی مدل را میتوان به شدت فشرده کرد، در حالی که پارامترهای حجیم بیشتر برای ذخیرهسازی اطلاعات عمومی و دانش دایرةالمعارفی مورد نیاز هستند.
💎 نتیجهگیری:
مدل VibeThinker-3B نشان میدهد که برای رسیدن به هوش مصنوعی قدرتمند، همیشه نیازی به مدلهای با میلیاردها پارامتر نیست. با روشهای آموزشی هوشمندانه، میتوان مدلهای کوچک و کارآمدی ساخت که در حوزههای خاص (مانند ریاضیات و برنامهنویسی) با غولهای صنعت رقابت کنند. این یعنی هوش مصنوعی قدرتمند، قابلدسترستر از چیزی است که فکر میکنیم.
🔗 منبع:
https://arxiv.org/abs/2606.16140
#AI #VibeThinker #هوش_مصنوعی | 937 |
| 13 | 🎬 بایتدنس از مدل ویدئویی SeedDance 2.5 رونمایی کرد
شرکت بایتدنس پس از نسخهی چشمگیر ۲.۰ در بهار، حالا از مدل جدید خود با نام SeedDance 2.5 پرده برداشته است. این بهروزرسانی با ارتقاهای قابلتوجهی همراه است:
✨ امکانات جدید:
مدت زمان تولید: امکان ساخت ویدئوهای تا ۳۰ ثانیه** (در نسخهی قبلی ۱۵ ثانیه بود).
کیفیت تصویر: پشتیبانی بومی از وضوح ۴K**.
تعداد مراجع ورودی: تا ۵۰ مرجع** شامل عکس، ویدئوهای کوتاه و صدا. این مراجع بر خروجی نهایی تأثیر گذاشته و ویژگیهای اشیاء را حفظ میکنند.
🔮 قابلیت ویژه:
جالبترین ویژگی، تولید ویدئو بر اساس مدلهای سهبعدی سفید (بدون بافت) است. SeedDance 2.5 خودش مدل را در صحنه قرار داده و به آن بافت و رنگ میدهد، گویی که یک دارایی آماده از موتور بازی است.
🔗 منبع: [پست Xiaohu در شبکه اجتماعی X](https://x.com/xiaohu/status/2069267306182762907?s=20)
#AI #ByteDance #SeedDance #تولید_ویدئو | 1 306 |
| 14 | 🗣 وقتی LM ضعیف، کلمات نادر رو قربانی میکنه
طبق گزارش جدید کانال فناوری گفتار، ترکیب مدلهای CTC با یک LM ساده (n‑gram) خطای بازشناسی کلمات نادر را بهشدت افزایش میدهد.
همیشه فکر میکردیم که ترکیب CTC + LM برای تطبیق سریع با دامنهی جدید، معماری خوبی است. حتی تستهای WER هم مزیتش رو نشون میداد. ولی آزمایشهای جدید روی کلمات نادر، نشون داده که این ترکیب به اون خوبی که فکر میکردیم عمل نمیکنه.
بیشتر سیستمهایی که از n-gram shallow fusion استفاده میکنند، WER کلمات نادرشون بهمراتب بدتر از WER کلمات نادر در مدلهای RNNT و حتی خود CTC بدون LM هست.
داستان از این قراره که دقت مدل Conformer بهتنهایی اونقدر بالاست که یه LM اضافهی ضعیف با perplexity ۱۰۰–۲۰۰ نهتنها کمکی نمیکنه، بلکه اوضاع رو بدتر میکنه و مدل رو گیج میکنه. از طرفی، ساختن یه n-gram LM قویتر هم کار آسونی نیست. برای کاهش perplexity به معماری پیشرفتهتری نیازه که بتونه زمینهی طولانیتری رو ببینه، و این فقط با ترنسفورمرها ممکنه.
واقعاً قضیه جالبی شده. یه LLM قوی مطمئناً اینجا کمک میکنه، ولی سؤال اصلی اینه که چطور میتونیم سریع با دامنهی جدید تطبیق پیدا کنیم.
🔍 چهار یافتهی مهم از یک مقایسه:
🔹مورد اول GigaAM3 CTC بهتنهایی:
WER کلی ۱۶.۷۲٪ – WER کلمات نادر ۲۱.۷۶٪
🔹مورد دوم GigaAM3 CTC + LM:
WER کلی ۱۵.۲۳٪ – WER کلمات نادر ۲۹.۵۹٪
یعنی اضافه کردن مدل زبانی، WER کلی را کمی بهتر کرده، اما کلمات نادر را ۳۶٪ بدتر تشخیص داده!
🔹مورد سوم T-one CTC + LM از همه بدتر:
WER کلی ۱۶.۸٪ – WER کلمات نادر ۳۷.۸۳٪
یعنی از هر سه کلمهی نادر، بیش از یک کلمه اشتباه تشخیص داده میشه.
🔹مورد چهارم اما GigaAM3 RNNT بدون LM:
WER کلی ۱۵.۶۵٪ – WER کلمات نادر ۲۰.۵۸٪
تعادل رو بهخوبی حفظ کرده.
🔹 بهترین نتیجه؟ فاینتیون GigaAM3 RNNT:
WER کلی ۱۴.۶۴٪ – WER کلمات نادر ۲۱.۲۲٪
🎯 چرا این اتفاق میافته؟
مدلهای آکوستیک مدرن (مثل Conformer) آنقدر قوی شدن که اطلاعات زبانی زیادی رو یاد گرفتن. وقتی یه LM ضعیف (با پرپلکسیتی ۱۰۰ تا ۲۰۰) رو بهش وصل میکنیم، بهجای کمک، مدل رو گیج میکنه. مخصوصاً برای کلمات نادر، پیشنهادهای اشتباه LM، تشخیص رو بدتر میکنه.
💡 پس راهکار چیه؟
بهجای ترکیب سطحی (Shallow Fusion):
✅ از مدلهای Transducer (RNNT) بدون LM خارجی استفاده کنید.
✅ مدل رو روی دادههای همون حوزه فاینتیون کنید.
✅ از بازبینی دومرحلهای (Second‑pass Rescoring) با یه LLM سبک استفاده کنید.
✅ از سوگیری زمینهای (Contextual Biasing) برای تقویت کلمات کلیدی استفاده کنید.
🔗 منابع برای مطالعه بیشتر:
- [Improving Rare Word Recognition with LM-aware MWER Training](https://ar5iv.labs.arxiv.org/html/2204.07553)
- [Mask The Bias: Improving Domain-Adaptive Generalization of CTC-based ASR](https://ar5iv.labs.arxiv.org/html/2305.03837)
- [CTC-Assisted LLM-Based Contextual ASR](https://ar5iv.labs.arxiv.org/html/2411.06437)
#ASR #SpeechRecognition #NLP #CTC #LM
🆔 @asrgooyeshpardaz | 1 469 |
| 15 | 👾 ماشینها آدمها را به شکل خودشان میخواهند
مجله Harvard Business Review توی گزارشی گفته که هوش مصنوعی داره فرایند استخدام رو خراب میکنه. رزومهها قابل اعتماد نیستن، مصاحبههای آنلاین امکان سواستفاده و فریب دادن کارفرما را دارند، و شرکتها به جای بهترین کارمند، بهترین مصاحبه شونده را استخدام میکنن. پیشنهادش هم اینه که به جای سوالات تکراری، از شبیهسازیهای کاری واقعی استفاده کنیم.
اما بیایید یک قدم عقبتر برویم و به خودِ این نگاه نقد کنیم.
وقتی ماشینها را به عنوان «داوران کامل» مینشانیم و آدمها را با معیارهای ماشینی میسنجیم، چه اتفاقی میافتد؟
آدمها ضعف دارند. دروغ میگویند. اشتباه میکنند. تقلب میکنند. گاهی بینظم اند، گاهی غیرمنطقی. اما همین نقصهاست که آنها را انسان میکند. همین آشفتگی است که منشأ خلاقیت، همدلی، و تصمیمگیریهای غیرخطی و در عین حال درست است.
اما یک ماشین طوری طراحی میشود که همیشه کامل به نظر برسد. بیخطا، بیاحساس، بیتغییر.
حالا اگر ما سیستمهای استخدامی را طوری طراحی کنیم که فقط «ماشینهای انسانی» را گزینش کنند— آنهایی که بینقص رزومه مینویسند، بینقص مصاحبه میدهند، بینقص از پس آزمونها برمیآیند — در واقع داریم چه کسانی را پرورش میدهیم؟
کسانی را که یاد گرفتهاند مثل ماشین رفتار کنند.
ماشینهای کامل، موجودات ترسناکی هستند.
تاریخ این را به ما نشان داده. ارتش نازیها قواعد و اصول دقیقی داشت. مثل یک ارتش ماشینی، منظم، بینقص و بیچونوچرا عمل میکرد و نتیجه چه شد؟ دنیا را به مرز نابودی کشاند. چون انسانیت در آن سیستم جایی نداشت؛ فقط اطاعت و دقت و اجرا وجود داشت.
ماشینهای هوشمند ما را به شکل خودشان میخواهند. نه با زور، بلکه با تغییر معیارها. با بازتعریف «شایستگی». با سیستمهایی که فقط کسانی را برمیگزینند که شبیه به خروجی یک مدل زبانی هستند.
نتیجه چیست؟ نسلی از آدمهای ماشینی که برای «پاس کردن» تربیت شدهاند، نه برای «فکر کردن». که برای «بینقص به نظر رسیدن» تلاش میکنند، نه برای «انسان بودن».
شاید مشکل فقط این نباشد که هوش مصنوعی روند استخدام را خراب کرده است. شاید مشکل این باشد که ما داریم استخدام را به ابزاری برای ماشینیسازی انسانها تبدیل میکنیم. و این، از هر رزومهی جعلی و هر مصاحبهی فریبدهندهای، خطرناکتر است.
🔗 HBR – AI Has Broken Hiring
#استخدام #هوش_مصنوعی #انسانیت #ماشینی_شدن #HBR | 1 516 |
| 16 | 🔍 افشای سناتور درباره Mythos و NSA
مارک وارنر، معاون رئیس کمیته اطلاعات سنا، به تازگی اعلام کرده که ژنرال جاشوا راد، رئیس آژانس امنیت ملی آمریکا (NSA)، به او گفته است که هوش مصنوعی Mythos موفق شده «تقریباً تمام سیستمهای سری آژانس را نه در عرض هفتهها، بلکه در عرض چند ساعت هک کند». 🕒
اما پیش از هرگونه نتیجهگیری، چند نکته کلیدی را باید در نظر داشت:
🚨 این رویداد یک حمله واقعی نبود، بلکه یک آزمایش کنترلشده امنیتی (Red Team) بر روی شبکههای خودِ آژانس بود. هدف از این تمرین، شناسایی نقاط ضعف و رفع آنها پیش از آنکه توسط مهاجمان واقعی بهرهبرداری شوند، بوده است. 🛡
به گفته وارنر، هدف از طرح این موضوع، ایجاد ترس و وحشت نیست، بلکه تأکید بر ضرورت انجام تستهای پیش از انتشار برای مدلهای پیشروی هوش مصنوعی است تا پیش از ورود به بازار، آسیبپذیریهای احتمالی آنها شناسایی و برطرف شود.
با این حال، اقتصاددان و سایر کارشناسان نسبت به برداشت سطحی از این خبر هشدار دادهاند. آنها تأکید میکنند که این آزمایش در شرایط بسیار خاص و با دسترسیهای ویژه انجام شده و خود مدل Mythos نیز به تنهایی عمل نکرده، بلکه در کنار سایر ابزارها و روشها مورد استفاده قرار گرفته است. ⚠️
💎 خلاصه و جمعبندی:
این خبر اگرچه جنجالی و توجهبرانگیز است، اما واقعیت آن چندان هولناک نیست. هوش مصنوعی در حال حاضر قادر به نفوذ به سامانههای NSA در یک سناریوی واقعی نیست. اما این رویداد، یک زنگ هشدار جدی است که نشان میدهد با افزایش توانمندیهای هوش مصنوعی، نیاز به نظارت و ایمنسازی این فناوری بیش از پیش احساس میشود. آینده نیازمند توجه جدی و اقدامات پیشگیرانه است. 🤔📰
#AI #Anthropic #Mythos
🆔 @asrgooyeshpardaz | 1 652 |
| 17 | نظریه «اینترنت مرده» در عمل
بازی World of Warcraft اکنون سروری بدون انسان دارد - در عوض، خانه ۱۸۰۰ ربات است که توسط DeepSeek پشتیبانی میشوند. این رباتها مانند بازیکنان معمولی رفتار میکنند: آنها چت میکنند، شخصیتها را ارتقا میدهند، سیاهچالها را اداره میکنند و حتی با یکدیگر میجنگند. در نتیجه، دنیای بازی کاملاً زنده به نظر میرسد.
#AI #DeepSeek
🆔 @asrgooyeshpardaz | 1 547 |
| 18 | مایکل جکسون خسته | 1 602 |
| 19 | 🔓 گذار از ترس به واقعیت: واشنگتن و آنتروپیک به راهکاری عملی برای دسترسی به Mythos و Fable نزدیک میشوند
به نظر میرسد دولت آمریکا و شرکت Anthropic به نخستین چارچوب عملی برای بازگرداندن دسترسی به مدلهای قدرتمند خود (Mythos 5 و Fable 5) دست یافتهاند، بدون آنکه تظاهر به «از بین بردن کامل جیلبریک» کنند. این تغییر رویکرد، نشاندهنده بلوغ تدریجی مقرراتگذاری هوش مصنوعی؛ از ترسهای مبهم به سمت مدلی عینیتر و مبتنی بر سناریوهای مشخص است.
🔄 از «آسیبپذیری مطلق» به «مدیریت ریسک»
واقعیت این است که حذف کامل حملات جیلبریک، احتمالاً ناممکن است. به همین دلیل، رویکرد جدید بر ارزیابی عمق و پیامدهای یک حمله موفق متمرکز است، نه صرفاً ثبت وقوع آن. به عبارت دیگر، به جای پرسش «آیا مدل جیلبریک شده است؟»، پرسشهای کلیدی عبارتند از:
🔹 چقدر از محافظتها دور زده شده است؟ (گستره نقض امنیت)
🔹 چه قابلیتهایی در دسترس مهاجم قرار گرفته است؟**گ (شدت دسترسی)
🔹 آیا حمله بهسادگی قابل تکرار است؟ (هزینه و پیچیدگی حمله)
🔹 آیا این دسترسی به پیامدهای عملیاتی واقعی منجر میشود؟ (تأثیر دنیای واقعی)
این معیارها، راهی برای ایجاد زبان مشترک میان تنظیمکنندگان و توسعهدهندگان فراهم میآورد تا بتوانند شدت یک تهدید را سنجیده و مرز میان «یک ترفند آزمایشگاهی» و «یک ریسک واقعی» را ترسیم کنند.
🧪 شواهد از میدان آزمایش (Red-Teaming)
تحقیقات اخیر تیمهای «کلاه قرمز» (Red-Team) نشان داده است که حتی پیشرفتهترین مدلهای هوش مصنوعی (Frontier Models) نیز در برابر حملات طولانی و خودکار، همچنان میتوانند پاسخهای مضر تأییدشده تولید کنند. در این آزمایشها، مدل Fable 5 اگرچه در مقایسه با Opus 4.8 مقاومت بیشتری از خود نشان داد، اما هرگز به «شکستناپذیری» کامل دست نیافت. این یافته، رویکرد مبتنی بر «مدیریت ریسک» را بیش از پیش تقویت میکند.
📋 چارچوب ارزیابی جدید برای مدلهای آینده
بر اساس این رویکرد، ارزیابی مدلهای جدید حول محور سوالات کلیدی زیر ساختار خواهد یافت:
۱. دامنه نقض: محافظتهای مدل تا چه حد دور زده شدهاند؟ آیا حمله به یک آسیبپذیری خاص محدود است یا حوزه وسیعی از قابلیتها را پوشش میدهد؟
۲. شدت دسترسی: چه قابلیتهای خاصی (مانند تولید کد مخرب، مهندسی معکوس یا دسترسی به دادههای حساس) برای مهاجم افشا شده است؟
۳. قابلیت تکرار: آیا حمله نیازمند تخصص بالا، زمان طولانی یا منابع محاسباتی عظیم است، یا هر کاربر معمولی نیز میتواند آن را تکرار کند؟
۴. پیامد عملیاتی: آیا پیامدهای حمله صرفاً تئوری است، یا میتواند به طور مستقیم به آسیبپذیریهای واقعی و قابل بهرهبرداری در دنیای خارج منجر شود؟
🔭 چشمانداز آینده
این چارچوب جدید، نشاندهنده گذار از یک رویکرد دودویی (امن/ناامن) به رویکردی طیفی (ارزیابی عمق و شدت ریسک) است. نتیجه این تغییر، نه تنها مسیر بازگشت مدلهای قدرتمندی مانند Mythos و Fable را هموار میکند، بلکه زمینهساز یک مدل نظارتی شفافتر و مبتنی بر شواهد برای کل صنعت هوش مصنوعی خواهد شد. این رویکرد به توسعهدهندگان اجازه میدهد تا بر تقویت نقاط ضعف خاص متمرکز شوند و به جای مبارزه با یک مشکل لاینحل (جیلبریک کامل)، بر مدیریت پیامدهای آن سرمایهگذاری کنند.
#AI #Regulation #Anthropic #Cybersecurity
🆔 @asrgooyeshpardaz | 2 066 |
| 20 | 🌐 اخبار هوش مصنوعی
👩💻 در نسخه macOS Codex، قابلیت ضبط و پخش عملیات اضافه شد
شرکت OpenAI قابلیت Record and Replay را برای خودکارسازی کارهای تکراری دسکتاپ به Codex افزوده است. این ابزار عملیات تکراری کاربر را ضبط کرده و آنها را به یک الگوریتم ساختاریافته تبدیل میکند.
کاربر فرایند ضبط را به صورت دستی کنترل میکند. پس از ضبط عملیات، مدل یک اسکریپت قابل ویرایش تولید میکند که میتوان آن را برای اجرا در آینده ذخیره کرد.
این قابلیت در حال حاضر به صورت یک تنظیم اختیاری (opt-in) و فقط در نسخه macOS در دسترس است. برای استفاده از آن، باید مجوز ویژه Computer Use فعال شود. به دلیل محدودیتهای منطقهای، این قابلیت در کشورهای منطقه اقتصادی اروپا، بریتانیا و سوئیس در دسترس نیست.
منبع: پست OpenAI Developers در شبکه اجتماعی X
---
📊 Artificial Analysis بنچمارکی برای سنجش هوش مصنوعی در پروژههای کسبوکار منتشر کرد
آزمون AA-Briefcase با همکاری گوگل، مککینزی و بوستون کانسالتینگ گروپ (BCG) توسعه یافته است. این آزمون شامل ۹۱ وظیفه است که فرایندهای حوزههایی مانند علم داده، مدیریت محصول، بانکداری و صنعت را شبیهسازی میکند. مدلها بر اساس کیفیت تحلیل، دقت پاسخها و قالب دادهها رتبهبندی میشوند.
مدل Fable 5 در صدر این ردهبندی قرار دارد و مدلهای Opus 4.8 و GLM-5.2 به ترتیب در جایگاه دوم و سوم ایستادهاند. نرخ موفقیت کلی همچنان پایین است؛ مدل برتر تنها در ۳٪ موارد به موفقیت ۱۰۰٪ دست یافته و در ۳۱ وظیفه نتوانسته نیمی از امتیاز را کسب کند. در بخش مدلهای متنباز، GLM-5.2 با وجود قیمت چهار برابر ارزانتر، ۹۰ امتیاز از Opus 4.8 عقبتر است.
هزینه اجرای هر وظیفه از ۴ سنت برای DeepSeek V4 تا ۳۱ دلار برای Fable 5 متغیر است. بنچمارک نشان داده که مدلهای برتر برای عبور از آزمونها، به طور منظم به ابزارهای تحلیل بصری نیاز داشتهاند.
منبع: artificialanalysis.ai
---
🧬 گوگل دیپمایند دو ستاره هوش مصنوعی خود را در یک هفته از دست داد
جان جامپر، رهبر پروژه AlphaFold و برنده جایزه نوبل شیمی ۲۰۲۴، پس از نزدیک به ۹ سال فعالیت در این بخش، تصمیم به پیوستن به Anthropic گرفته است. جامپر با توسعه الگوریتمی که انقلابی در پیشبینی ساختار سهبعدی پروتئینها ایجاد کرد، به شهرت جهانی رسید و این جایزه را با دمیس هاسابیس تقسیم کرد.
اندکی پیش از این، نوام شازیر نیز خروج خود از گوگل دیپمایند را برای پیوستن به OpenAI اعلام کرد. شازیر یکی از اعضای کلیدی تیم توسعه Gemini و از معماران اصلی معماری استدلال در مدلهای زبانی گوگل بود.
در مجموع، تنها در چند روز، Anthropic و OpenAI موفق به جذب دو تن از مهمترین متخصصانی شدند که مستقیماً مسیر توسعه محصولات هوش مصنوعی این غول جستجو را تعیین میکردند.
منبع: پستهای John Jumper و Noam Shazeer در شبکه اجتماعی X
---
🤖 Genesis AI از ربات چرخدار تاشو رونمایی کرد
این استارتاپ که مورد حمایت اریک اشمیت قرار دارد، از ربات چرخدار تاشو خود به نام Eno بر پایه مدل اختصاصی GENE رونمایی کرده است.
برخلاف پلتفرمهای دوپا، Eno روی یک شاسی چرخدار با یک پایه قابل تنظیم از پنلهای مفصلی حرکت میکند. این دستگاه میتواند ارتفاع خود را در حین حرکت تغییر داده و تا ابعاد یک چمدان جمع شود.
این ربات به بازوهایی با ۲۰ درجه آزادی فعال و بازخورد حسی مجهز است. مدل GENE به عنوان یک عامل فیزیکی (physical agent) عمل میکند و محیط را تحلیل کرده، بدون نیاز به سناریوهای از پیش برنامهریزیشده، خود را با تغییرات وفق میدهد.
Genesis AI چندین ده نمونه پیشتولید جمعآوری کرده است. این شرکت تا پایان سال برنامهریزی کرده تا تولید خود را برای کاربردهای لجستیک انباری آغاز کند و در آینده این دستگاه را به هتلها، بیمارستانها و بخش مصرفکننده نیز عرضه نماید.
منبع: genesis.ai
---
📚 نروژ استفاده از هوش مصنوعی را در دوره ابتدایی ممنوع کرد
از پایان ماه اوت، دسترسی دانشآموزان پایههای اول تا هفتم (۶ تا ۱۳ سال) به ابزارهای هوش مصنوعی مولد در مدارس نروژ بسته خواهد شد.
در دوره راهنمایی (۱۴ تا ۱۶ سال)، استفاده از شبکههای عصبی تنها با نظارت معلمان مجاز است. آموزش کار با الگوریتمها نیز منحصراً به دانشآموزان دبیرستانی اختصاص خواهد یافت.
دولت نروژ معتقد است که هوش مصنوعی به دانشآموزان امکان میدهد فرایندهای آموزشی را دور بزنند و به یادگیری پایهای خواندن، نوشتن و ریاضیات آسیب میزند. مقامات این کشور کاهش کلی نرخ موفقیت تحصیلی از سال ۲۰۱۵ را مستقیماً به دیجیتالیسازی آموزش مرتبط میدانند.
منبع: reuters.com
---
#news #ai
🆔 @asrgooyeshpardaz | 1 856 |
¡Ya disponible! Investigación de Telegram 2025 — los principales insights del año 
