es
Feedback
عصر گویش | هوش مصنوعی

عصر گویش | هوش مصنوعی

Ir al canal en Telegram

مجله هوش مصنوعی عصر گویش 021 61931000

Mostrar más

📈 Análisis del canal de Telegram عصر گویش | هوش مصنوعی

El canal عصر گویش | هوش مصنوعی (@asrgooyeshpardaz) en el segmento lingüístico de Farsi es un actor destacado. Actualmente la comunidad reúne a 102 065 suscriptores, ocupando la posición 1 227 en la categoría Tecnologías y Aplicaciones y el puesto 2 923 en la región Irán.

📊 Métricas de audiencia y dinámica

Desde su creación el невідомо, el proyecto ha mostrado un crecimiento acelerado, reuniendo a 102 065 suscriptores.

Según los últimos datos del 25 junio, 2026, el canal mantiene una actividad estable. En los últimos 30 días la variación de miembros fue de -1 721, y en las últimas 24 horas de -83, conservando un alto alcance.

  • Estado de verificación: No verificado
  • Tasa de interacción (ER): El promedio de interacción de la audiencia es 2.25%. Durante las primeras 24 horas tras publicar, el contenido suele obtener 1.03% de reacciones respecto al total de suscriptores.
  • Alcance de las publicaciones: Cada publicación recibe en promedio 2 296 visualizaciones. En el primer día suele acumular 1 052 visualizaciones.
  • Reacciones e interacción: La audiencia responde de forma activa: el promedio de reacciones por publicación es 3.
  • Intereses temáticos: El contenido se centra en temas clave como مدل, گفتار, به‌طور, عامل, ابزار.

📝 Descripción y política de contenido

El autor describe el recurso como un espacio para expresar opiniones subjetivas:
مجله هوش مصنوعی عصر گویش 021 61931000

Gracias a la alta frecuencia de actualizaciones (últimos datos recibidos el 26 junio, 2026), el canal mantiene la vigencia y un amplio alcance. La analítica demuestra que la audiencia interactúa activamente con el contenido, lo que lo convierte en un punto de referencia dentro de la categoría Tecnologías y Aplicaciones.

102 065
Suscriptores
-8324 horas
-1587 días
-1 72130 días
Atraer Suscriptores
junio '26
junio '26
+117
en 1 canales
mayo '260
en 0 canales
Get PRO
abril '260
en 0 canales
Get PRO
marzo '260
en 0 canales
Get PRO
febrero '260
en 0 canales
Get PRO
enero '260
en 2 canales
Get PRO
diciembre '25
+1
en 4 canales
Get PRO
noviembre '250
en 7 canales
Get PRO
octubre '250
en 6 canales
Get PRO
septiembre '250
en 5 canales
Get PRO
agosto '250
en 5 canales
Get PRO
julio '250
en 1 canales
Get PRO
junio '250
en 4 canales
Get PRO
mayo '25
+2
en 1 canales
Get PRO
abril '250
en 1 canales
Get PRO
marzo '250
en 0 canales
Get PRO
febrero '250
en 0 canales
Get PRO
enero '250
en 0 canales
Get PRO
diciembre '24
+352
en 1 canales
Get PRO
noviembre '24
+588
en 0 canales
Get PRO
octubre '24
+53
en 4 canales
Get PRO
septiembre '24
+65
en 5 canales
Get PRO
agosto '24
+14
en 6 canales
Get PRO
julio '24
+317
en 6 canales
Get PRO
junio '24
+490
en 5 canales
Get PRO
mayo '240
en 4 canales
Get PRO
abril '24
+452
en 4 canales
Get PRO
marzo '24
+2 402
en 5 canales
Get PRO
febrero '24
+5 784
en 9 canales
Get PRO
enero '24
+8 641
en 14 canales
Get PRO
diciembre '23
+17 410
en 7 canales
Get PRO
noviembre '23
+7 494
en 9 canales
Get PRO
octubre '23
+10 370
en 8 canales
Get PRO
septiembre '23
+14 111
en 0 canales
Get PRO
agosto '23
+5 803
en 0 canales
Get PRO
julio '23
+5 026
en 0 canales
Get PRO
junio '23
+7 915
en 0 canales
Get PRO
mayo '23
+21 355
en 0 canales
Get PRO
abril '23
+43 552
en 0 canales
Get PRO
marzo '23
+59 493
en 0 canales
Get PRO
febrero '23
+3 388
en 0 canales
Get PRO
enero '23
+1 433
en 0 canales
Get PRO
diciembre '22
+517
en 0 canales
Get PRO
noviembre '22
+498
en 0 canales
Get PRO
octubre '22
+274
en 0 canales
Get PRO
septiembre '22
+464
en 0 canales
Get PRO
agosto '22
+721
en 0 canales
Get PRO
julio '22
+599
en 0 canales
Get PRO
junio '22
+1 527
en 0 canales
Get PRO
mayo '22
+2 541
en 0 canales
Get PRO
abril '22
+1 061
en 0 canales
Get PRO
marzo '22
+1 666
en 0 canales
Get PRO
febrero '22
+2 147
en 0 canales
Get PRO
enero '22
+6 134
en 0 canales
Get PRO
diciembre '21
+4 172
en 0 canales
Get PRO
noviembre '21
+4 271
en 0 canales
Get PRO
octubre '21
+4 181
en 0 canales
Get PRO
septiembre '21
+1 061
en 0 canales
Get PRO
agosto '21
+13 231
en 0 canales
Get PRO
julio '21
+5 069
en 0 canales
Get PRO
junio '21
+2 973
en 0 canales
Get PRO
mayo '21
+3 700
en 0 canales
Get PRO
abril '21
+5 497
en 0 canales
Get PRO
marzo '21
+9 553
en 0 canales
Get PRO
febrero '21
+5 411
en 0 canales
Get PRO
enero '21
+3 903
en 0 canales
Get PRO
diciembre '20
+46 342
en 0 canales
Fecha
Crecimiento de Suscriptores
Menciones
Canales
26 junio+5
25 junio0
24 junio0
23 junio+3
22 junio+4
21 junio+4
20 junio+23
19 junio+15
18 junio0
17 junio+36
16 junio+27
15 junio0
14 junio0
13 junio0
12 junio0
11 junio0
10 junio0
09 junio0
08 junio0
07 junio0
06 junio0
05 junio0
04 junio0
03 junio0
02 junio0
01 junio0
Publicaciones del Canal
🎵 معرفی SPEAR XLarge v2 – رمزگذار متن‌باز پیشرفته برای گفتار و صدا مدل SPEAR XLarge v2 به‌عنوان پرچم‌دار رمزگذارهای متن‌باز SPEAR، برای یادگیری یکپارچه‌ی بازنمایی گفتار و صداهای عمومی طراحی شده. این نسخه‌ی پذیرفته‌شده در کنفرانس ICML 2026 بوده و نسبت به نسخه‌ی قبلی (v1)، با افزودن Token Mixing برای صحنه‌های آکوستیک پیچیده بهینه‌تر شده و عملکرد بهتری در گفتار هم‌پوشان، صداهای نویزی و ترکیب‌های صوتی دنیای واقعی ارائه می‌دهد. --- ⚙️ مشخصات فنی - پشتیبان (Backbone): Zipformer با حدود ۶۰۰ میلیون پارامتر و ۱۳ پشته‌ی Zipformer - خروجی: بازنمایی‌های سطح فریم با ابعاد ۱۲۸۰ و نرخ تقریباً ۵۰ هرتز از شکل‌موجهای ۱۶ کیلوهرتز --- 📊 داده‌های پیش‌آموزش مدل روی ۱۹۷٬۰۰۰ ساعت داده‌ی ترکیبی آموزش دیده است: - ۱۸۴٬۰۰۰ ساعت داده‌ی گفتاری شامل دیتاست‌های Libriheavy (~۵۰k ساعت)، Gigaspeech (~۱۰k)، VoxPopuli (~۲۴k) و yodas-granary (~۱۰۰k ساعت) - ۱۳٬۰۰۰ ساعت داده‌ی صوتی عمومی شامل AudioSet (~۵k)، Freesound (~۲.۸k)، Music4all (~۱k)، VGGSound (~۵۰۰) و MTG-Jamendo (~۳.۸k ساعت) --- 🏆 عملکرد درخشان این مدل در هر دو معیار اصلی SUPERB (ارزیابی بازنمایی گفتار) و HEAR (ارزیابی بازنمایی صدای عمومی) به نتایج پیشرو (SOTA) دست یافته است. نتایج تنظیم دقیق روی LibriSpeech (تشخیص خودکار گفتار): - با داده‌ی LS960، نرخ خطای کلمه (WER) در مجموعه‌ی test-clean به ۱٫۶٪ و در test-other به ۲٫۹٪ رسیده است. نتایج تنظیم دقیق روی AudioSet (برچسب‌گذاری صوتی): - با داده‌ی AudioSet Balanced، امتیاز mAP برابر ۳۹٫۴ و با داده‌ی Full به ۵۰٫۰ دست یافته است. --- 📄 درباره‌ی مقاله نویسندگان: Xiaoyu Yang, Yifan Yang, Zengrui Jin, Ziyun Cui, Wen Wu, Baoxiang Li, Chao Zhang, Phil Woodland ایده‌ی اصلی: بیشتر مدل‌های SSL موجود یا برای گفتار بهینه‌سازی شده‌اند یا برای صداهای عمومی، اما SPEAR این شکاف را با تقطیر دانش مکمل از دو معلم SSL (یکی متمرکز بر گفتار و دیگری بر صدای عمومی) در یک مدل یکپارچه پر می‌کند. استفاده از کوانتیزاسیون برداری با چند کدبوک باعث تولید توکن‌های گسسته‌ای می‌شود که هم اطلاعات معنایی و هم آکوستیک را در بر دارند. --- 📜 مجوز: Apache-2.0 🔗 لینک مدل: https://huggingface.co/marcoyang/spear-xlarge-speech-audio-v2 --- #اخبار_هوش_مصنوعی #AI #ML #SPEAR #ICML2026 #پردازش_گفتار #صدا 🆔 @asrgooyeshpardaz

2
صدای مجری مشهور آمریکایی هم از جنایت ارتش ایالات متحده درآمد 🔹بازیکنان تیم ملی ایران در آخرین یادداشت خود دوباره از کودکان م
صدای مجری مشهور آمریکایی هم از جنایت ارتش ایالات متحده درآمد 🔹بازیکنان تیم ملی ایران در آخرین یادداشت خود دوباره از کودکان میناب یاد کردند 🔹شرم بر ما که پس از کشتار این کودکان توسط ارتش آمریکا هنوز سکوت کرده‌‌ایم... @isna94
1 880
3
مدل Qwen-AgentWorld از Claude Opus و GPT-5.4 در بنچمارک جدید عامل‌ها پیشی گرفت. شرکت Qwen مدل‌های open-weight جدیدی را منتشر
مدل Qwen-AgentWorld از Claude Opus و GPT-5.4 در بنچمارک جدید عامل‌ها پیشی گرفت. شرکت Qwen مدل‌های open-weight جدیدی را منتشر کرده است که محیط‌های واقعی برای عامل‌ها را شبیه‌سازی می‌کنند: وب، ترمینال، برنامه‌نویسی، جستجو، سیستم‌عامل و اندروید. نکات اصلی: • مدل 397B امتیاز 58.71 کسب کرد و از Opus 4.8 / GPT-5.4 پیشی گرفت • مدل 35B MoE از Sonnet 4.6 پیشی گرفت • افزایش قابل توجه در وظایف برنامه‌نویسی، وب و ترمینال • وزن‌ها هم‌اکنون در Hugging Face در دسترس هستند مقاله: https://arxiv.org/abs/2606.24597 وبلاگ: https://qwen.ai/blog?id=qwen-agentworld گیت‌هاب: https://github.com/QwenLM/Qwen-AgentWorld HuggingFace: https://huggingface.co/collections/Qwen/qwen-agentworld ModelScope: https://modelscope.cn/collections/Qwen/Qwen-AgentWorld
2 109
4
📌 وال استریت ژورنال: قراردادهای تجاری OpenAI با رشد سرمایه‌گذاری شخصی سم آلتمن گره خورده است روزنامه وال استریت ژورنال با استناد به اسناد دادگاه پرونده «ایلان ماسک علیه OpenAI»، از ارتباط نزدیک قراردادهای این شرکت با افزایش ثروت شخصی مدیرعامل آن خبر داده است. جالب اینجاست که خود آلتمن سهمی در مالکیت OpenAI ندارد و درآمدش به شدت به سرمایه‌گذاری‌های خارجی وابسته است. 🟡 مکانیزم اثرگذاری شرکت OpenAI با یک استارتاپ قرارداد همکاری می‌بندد و باعث افزایش ارزش آن می‌شود. در ادامه، سهام‌داران بزرگی مثل Thrive Capital یا شرکای تجاری مثل SoftBank سهام آن استارتاپ را می‌خرند. از آنجایی که آلتمن شخصاً در آن استارتاپ‌ها سرمایه‌گذاری کرده، ثروتش به طور غیرمستقیم افزایش پیدا می‌کند. 🟡 بررسی سه مورد عینی 🔹 هلیون (Helion): در سال ۲۰۲۵، آلتمن پیشنهاد سرمایه‌گذاری ۵۰۰ میلیون دلاری OpenAI در این استارتاپ همجوشی هسته‌ای را داد (که با نگرانی کارکنان مواجه شد). در مارس ۲۰۲۶ قرارداد همکاری جدیدی بستند و او برای رفع تعارض منافع از هیئت مدیره کنار رفت. نهایتاً در ژوئن ۲۰۲۶، ارزش هلیون به ۱۵.۵ میلیارد دلار رسید و سهام آلتمن حداقل ۴.۱ میلیارد دلار ارزش پیدا کرد. 🔹 سربراس (Cerebras): پس از دریافت تعهد خرید از سوی OpenAI و انجام عرضه اولیه (IPO)، ارزش سهام آلتمن در این شرکت تراشه‌سازی نسبت به دسامبر ۲۰۲۵، بیش از ۶ برابر افزایش یافت. 🔹 رترو بایوساینسز (Retro Biosciences): پس از امضای قرارداد همکاری علمی با OpenAI، سهام آلتمن در این شرکت فعال در حوزه افزایش عمر، تا دسامبر ۲۰۲۵ به ۲۵۸ میلیون دلار رسید. 📊 طبق گزارش WSJ، حداقل ۱۰ شرکت در پرتفوی سرمایه‌گذاری آلتمن با OpenAI قرارداد تجاری دارند. 🏛️ واکنش نهادهای نظارتی کمیته نظارت مجلس نمایندگان آمریکا تحقیق رسمی را آغاز کرده و دادستان‌های چند ایالت از کمیسیون بورس و اوراق بهادار (SEC) خواسته‌اند تا پیش از عرضه اولیه سهام OpenAI، این موضوع را بررسی کنند. البته خود آلتمن و مقامات شرکت‌های مربوطه معتقدند که این نوع همکاری‌ها، رویه‌ای کاملاً عادی و رایج در دنیای تجارت است. #اخبار_هوش_مصنوعی #AI #ML 🆔 @asrgooyeshpardaz
1 710
5
🦾 یونیتری R1 | قیمت از ۴۹۰۰ دلار.
🦾 یونیتری R1 | قیمت از ۴۹۰۰ دلار.
1 357
6
ایلان ماسک، نماد شکست یک سیستم ایلان ماسک، نخستین تریلیونر تاریخ شد. ثروتی که از دارایی نیمی از جمعیت زمین بیشتر است. اما این
ایلان ماسک، نماد شکست یک سیستم ایلان ماسک، نخستین تریلیونر تاریخ شد. ثروتی که از دارایی نیمی از جمعیت زمین بیشتر است. اما این ثروت افسانه‌ای، نه زاییده‌ی نبوغ فردی، که محصول میلیاردها دلار یارانه و قرارداد دولتی است؛ پولی که از جیب مالیات‌دهندگان تأمین شد تا امپراتوری او را از ورشکستگی نجات دهد. ماسک اما از یک یارانه‌بگیر به یک جنگ‌افروز تبدیل شده است. هوش مصنوعی او اهداف بمباران آمریکا در ایران را انتخاب می‌کند و استارلینک، ستون فقرات عملیاتی این جنگ است. بهای این فناوری «پیشرفته» چه بود؟ بمباران مدرسه‌ی دخترانه‌ی شجره‌ی طیبه در میناب و کشته شدن دست‌کم ۱۵۶ دانش‌آموز بی‌گناه. در سرمایه‌داری امروز، دولت با پول مردم، میلیاردرها را تغذیه می‌کند و آنها نیز با مکیدن خونِ ملت‌ها، ثروت بیشتری انباشت می‌کنند. ماسک، دیگر فقط یک تریلیونرِ یارانه‌بگیر نیست؛ او نماد زنده‌ی سیستمی است که جنگ، فقر و نابرابری را به سودِ معدودی، به‌قیمتِ جانِ بسیاری، مدیریت می‌کند. https://telegra.ph/investigation-06-24-4 🆔 @asrgooyeshpardaz
1 522
7
ایلان ماسک، نماد شکست یک سیستم ایلان ماسک، نخستین تریلیونر تاریخ شد؛ ثروتی که از دارایی نیمی از انسان‌های این سیاره بیشتر است
ایلان ماسک، نماد شکست یک سیستم ایلان ماسک، نخستین تریلیونر تاریخ شد؛ ثروتی که از دارایی نیمی از انسان‌های این سیاره بیشتر است. اما این ثروت افسانه‌ای، نه حاصل نبوغ فردی، که محصول میلیاردها دلار یارانه و قرارداد دولتی است. اما ماسک حالا از یک یارانه‌بگیر به یک جنگ‌افروز تبدیل شده: هوش مصنوعی او اهداف بمباران آمریکا در ایران را انتخاب می‌کند و استارلینک، ستون فقرات عملیاتی جنگ است. بهای این فناوری «پیشرفته» چیست؟ بمباران مدرسه دخترانه شجره طیبه میناب و کشته شدن ۱۵۶ دانش‌آموز. در سرمایه‌داری امروز، دولت با پول مالیات‌دهندگان، میلیاردرها را پشتیبانی می‌کند تا با مکیدن خون مردم عادی، ثروت بیشتری انباشت کنند. https://telegra.ph/investigation-06-24-4
222
8
🌐اخبار هوش مصنوعی 🛡️ شرکت OpenAI حضور خود را در حوزه امنیت سایبری گسترش می‌دهد این شرکت مدل تخصصی GPT-5.5-Cyber را برای کارشناسان امنیت اطلاعات و همچنین به‌روزرسانی افزونه Codex Security منتشر کرده است. دسترسی به مدل GPT-5.5-Cyber فقط برای کاربران تأییدشده فراهم است. این مدل برای کاهش موارد拒回答 در پردازش درخواست‌های تخصصی امنیتی تنظیم شده است. نسخه به‌روز شده Codex Security کد را اسکن می‌کند، بردارهای حمله را تحلیل می‌کند، قابلیت دسترسی به کدهای آسیب‌پذیر را بررسی و برای آنها وصله (پچ) تولید می‌کند. این ابزار از پردازش گزارش‌های باگ از اسکنرهای خارجی و خروجی داده از طریق فایل‌های SARIF یا درخواست‌های CodeQL پشتیبانی می‌کند. همچنین همراه با HackerOne و Trail of Bits، برنامه Patch the Planet را برای محافظت خودکار از پروژه‌های متن‌باز راه‌اندازی کرده است. پروژه‌های cURL، Python و Go به این برنامه پیوسته‌اند. منبع: openai.com --- 🌱 گوگل برنامه شتاب‌دهی هوش مصنوعی برای کارمندان سابق خود راه‌اندازی کرد این شرکت برنامه‌ای برای جامعه کارمندان سابق خود که پروژه‌های هوش مصنوعی ایجاد می‌کنند، معرفی کرده است. هدف این ابتکار جلوگیری از مهاجرت استعدادها به رقبا است. گوگل قصد دارد پروژه‌های جدید را در مراحل اولیه جذب کند تا رهبران آینده بازار را به زیرساخت Google Cloud متصل نگه دارد. در مرحله اول ۱۲ هفته‌ای، ۱۰ تا ۲۰ تیم انتخاب خواهند شد. هر تیم تا ۱۰۰ هزار دلار بودجه مستقیم و ۳۵۰ هزار دلار اعتبار برای خدمات ابری دریافت می‌کند. شرکت‌کنندگان همچنین به مدل‌های گوگل قبل از انتشار عمومی دسترسی خواهند داشت. شرکای این پروژه شامل استودیوی سرمایه‌گذاری Key Studio و پلتفرم Xoogler.co (با بیش از ۳۵ هزار عضو از کارمندان سابق گوگل در سراسر جهان) هستند. مربیگری توسط مدیران ارشد با تجربه، از جمله ماریسا مایر (مدیرعامل سابق یاهو) انجام می‌شود. منبع: bloomberg.com --- 🤖 انویدیا از پلتفرم ایمنی برای ربات‌های فیزیکی رونمایی کرد پلتفرمHalos for Robotics یک پلتفرم سخت‌افزاری-نرم‌افزاری برای تعامل ایمن ربات‌های خودمختار با انسان‌ها در محیط‌های صنعتی است. بخش سخت‌افزاری شامل ماژول IGX Thor و دروازه سنسور Holoscan Sensor Bridge برای پردازش داده‌های حسگرها است. بخش نرم‌افزاری بر پایه Halos OS با هسته Halos Core ساخته شده و از سیستم‌های عامل بلادرنگ تأییدشده مانند BlackBerry QNX پشتیبانی می‌کند. انویدیا یک طرح مرجع متن‌باز برای ایمنی منتشر کرده که از دوربین‌های خارجی برای نظارت بر نقاط کور ربات استفاده می‌کند. همچنین یک آزمایشگاه تأیید با مجوز ANSI برای تست انطباق محصولات راه‌اندازی کرده است. شرکت Agility Robotics اولین یکپارچه‌کننده این فناوری است و قطعات Halos را در ربات‌های Digit خود پیاده‌سازی می‌کند. منبع: nvidia.com --- 📢 شرکت ElevenLabs ابزار محلی‌سازی تبلیغات را منتشر کرد موتور Ads Engine موتوری برای ترجمه خودکار تبلیغات به ۵۰ زبان است. این سیستم با پنل‌های تبلیغاتی یکپارچه می‌شود، مواد اولیه را دریافت، محلی‌سازی و دوباره بارگذاری می‌کند. این ابزار از فناوری Dubbing V2 استفاده می‌کند که صدا را ترجمه و صدای گوینده را با حفظ لحن اصلی کپی می‌کند. همچنین ویدیو را تطبیق می‌دهد: زیرنویس‌ها را ترجمه و ترکیب فریم‌ها را تغییر می‌دهد. سیستم نظارت بر عملکرد نیز تعبیه شده است که کاهش نرخ تبدیل را ردیابی کرده و در صورت نیاز به تغییر محتوا هشدار می‌دهد. قابلیت نظارت و بازبینی دستی در طرح Scale موجود است. امکانات پایه Ads Engine در اشتراک Pro گنجانده شده (با محدودیت در تعداد حساب‌های تبلیغاتی، زبان‌ها و تولیدات). این ابزار فقط از طریق وب در دسترس است و API ندارد. منبع: elevenlabs.io --- 📉 اوراکل ۲۱ هزار کارمند خود را در بحبوحه بازسازی کسب‌وکار حول هوش مصنوعی تعدیل کرد این شرکت نیروی خود را ۱۳ درصد کاهش داده (از ۱۶۲ هزار به ۱۴۱ هزار نفر). بر اساس گزارش سالانه، تعدیل ۲۱ هزار نفر به دلیل پیاده‌سازی هوش مصنوعی در فرایندهای داخلی و تخصیص مجدد منابع است. هزینه‌های پایان کار و هزینه‌های مرتبط به ۱.۸ میلیارد دلار رسیده که ۵ برابر بیشتر از هزینه بازسازی سال قبل است. بودجه صرفه‌جویی‌شده صرف ساخت مراکز داده جدید خواهد شد. اوراکل به تغییر ساختار واحدهای مهندسی خود با تمرکز بر خدمات ابری و محصولات هوش مصنوعی ادامه خواهد داد. منبع: bbc.com --- #news #ai 🆔 @asrgooyeshpardaz
1 571
9
🌐اخبار هوش مصنوعی 🎬 به‌روزرسانی مدل ویدیویی HappyHorse از علی‌بابا نسخه ۱.۱ این مدل با قابلیت‌های جدید عرضه شده است: - پردازش پرامپت‌های بیش از ۲۵۰۰ کاراکتر - ساخت ۶ تا ۸ صحنه متوالی از یک درخواست واحد - تولید ویدیو با کیفیت FullHD - هماهنگی لب و صدا به چندین زبان ۴ حالت مختلف برای تولید: از روی متن، از روی تصویر، انتقال شخصیت بر اساس نمونه و ویرایش ویدیو. قیمت‌گذاری از طریق API: ۱۴ سنت به ازای هر ثانیه ویدیوی HD و ۱۸ سنت برای کیفیت ۱۰۸۰p. تا دو هفته اول ۴۰٪ تخفیف اعمال می‌شود. منبع: Alibaba در X --- 🧠 همکاری آنتروپیک و مایکرون در طراحی معماری حافظه دو شرکت برای بررسی رفتار سیستم‌های حافظه در آموزش و استنتاج مدل‌های زبانی بزرگ، همکاری می‌کنند. مایکرون حافظه‌های HBM، DRAM و SSD را در اختیار آنتروپیک قرار می‌دهد و آنتروپیک نیز مدل‌های Claude را برای تولید کد و خودکارسازی فرایندهای تولید در اختیار مایکرون می‌گذارد. نکته‌ی قابل توجه: مایکرون هم‌زمان هم سرمایه‌گذار آنتروپیک است و هم تأمین‌کننده‌ی تجهیزات آن. برخی تحلیلگران این نوع قرارداد را «معامله‌ی دوری» می‌نامند که می‌تواند تصویر واقعی از تقاضا در بازار سخت‌افزار هوش مصنوعی را مخدوش کند. منبع: micron.com --- 🔌 Interactions API گوگل به‌صورت عمومی منتشر شد گوگل رابط کاربری جدیدی به نام Interactions API را جایگزین متد قبلی (generateContent) در پلتفرم Google AI Studio کرده است. در این روش جدید، نقش‌های قبلی (user و model) حذف شده و هر ورودی یا فراخوانی به‌عنوان یک گام مجزا ثبت می‌شود. قابلیت‌های جدید: - مدیریت عامل‌های هوش مصنوعی - اجرای پس‌زمینه‌ی وظایف سنگین - یکپارچه‌سازی با جستجو و نقشه‌های گوگل - تولید محتوای چندرسانه‌ای - دو حالت جدید: Flex با ۵۰٪ کاهش هزینه و Priority با حداکثر سرعت منبع: blog.google --- 🗣️ تشخیص گفتار به اوبونتو می‌آید شرکت کانونیکال قصد دارد قابلیت تبدیل گفتار به متن را با نام Myna به نسخه‌ی دسکتاپ اوبونتو اضافه کند. این ابزار در نسخه‌ی Ubuntu 26.10 و برای محیط GNOME در دسترس خواهد بود. معماری Myna از سه بخش تشکیل شده: دریافت و پالایش صدا، مدیریت جلسه و پردازش در محیط ایزوله. مدل به‌صورت آفلاین و پس از دانلود وزن‌ها کار می‌کند، اما در نسخه‌های اولیه از گوش‌دادن پس‌زمینه یا ورود صوتی رمزها پشتیبانی نمی‌شود. منبع: ubuntu.com --- 📸 تصاویر Getty Images به ChatGPT اضافه می‌شوند طبق یک قرارداد چندساله، عکس‌های کتابخانه‌ی عظیم Getty Images در نتایج جستجوی ChatGPT نمایش داده می‌شوند. پیش‌تر گتی از استیبل‌دیفیوژن به دلیل استفاده‌ی غیرمجاز از تصاویرش شکایت کرده بود، اما حالا با OpenAI همکاری می‌کند. هم‌زمان، گتی در انتظار تأیید نهادهای نظارتی برای خرید رقیب خود، Shutterstock، است. جزئیات مالی قرارداد با OpenAI و اینکه آیا این شرکت اجازه‌ی استفاده از تصاویر گتی را برای آموزش مدل‌های خود دارد، هنوز مشخص نیست. منبع: gettyimages.com --- #هوش_مصنوعی #اخبار_فناوری #AI 🆔 @asrgooyeshpardaz
1 252
10
🔍 بایدو مدل Unlimited OCR را منتشر کرد - مدلی برای شناسایی اسناد طولانی در یک بار پردازش. این مدل دارای 3 میلیارد پارامتر اس
🔍 بایدو مدل Unlimited OCR را منتشر کرد - مدلی برای شناسایی اسناد طولانی در یک بار پردازش. این مدل دارای 3 میلیارد پارامتر است، اما تنها 500 میلیون فعال می‌شوند. با این حال، نتایج جدید SOTA را در OmniDocBench نسخه‌های 1.5 و 1.6 نشان می‌دهد. ویژگی اصلی - توجه پنجره لغزنده مرجع (Reference Sliding Window Attention) است. مدل بر روی موارد زیر تمرکز دارد: • سند اصلی • زمینه اخیر • کلمات بعدی و همه چیز اضافی به تدریج «فراموش» می‌شود تا محاسبات افزایش نیابد. به دلیل اندازه ثابت کش KV و توجه ارزان‌تر، Unlimited OCR می‌تواند بیش از 40 صفحه را در یک بار پردازش شناسایی کند، بدون از دست دادن زمینه و بدون کاهش سرعت. گیت‌هاب: https://github.com/baidu/Unlimited-OCR هاگینگ فیس: https://huggingface.co/baidu/Unlimited-OCR #ocr #baidu
870
11
📌 میسترال از OCR 4 رونمایی کرد؛ مدلی که اسناد را به ساختار تبدیل می‌کند شرکت میسترال (Mistral AI) از جدیدترین نسخه مدل OCR خود با نام OCR 4 رونمایی کرده است. این مدل فراتر از تشخیص متن ساده عمل کرده و اسناد را به یک ساختار منسجم و قابل استفاده تبدیل می‌کند. ✨ قابلیت‌های کلیدی: - تشخیص بلوک‌ها با جعبه‌های محدود (Bounding Boxes): هر عنصر سند (متن، جدول، عنوان، تصویر) با مختصات دقیق مشخص می‌شود. - طبقه‌بندی انواع عناصر: تشخیص خودکار انواع محتوای سند شامل عنوان، زیرعنوان، جدول، فرمول، امضا و تصویر. - نمره اطمینان در سطح صفحه و کلمه: نشان‌دهنده میزان اطمینان مدل در تشخیص هر بخش از سند. - پشتیبانی از ۱۷۰ زبان: در ۱۰ گروه زبانی مختلف. 🎯 کاربرد اصلی: هدف اصلی این مدل صرفاً «تشخیص متن» نیست، بلکه تبدیل اسناد به ساختاری است که بتوان از آن در سیستم‌های RAG، جستجوی سازمانی، ویرایش و بازبینی انسانی و خطوط لوله عامل‌های هوش مصنوعی استفاده کرد. 📊 عملکرد و نتایج: در یک مقایسه کور بر روی بیش از ۶۰۰ سند واقعی، کاربران مستقل در ۷۲٪ موارد OCR 4 را به سایر سیستم‌های پیشرو ترجیح داده‌اند. این مدل بالاترین امتیاز (۸۵.۲۰) را در بنچمارک OlmOCRBench کسب کرده و در ارزیابی چندزبانه داخلی (Crawl Multilingual) با امتیاز ۰.۹۸ از رقبا پیشی گرفته است. در بنچمارک OmniDocBench نیز امتیاز ۹۳.۰۷ را به دست آورده است. 🔒 امنیت و استقرار: مدل به اندازه‌ای جمع‌وجور است که در یک کانتینر واحد قابل استقرار است و امکان اجرای خودمیزبان (Self-hosted) را فراهم می‌کند. این ویژگی به سازمان‌ها اجازه می‌دهد اسناد خود را بدون خروج از زیرساخت اختصاصی پردازش کنند و نیازهای حاکمیتی و حریم خصوصی را برآورده سازند. 🔗 اطلاعات بیشتر: بیانیه رسمی میسترال #MistralAI #OCR #DocumentUnderstanding #AI 🆔 @asrgooyeshpardaz
774
12
🔍 مدل Unlimited-OCR از Baidu؛ یک گام فراتر از DeepSeek-OCR در پردازش اسناد طولانی شرکت بایدو به تازگی مدل OCR جدید خود با نام مدل Unlimited-OCR را به صورت متن‌باز منتشر کرده است. این مدل که با هدف «پردازش یک‌باره اسناد طولانی» (One-shot Long-horizon Parsing) طراحی شده، با تکیه بر معماری نوین و بهره‌گیری از ایده‌های الهام‌گرفته از حافظه کاری انسان، توانسته عملکردی فراتر از مدل‌های قبلی از جمله DeepSeek-OCR ارائه دهد. --- 🧠 نوآوری کلیدی: Reference Sliding Window Attention (R-SWA) چالش اصلی مدل‌های OCR مبتنی بر رمزگشای LLM، رشد خطی حافظه نهان KV با افزایش طول خروجی است که مصرف حافظه را افزایش داده و سرعت را کاهش می‌دهد. مدل‌های قبلی برای رفع این مشکل، اسناد را صفحه‌به‌صفحه و با حلقه‌های متوالی پردازش می‌کردند که فرایندی ناپیوسته و ناکارآمد است. مدل Unlimited-OCR با معرفی مکانیزم توجه R-SWA این مشکل را حل کرده است. این روش، حافظه نهان KV را از رشد خطی به یک مقدار ثابت تبدیل می‌کند. R-SWA از دو بخش تشکیل شده است: - بخش مرجع (Reference): شامل توکن‌های بصری و پرامپت که در کل فرایند رمزگشایی ثابت و قابل مشاهده هستند. - پنجره لغزنده (Sliding Window): شامل ۱۲۸ توکن اخیر که با تولید هر توکن جدید، قدیمی‌ترین توکن از پنجره خارج می‌شود و اندازه آن ثابت می‌ماند. این طراحی، مشابه حافظه کاری انسان عمل می‌کند که اطلاعات دور را به تدریج «فراموش می‌کند» و تمرکز را روی بافت نزدیک حفظ می‌کند. --- 📊 عملکرد و نتایج مدل Unlimited-OCR با معماری ۳ میلیارد پارامتری (۵۰۰ میلیون فعال) بر روی بنچمارک OmniDocBench به نتایج قابل توجهی دست یافته است: - کسب امتیاز کلی ۹۳.۹۲٪ در OmniDocBench v1.6 و ثبت رکورد جدید (SOTA). - بهبود بیش از ۶ درصد نسبت به DeepSeek-OCR در نسخه قبلی بنچمارک. - کاهش فاصله ویرایش (Edit Distance) متن از ۰.۰۷۳ به ۰.۰۳۸ و بهبود قابل توجه در تشخیص فرمول‌ها و جداول. - عملکرد چشمگیر در اسناد بلند: پردازش اسناد ۲۰ صفحه‌ای در یک بار با فاصله ویرایش ۰.۰۵۷۲ و اسناد ۴۰ صفحه‌ای با فاصله ویرایش ۰.۱۰۶۹. - توان عملیاتی ۵,۵۸۰ توکن در ثانیه که نسبت به DeepSeek-OCR بهبود ۱۲.۷٪ را نشان می‌دهد. 🔑 نکته کلیدی: در حالی که تأخیر DeepSeek-OCR با افزایش طول خروجی به طور خطی رشد می‌کند، تأخیر مدل Unlimited-OCR در تمام طول‌های توالی ثابت باقی می‌ماند. --- ⚙️ استقرار و دسترسی مدل Unlimited-OCR تحت مجوز MIT منتشر شده است و از موتورهای اصلی استنتاج مانند Hugging Face Transformers، vLLM و SGLang پشتیبانی می‌کند. کد و وزن‌های مدل در مخازن زیر در دسترس است: - GitHub: https://github.com/baidu/Unlimited-OCR - Hugging Face: https://huggingface.co/baidu/Unlimited-OCR - ModelScope: https://modelscope.cn/models/PaddlePaddle/Unlimited-OCR --- 💎 خلاصه مطلب مدل Unlimited-OCR با معرفی مکانیزم R-SWA، گامی اساسی در جهت حل مشکل پردازش اسناد طولانی برداشته است. این مدل با حفظ حافظه نهان KV ثابت، امکان پردازش یک‌باره ده‌ها صفحه سند را با سرعت و دقت بالا فراهم می‌کند. R-SWA به عنوان یک مکانیزم توجه عمومی، پتانسیل کاربرد در وظایف توالی طولانی دیگر مانند بازشناسی گفتار (ASR) و ترجمه ماشینی را نیز دارد. انتشار این مدل تحت مجوز MIT، دسترسی و استفاده از آن را برای جامعه پژوهش و توسعه تسهیل کرده است. 🔗 مقاله: https://arxiv.org/abs/2606.23050 #OCR #Baidu #DeepSeek #OpenSource 🆔 @asrgooyeshpardaz
791
13
🧠 مدل VibeThinker-3B: اندازه مهم نیست، کارایی مهم است! شرکت سینا ویبو از مدل جدید خود با نام VibeThinker-3B رونمایی کرده است. این مدل با تنها ۳ میلیارد پارامتر، در برخی از سخت‌ترین آزمون‌های منطقی به پای مدل‌های غول‌پیکری مثل Gemini 3 Pro و DeepSeek V3.2 رسیده است. 📊 عملکرد خیره‌کننده - 🔹 ریاضیات: امتیاز ۹۴.۳ در آزمون AIME26 (که با فناوری CLR به ۹۷.۱ می‌رسد). این یعنی این مدل کوچک در ریاضیات در سطح بهترین مدل‌های دنیا قرار دارد. - 🔹 برنامه‌نویسی: موفقیت ۸۰.۲٪ در بنچمارک LiveCodeBench و ۹۶.۱٪ قبولی در مسائل جدید LeetCode. این یعنی مدل حتی در مواجهه با مسائل ناآشنا و جدید، عملکرد فوق‌العاده‌ای دارد. - 🔹 دقت در پیروی از دستورات: امتیاز ۹۳.۴ در آزمون IFEval نشان می‌دهد که توانایی بالای استدلال این مدل، به قیمت از دست دادن توانایی پیروی از دستورات دقیق کاربر تمام نشده است. 🤔 راز موفقیت چیست؟ تیم سازنده از رویکرد جدیدی به نام «از طیف تا سیگنال» و یک روش آموزش چندمرحله‌ای مبتنی بر یادگیری تقویتی استفاده کرده است. فرضیه آن‌ها این است که هسته‌ی منطقی مدل را می‌توان به شدت فشرده کرد، در حالی که پارامترهای حجیم بیشتر برای ذخیره‌سازی اطلاعات عمومی و دانش دایرةالمعارفی مورد نیاز هستند. 💎 نتیجه‌گیری: مدل VibeThinker-3B نشان می‌دهد که برای رسیدن به هوش مصنوعی قدرتمند، همیشه نیازی به مدل‌های با میلیاردها پارامتر نیست. با روش‌های آموزشی هوشمندانه، می‌توان مدل‌های کوچک و کارآمدی ساخت که در حوزه‌های خاص (مانند ریاضیات و برنامه‌نویسی) با غول‌های صنعت رقابت کنند. این یعنی هوش مصنوعی قدرتمند، قابل‌دسترس‌تر از چیزی است که فکر می‌کنیم. 🔗 منبع: https://arxiv.org/abs/2606.16140 #AI #VibeThinker #هوش_مصنوعی
974
14
🎬 بایت‌دنس از مدل ویدئویی SeedDance 2.5 رونمایی کرد شرکت بایت‌دنس پس از نسخه‌ی چشمگیر ۲.۰ در بهار، حالا از مدل جدید خود با ن
🎬 بایت‌دنس از مدل ویدئویی SeedDance 2.5 رونمایی کرد شرکت بایت‌دنس پس از نسخه‌ی چشمگیر ۲.۰ در بهار، حالا از مدل جدید خود با نام SeedDance 2.5 پرده برداشته است. این به‌روزرسانی با ارتقاهای قابل‌توجهی همراه است: ✨ امکانات جدید: مدت زمان تولید: امکان ساخت ویدئوهای تا ۳۰ ثانیه** (در نسخه‌ی قبلی ۱۵ ثانیه بود). کیفیت تصویر: پشتیبانی بومی از وضوح ۴K**. تعداد مراجع ورودی: تا ۵۰ مرجع** شامل عکس، ویدئوهای کوتاه و صدا. این مراجع بر خروجی نهایی تأثیر گذاشته و ویژگی‌های اشیاء را حفظ می‌کنند. 🔮 قابلیت ویژه: جالب‌ترین ویژگی، تولید ویدئو بر اساس مدل‌های سه‌بعدی سفید (بدون بافت) است. SeedDance 2.5 خودش مدل را در صحنه قرار داده و به آن بافت و رنگ می‌دهد، گویی که یک دارایی آماده از موتور بازی است. 🔗 منبع: [پست Xiaohu در شبکه اجتماعی X](https://x.com/xiaohu/status/2069267306182762907?s=20) #AI #ByteDance #SeedDance #تولید_ویدئو
1 367
15
🗣 وقتی LM ضعیف، کلمات نادر رو قربانی می‌کنه طبق گزارش جدید کانال فناوری گفتار، ترکیب مدل‌های CTC با یک LM ساده (n‑gram) خطای بازشناسی کلمات نادر را به‌شدت افزایش می‌دهد. همیشه فکر می‌کردیم که ترکیب CTC + LM برای تطبیق سریع با دامنه‌ی جدید، معماری خوبی است. حتی تست‌های WER هم مزیتش رو نشون می‌داد. ولی آزمایش‌های جدید روی کلمات نادر، نشون داده که این ترکیب به اون خوبی که فکر می‌کردیم عمل نمی‌کنه. بیشتر سیستم‌هایی که از n-gram shallow fusion استفاده می‌کنند، WER کلمات نادرشون به‌مراتب بدتر از WER کلمات نادر در مدل‌های RNNT و حتی خود CTC بدون LM هست. داستان از این قراره که دقت مدل Conformer به‌تنهایی اونقدر بالاست که یه LM اضافه‌ی ضعیف با perplexity ۱۰۰–۲۰۰ نه‌تنها کمکی نمی‌کنه، بلکه اوضاع رو بدتر می‌کنه و مدل رو گیج می‌کنه. از طرفی، ساختن یه n-gram LM قوی‌تر هم کار آسونی نیست. برای کاهش perplexity به معماری پیشرفته‌تری نیازه که بتونه زمینه‌ی طولانی‌تری رو ببینه، و این فقط با ترنسفورمرها ممکنه. واقعاً قضیه جالبی شده. یه LLM قوی مطمئناً اینجا کمک می‌کنه، ولی سؤال اصلی اینه که چطور می‌تونیم سریع با دامنه‌ی جدید تطبیق پیدا کنیم. 🔍 چهار یافته‌ی مهم از یک مقایسه: 🔹مورد اول GigaAM3 CTC به‌تنهایی: WER کلی ۱۶.۷۲٪ – WER کلمات نادر ۲۱.۷۶٪ 🔹مورد دوم GigaAM3 CTC + LM: WER کلی ۱۵.۲۳٪ – WER کلمات نادر ۲۹.۵۹٪ یعنی اضافه کردن مدل زبانی، WER کلی را کمی بهتر کرده، اما کلمات نادر را ۳۶٪ بدتر تشخیص داده! 🔹مورد سوم T-one CTC + LM از همه بدتر: WER کلی ۱۶.۸٪ – WER کلمات نادر ۳۷.۸۳٪ یعنی از هر سه کلمه‌ی نادر، بیش از یک کلمه اشتباه تشخیص داده می‌شه. 🔹مورد چهارم اما GigaAM3 RNNT بدون LM: WER کلی ۱۵.۶۵٪ – WER کلمات نادر ۲۰.۵۸٪ تعادل رو به‌خوبی حفظ کرده. 🔹 بهترین نتیجه؟ فاین‌تیون GigaAM3 RNNT: WER کلی ۱۴.۶۴٪ – WER کلمات نادر ۲۱.۲۲٪ 🎯 چرا این اتفاق می‌افته؟ مدل‌های آکوستیک مدرن (مثل Conformer) آنقدر قوی شدن که اطلاعات زبانی زیادی رو یاد گرفتن. وقتی یه LM ضعیف (با پرپلکسیتی ۱۰۰ تا ۲۰۰) رو بهش وصل می‌کنیم، به‌جای کمک، مدل رو گیج می‌کنه. مخصوصاً برای کلمات نادر، پیشنهادهای اشتباه LM، تشخیص رو بدتر می‌کنه. 💡 پس راهکار چیه؟ به‌جای ترکیب سطحی (Shallow Fusion): ✅ از مدل‌های Transducer (RNNT) بدون LM خارجی استفاده کنید. ✅ مدل رو روی داده‌های همون حوزه فاین‌تیون کنید. ✅ از بازبینی دومرحله‌ای (Second‑pass Rescoring) با یه LLM سبک استفاده کنید. ✅ از سوگیری زمینه‌ای (Contextual Biasing) برای تقویت کلمات کلیدی استفاده کنید. 🔗 منابع برای مطالعه بیشتر: - [Improving Rare Word Recognition with LM-aware MWER Training](https://ar5iv.labs.arxiv.org/html/2204.07553) - [Mask The Bias: Improving Domain-Adaptive Generalization of CTC-based ASR](https://ar5iv.labs.arxiv.org/html/2305.03837) - [CTC-Assisted LLM-Based Contextual ASR](https://ar5iv.labs.arxiv.org/html/2411.06437) #ASR #SpeechRecognition #NLP #CTC #LM 🆔 @asrgooyeshpardaz
1 526
16
👾 ماشین‌ها آدم‌ها را به شکل خودشان می‌خواهند مجله Harvard Business Review توی گزارشی گفته که هوش مصنوعی داره فرایند استخدام رو خراب می‌کنه. رزومه‌ها قابل اعتماد نیستن، مصاحبه‌های آنلاین امکان سواستفاده و فریب دادن کارفرما را دارند، و شرکتها به جای بهترین کارمند، بهترین مصاحبه شونده را استخدام می‌کنن. پیشنهادش هم اینه که به جای سوالات تکراری، از شبیه‌سازی‌های کاری واقعی استفاده کنیم. اما بیایید یک قدم عقب‌تر برویم و به خودِ این نگاه نقد کنیم. وقتی ماشین‌ها را به عنوان «داوران کامل» می‌نشانیم و آدم‌ها را با معیارهای ماشینی می‌سنجیم، چه اتفاقی می‌افتد؟ آدم‌ها ضعف دارند. دروغ می‌گویند. اشتباه می‌کنند. تقلب می‌کنند. گاهی بی‌نظم اند، گاهی غیرمنطقی. اما همین نقص‌هاست که آنها را انسان می‌کند. همین آشفتگی است که منشأ خلاقیت، همدلی، و تصمیم‌گیری‌های غیرخطی و در عین حال درست است. اما یک ماشین طوری طراحی می‌شود که همیشه کامل به نظر برسد. بی‌خطا، بی‌احساس، بی‌تغییر. حالا اگر ما سیستم‌های استخدامی را طوری طراحی کنیم که فقط «ماشین‌های انسانی» را گزینش کنند— آنهایی که بی‌نقص رزومه می‌نویسند، بی‌نقص مصاحبه می‌دهند، بی‌نقص از پس آزمون‌ها برمی‌آیند — در واقع داریم چه کسانی را پرورش می‌دهیم؟ کسانی را که یاد گرفته‌اند مثل ماشین رفتار کنند. ماشین‌های کامل، موجودات ترسناکی هستند. تاریخ این را به ما نشان داده. ارتش نازی‌ها قواعد و اصول دقیقی داشت. مثل یک ارتش ماشینی، منظم، بی‌نقص و بی‌چون‌وچرا عمل می‌کرد و نتیجه چه شد؟ دنیا را به مرز نابودی کشاند. چون انسانیت در آن سیستم جایی نداشت؛ فقط اطاعت و دقت و اجرا وجود داشت. ماشین‌های هوشمند ما را به شکل خودشان می‌خواهند. نه با زور، بلکه با تغییر معیارها. با بازتعریف «شایستگی». با سیستم‌هایی که فقط کسانی را برمی‌گزینند که شبیه به خروجی یک مدل زبانی هستند. نتیجه چیست؟ نسلی از آدم‌های ماشینی که برای «پاس کردن» تربیت شده‌اند، نه برای «فکر کردن». که برای «بی‌نقص به نظر رسیدن» تلاش می‌کنند، نه برای «انسان بودن». شاید مشکل فقط این نباشد که هوش مصنوعی روند استخدام را خراب کرده است. شاید مشکل این باشد که ما داریم استخدام را به ابزاری برای ماشینی‌سازی انسان‌ها تبدیل می‌کنیم. و این، از هر رزومه‌ی جعلی و هر مصاحبه‌ی فریب‌دهنده‌ای، خطرناک‌تر است. 🔗 HBR – AI Has Broken Hiring #استخدام #هوش_مصنوعی #انسانیت #ماشینی_شدن #HBR
1 569
17
🔍 افشای سناتور درباره Mythos و NSA مارک وارنر، معاون رئیس کمیته اطلاعات سنا، به تازگی اعلام کرده که ژنرال جاشوا راد، رئیس آژانس امنیت ملی آمریکا (NSA)، به او گفته است که هوش مصنوعی Mythos موفق شده «تقریباً تمام سیستم‌های سری آژانس را نه در عرض هفته‌ها، بلکه در عرض چند ساعت هک کند». 🕒 اما پیش از هرگونه نتیجه‌گیری، چند نکته کلیدی را باید در نظر داشت: 🚨 این رویداد یک حمله واقعی نبود، بلکه یک آزمایش کنترل‌شده امنیتی (Red Team) بر روی شبکه‌های خودِ آژانس بود. هدف از این تمرین، شناسایی نقاط ضعف و رفع آنها پیش از آنکه توسط مهاجمان واقعی بهره‌برداری شوند، بوده است. 🛡 به گفته وارنر، هدف از طرح این موضوع، ایجاد ترس و وحشت نیست، بلکه تأکید بر ضرورت انجام تست‌های پیش از انتشار برای مدل‌های پیشروی هوش مصنوعی است تا پیش از ورود به بازار، آسیب‌پذیری‌های احتمالی آنها شناسایی و برطرف شود. با این حال، اقتصاددان و سایر کارشناسان نسبت به برداشت سطحی از این خبر هشدار داده‌اند. آنها تأکید می‌کنند که این آزمایش در شرایط بسیار خاص و با دسترسی‌های ویژه انجام شده و خود مدل Mythos نیز به تنهایی عمل نکرده، بلکه در کنار سایر ابزارها و روش‌ها مورد استفاده قرار گرفته است. ⚠️ 💎 خلاصه و جمع‌بندی: این خبر اگرچه جنجالی و توجه‌برانگیز است، اما واقعیت آن چندان هولناک نیست. هوش مصنوعی در حال حاضر قادر به نفوذ به سامانه‌های NSA در یک سناریوی واقعی نیست. اما این رویداد، یک زنگ هشدار جدی است که نشان می‌دهد با افزایش توانمندی‌های هوش مصنوعی، نیاز به نظارت و ایمن‌سازی این فناوری بیش از پیش احساس می‌شود. آینده نیازمند توجه جدی و اقدامات پیشگیرانه است. 🤔📰 #AI #Anthropic #Mythos 🆔 @asrgooyeshpardaz
1 728
18
نظریه «اینترنت مرده» در عمل بازی World of Warcraft اکنون سروری بدون انسان دارد - در عوض، خانه ۱۸۰۰ ربات است که توسط DeepSeek
نظریه «اینترنت مرده» در عمل بازی World of Warcraft اکنون سروری بدون انسان دارد - در عوض، خانه ۱۸۰۰ ربات است که توسط DeepSeek پشتیبانی می‌شوند. این ربات‌ها مانند بازیکنان معمولی رفتار می‌کنند: آنها چت می‌کنند، شخصیت‌ها را ارتقا می‌دهند، سیاه‌چال‌ها را اداره می‌کنند و حتی با یکدیگر می‌جنگند. در نتیجه، دنیای بازی کاملاً زنده به نظر می‌رسد. #AI #DeepSeek 🆔 @asrgooyeshpardaz
1 626
19
مایکل جکسون خسته
مایکل جکسون خسته
1 652
20
🔓 گذار از ترس به واقعیت: واشنگتن و آنتروپیک به راهکاری عملی برای دسترسی به Mythos و Fable نزدیک می‌شوند به نظر می‌رسد دولت آمریکا و شرکت Anthropic به نخستین چارچوب عملی برای بازگرداندن دسترسی به مدل‌های قدرتمند خود (Mythos 5 و Fable 5) دست یافته‌اند، بدون آنکه تظاهر به «از بین بردن کامل جیلبریک» کنند. این تغییر رویکرد، نشان‌دهنده بلوغ تدریجی مقررات‌گذاری هوش مصنوعی؛ از ترس‌های مبهم به سمت مدلی عینی‌تر و مبتنی بر سناریوهای مشخص است. 🔄 از «آسیب‌پذیری مطلق» به «مدیریت ریسک» واقعیت این است که حذف کامل حملات جیلبریک، احتمالاً ناممکن است. به همین دلیل، رویکرد جدید بر ارزیابی عمق و پیامدهای یک حمله موفق متمرکز است، نه صرفاً ثبت وقوع آن. به عبارت دیگر، به جای پرسش «آیا مدل جیلبریک شده است؟»، پرسش‌های کلیدی عبارتند از: 🔹 چقدر از محافظت‌ها دور زده شده است؟ (گستره نقض امنیت) 🔹 چه قابلیت‌هایی در دسترس مهاجم قرار گرفته است؟**گ (شدت دسترسی) 🔹 آیا حمله به‌سادگی قابل تکرار است؟ (هزینه و پیچیدگی حمله) 🔹 آیا این دسترسی به پیامدهای عملیاتی واقعی منجر می‌شود؟ (تأثیر دنیای واقعی) این معیارها، راهی برای ایجاد زبان مشترک میان تنظیم‌کنندگان و توسعه‌دهندگان فراهم می‌آورد تا بتوانند شدت یک تهدید را سنجیده و مرز میان «یک ترفند آزمایشگاهی» و «یک ریسک واقعی» را ترسیم کنند. 🧪 شواهد از میدان آزمایش (Red-Teaming) تحقیقات اخیر تیم‌های «کلاه قرمز» (Red-Team) نشان داده است که حتی پیشرفته‌ترین مدل‌های هوش مصنوعی (Frontier Models) نیز در برابر حملات طولانی و خودکار، همچنان می‌توانند پاسخ‌های مضر تأییدشده تولید کنند. در این آزمایش‌ها، مدل Fable 5 اگرچه در مقایسه با Opus 4.8 مقاومت بیشتری از خود نشان داد، اما هرگز به «شکست‌ناپذیری» کامل دست نیافت. این یافته، رویکرد مبتنی بر «مدیریت ریسک» را بیش از پیش تقویت می‌کند. 📋 چارچوب ارزیابی جدید برای مدل‌های آینده بر اساس این رویکرد، ارزیابی مدل‌های جدید حول محور سوالات کلیدی زیر ساختار خواهد یافت: ۱. دامنه نقض: محافظت‌های مدل تا چه حد دور زده شده‌اند؟ آیا حمله به یک آسیب‌پذیری خاص محدود است یا حوزه وسیعی از قابلیت‌ها را پوشش می‌دهد؟ ۲. شدت دسترسی: چه قابلیت‌های خاصی (مانند تولید کد مخرب، مهندسی معکوس یا دسترسی به داده‌های حساس) برای مهاجم افشا شده است؟ ۳. قابلیت تکرار: آیا حمله نیازمند تخصص بالا، زمان طولانی یا منابع محاسباتی عظیم است، یا هر کاربر معمولی نیز می‌تواند آن را تکرار کند؟ ۴. پیامد عملیاتی: آیا پیامدهای حمله صرفاً تئوری است، یا می‌تواند به طور مستقیم به آسیب‌پذیری‌های واقعی و قابل بهره‌برداری در دنیای خارج منجر شود؟ 🔭 چشم‌انداز آینده این چارچوب جدید، نشان‌دهنده گذار از یک رویکرد دودویی (امن/ناامن) به رویکردی طیفی (ارزیابی عمق و شدت ریسک) است. نتیجه این تغییر، نه تنها مسیر بازگشت مدل‌های قدرتمندی مانند Mythos و Fable را هموار می‌کند، بلکه زمینه‌ساز یک مدل نظارتی شفاف‌تر و مبتنی بر شواهد برای کل صنعت هوش مصنوعی خواهد شد. این رویکرد به توسعه‌دهندگان اجازه می‌دهد تا بر تقویت نقاط ضعف خاص متمرکز شوند و به جای مبارزه با یک مشکل لاینحل (جیلبریک کامل)، بر مدیریت پیامدهای آن سرمایه‌گذاری کنند. #AI #Regulation #Anthropic #Cybersecurity 🆔 @asrgooyeshpardaz
2 105