uk
Feedback
Silicon Brain | جامعه هوش مصنوعی

Silicon Brain | جامعه هوش مصنوعی

Відкрити в Telegram

مغز سیلیکونی|جامعه هوش مصنوعی و یادگیری ماشین گروه بحث و تبادل نظر: https://t.me/+SWbgmMZt0XU0MGY0 مطالب و بحث های بیشتر در اینستاگرام: https://www.instagram.com/silicon_brain/ ارتباط با ادمین: @silicon_brain_admin

Показати більше
7 101
Підписники
+324 години
+247 днів
+6530 день
Архів дописів
متد جدید QUERY در HTTP، انقلابی در طراحی API! بالاخره بعد از سال‌ها، یک متد رسمی و جدید به پروتکل HTTP اضافه شد: متد QUERY. این اولین تغییر بزرگ و اساسی بعد از معرفی PATCH در سال ۲۰۱۰ به حساب میاد.
مشکل چی بود؟
تا قبل از این، برای سرچ‌ها و فیلترهای پیچیده دو راه داشتیم که هر دو ناقص بودن: ۱. استفاده از GET: امن و تکرارپذیر (idempotent) بود، اما مجبور بودیم همه فیلترها رو تو URL بنویسیم. این کار باعث لو رفتن دیتای حساس تو server logs و ارور طولانی شدن URL می‌شد. ۲. استفاده از POST: اجازه می‌داد فیلترهای حجیم (مثل JSON یا GraphQL) رو تو body بفرستیم، اما چون POST برای ساختن دیتای جدید هست، قابلیت cache شدن نداشت و مرورگرها نمی‌تونستن در صورت قطع اینترنت، درخواست رو خودکار تکرار کنن.
حالا QUERY چیکار میکنه؟
این متد جدید در واقع مثل یک GET request هست که body داره! یعنی ویژگی‌های خوب هر دو متد قبلی رو ترکیب کرده: 🔹 دارای Request Body: می‌تونید فیلترهای حجیم و تو در توی JSON یا SQL رو راحت تو payload بفرستید. 🔹 امن و تکرارپذیر (Safe & Idempotent): فقط دیتا رو می‌خونه و تغییری تو سرور نمیده؛ پس اگه شبکه قطع شد، مرورگر بدون ریسک درخواست رو دوباره می‌فرسته. 🔹 قابلیت Cache بالا: برعکس POST، جواب این متد توسط مرورگرها و CDNs ذخیره میشه (با استفاده از ترکیب URL و body به عنوان cache key). 🔹هدر جدید Accept-Query: سرور با این response header اعلام می‌کنه از چه زبان‌هایی (مثل SQL یا OData) برای فیلتر کردن پشتیبانی می‌کنه.
این قابلیت در حال حاضر برای آزمایش و پروژه‌های داخلی (که کنترل کامل روی سرور و کلاینت دارید) در دسترس است، اما برای اینکه در وب‌سایت‌های عمومی جایگزین POST یا GET شود، باید منتظر آپدیت تدریجی مرورگرها و تجهیزات شبکه طی ماه‌های آینده باشیم.
@silicon_brain | از هوش مصنوعی عقب نمانید

شرکت ‏Anthropic مدل جدید Claude Sonnet 5 رو منتشر کردهمدلی که با هزینه‌ای کمتر، عملکردی نزدیک به مدل پرچم‌دار Opus ارائه می‌د
شرکت ‏Anthropic مدل جدید Claude Sonnet 5 رو منتشر کردهمدلی که با هزینه‌ای کمتر، عملکردی نزدیک به مدل پرچم‌دار Opus ارائه می‌ده. تا قبل از این، برای کارهای agentic (مثل برنامه‌ریزی، استفاده از toolها و انجام خودکار taskها) معمولاً باید از مدل‌های گرون‌تر Opus استفاده میکردیم. اما Sonnet 5 حالا می‌تونه این کارها رو با کیفیتی نزدیک به Opus 4.8 انجام بده. از قابلیت‌های جدیدش می‌شه به self-check کردن پاسخ‌ها، 1M context window، 128K output token و عملکرد نزدیک به Opus در agentic coding اشاره کرد
جایی که امتیاز 63.2٪ گرفته، در حالی که Opus 4.8 امتیاز 69.2٪ داشته، اما با حدود ۴۰٪ هزینه کمتر.
این مدل از طریق Claude API با نام claude-sonnet-5 در دسترسه و به مدل پیش‌فرض کاربران Free و Pro هم تبدیل شده است. لینک @silicon_brain | از هوش مصنوعی عقب نمانید

اگر برای موقعیت‌های AI Engineer، GenAI Engineer یا Agentic AI آماده می‌شید،تو سطح Senior احتمالاً توی مصاحبه با سؤال‌هایی شبیه این روبه‌رو می‌شید: 🔹اگر RAG ناگهان جواب‌های اشتباه بده، اولین چیزی که بررسی می‌کنید چیه و چطور ثابت می‌کنید مشکل از همونه؟ 🔹اگر retriever اسناد مرتبط رو پیدا کنه، ولی کیفیت پاسخ پایین باشه، مشکل بین retrieval و generation کجاست؟ 🔹اگر embeddingها رو تغییر بدید، از کجا می‌فهمید سیستم واقعاً بهتر شده؟ چه metricهایی رو قبل و بعد مقایسه می‌کنید؟ 🔹اگر جواب یک سؤال داخل ۵ سند مختلف باشه، retrieval و context construction رو چطور طراحی می‌کنید؟ 🔹اگر تعداد اسناد از 10 هزار به 1 میلیون برسه، اولین چیزی که از کار می‌افته چیه و معماری سیستم رو چطور تغییر می‌دید؟ نکته مهم اینه که اینا سؤال‌های مربوط به RAG نیستن، اینا سؤال‌های Engineering هستن.
یاد گرفتن ساختن یک chatbot کار سختی نیست، اما چیزی که یک AI Engineer رو از یک مبتدی جدا می‌کنه، درک مفاهیمی مثل evaluation، reliability، observability، scalability، failure modes و system design هست؛ نه صرفاً بلد بودن استفاده از frameworkها، APIها یا مدل‌های AI.
@silicon_brain | از هوش مصنوعی عقب نمانید

البته نگران Job time نباشین 😅 @silicon_brain | از هوش مصنوعی عقب نمانید
البته نگران Job time نباشین 😅 @silicon_brain | از هوش مصنوعی عقب نمانید

⭕️ سلسله وبینارهای رایگان: هوش‌مصنوعی برای همه اگه توی این حوزه فعالی یا بهش علاقه داری، وقتشه مسیرت رو با هوش مصنوعی گره بزن
⭕️ سلسله وبینارهای رایگان: هوش‌مصنوعی برای همه اگه توی این حوزه فعالی یا بهش علاقه داری، وقتشه مسیرت رو با هوش مصنوعی گره بزنی. قراره توی این وبینار یاد بگیری چه زمانی و چطوری از هوش‌مصنوعی بهترین استفاده رو کنی. 🚀 دو شب، از پژوهش تا کسب‌وکار 🗓 سه‌شنبه و چهارشنبه، ساعت ۱۸ 🚨 همین حالا، رایگان ثبت‌نام کن: 👉📎 https://httb.ir/oHyWp 👉📎 https://httb.ir/oHyWp @Cafetadris | کافه‌تدریس

توی مقاله
LLM hallucinations in the wild: Large-scale evidence from non-existent citations
که بیش از ۱۱۱ میلیون رفرنس از حدود ۲.۵ میلیون مقاله علمی بررسی شده و نتیجه نشون می‌ده از سال ۲۰۲۳ به بعد، تعداد Citationهای جعلی با سرعت زیادی افزایش پیدا کرده. فقط برای سال ۲۰۲۵ تخمین زده شده که حدود ۱۴۶ هزار رفرنس غیرواقعی وارد مقالات علمی شده. نکته ترسناک اینجاست که موضوع فقط چند نویسنده متقلب نیست. بخش زیادی از این رفرنس‌های فیک، نتیجه Hallucination مدل‌های LLM هست. یعنی نویسنده مقاله رو نوشته، برای ساختن بخش منابع از AI کمک گرفته و مدل هم با اعتمادبه‌نفس کامل اسم مقاله، کتاب یا حتی DOIهایی ساخته که اصلاً وجود خارجی ندارن. بیشترین آمار هم مربوط به حوزه‌های Computer Science و Social Science بوده؛ دقیقاً جاهایی که استفاده از AI-assisted writing بیشتر از بقیه است. جالب‌تر اینکه پژوهشگرهای تازه‌کار و تیم‌های کوچک بیشتر از همه گرفتار این مشکل شدن. به نظرم خطر اصلی تازه از اینجا شروع می‌شه. وقتی این رفرنس‌های جعلی از فیلتر داوری مجلات هم عبور می‌کنن، وارد دیتابیس‌های علمی می‌شن و به بخشی از دانش ثبت‌شده تبدیل می‌شن. از اون طرف، نسل بعدی مدل‌های AI هم روی همین مقالات Train می‌شن. نتیجه؟ یک Feedback Loop خطرناک که توش مدل‌های جدید، خطاها و توهمات مدل‌های قبلی رو یاد می‌گیرن و دوباره تولید می‌کنن. لینک مقاله
به همین خاطر، استفاده از AI در پژوهش علمی نباید به معنی اعتماد کورکورانه به خروجی مدل‌ها باشه. هر Citation، DOI و منبعی که توسط AI پیشنهاد می‌شه باید قبل از انتشار به‌صورت دستی یا با ابزارهای معتبر بررسی و تأیید بشه. اگر این موضوع جدی گرفته نشه، در آینده ممکنه با انبوهی از مقالاتی روبه‌رو بشیم که ظاهراً معتبر هستن، اما بخشی از پایه علمی اون‌ها روی منابعی بنا شده که هیچ‌وقت وجود نداشتن.
@silicon_brain | از هوش مصنوعی عقب نمانید

دولت آمریکا از OpenAI خواسته انتشار عمومی GPT-5.6 رو فعلاً محدود کنه طبق گزارش Axios و Reuters، این مدل به‌جای عرضه عمومی، فعلاً فقط در اختیار تعداد محدودی از شرکت‌های تأییدشده قرار گرفته و دسترسی‌ها هم به‌صورت موردی بررسی می‌شن. دلیلشم گفتن نگرانی‌های امنیت ملی، به‌ویژه در حوزه‌هایی مثل امنیت سایبری و سوءاستفاده‌های احتمالی از مدل‌های frontier هست! نکته مهم اینه که: این اولین باره دولت آمریکا قبل از عرضه عمومی، مستقیماً روی نحوه انتشار یک مدل AI مداخله می‌کنه و شرکت OpenAI هم گفته این وضعیت موقتیه و امیدوارن طی هفته‌های آینده دسترسی گسترده‌تری بدن.
اما پشت این اتفاق چند تغییر مهم داره شکل می‌گیره
🔹 پایان انتشار آزاد مدل‌های پیشرفته: مدل‌های frontier دارن از مسیر لانچ‌های عادی خارج می‌شن و وارد فاز نظارت دولتی می‌شن. 🔹شکل‌گیری دسترسی لایه‌ای: شرکت‌های بزرگ و تأییدشده زودتر به تکنولوژی دسترسی دارن، بقیه دیرتر. 🔹داره AI به‌عنوان زیرساخت استراتژیک استفاده میشه: وقتی دولت‌ها وارد فرآیند انتشار می‌شن، یعنی AI دیگه فقط یک محصول تکنولوژیک نیست. قبلا تو این پست در مورد داستان مشابه ای هم برای Claude Mythos پیش اومده بود هم صحبت کرده بودیم.
حالا تو این شراط اگه آمریکا دسترسی به مدل‌های پیشرفته رو کنترل کنه، آیا بقیه دنیا همچنان به سمت مدل‌های اوپن سورس (open-weight) حرکت می‌کنن؟
@silicon_brain | از هوش مصنوعی عقب نمانید

مدل جدید Qwen-AgentWorld به‌جای آموزش خود AI Agent، رفتار محیط رو شبیه‌سازی می‌کنه. یعنی مثل یه flight simulator برای Agentها
مدل جدید Qwen-AgentWorld به‌جای آموزش خود AI Agent، رفتار محیط رو شبیه‌سازی می‌کنه. یعنی مثل یه flight simulator برای Agentها عمل می‌کنه و به‌جای اجرای واقعی Terminal، Browser یا Android، پیش‌بینی می‌کنه بعد از هر action چه اتفاقی می‌افته.
این کار باعث می‌شه آموزش و تست Agentها خیلی سریع‌تر، ارزون‌تر و قابل‌کنترل‌تر انجام بشه، چون دیگه لازم نیست هر بار با محیط واقعی کار کنن.
این مدل از ۷ محیط شامل MCP، Search، Terminal، SWE، Web، OS و Android پشتیبانی می‌کنه و طبق نتایج منتشرشده، روی AgentWorldBench عملکردی بهتر از GPT-5.4 و Claude Opus 4.8 داشته. همچنین در تست‌های Sim RL حتی از آموزش با محیط واقعی (Real RL) هم نتیجه بهتری گرفته. نسخه 35B open-weight این مدل با لایسنس Apache 2.0 روی Hugging Face منتشر شده و با vLLM یا SGLang قابل اجراست هاگینگ فیس @silicon_brain | از هوش مصنوعی عقب نمانید

یکی از عجیب‌ترین و معروف‌ترین معماهای دنیای ریاضیات، «فرضیه ریمان» Riemann Hypothesis هست. که بیشتر از ۱۶۰ ساله کسی نتونسته جواب قطعی براش پیدا کنه. داستان از اعداد اول شروع میشه؛ همون اعدادی مثل ۲، ۳، ۵، ۷ و ۱۱ که فقط به خودشون و عدد ۱ بخش‌پذیرن. اگه به اعداد اول نگاه کنیم، انگار کاملاً تصادفی پخش شدن. بعضی جاها پشت سر هم ظاهر میشن و بعضی جاها فاصله زیادی بینشون میفته. سال‌هاست ریاضیدان‌ها می‌پرسن: آیا واقعاً این اعداد تصادفی هستن یا یه نظم پنهان پشتشون وجود داره؟ سال ۱۸۵۹ ریاضیدان آلمانی، برنهارد ریمان، یه حدس عجیب مطرح کرد. اون متوجه شد یه تابع ریاضی خاص وجود داره که رفتارش به شکل عجیبی به اعداد اول وصله. ریمان حدس زد که همه نقاط مهم این تابع روی یه خط مشخص قرار می‌گیرن. این حدس بعدها به اسم «فرضیه ریمان» شناخته شد.
شاید این حرف خیلی فنی به نظر برسه، ولی اگر این فرضیه درست باشه، یعنی اعداد اول اون‌قدرها هم که فکر می‌کنیم بی‌نظم نیستن و در واقع از یه قانون عمیق و دقیق پیروی می‌کنن. به همین خاطر خیلی‌ها این مسئله رو یکی از مهم‌ترین سوالات حل‌نشده تاریخ ریاضیات می‌دونن.
جالب اینجاست که با وجود پیشرفت فوق‌العاده کامپیوترها، هنوز کسی نتونسته این فرضیه رو اثبات کنه. دانشمندان با استفاده از ابرکامپیوترها میلیاردها و میلیاردها مورد رو بررسی کردن و هر بار نتیجه با پیش‌بینی ریمان جور دراومده. یعنی تا الان حتی یک مثال نقض هم پیدا نشده. برای همین بعد از گذشت بیش از یک قرن و نیم، فرضیه ریمان همچنان یکی از بزرگ‌ترین رازهای دنیای ریاضیات باقی مونده؛ معمایی که هر کسی بتونه حلش کنه، علاوه بر شهرت علمی، یک میلیون دلار جایزه هم دریافت می‌کنه. @silicon_brain | از هوش مصنوعی عقب نمانید

الان یه جوی به وجود اومده که اگه با هوش مصنوعی کاری انجام بدی، بعضیا سریع میگن: «خب این که با AI ساخته شده، پس ارزش خاصی نداره!» ولی اگه دوران اوایل فراگیر شدن اینترنت رو یادتون باشه، دقیقاً همین حرف‌ها اون موقع هم زده می‌شد. خیلی‌ها می‌گفتن چون مطلبت رو از اینترنت پیدا کردی، ارزش نداره و مهم اینه که همه چیز رو خودت بنویسی. اما خیلی طول نکشید که همه فهمیدن اینترنت فقط یه ابزاره؛ ابزاری که دسترسی به اطلاعات رو سریع‌تر و راحت‌تر می‌کنه. امروز هم تقریباً هیچ تحقیق، پروژه یا کاری رو نمی‌تونیم تصور کنیم که بدون اینترنت انجام بشه. هوش مصنوعی هم به نظرم دقیقاً داره همین مسیر رو طی می‌کنه. ارزش کار رو خود ابزار تعیین نمی‌کنه، بلکه کسی تعیین می‌کنه که از اون ابزار چطور استفاده می‌کنه. همون‌طور که اینترنت جای فکر کردن رو نگرفت، AI هم قرار نیست جای خلاقیت و تصمیم‌گیری انسان رو بگیره؛ فقط باعث میشه سریع‌تر، دقیق‌تر و مؤثرتر کار کنیم.
احتمالاً چند سال دیگه استفاده از هوش مصنوعی به اندازه استفاده از اینترنت عادی میشه. اون موقع تقریباً هر فرد و هر کسب‌وکاری یه Agent هوش مصنوعی کنار خودش داره که بخشی از کارهاش رو انجام میده.
اون روز دیگه کسی نمی‌پرسه «اینو با هوش مصنوعی ساختی؟»؛ می‌پرسه «چقدر خوب از هوش مصنوعی استفاده کردی؟» @silicon_brain I از هوش مصنوعی عقب نمانید

‏احتمالاً تا الان اسم ژرف رو شنیدین یا ازش استفاده کردین؛ یک پلتفرم هوش مصنوعی که مجموعه‌ای از قدرتمندترین مدل‌های دنیا رو در یک محیط یکپارچه کنار هم آورده، از مدل‌های زبانی (LLM) گرفته تا مدل های تولید تصویر. مدل‌هایی مثل ChatGPT، Gemini، Claude، Qwen، Nano Banana و مدل‌های متنوع دیگه، همگی از طریق ژرف در دسترس هستن.
اما یکی از قابلیت‌های مهم ژرف، ارائه به صورت B2B و سازمانی هست
یعنی می‌تونین ژرف رو به شکل داخلی داخل شرکت یا سازمان خودتون راه‌اندازی کنین و کنترل کامل روی استفاده از هوش مصنوعی داشته باشین. مزیت‌های استفاده سازمانی از ژرف:داشبورد مدیریتی کامل مدیریت و نظارت روی گفتگوها، داده‌ها، خروجی‌ها و فعالیت کاربران از یک پنل متمرکز. ✅ مدیریت هزینه و مصرف هوش مصنوعی مشاهده آمار مصرف توکن هر کاربر، تحلیل نرخ استفاده تیم‌ها و بهینه‌سازی هزینه استفاده از مدل‌ها. ✅ مدیریت کاربران و سطح دسترسی تعریف نقش‌ها و کنترل اینکه هر تیم یا کاربر به کدوم مدل‌ها و قابلیت‌ها دسترسی داشته باشه. ✅ حفظ حریم خصوصی و کنترل داده‌ها برای سازمان‌هایی که امنیت و محرمانگی اهمیت بالایی داره، امکان استفاده از تنظیمات و مدل‌هایی وجود داره که داده‌ها در زیرساخت سازمان باقی بمونن. ✅ دسترسی به چندین مدل در یک پلتفرم به‌جای استفاده پراکنده از چند سرویس مختلف، همه ابزارهای هوش مصنوعی رو یکجا مدیریت کنین و برای هر سناریو بهترین مدل رو انتخاب کنین. ✅ مقیاس‌پذیری برای تیم‌ها و سازمان‌ها از تیم‌های کوچک تا سازمان‌های بزرگ، ژرف می‌تونه متناسب با نیاز مجموعه توسعه پیدا کنه. ✅ یکپارچه‌سازی با فرآیندهای داخلی امکان استفاده از ژرف در کنار ابزارها و فرآیندهای فعلی سازمان برای افزایش بهره‌وری و سرعت انجام کارها.
مشاهده عملکرد ژرف
chat.zharph.com برای پشتیبانی، سوالات یا درخواست همکاری به اکانت ادمین پیام بدین یا از طریق اطلاعات موجود در: zharph.com/contact-us.html اقدام کنین @silicon_brain | از هوش مصنوعی عقب نمانید

احتمالا از هوش مصنوعی ژرف استفاده کردین و میدونین که یک پلتفرم هوش مصنوعی هست مدل های LLM و تولید تصویر مختلف مثل ChatGPT، Gemini، Claude، Qwen، Nano Banana و... رو تو دل خودش جا داده این پلتفرم به صورت B2B هم ارائه میشه، یعنی شما میتونین ژرف رو به صورت داخلی در شرکت یا سازمان خودتون بالا بیارین این کار چند تا آپشن خیلی مهم به مجموعه شما خواهد داد: 1- داشبورد مدیریت خواهید داشت و میتونین تمام داده ها، گفتگوها و تولیدات رو مدیریت کنین 1- آمار مصرف توکن هر کاربر و نرخ استفاده مجموعه از هر مدل رو مدیریت کنین 3- کاربران مجموعه و سطح دسترسی هر کاربر به مدل های مختلف رو مدیریت کنین 4- اگه براتون مهمه که داده هاتون داخل سازمان بمونه و حریم خصوصی مجموعه رعایت بشه مدل های مخصوص این شرایط رو فعال کنین و کلی آپشن های دیگه داشبورد و پتلفرم ژرف در اختیار شما قرار خواهد داد. مشاهده عملکرد ژرف: chat.zharph.com برای پشتیبانی، سوالات و درخواست همکاری به

فقط با ۳ ثانیه از صدای تو، هوش مصنوعی Qwen3-TTS میتونه هر متنی رو با صدای تو بخونه تا چند سال پیش، ساخت یک نسخه دیجیتالی از ص
فقط با ۳ ثانیه از صدای تو، هوش مصنوعی Qwen3-TTS میتونه هر متنی رو با صدای تو بخونه تا چند سال پیش، ساخت یک نسخه دیجیتالی از صدای یک فرد به ساعت‌ها داده صوتی نیاز داشت. بعد این عدد به چند دقیقه رسید و حالا با نسل جدید مدل‌های Text-to-Speech (TTS)، تنها چند ثانیه نمونه صوتی برای voice cloning کافیه. مدل Qwen3-TTS یک مدل متن‌باز از Qwen در Alibaba Cloud هست که میتونه با یک نمونه بسیار کوتاه از صدا، گفتار جدیدی تولید کنه، و اینکارو میتونه با حفط ویژگی‌های صوتی گوینده اصلی انجام بده بدون نیاز به fine-tuning اختصاصی یا فرایندهای آموزشی پیچیده.
این قابلیت فقط یک پیشرفت فنی نیست، چون کاربردهای واقعی زیادی داره:
🔹 تولید پادکست بدون نیاز به ضبط مجدد 🔹 ساخت ویدیوهای آموزشی با حفظ صدای اصلی تولیدکننده 🔹 تولید دیالوگ برای شخصیت‌های بازی 🔹 انتشار محتوا در چند زبان بدون از بین رفتن هویت صوتی برند
از نظر فنی هم مشخصات قابل‌توجهی دارد:
🔹 پشتیبانی از ۱۰ زبان 🔹 اندازه مدل بین ۰.۶ تا ۱.۷ میلیارد پارامتر 🔹 حدود ۹۷ میلی‌ثانیه latency برای streaming گیتهاب | مقاله @silicon_brain | از هوش مصنوعی عقب نمانید

آنتروپیک نتایج تحلیل 400 هزار جلسه Claude Code از 235 هزار کاربر رو منتشر کرده انسان حدود 70٪ تصمیم‌گیری و planning رو انجام
آنتروپیک نتایج تحلیل 400 هزار جلسه Claude Code از 235 هزار کاربر رو منتشر کرده انسان حدود 70٪ تصمیم‌گیری و planning رو انجام می‌ده Claude حدود 80٪ اجرا (execution) رو به عهده می‌گیره البته تخصص هنوز مهمه؛ افراد مبتدی فقط حدود 15٪ موفقیت تأییدشده داشتن، ولی کاربران متوسط و حرفه‌ای بین 28 تا 33٪ رسیدن و فاصله بین intermediate و expert خیلی زیاد نبوده. لینک @silicon_brain | از هوش مصنوعی عقب نمانید

جدیدا ‏Unsloth یه جرکتی زده تا اجرای مدل های خیلی بزرگ GLM-5.2 روی سیستم های شخصی تا حدی ممکن بشه خود GLM-5.2 یه مدل 744B par
جدیدا ‏Unsloth یه جرکتی زده تا اجرای مدل های خیلی بزرگ GLM-5.2 روی سیستم های شخصی تا حدی ممکن بشه خود GLM-5.2 یه مدل 744B parameter با 1M context window هست که اندازه کاملش حدود 1.51TB می‌شه یعنی عملاً اجرای مستقیمش برای بیشتر سیستم ها غیرممکنه.
راه‌حل Unsloth استفاده از quantization بوده
یعنی کاهش دقت ذخیره‌سازی اعداد (یه جور فشرده‌سازی هوشمند مدل). نسخه 2-bit اندازه مدل رو حدود 84٪ کوچیک‌تر کرده و به 238GB رسونده، در حالی که هنوز حدود 82٪ از accuracy حفظ شده. برای جلوگیری از افت کیفیت هم بعضی لایه‌های مهم با دقت بالاتر نگه داشته شدن.
برای اجراش چی میخوای؟
یه Mac با 256GB RAM (M3/M4 Ultra) برای اجرای کامل روی یه دستگاه یا GPU با 24GB VRAM + 256GB RAM با memory offloading و می‌تونی با ابزارهایی مثل llama.cpp، LM Studio یا Unsloth Studio اجراش کنی. درسته این سیستمی که میخواد خیلی قویه و برای خیلیا در دسترس نیست اما کارهایی مثل local coding agent و پردازش long-context که قبلاً فقط با cloud API ممکن بود، کم‌کم دارن روی سیستم شخصی هم قابل اجرا می‌شن لینک @silicon_brain | از هوش مصنوعی عقب نمانید

سایت OpenRouter یه ابزار اضافه کرده به اسم Cost Simulator این ابزار ۱۰۰ تا ریکوئست آخرت رو برمی‌داره و می‌ندازه روی مدل‌های د
سایت OpenRouter یه ابزار اضافه کرده به اسم Cost Simulator این ابزار ۱۰۰ تا ریکوئست آخرت رو برمی‌داره و می‌ندازه روی مدل‌های دیگه مثل GPT-5.5 یا GLM 5.2 تا ببینی روی اون مدلا چقد هزینت میشد.
سیستمش بر اساس Median Endpoint Pricing کار می‌کنه
یعنی قیمت واقعی رو حساب می‌کنه نه اون قیمت‌های اسمی که شرکت‌ها توی داکیومنت‌هاشون می‌زنن. خروجی کار هم یه جدول مقایسه‌ای و فایل CSV هست که برای گزارش دادن به تیم محصول یا مدیریت عالیه.
مثلاً توی دمو نشون می‌ده که سوییچ کردن از Claude Fable 5 به مدل‌های اقتصادی‌تر می‌تونه تا ۷۰ درصد هزینه‌هات رو کم کنه بدون اینکه لازم باشه حدس بزنی.
لینک @silicon_brain | از هوش مصنوعی عقب نمانید

احیای نسبی بازار کار پس از اتصال مجدد اینترنت 📊 در دوره اختلال اینترنت، بسیاری از کسب‌وکارها به دلیل افزایش نااطمینانی و آسی
احیای نسبی بازار کار پس از اتصال مجدد اینترنت 📊 در دوره اختلال اینترنت، بسیاری از کسب‌وکارها به دلیل افزایش نااطمینانی و آسیب به فرآیندهای عملیاتی، برنامه‌های جذب نیرو را متوقف یا محدود کرده بودند. اکنون با بازگشت اینترنت، بخشی از نیازهای استخدامی معوق دوباره فعال شده و نشانه‌هایی از احیای بازار کار دیده می‌شود. به طوری که:
تعداد آگهی‌های استخدامی به بالاترین میزان از دی‌ماه سال گذشته رسیده است.
📈 با این حال، این بهبود هنوز به معنای خروج کامل از رکود نیست. زیرا
تعداد آگهی‌های استخدامی همچنان حدود ۵۰ درصد کمتر از مدت مشابه سال گذشته است
و هم‌زمان
تعداد کارجویانی که رزومه ارسال می‌کنند نیز ۱۰ درصد کاهش یافته است؛
موضوعی که می‌تواند ناشی از ناامیدی در رقابت شدید بازار کار یا احتیاط بیشتر افراد برای تغییر شغل در شرایط اقتصادی نامطمئن باشد. 🔗 برای جزئیات بیشتر، می‌توانید لینک زیر را مشاهده کنید: www.e-estekhdam.com/u-zk4bi4

‏Z.ai مدل جدیدش یعنی GLM-5.2 رو منتشر کرده یه open-weights model که تمرکزش روی coding و کارهای سنگین توسعه نرم‌افزاره. مهم‌تر
Z.ai مدل جدیدش یعنی GLM-5.2 رو منتشر کرده یه open-weights model که تمرکزش روی coding و کارهای سنگین توسعه نرم‌افزاره. مهم‌ترین تغییرش 1M context window هست، یعنی می‌تونی تقریباً یه codebase کامل رو یکجا به مدل بدی و ازش بخوای refactor، debug یا توسعه بده، بدون اینکه وسط کار context رو از دست بده. این عدد نسبت به GLM-5.1 حدود ۵ برابر بیشتر شده (از 200K به 1M رسیده) برای کنترل تعادل بین سرعت و کیفیت هم دو حالت reasoning داره:
Max mode
قدرت بیشتر برای مسئله‌های پیچیده، ولی مصرف compute بالاتر
High mode
سریع‌تر و ارزون‌تر، مناسب بیشتر کارها یه نکته جذاب دیگه اینه که با MIT license منتشر شده؛ یعنی می‌تونی weights رو دانلود کنی، self-host کنی، fine-tune انجام بدی و راحت برای کارای تجاری استفاده کنی. از نظر benchmark هم روی Terminal-Bench 2.1 امتیاز 81.0 گرفته که نسبت به 62.0 در GLM-5.1 رشد قابل توجهیه. از نظر قیمت هم حدود 1.40 دلار برای هر میلیون input token هزینه داره؛ تقریباً یک‌ششم GPT-5.5. @silicon_brain | از هوش مصنوعی عقب نمانید

نتیجه ۴ تا از بازی‌های اخیر توسط AI درست پیش بینی شد. با اختلاف گل نزدیک بعد از اتمام دور اول بازی‌ها یه ریپورتی از عملکردش درمیارم بررسی کنیم @preaiball

جدیدا MiniMax وزن‌های (weights) مدل MiniMax M3 رو به‌صورت عمومی روی Hugging Face منتشر کرده نکته مهم اینه که M3 اولین open-we
جدیدا MiniMax وزن‌های (weights) مدل MiniMax M3 رو به‌صورت عمومی روی Hugging Face منتشر کرده نکته مهم اینه که M3 اولین open-weight model محسوب می‌شه که هم‌زمان coding قوی، پنجره context یک میلیون توکنی و پشتیبانی multimodal از تصویر و ویدیو رو تو یه مدل ارائه می‌ده؛ قابلیتی که تا الان بیشتر پشت APIهای پولی بود. بزرگ‌ترین ویژگی M3 همون 1M context window هست؛ یعنی می‌تونه حجم خیلی بزرگی از اطلاعات (مثلاً کل یه codebase) رو یکجا پردازش کنه و به کمک معماری جدید sparse attention هزینه پردازش contextهای بلند رو تا حدود ۲۰ برابر کمتر از نسل قبل کرده. از نظر performance هم توی SWE-Bench Pro امتیاز 59.0٪ گرفته و کمی از GPT-5.5 (58.6٪) جلو زده.
قابلیت‌های مهم
پردازش کل codebase بدون نیاز به chunking دریافت مستقیم image و video بدون مدل vision جدا کنترل کامپیوتر شبیه computer-use API شرکت Anthropic فعال یا غیرفعال کردن thinking mode برای هر درخواست هم از طریق API قابل استفاده‌ست و هم چون weights منتشر شده، می‌شه به‌صورت self-host اجراش کرد هاگینگ‌فیس @silicon_brain | از هوش مصنوعی عقب نمانید