Tensorflow(@CVision)

Open in Telegram

اخبار حوزه یادگیری عمیق و هوش مصنوعی مقالات و یافته های جدید یادگیری عمیق بینایی ماشین و پردازش تصویر TensorFlow, Keras, Deep Learning, Computer Vision سایت: http://class.vision 👨‍💻👩‍💻پشتیبان دوره ها: @classvision_support لینک گروه: @tf2keras

Iran22 034 Technologies & Applications8 515...

📈 Analytical overview of Telegram channel Tensorflow(@CVision)

Channel Tensorflow(@CVision) (@cvision) in the Farsi language segment is an active participant. Currently, the community unites 14 979 subscribers, ranking 8 515 in the Technologies & Applications category and 22 034 in the Iran region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 14 979 subscribers.

According to the latest data from 27 July, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -22 over the last 30 days and by -9 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 21.25%. Within the first 24 hours after publication, content typically collects 10.16% reactions from the total number of subscribers.
Post reach: On average, each post receives 3 183 views. Within the first day, a publication typically gains 1 522 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 18.
Thematic interests: Content is focused on key topics such as مدل, مصنوعی, llm, استدلال, مغز.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“اخبار حوزه یادگیری عمیق و هوش مصنوعی مقالات و یافته های جدید یادگیری عمیق بینایی ماشین و پردازش تصویر TensorFlow, Keras, Deep Learning, Computer Vision سایت: http://class.vision 👨‍💻👩‍💻پشتیبان دوره ها: @classvision_support لینک گروه: @tf2kera...”

Thanks to the high frequency of updates (latest data received on 28 July, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

14 979

Subscribers

-924 hours

+67 days

-2230 days

3 183

Post views

~ 1 52224 hours

~ 1 74148 hours

21.25%

Engagement rate

~ 1

Posts per day

Ads index

beta

Posts Archive

14 979

اسکیل پیشنهادی: video-prompt-generator (توسعه‌یافته توسط Liangdabiao) 📝 درباره این ابزار: این اسکیل بر پایه یک چارچوب ۷ لایه‌ای و حرفه‌ای برای نوشتن پرامپت‌های قدرتمند طراحی شده است. کارکرد اصلی آن، آموزش به ایجنت (Agent) برای تنظیم دقیق جزئیاتی مانند توصیفات فیزیکی، نورپردازی، ساختار چهره و فرمت‌های JSON است. نتیجه این دقت، خلق تصاویر پایدار با حفظ ثبات (Consistency) در تمامی زوایا خواهد بود

14 979

Repost from N/a

در صورتی که به مدرک مکتب‌خونه نیاز ندارید، می‌توانید کوییزها، و تمرین‌ها و پروژه‌ها را از طریق کانال دانلود کنید: لینک کانال: https://t.me/agentic_llm لینک دوره: https://mktb.me/m6tt/ هنگام خرید، کافیست گزینه‌ی «دسترسی پایه» را تیک بزنید تا فقط به ویدیوها دسترسی داشته باشید و بتوانید با هزینه‌ی کمتری ثبت‌نام کنید. @agentic_llm

14 979

Repost from N/a

اگر به مدرک مکتب خونه نیازی ندارید، کوییز ها و تمرینها و پروژه را میتوانید از کانال دانلود کنید: https://t.me/agentic_llm لینک دوره https://mktb.me/m6tt/

14 979

Repost from N/a

نیازی نیست دوره اگر به مدرک مکتب خونه نیازی ندارید، کوییز ها و تمرینها را میتوانید از کانال دانلود کنید: https://t.me/agentic_llm لینک دوره https://mktb.me/m6tt/

14 979

Repost from N/a

اسلایدهای دوره Agentic

14 979

Repost from N/a

🤖 دوره «Agentic AI با پایتون» منتشر شد! اگه دنبال این هستی که از حرف زدن با یه مدل زبانی، بری سراغ ساختن عامل‌هایی (Agent) که واقعاً کار انجام می‌دن، ابزار صدا می‌زنن، با هم تیم می‌شن و پروژه‌های واقعی رو پیش می‌برن، این دوره برای شماست! توی ۸ فصل، از صفر تا ساخت یک پروژه‌ی نهایی کامل جلو می‌ریم: 📘 مقدمه 📗 فصل ۱ - مقدمه‌ای بر گردش‌کارهای عامل‌محور 📗 فصل ۲ - الگوی طراحی Reflection 📗 فصل ۳ - استفاده از ابزار (Tool Use) 📗 فصل ۴ - MCP (پروتکل ارتباط مدل با ابزارها) 📗 فصل ۵ - نکات عملی برای ساخت Agentic AI 📗 فصل ۶ - الگوهای عامل‌های با خودمختاری بالا 📗 فصل ۷ - سیستم‌های چندعامله با crewAI 📗 فصل ۸ - LangChain 🎯 پروژه نهایی: پیاده‌سازی سامانه‌ی Text-to-SQL تمام کدهای دوره روی گیت‌هاب در دسترس است: 👉 github.com/Alireza-Akhavan/agentic_ai 🎁 تخفیف ویژه 1️⃣برای ۱۰۰ نفر اول، کد تخفیف ۷۰٪ی: COUPON-EAA61 2️⃣ برای ۱۰۰ نفر بعدی، کد تخفیف ۶۰٪ی: COUPON-6EE77 تعداد کدها محدوده، پس اگر می‌خواهی Agentic AI را اصولی یاد بگیری، همین امروز ثبت‌نام کن. سرفصلهای این دوره |برای مشاهده اسلاید؛ تمرین، پروژه 👈 @agentic_llm

14 979

Repost from آموزش LLM و VLM

🧠 مایکروسافت مدل جدید Mage-VL رو منتشر کرد؛ یک مدل چندوجهیِ «کدک-محور» برای درک ویدیو و استریم زنده مایکروسافت دو مدل به‌هم‌مرتبط رو روی HuggingFace منتشر کرده: 🔹 مدل Mage-VL — مدل چندوجهیِ ۴ میلیارد پارامتری (بر پایه‌ی Qwen3-4B) که هم‌زمان تصویر، ویدیوی کوتاه/بلند و استریم زنده رو درک می‌کنه. 🔹 مدل Mage-ViT — انکودر بصری همین مدل، که کاملاً از صفر (بدون هیچ پیش‌آموزش تصویر-متنِ میلیاردی) آموزش دیده. ✨ ایده‌ به‌جای اینکه ویدیو رو به فریم‌های یکنواخت تبدیل کنن و همه‌شون رو به مدل بدن (که پرهزینه‌ست)، از منطق کدک‌های ویدیویی (مثل H.264/HEVC) الهام گرفتن: فقط فریم‌های کلیدی (I-frame) کامل نگه داشته می‌شن و از فریم‌های پیش‌بینی‌شده (P-frame) فقط بخش‌هایی که واقعاً حرکت/تغییر دارن انتخاب می‌شن. نتیجه؟ • کاهش بیش از ۷۵٪ در تعداد توکن‌های بصری • تا ۳.۵ برابر سرعت بیشتر در inference • آموزش روی ویدیوهایی تا ۸ برابر طولانی‌تر با همون بودجه‌ی محاسباتی 📊 عملکرد: با همون بک‌بون ۴B، در تقریباً همه‌ی بنچمارک‌های ویدیویی و درک مکانی از Qwen3-VL-4B جلوتره (مثلاً +۲۲.۵ در QVHighlight و +۱۱ در VSI-Bench)، و در تصاویر استاتیک هم‌سطح یا کمی بهتره. 🎙️ یه قابلیت جالب دیگه: یک «گیت شناختی» سبک داره که مدل رو در حالت استریم فقط وقتی «رویداد قابل‌توجهی» رخ بده فعال می‌کنه (مثلاً روی گزارش زنده‌ی فوتبال تست شده) — بدون نیاز به چند مدل جدا. 🔗 Mage-VL: https://huggingface.co/microsoft/Mage-VL 🔗 Mage-ViT: https://huggingface.co/microsoft/Mage-ViT

14 979

مقدمه کورس Agentic AI که در روزهای پیش رو منتشر خواهد شد...

14 979

🔥 یه خبر فوق‌العاده برای دیزاینرها و تولیدکننده‌های محتوا! نسخه جدید هوش مصنوعی Qwen-Image-3.0 معرفی شد و این بار قرار نیست فقط عکس‌های قشنگ تحویلمون بده! این مدل یه ابزار کاملاً کاربردی و حرفه‌ایه که می‌تونه طرح‌های پیچیده و دقیق بزنه؛ از جمله: 📰 طراحی صفحات روزنامه و مجله 🎬 ساخت استوری‌بورد برای ویدیوها 💻 طراحی رابط کاربری (UI) وب‌سایت 💡 نکته جذاب‌تر؟ از ۱۲ زبان مختلف پشتیبانی می‌کنه و دقتش توی درک جزئیات واقعاً بالاست. 📌 اگه دیزاینری یا محتوا می‌سازی، حتماً این ابزار جدید رو تست کن!

14 979

اصلاحیه: مون شات🫣

14 979

Repost from آموزش LLM و VLM

🚀 موشن‌شات از کیمی K3 رونمایی کرد شرکت چینی Moonshot AI امروز قدرتمندترین مدل پرچمدار خودش، Kimi K3، رو رسما معرفی کرد. 🔹 پنجره‌ی زمینه تا ۱ میلیون توکن 🔹 بهبود قابل‌توجه در کدنویسی، تولید سه‌بعدی و وظایف دانشی پیچیده 🔹 طبق برخی نشت‌ها و تست‌های کاربران، حدود ۲.۵ تریلیون پارامتر دارد (این رقم هنوز رسما تأیید نشده) 🔹 در برخی بنچمارک‌های کدنویسی از GPT-5.5 جلو زده این عرضه فقط ۳ ماه بعد از متن‌باز شدن K2.6 اتفاق افتاد و نشون‌دهنده‌ی شتاب چشمگیر در چرخه‌ی توسعه‌ی موشن‌شاته. 💰 هم‌زمان، موشن‌شات دور جدید تأمین مالی با ارزش‌گذاری ۲۰ میلیارد دلاری رو بسته و درآمد سالانه‌ی خانواده‌ی مدل‌های کیمی از ۳۰۰ میلیون دلار عبور کرده. بازار پیش‌بینی Polymarket پیش از رونمایی، احتمال عرضه‌ی K3 در جولای رو تا ۹۸٪ برآورد کرده بود. 📎 منبع: finance.biggo.com

14 979

NotebookLM is now Gemini Notebook https://blog.google/innovation-and-ai/products/gemini-notebook/notebooklm-gemini-notebook/

14 979

Repost from آموزش LLM و VLM

پارت ۲ 2️⃣ ادغام چند متخصص RL در یک مدل (on-policy distillation): به‌جای اینکه یک مدل رو با RL روی همه‌چی خوب کنیم (که باعث فراموشی مهارت‌های قبلی می‌شه)، برای هر حوزه (ریاضی، کد، ایجنت) یه معلمِ متخصص جدا با RL می‌سازن، بعد همه رو تو یه دانش‌آموز واحد distill می‌کنن؛ در حالی که خودِ دانش‌آموز داره rollout تولید می‌کنه. جالبه که این معلم‌ها لزوماً بزرگ‌تر نیستن، فقط تخصصی‌ترن. این الگو رو DeepSeek-V4، MiMo (با نام MOPD)، GLM-5 و Nemotron 3 Ultra استفاده کردن. 3️⃣ خود مدل، معلم خودش (self-distillation): مثل Cursor Composer 2.5 که یه hint به context اضافه می‌کنه، نسخه‌ی hint‌دار مدل می‌شه معلم نسخه‌ی بدون‌hint. یا روش Thinking Machines که برای جلوگیری از فراموشی، از چک‌پوینتِ قبل از fine-tune به‌عنوان معلم استفاده می‌کنن. نکته‌ی مشترک همه‌شون: معلم لزوماً بزرگ‌تر نیست، فقط تو یه context یا حوزه بهتره. گاهی اون معلم، خودِ مدله. 🔗 منبع: huggingface.co/blog/sergiopaniego/distillation-2026

14 979

Repost from آموزش LLM و VLM

پارت ۱ تو دوره‌ی LLM مکتب‌خونه با مفهوم knowledge distillation آشنا شدیم؛ ایده‌ی ساده و آشنا: یه مدل معلمِ بزرگ و گرون، یه مدل دانش‌آموزِ کوچیک‌تر رو آموزش می‌ده تا رفتارش رو تقلید کنه. اما واقعیت اینه که این روش خیلی متنوع‌تره. تو پست زیر نشون می‌ده مدل‌های فرانتیر ۲۰۲۶ دقیقاً از چه نسخه‌هایی از distillation استفاده می‌کنن: 1️⃣ معلم بزرگ و دانش‌آموز کوچیک (روش کلاسیک): مثل Gemma 3 و DeepSeek-R1-Distill که یا روی logit‌های معلم match می‌کنن (soft label) یا مستقیم روی متن تولیدشده‌ی معلم fine-tune می‌شن.

14 979

شرکت NVIDIA یه مجموعه داده بزرگ رایگان برای آموزش هوش مصنوعی منتشر کرده برای اینکه یه هوش مصنوعی بتونه کارهای واقعی انجام بده (کد بزنه، خطا پیدا کنه، از ابزار استفاده کنه)، باید با هزاران نمونه‌ی واقعی از این کارها آموزش ببینه. ولی این نمونه‌ها کمیاب هستن و شرکت‌ها معمولاً منتشر نمی‌کنند. مثلا یه ربات که فقط با متن انگلیسی آموزش دیده، وقتی بخواد توهین رو توی زبون کره‌ای یا ژاپنی تشخیص بده، شکست می‌خوره، چرا که توی این زبون‌ها پرخاشگری معمولاً توی «لحن مؤدبانه‌ی ظاهری» پنهان می‌شه، نه توی کلمات رکیک! فلذا بدیهیست که داده‌ی انگلیسی به تنهایی کافی نیست. حالا انویدیا دو تا چیز رو رایگان منتشر کرده: 📍 اولا Prompt Atlas — یه نقشه‌ی بصری با میلیون‌ها نمونه پرامپت واقعی (کدنویسی، ریاضی، ایمنی و...) که می‌تونی توش بگردی: https://huggingface.co/spaces/nvidia/nemotron-post-training-v3-prompt-atlas 👥 ثانیا Nemotron-Personas — بیش از ۲ میلیارد «آدم مصنوعی» از ۱۰ کشور مختلف، برای تست اینکه هوش مصنوعی واقعاً فرهنگ و زبون مردمِ مناطق مختلف رو می‌فهمه یا نه. 🔗 مقاله: https://huggingface.co/blog/nvidia/open-data-for-agents #NVIDIA #هوش_مصنوعی #Nemotron

14 979

Repost from آموزش LLM و VLM

مدل SenseNova-Vision-7B-MoT از تیم SenseNova برخلاف VLMهای معمول (مثل Qwen-VL) که فقط تصویر می‌گیرن و متن تولید می‌کنن، این مدل هم متن تولید می‌کنه هم تصویر — یعنی می‌تونه خروجی‌هایی مثل نقشه عمق، ماسک سگمنتیشن یا نقشه نقاط سه‌بعدی رو مستقیماً و بدون هد اختصاصی برای هر تسک بسازه - تشخیص اشیا، لوکالیزیشن، OCR، گراندینگ رابط کاربری، کی‌پوینت - تخمین عمق و نرمال سطح - سگمنتیشن (رفرنسی، استدلالی، تعاملی، GCG) - بازسازی هندسه چندنمایی و تخمین پوز دوربین 📊 عملکرد: در مقایسه با Qwen3-VL-8B-Instruct، در اکثر تسک‌های تشخیص و لوکالیزیشن جلوتره؛ مثلاً OCR (ICDAR15): ۴۹.۵ در برابر ۲۵.۴، و RefCOCOg: ~80 در برابر ~72. البته در مقابل، توی درک عمومی تصویر (MMMU) با نمره ۰.۴۲ از Bagel (۰.۵۵) عقب‌تره — یعنی این مدل تخصصیِ کارهای ساختاریافته بینایی‌ست، نه مکالمه و استدلال عمومی. 🔗 مدل در هاگینگ فیس 🔗 گیت‌هاب 📄 مقاله ___ @llm_huggingface @cvision

14 979

یه وکتور دیبابیس سبک از علی بابا https://github.com/alibaba/zvec

14 979

چند هفته پیش ضبط دوره‌ی Agentic AI تموم شد 🎬 طبق چیزی که دوستان مکتب‌خونه گفتن، این دوره ۸ فصلی قراره هفته آینده روی سایت مکتب‌خونه منتشر بشه ✅ منتظرتون هستیم 🚀

14 979

Repost from آموزش LLM و VLM

مدل LocateAnything از NVIDIA؛ حذف یکی از بزرگ‌ترین گلوگاه‌های مدل‌های Vision-Language مدل جدید LocateAnything انویدیا مشکل کندی مدل‌های تشخیص اشیاء رو با یه ایده ساده و هوشمندانه حل کرده: Parallel Box Decoding (PBD). مسئله چی بود؟ مدل‌های VLM معمولاً مختصات هر باکس (x1,y1,x2,y2) رو توکن به توکن و به‌صورت متوالی تولید می‌کنن. وقتی صحنه پر از اشیاء باشه (مثلاً ۱۰۰ آبجکت)، این یعنی هزاران توکن قبل از رسیدن به جواب نهایی! هم کند، هم چون مختصات یک باکس مستقل از هم پیش‌بینی می‌شن، کاهش دقت هندسی. راه‌حل PBD: کل باکس به‌عنوان یک واحد اتمیک (block) با طول ثابت در یک گام موازی پیش‌بینی می‌شه، نه توکن به توکن. این کار هم‌زمانی همون‌قدر که سرعت رو بالا می‌بره، دقت رو هم بهتر می‌کنه چون چهار مختصه با آگاهی از هم پیش‌بینی می‌شن (نه کور و مستقل). 📄 مقاله: https://research.nvidia.com/labs/lpr/locate-anything/LocateAnything.pdf 🌐 پروژه: https://research.nvidia.com/labs/lpr/locate-anything/ 💻 دمو : https://huggingface.co/spaces/nvidia/LocateAnything 🤗مدل: https://huggingface.co/spaces/nvidia/LocateAnything

14 979

یه بنده خدایی یه پرامپت را آزمایش کرده و اعلام کرده که Fable 5 تو رقابت جدیدمون کامل بقیه رو داغون کرد، ولی ۶ برابر گرون‌تر از Opus 4.8 تموم شد! به ۴ مدل یه پرامپت یکسان داده: ساخت سه تا صحنه مستقل با HTML5 canvas و فیزیک واقعی پرامپت‌ها: خارج شدن قطار از ریل روی یه پل شکسته و سقوط تو آب پرش دو ماشین از سکو و برخورد تو هوا روی یه دره له کردن یه ردیف ماشین پارک‌شده توسط مونستر تراک خروجی‌ها: Fable 5: ۶۲,۱۵۸ توکن، $۳.۱۲ GPT 5.5: ۳۷,۷۵۳ توکن، $۱.۱۴ Opus 4.8: ۲۲,۲۸۰ توکن، $۰.۵۶ GLM 5.2: ۳۶,۲۴۶ توکن، $۰.۰۸ مدل Fable 5 هر سه صحنه رو با نمره A+ رد کرد. برخوردها واقعی به‌نظر می‌رسیدن، اشیاء درست می‌افتادن و می‌شکستن، و هیچ‌چیز از داخل زمین رد نمی‌شد یا معلق نمی‌موند. مدل GPT 5.5 نزدیک‌ترین رقیب به Fable بود. تو صحنه‌ی Bigfoot حتی به‌نظرمون یه‌کم از Fable بهتر بود. مدل GLM 5.2 تو هیچ صحنه‌ای برنده نشد، ولی به‌مراتب ارزون‌ترین بود. منبع: https://twitter.com/atomic_chat_hq/status/2072446067962978411