es
Feedback
Tensorflow(@CVision)

Tensorflow(@CVision)

Ir al canal en Telegram

اخبار حوزه یادگیری عمیق و هوش مصنوعی مقالات و یافته های جدید یادگیری عمیق بینایی ماشین و پردازش تصویر TensorFlow, Keras, Deep Learning, Computer Vision سایت: http://class.vision 👨‍💻👩‍💻پشتیبان دوره ها: @classvision_support لینک گروه: @tf2keras

Mostrar más

📈 Análisis del canal de Telegram Tensorflow(@CVision)

El canal Tensorflow(@CVision) (@cvision) en el segmento lingüístico de Farsi es un actor destacado. Actualmente la comunidad reúne a 15 002 suscriptores, ocupando la posición 8 596 en la categoría Tecnologías y Aplicaciones y el puesto 21 674 en la región Irán.

📊 Métricas de audiencia y dinámica

Desde su creación el невідомо, el proyecto ha mostrado un crecimiento acelerado, reuniendo a 15 002 suscriptores.

Según los últimos datos del 30 junio, 2026, el canal mantiene una actividad estable. En los últimos 30 días la variación de miembros fue de 14, y en las últimas 24 horas de -1, conservando un alto alcance.

  • Estado de verificación: No verificado
  • Tasa de interacción (ER): El promedio de interacción de la audiencia es 26.88%. Durante las primeras 24 horas tras publicar, el contenido suele obtener 9.81% de reacciones respecto al total de suscriptores.
  • Alcance de las publicaciones: Cada publicación recibe en promedio 4 033 visualizaciones. En el primer día suele acumular 1 471 visualizaciones.
  • Reacciones e interacción: La audiencia responde de forma activa: el promedio de reacciones por publicación es 26.
  • Intereses temáticos: El contenido se centra en temas clave como مدل, مصنوعی, llm, استدلال, مغز.

📝 Descripción y política de contenido

El autor describe el recurso como un espacio para expresar opiniones subjetivas:
اخبار حوزه یادگیری عمیق و هوش مصنوعی مقالات و یافته های جدید یادگیری عمیق بینایی ماشین و پردازش تصویر TensorFlow, Keras, Deep Learning, Computer Vision سایت: http://class.vision 👨‍💻👩‍💻پشتیبان دوره ها: @classvision_support لینک گروه: @tf2kera...

Gracias a la alta frecuencia de actualizaciones (últimos datos recibidos el 01 julio, 2026), el canal mantiene la vigencia y un amplio alcance. La analítica demuestra que la audiencia interactúa activamente con el contenido, lo que lo convierte en un punto de referencia dentro de la categoría Tecnologías y Aplicaciones.

15 002
Suscriptores
-124 horas
+237 días
+1430 días
Atraer Suscriptores
junio '26
junio '26
+104
en 1 canales
mayo '26
+22
en 0 canales
Get PRO
abril '26
+22
en 0 canales
Get PRO
marzo '26
+8
en 0 canales
Get PRO
febrero '26
+29
en 0 canales
Get PRO
enero '26
+13
en 0 canales
Get PRO
diciembre '25
+62
en 1 canales
Get PRO
noviembre '25
+281
en 22 canales
Get PRO
octubre '25
+201
en 14 canales
Get PRO
septiembre '25
+265
en 21 canales
Get PRO
agosto '25
+284
en 16 canales
Get PRO
julio '25
+165
en 3 canales
Get PRO
junio '25
+64
en 5 canales
Get PRO
mayo '25
+236
en 9 canales
Get PRO
abril '25
+123
en 3 canales
Get PRO
marzo '25
+164
en 10 canales
Get PRO
febrero '25
+153
en 7 canales
Get PRO
enero '25
+136
en 5 canales
Get PRO
diciembre '24
+100
en 1 canales
Get PRO
noviembre '24
+247
en 4 canales
Get PRO
octubre '24
+353
en 10 canales
Get PRO
septiembre '24
+239
en 6 canales
Get PRO
agosto '24
+250
en 6 canales
Get PRO
julio '24
+230
en 7 canales
Get PRO
junio '24
+182
en 2 canales
Get PRO
mayo '24
+1 045
en 16 canales
Get PRO
abril '24
+533
en 17 canales
Get PRO
marzo '24
+364
en 3 canales
Get PRO
febrero '24
+453
en 5 canales
Get PRO
enero '24
+753
en 12 canales
Get PRO
diciembre '23
+837
en 15 canales
Get PRO
noviembre '23
+416
en 17 canales
Get PRO
octubre '23
+223
en 9 canales
Get PRO
septiembre '23
+296
en 0 canales
Get PRO
agosto '23
+226
en 0 canales
Get PRO
julio '23
+144
en 0 canales
Get PRO
junio '23
+229
en 0 canales
Get PRO
mayo '23
+135
en 0 canales
Get PRO
abril '23
+166
en 0 canales
Get PRO
marzo '23
+189
en 0 canales
Get PRO
febrero '23
+132
en 0 canales
Get PRO
enero '23
+149
en 0 canales
Get PRO
diciembre '22
+101
en 0 canales
Get PRO
noviembre '22
+124
en 0 canales
Get PRO
octubre '22
+132
en 0 canales
Get PRO
septiembre '22
+185
en 0 canales
Get PRO
agosto '22
+231
en 0 canales
Get PRO
julio '22
+180
en 0 canales
Get PRO
junio '22
+106
en 0 canales
Get PRO
mayo '22
+347
en 0 canales
Get PRO
abril '22
+291
en 0 canales
Get PRO
marzo '22
+74
en 0 canales
Get PRO
febrero '22
+90
en 0 canales
Get PRO
enero '22
+165
en 0 canales
Get PRO
diciembre '21
+87
en 0 canales
Get PRO
noviembre '21
+208
en 0 canales
Get PRO
octubre '21
+140
en 0 canales
Get PRO
septiembre '21
+267
en 0 canales
Get PRO
agosto '21
+103
en 0 canales
Get PRO
julio '21
+167
en 0 canales
Get PRO
junio '21
+175
en 0 canales
Get PRO
mayo '21
+213
en 0 canales
Get PRO
abril '21
+147
en 0 canales
Get PRO
marzo '21
+87
en 0 canales
Get PRO
febrero '21
+270
en 0 canales
Get PRO
enero '21
+86
en 0 canales
Get PRO
diciembre '20
+6 203
en 0 canales
Fecha
Crecimiento de Suscriptores
Menciones
Canales
30 junio+2
29 junio+3
28 junio+3
27 junio+9
26 junio+2
25 junio+14
24 junio+9
23 junio+12
22 junio+2
21 junio+6
20 junio+6
19 junio0
18 junio+6
17 junio+1
16 junio+9
15 junio+1
14 junio+3
13 junio+1
12 junio+3
11 junio+5
10 junio0
09 junio0
08 junio+1
07 junio0
06 junio0
05 junio+4
04 junio0
03 junio0
02 junio+1
01 junio+1
Publicaciones del Canal
🚀 معرفی Claude Sonnet 5 آنتروپیک از Claude Sonnet 5 رونمایی کرد؛ عامل‌محورترین مدل خانواده Sonnet تا امروز. 🔹 عملکردش به Opus 4.8 نزدیک شده، اما با قیمتی به‌مراتب پایین‌تر 🔹 پیشرفت محسوس نسبت به Sonnet 4.6 در استدلال، استفاده از ابزار‌، کدنویسی و کارهای دانش‌محور 🔹 از امروز در همه پلن‌ها در دسترسه؛ مدل پیش‌فرض پلن‌های Free و Pro، و در دسترس برای Max، Team و Enterprise 🔹 در Claude Code و Claude Platform هم فعاله؛ نام مدل برای API: claude-sonnet-5 💰 قیمت‌گذاری مقدماتی (تا 31 آگوست 2026): ورودی: $2 به ازای هر میلیون توکن خروجی: $10 به ازای هر میلیون توکن بعد از اون: $3 ورودی / $15 خروجی 🛡 ایمنی: نرخ رفتارهای نامطلوب نسبت به Sonnet 4.6 کاهش پیدا کرده و در زمینه‌های عامل‌محور (مثل مقاومت در برابر حملات prompt injection) ایمن‌تر شده. توانایی انجام کارهای سایبری خطرناک (مثل توسعه اکسپلویت) به‌طور قابل‌توجهی پایین‌تر از مدل‌های Opus هست. 📖 جزئیات کامل: https://www.anthropic.com/news/claude-sonnet-5 #Claude #Anthropic #AI #LLM

2
برای این مدل krea تازه منتشر شده یکی LoRA ترین کرده که بزارید کنار مدل تا تصاویر realistic درست کنه https://huggingface.co/gokaygokay/Krea-2-Realism-LoRA
1 429
3
📊 بهره‌وری توکن در Agent Arena بنچ مارک Agent Arena عملکرد ایجنت‌های هوش مصنوعی رو روی تسک‌های واقعی (نوشتن کد، ساخت اسلاید،
📊 بهره‌وری توکن در Agent Arena بنچ مارک Agent Arena عملکرد ایجنت‌های هوش مصنوعی رو روی تسک‌های واقعی (نوشتن کد، ساخت اسلاید، تحقیق وب، توسعه اپ، تحلیل اسناد) با ابزارهای search، filesystem و terminal می‌سنجه. نکته کلیدی اینه که مصرف توکن بیشتر همیشه به کیفیت بهتر منجر نمی‌شه. این نمودار هر مدل را نشون می‌ده بهبود عملکرد (عمودی) در برابر میانه توکن مصرفی (افقی) — و یک خط روند کلی ترسیم می‌کنه. فاصله از این خط، بخش جالب ماجراست. یافته‌ها: ✅مدل Opus با توکن کمتر کیفیت بالاتری می‌ده. Fable با +۱۴.۱٪ بهترین کیفیت رو داره، در برابر +۹.۲٪ برای Opus 4.8 Thinking با مصرف توکن مشابه. ✅ هر سه مدل GPT-5.5 (بین +۶.۲٪ تا +۸.۶٪) بالای خط بهره‌وری قرار دارن، با توکن کمتر از مدل‌های پیشروی Claude. ✅ مدل GLM-5.2 با +۵.۱٪ تقریباً دقیق روی خط روند قرار می‌گیره. ⚠️ توکن مساوی بازده نیست: Gemini-3.5 Flash بیشترین توکن رو مصرف می‌کنه ولی فاصله زیادی تا فرانتیر داره، و Grok Build 0.1 با ۲۰هزار+ توکن، بهبود منفی نشون می‌ده. ⚠️ گوشه پایین-چپ (مصرف کم، بازده کم): Grok-4.3، Nemotron 3 Ultra و Gemma-4 31B. @cvision
1 602
4
روش MiCA جایگزین قدرتمند LoRA در Fine-tuning یه روش جدید به اسم MiCA یا (MinoCA Component Adaptation) به کتابخونه PEFT هاگینگ
روش MiCA جایگزین قدرتمند LoRA در Fine-tuning یه روش جدید به اسم MiCA یا (MinoCA Component Adaptation) به کتابخونه PEFT هاگینگ‌فیس اضافه شده و نتایجش چشمگیره. ایده اصلی تکنیک LoRA روی بخش‌هایی از مدل تمرکز می‌کنه که بیشترین استفاده رو دارن. MiCA برعکس عمل می‌کنه — روی فضاهای کمتر استفاده‌شده (minor singular subspace) تنظیم می‌کنه تا دانش جدید جذب بشه بدون اینکه دانش قبلی از بین بره. نتایج روی ۳ مدل مختلف: 📈 +۸۸٪ یادگیری دانش جدید نسبت به LoRA 🧠 -۱۹٪ فراموشی فاجعه‌بار (Catastrophic Forgetting) ⚡ -۸۳٪ پارامتر قابل آموزش استفاده ازش ساده‌ست. فقط یه خط تغییر کافیه: init_lora_weights="mica" کاربرد اصلی: به‌خصوص برای continued pretraining و domain adaptation — جایی که می‌خواید مدل دانش جدید یاد بگیره ولی توانایی‌های قبلیش رو حفظ کنه. 🔗 لینک‌ها: 📄 Paper (arXiv): https://arxiv.org/abs/2604.01694 🤗 HuggingFace: https://huggingface.co/papers/2604.01694 💻 PEFT Example & README: https://github.com/huggingface/peft/blob/main/examples/mica_finetuning/README.md
1 326
5
🖼️ Krea 2 Turbo مدل تولید تصویر اوپن‌سورس با ۱۲ میلیارد پارامتر مجپوعه Krea AI اولین مدل بومی خودش رو منتشر کرد و وزن‌ها رو هم اوپن‌سورس کرده. ✨ چرا جالبه؟ ▸ تولید تصویر ۲K در ~۲ ثانیه روی GPU معمولی ▸ فقط ۸ inference step، بدون CFG ▸ رتبه اول بین لب‌های مستقل در لیدربورد Artificial Analysis ▸ اختلاف تنها ۰.۱۴ امتیاز با GPT Image در style fidelity 🔗 لینک‌ها HuggingFace: https://huggingface.co/krea/Krea-2-Turbo GitHub: https://github.com/krea-ai/krea-2 گزارش تکنیکال: https://www.krea.ai/blog/krea-2-technical-report
1 418
6
🗂️ تبدیل اسناد به چانک‌های آماده برای RAG با Chunkr یه ابزار متن‌باز برای پردازش هوشمند اسناد؛ PDF، PowerPoint، Word و تصویر
🗂️  تبدیل اسناد به چانک‌های آماده برای RAG با Chunkr یه ابزار متن‌باز برای پردازش هوشمند اسناد؛ PDF، PowerPoint، Word و تصویر رو می‌گیره و خروجی ساختاریافته برای پایپ‌لاین‌های RAG و LLM تولید می‌کنه. ✅ تحلیل لایه‌بندی سند با OCR و Bounding Box ✅ خروجی HTML و Markdown ساختاریافته ✅ پردازش با مدل‌های Vision-Language ✅ Self-hosted با Docker Compose و پشتیبانی از LLMهای مختلف 🔗 مستندات: https://docs.chunkr.ai/pages/get-started/welcome 🐙 گیت‌هاب: https://github.com/lumina-ai-inc/chunkr #RAG #LLM #OpenSource #DocumentAI
1 358
7
سلام و درود خدمت دوستان و همراهان گرامی 🌱 با توجه به پیام‌هایی که اخیراً دریافت کرده‌ام، لازم دانستم توضیح کوتاهی ارائه کنم. در حال حاضر بنده در هیچ مؤسسه‌ای (چه به‌صورت حضوری و چه آنلاین) که ثبت‌نام دوره‌ای در این فصل داشته باشد، تدریس نمی‌کنم. برخی از مواردی که نام بنده در معرفی دوره‌ها یا صفحات مؤسسات درج شده، مربوط به همکاری‌های قبلی بوده است. همچنین چند موردی که دوستان ارسال کرده‌اند و دوره‌ای با عنوان مدرس «اخوان» معرفی شده بود، صرفاً تشابه اسمی داشته و ارتباطی با بنده ندارد. هدف از این پیام صرفاً شفاف‌سازی و جلوگیری از هرگونه سوءبرداشت است. از همراهی و توجه شما سپاسگزارم. با احترام علیرضا اخوان‌پور
1 747
8
پیاده سازی GraphRAG با Neo4j، Qdrant و Ollama اگه با RAG کار کرده باشید، می‌دونید که بزرگ‌ترین ضعفش اینه که فقط «تکه‌های متن» بازیابی می‌کنه و روابط بین موجودیت‌ها رو از دست میده. میشه گفت GraphRAG تا حد خوبی این مشکل رو حل می‌کنه متن خام رو به یه Knowledge Graph تبدیل می‌کنه و موقع retrieval، هم جستجوی معنایی داری، هم پیمایش روابط گراف. این پست یه پیاده‌سازی عملی ارائه میده: ▫️ابتدا LangExtract — استخراج خودکار موجودیت‌ها و روابط از متن ▫️سپس Neo4j — ذخیره گراف دانش و traversal روابط ▫️و Qdrant — جستجوی vector روی node های گراف ▫️سرو مدل هم Ollama — تمام مدل‌ها local، بدون نیاز به API خارجی جریان کار: متن خام ← استخراج entity/relation ← ذخیره در Neo4j ← embedding هر node در Qdrant ← query time: جستجوی vector + توسعه گراف + پاسخ با LLM https://medium.com/@manthapavankumar11/a-practical-graphrag-architecture-using-langextract-neo4j-qdrant-and-ollama-0e4c86908c41
2 195
9
مثلا صدای Andrew NG را کلون کردم... کاملا لوکال و بدون وب سرویس
2 284
10
for-anyone-interested-in-ai--i.wav
192
11
🎙 Voicebox این ستودیوی صوتی AI متن‌باز جایگزین رایگان ElevenLabs + WisprFlow در یک اپ تر تمیزه که روی کامپیوتر خودتون اجرا می‌شه: ✅ کلون صدا از چند ثانیه صوت ✅ ۷ موتور TTS (Qwen3، Chatterbox، Kokoro، ...) ✅ دیکته با hotkey در هر جای سیستم ✅ کاملاً Local — هیچ داده‌ای از دستگاه خارج نمی‌شه ⭐️ 23k | MIT License ❌هنوز خودش فارسی را ساپورت نکرده، این که یه نفر خودش بخواد فاین تیون کنه یه حرف دیگست... 🔗 github.com/jamiepine/voicebox
2 431
12
فاین تیون کردن مدل‌های MoE با یه خط کد، ۳.۷ برابر سریع‌تر! اخیرا NVIDIA یه کتابخونه open-source معرفی کرده به اسم NeMo AutoMo
فاین تیون کردن مدل‌های MoE با یه خط کد، ۳.۷ برابر سریع‌تر! اخیرا NVIDIA یه کتابخونه open-source معرفی کرده به اسم NeMo AutoModel که روی Transformers v5 هاگینگ‌فیس ساخته شده. فقط یه خط import عوض می‌شه: 🔹 تا ۳.۷ برابر throughput بالاتر 🔹 تا ۳۲٪ حافظه GPU کمتر 🔹 امکان fine-tune مدل ۵۵۰B که با Transformers خالص اصلاً در حافظه جا نمی‌شه سه تکنیک به کار برده: Expert Parallelism، DeepEP fused dispatch، و TransformerEngine kernels. اگه با مدل‌های MoE مثل Qwen3 یا DeepSeek کار می‌کنید، ارزش خوندن داره 👇 🔗 https://huggingface.co/blog/nvidia/accelerating-fine-tuning-nvidia-nemo-automodel
2 124
13
OpenKB یه ایده از Karpathy بود که خیلی‌ها ازش رد شدن — ولی یه تیم رفت پیاده‌ش کرد! ایده اینه: به جای اینکه LLM هر بار سند رو بخونه و جواب بده، یه بار همه چیز رو compile کنه و نتیجه رو نگه داره. RAG معمولی چه مشکلی داره؟ هر query از صفر شروع می‌کنه. هیچی جمع نمی‌شه. ارتباط بین اسناد پیدا نمی‌شه. تناقض‌ها دیده نمی‌شن. اما OpenKB یه بار اسنادت رو می‌خونه و تبدیل می‌کنه به یه ویکی ساختاریافته — خلاصه، صفحات مفهومی، entities (افراد، سازمان‌ها، محصولات) و لینک‌های متقاطع بین همه چیز. دانش تجمیع می‌شه، نه اینکه هر بار از نو کشف بشه. قابلیت Skill Factory از ویکیت می‌تونی یه agent skill بسازی — یه فایل portable که Claude Code، Codex یا Gemini CLI می‌تونن مستقیم load کنن و ازش استفاده کنن. مثلاً ۲۰ تا پیپر درباره‌ی attention بهش می‌دی، یه متخصص transformer می‌سازی که agent دیگه‌ات می‌تونه ازش بخواد. سایر امکانات: - ورودی: PDF، Word، PPT، Excel، HTML، URL و... - اسناد بلند رو بدون Vector DB مدیریت می‌کنه (با PageIndex) - تصویر و جدول رو هم می‌فهمه - ویکی خروجی کاملاً با Obsidian باز می‌شه 🔗 github.com/VectifyAI/OpenKB
2 264
14
مدل جدید Gemma4-12B Agentic v2 — یه ایجنت کدنویسی کامل روی سخت‌افزار شخصی یه fine-tune قوی روی Gemma 4 12B که تمرکزش روی کدنویسی + استفاده از ابزار + کارهای چندمرحله‌ای (agentic) هست. 📊 عملکرد روی بنچمارک ایجنتیک (tau2-bench telecom): | مدل | امتیاز | |---|---| | Gemma 4 12B-it (پایه) | ~۱۵٪ | | این مدل (v2) | ~۵۵٪ | ➡️ تقریباً ۳.۵ برابر بهتر از مدل پایه در تسک‌های ایجنتیک مدل پایه معمولاً توی تسک‌های چندمرحله‌ای زود تسلیم می‌شه و کار رو به انسان واگذار می‌کنه. این مدل یاد گرفته مثل یه دولوپر واقعی عمل کنه: read → reason → act → verify یعنی اول state رو بررسی می‌کنه، بعد تشخیص می‌ده، بعد fix می‌زنه، و در نهایت نتیجه رو verify می‌کنه — بدون hallucinate کردن مسیرها یا توابع ناموجود. 📦 سایزهای GGUF موجود: - Q3_K_M → 5.7 GB (مناسب GPU های 8GB) - Q4_K_M → 6.87 GB ✅ پیشنهادی - Q6_K → 9.11 GB - Q8_0 → 11.8 GB ⚡ اجرا با Ollama: ollama run hf.co/yuxinlu1/gemma-4-12B-agentic-fable5-composer2.5-v2-3.5x-tau2-GGUF:Q4_K_M --- ⚠️ نکات مهم: - لایسنس Apache 2.0 (آزاد برای استفاده تجاری) - بهینه برای کدنویسی و کارهای ایجنتیک — نه دانش عمومی - safety alignment کمتری داره، برای production باید guardrail اضافه کنید 🔗 https://huggingface.co/yuxinlu1/gemma-4-12B-agentic-fable5-composer2.5-v2-3.5x-tau2-GGUF
2 597
15
🔍 Agentic Resource Discovery (ARD) یه استاندارد جدید و باز از Hugging Face (با همکاری Microsoft، Google، GoDaddy و دیگران) که لایه‌ی discovery رو برای ایجنت‌ها حل می‌کنه. مشکل امروز اینه که ایجنت‌ها باید همه چیز رو از قبل بدونن — URL سرور MCP رو hardcode کنی، ابزارها رو از قبل install کنی، و همه چیز static باشه. با بزرگ‌شدن اکوسیستم، این روش دیگه scale نمی‌ده. ARD چی می‌کنه؟ — هر publisher یه فایل ai-catalog.json رو در یه مسیر well-known روی دامنه‌ش منتشر می‌کنه — رجیستری‌ها اون رو ایندکس می‌کنن — ایجنت به‌جای hardcode کردن، با intent جستجو می‌کنه و capability مناسب رو پیدا می‌کنه # نمونه با HF CLI hf discover search "Fine tune a language model" hf discover search "Generate an image" --kind mcp Hugging Face یه reference implementation به اسم Discover Tool ارائه داده که به هزاران Skills، MCP Server و Spaces دسترسی می‌ده — و از طریق MCP هم قابل استفاده‌ست: https://huggingface-hf-discover.hf.space/mcp در واقع ARD مثل DNS برای ایجنت‌هاست — به‌جای اینکه بدونی کجا بری، بگی چی می‌خوای. 🔗 مستندات: agenticresourcediscovery.org
3 156
16
در هاگینگ فیس هم اضافه شد https://huggingface.co/baidu/Unlimited-OCR
2 735
17
🔍 Unlimited-OCR از Baidu یه مدل OCR قدرتمند از بایدو که یک قدم جلوتر از DeepSeek-OCR حرکت کرده. قابلیت پارس تک‌شات اسناد طول
🔍 Unlimited-OCR از Baidu یه مدل OCR قدرتمند از بایدو که یک قدم جلوتر از DeepSeek-OCR حرکت کرده. قابلیت پارس تک‌شات اسناد طولانی (Long-horizon Parsing) رو داره — تصویر، چند صفحه، یا PDF کامل رو یه‌جا پردازش می‌کنه. پشتیبانی از Transformers و SGLang، و خروجی ساختاریافته با کیفیت بالا. 🔗 github.com/baidu/Unlimited-OCR
3 060
18
🔇 گوگل بی‌سروصدا یک هوش مصنوعی منتشر کرد که الگوها را پیش‌بینی می‌کند فروش. قیمت بازار. ترافیک وب. تقاضای انرژی. نوسانات کری
🔇 گوگل بی‌سروصدا یک هوش مصنوعی منتشر کرد که الگوها را پیش‌بینی می‌کند فروش. قیمت بازار. ترافیک وب. تقاضای انرژی. نوسانات کریپتو. مدل جدید منتشر شده TimesFM : ← روی ۱۰۰ میلیارد داده واقعی آموزش دیده ← پیش‌بینی zero-shot، بدون نیاز به fine-tune ← روی سیستم شما اجرا می‌شود. کاملاً رایگان و متن‌باز 🔗 لینک
5 360
19
مدل RF-DETR — ترنسفورمر جدید Roboflow برای تشخیص و سگمنتیشن real-time گروه Roboflow مدل RF-DETR را به کتابخانه 🤗 Transformer
مدل RF-DETR — ترنسفورمر جدید Roboflow برای تشخیص و سگمنتیشن real-time گروه Roboflow مدل RF-DETR را به کتابخانه 🤗 Transformers اضافه کرد؛ یک معماری مبتنی بر ترنسفورمر که ادعا می‌کند هم در Object Detection و هم در Instance Segmentation از YOLO پیشی می‌گیرد. چی داره؟ مجموعه‌ای کامل از سایزهای مختلف برای هر دو تسک: 🔍 تشخیص شیء: nano / small / medium / large / base ✂️ سگمنتیشن: nano / small / medium / large / xlarge / xxlarge چرا جالبه؟ مستقیماً در transformers قابل استفاده‌ست دموی real-time با وبکم روی HuggingFace Spaces موجوده معماری بر اساس Neural Architecture Search طراحی شده (مقاله: RF-DETR) تست آنلاین: 🔗 huggingface.co/spaces/huggingface-projects/rf-detr-realtime-webcam مدل‌ها: 🔗 huggingface.co/Roboflow/models
4 248
20
https://sophon.at/papers
3 360