Tensorflow(@CVision)

اخبار حوزه یادگیری عمیق و هوش مصنوعی مقالات و یافته های جدید یادگیری عمیق بینایی ماشین و پردازش تصویر TensorFlow, Keras, Deep Learning, Computer Vision سایت دوره http://class.vision 👨‍💻👩‍💻پشتیبان دوره ها: @classvision_support

مشاركات الإعلانات

12 640

المشتركون

+5224 ساعات

+2667 أيام

+83630 أيام

4 455

عرض المشاهدات

~ 1 51324 ساعات

~ 1 82948 ساعات

35.27%

معدل المشاركة

12.0%24 ساعات

14.5%48 ساعات

314

الإشارات

37 أيام

530 أيام

~ 1

المشاركات في اليوم

~ 11

ردود

~ 4

تعليقات

~ 71

إعادة

توزيع وقت النشر

جاري تحميل البيانات...

Find out who reads your channel

This graph will show you who besides your subscribers reads your channel and learn about other sources of traffic.

تحليل النشر

المشاركات	المشاهدات	الأسهم	ديناميات المشاهدات
01 اگر دموهای GPT-4o براتون جذاب بود، احتمالا تا الان به مدل‌های بینایی-زبان (Vision-Language Models) هم علاقه‌مند شده‌اید. مدل‌هایی که تصویر و نوشتار را به‌صورت هم‌زمان دریافت و درک کرده و متنی مرتبط را در خروجی تولید می‌کنند. امروز گوگل خانواده‌ای از مدل‌های VLM اوپن‌سورس به نام PaliGemma معرفی کرد. این مدل از کد‌کننده‌ی تصویر موجود در مدل SigLip-So400m برای کدکردن تصویر ورودی استفاده کرده و به‌کمک مدل Gemma-2B که یک مدل decoder-only است، متن خروجی را تولید می‌کند. گیت‌هاب: https://github.com/google-research/big_vision/blob/main/big_vision/configs/proj/paligemma/README.md هاگینگ‌فیس: https://huggingface.co/blog/paligemma	445	22	Loading...
02 چشم به آینده با هوش مصنوعی Astra گوگل! در رویداد Google I/O 2024، شاهد رونمایی از پروژه‌ی Astra، یک دستیار هوش مصنوعی فوق‌العاده، بودیم. پروژه Astra با استفاده از هوش مصنوعی قدرتمند Gemini، به شما کمک می‌کند تا با دنیای اطرافتان به گونه‌ای جدید تعامل داشته باشید. این دستیار هوشمند می‌تواند: ♨️ محیط اطراف شما را درک کند و به سوالات در مورد آن پاسخ دهد. ♨️ اشیاء گمشده شما را پیدا کند. ️‍♀️ ♨️ منابع ایجاد صدا را در محیط تان مشخص کند. ... و بسیاری کارهای شگفت‌انگیز دیگر! پروژه Astra نه تنها روی گوشی‌های هوشمند، بلکه روی عینک‌های هوشمند نیز قابل استفاده است. ️ این امر تجربه‌ای کاملاً جدید و فراگیر از هوش مصنوعی را به ارمغان می‌آورد. پروژه‌ی Astra هنوز در مراحل اولیه توسعه قرار دارد و به برنامه‌‌ی انتشار عمومی آن اشاره‌ای نشده است. ♨️♨️♨️♨️♨️ 〰️〰️〰️〰️〰️ 💡 @cvision 💡 〰️〰️〰️〰️〰️	1 228	16	Loading...
03 با AI Overviews، دنیای اطلاعات در دستان شماست! این قابلیت جدید گوگل، به شما کمک می‌کند تا به سرعت و به سادگی، خلاصه‌ای جامع و دقیق از هر موضوعی که به آن علاقه دارید، دریافت کنید. AI Overviews با استفاده از هوش مصنوعی قدرتمند گوگل، منابع مختلف مانند مقالات، وب‌سایت‌ها و حتی کتاب‌ها را تجزیه و تحلیل می‌کند و مهم‌ترین نکات را به صورت خلاصه‌ای خواندنی به شما ارائه می‌دهد. با AI Overviews می‌توانید: 💢 در زمان خود صرفه‌جویی کنید و به سرعت به اطلاعات مورد نیازتان دسترسی پیدا کنید. ⏳ 💢 دانش خود را در هر زمینه‌ای افزایش دهید، بدون اینکه نیاز به مطالعه‌ی حجم زیادی از مطالب داشته باشید. 💢 موضوعات پیچیده را به سادگی درک کنید و از جزئیات مهم آنها آگاه شوید. AI Overviews در حال حاضر به زبان انگلیسی در دسترس است، اما به زودی به زبان‌های دیگر نیز ترجمه خواهد شد.	1 143	16	Loading...
04 Ask Photos: جستجوی هوشمندانه در دنیای تصاویرتان! قابلیت Ask Photos، که به تازگی توسط گوگل در Google Photos معرفی شده، انقلابی در نحوه جستجو و مدیریت تصاویر ایجاد کرده است. این قابلیت به شما امکان می دهد تا با استفاده از زبان طبیعی و به جای کلمات کلیدی، به سادگی و به سرعت تصاویر مورد نظرتان را پیدا کنید. تصور کنید: می خواهید عکس هایتان را بر اساس مکان، زمان، افراد حاضر در عکس یا حتی اشیاء موجود در آنها جستجو کنید. Ask Photos با درک دقیق محتوای تصاویر، به شما کمک می کند تا به راحتی به این خواسته خود برسید. علاوه بر این، Ask Photos می تواند برای یافتن تصاویر مشابه، بهترین عکس از یک رویداد خاص و یا حتی خاطراتتان در مورد یک مکان خاص نیز مورد استفاده قرار گیرد. این قابلیت در حال حاضر برای مشترکین Google One در زبان انگلیسی در دسترس است و به زودی برای سایر زبان ها و کاربران نیز ارائه خواهد شد.	1 141	11	Loading...
05 ⚡️ گوگل I/O 2024: هوش مصنوعی، اندروید 15 و دنیایی از نوآوری ها! ⚡️ غول فناوری، گوگل، در رویداد I/O 2024، از جدیدترین دستاوردهای خود در زمینه هوش مصنوعی، اندروید و موارد دیگر رونمایی کرد. اندروید 15 نیز با آپدیت های جذاب و کارآمد، تجربه کار با گوشی های هوشمند را متحول خواهد کرد. ♨️♨️♨️	1 187	2	Loading...
06 خلاصه ارائه دیروز OpenAI و شفاف‌سازی برخی اصطلاحات و زمان‌بندی دیروز OpenAI ارائه خیلی جالبی داشت که سریع ترند شد! بیایید باهم خلاصه‌وار به اون نگاهی بندازیم و چند تا اصطلاح و زمان‌بندی رو روشن کنیم. پیشنهاد می‌کنم دو تا سند کوتاه رو که دیروز منتشر شدن بخونید: [لینک اول توضیح دسترسی به GPT-4، GPT-4 Turbo و GPT-4o][1] [لینک دوم درباره قابلیت‌های صوتی جدید چت‌جی‌پی‌تی و رایگان شدن آن][2] شاید با دیدن قابلیت‌های صوتی جدید در چت‌جی‌پی‌تی وسوسه شدید اون رو امتحان کنید، ولی متاسفانه باید فعلا صبر کنید😩. چت‌جی‌پی‌تی فعلا به روش قدیمی جواب شما رو میده. یعنی متن رو به صوت و برعکس تبدیل می‌کنه، نه با اون سرعت و هوشمندی‌ای که توی نمایش‌ها دیدیم. در حال حاضر، چت‌جی‌پی‌تی از قابلیت “حالت صوتی” که از اول وجود داشته برای پشتیبانی از صدا استفاده می‌کنه. قابلیت‌های صوتی و تصویری جدید GPT-4o به زودی به چت‌جی‌پی‌تی اضافه میشه. (بیشتر در این مورد پایین توضیح میدیم). یعنی مدل هوشمند جدید با روش قدیمی (کندتر) با شما صحبت می‌کنه. مدل سریع‌تر و جدیدتر به زودی در دسترس قرار می‌گیره، بله، و حتی بعدا می‌تونه آواز هم بخونه! اون اپلیکیشن با تمام امکاناتی که توی نمایش دیدیم، آماده‌ست، ولی فعلا فقط برای مک. به تدریج در مناطق و حساب‌های کاربری مختلف عرضه میشه. چت‌جی‌پی‌تی به شما اطلاع میده. برای ویندوز فعلا خبری نیست: قراره اواخر امسال نسخه ویندوز هم عرضه بشه. درباره محدودیت پیام: "کاربران پلاس می‌تونن تا ۸۰ پیام هر ۳ ساعت با GPT-4o و تا ۴۰ پیام هر ۳ ساعت با GPT-4 ارسال کنن. ممکنه این محدودیت در ساعات اوج ترافیک برای اینکه GPT-4 و GPT-4o برای تعداد بیشتری از افراد در دسترس باشه، کاهش پیدا کنه." برای حساب‌های رایگان، این محدودیت می‌تونه خیلی کم باشه، مخصوصا اگه سرور نزدیک شما شلوغ باشه. حتی گاهی اوقات فقط ۲ تا ۴ پیام. اول از همه محدودیت حساب‌های رایگان کم میشه و به ۳.۵ تا پیام در هر ۳ ساعت تغییر می‌کنه. ظرفیت حافظه مدل GPT-4o هم 128 کیلوبایت هست. خیلی زیاده. برای ۹۵ درصد از کاربران خیلی زیاده. به طور کلی این مقدار، حجم متن و پیام‌های یه چت رو شامل میشه که مدل برای پاسخ دادن به شما توی حافظه نگه میداره تا بر اساس اطلاعاتی که "تو مغزش داره" جواب بده. مدل جدید تصاویر رو بهتر درک می‌کنه: قابلیت‌های تصویری GPT-4o عملکرد بهتری نسبت به GPT-4 توربو داره. دو برابر سریع‌تره (این توی چت‌جی‌پی‌تی قابل توجهه): GPT-4o دو برابر سریع‌تر از GPT-4 توربو هست. پشتیبانی GPT-4o از زبان‌های غیرانگلیسی نسبت به GPT-4 توربو بهبود پیدا کرده. برای علاقه‌مندان به API: قیمت: GPT-4o نسبت به GPT-4 توربو ۵۰ درصد ارزون‌تره و قیمتش ۵ دلار به ازای هر یک میلیون توکن ورودی و ۱۵ دلار به ازای هر یک میلیون توکن خروجی هست. @cvision محدودیت سرعت: محدودیت سرعت GPT-4o پنج برابر بیشتر از GPT-4 توربو هست - تا ۱۰ میلیون توکن در دقیقه. این قابلیت‌های چندوجهی به تدریج فعال میشن. مثلا تبدیل صدا به صدا، تصویر به تصویر، و مکالمه با ویدیو. فکر می‌کنم به زودی شاهد آپدیت DALL·E 3 یا یه روش کاملا جدید برای تولید تصویر باشیم. باید صبر کنیم. در همین حال، GPT-4o در تست‌های مختلف عملکرد بهتری نسبت به مدل‌های دیگه داره و به صورت رایگان در چت‌جی‌پی‌تی در دسترسه.	1 752	52	Loading...
07 ویدیو اصلا شد.	1 620	0	Loading...
08 اگر دوست داشتید ما را در اینستاگرام نیز دنبال کنید: @class.vision 🙏https://www.instagram.com/class.vision/	1 628	2	Loading...
09 توسعه‌دهندگان از همین امروز می‌توانند در فریم‌ورک LangChain از مدل GPT-4o از طریق API استفاده کنند. در این کد نمونه، آدرس یک تصویر به مدل داده شده و از مدل خواسته شده محتوای تصویر را شرح دهد. https://python.langchain.com/v0.1/docs/integrations/chat/openai/	1 259	48	Loading...
10 پاسخ روشن ایلان ماسک به یک خبرنگار 🔥 سوال: به نظر شما چه کسی برنده کاخ سفید در سال 2024 خواهد بود؟ پاسخ ایلان ماسک: فکر می کنید چه کسی برنده کاخ سفید در سال 2032 خواهد شد؟ کدام نوع هوش مصنوعی؟ ترنسفورمر یا دیفیوژن؟	1 902	40	Loading...
11 https://twitter.com/danielkempe/status/1790096679384883217	1 819	17	Loading...
12 این مدل، GPT-4o می تواند کمیک نیز تولید کند! یاد گرفته است که شخصیت های شما را به خاطر بسپارد و آنها را در صحنه های مختلف خلق کند.	1 805	25	Loading...
13 یکی از ویژگی های برجسته این مدل جدید صدای واقعی آن است که مطابق با ترجیحات شما سازگار می شود. @cvision	1 769	23	Loading...
14 این مدل، GPT-4o می تواند کمیک نیز تولید کند! یاد گرفته است که شخصیت های شما را به خاطر بسپارد و آنها را در صحنه های مختلف خلق کند.	225	4	Loading...
15 یکی از ویژگی های برجسته این مدل جدید صدای واقعی آن است که مطابق با ترجیحات شما سازگار می شود. @cvision	213	3	Loading...
16 میدانید دیروز شرکت OpenAI از GPT-4o جدیدترین نسخه ChatGPT رو نمایی کرد 🤖 🆕 با GPT-4o، آخرین پیشرفت OpenAI، که برای عملکرد فوق العاده سریع و کیفیت استثنایی در 50 زبان طراحی شده است، آشنا شویم... 1️⃣ با GPT-4o به راحتی متون، تصاویر و صدا را میتوان مدیریت کرد و به توسعه دهندگان این امکان را می دهد تا با استفاده از OpenAI API به راحتی نوآوری کنند. 2️⃣ مدل ارائه شده ی GPT-4o با سرعتی دو برابر ولی هزینه ی معادل نیمی از هزینه نسل قبلی خود، یعنی GPT-4 Turbo، نوید کارایی بی نظیر و مقرون به صرفه را می دهد. 3️⃣ هوش مصنوعی OpenAI با افتخار "هوش عاطفی" GPT-4o را برجسته می کند، که به طرز ماهرانه ای تعاملات و وقفه های کاربر را مدیریت می کند. 4️⃣ فراتر از ترجمه، GPT-4o با توانایی خود در تغییر تن صدا، افزودن درام یا ...، تحت تاثیر قرار می‌دهد. 5️⃣ اما این همه ماجرا نیست – اعضای تیم مهارت های ریاضی و کمک های کدنویسی GPT-4o را به نمایش گذاشتند و آن را به عنوان رقیب قدرتمندی برای GitHub Copilot مایکروسافت معرفی کردند. @cvision	2 108	54	Loading...
17 ⚡️مدل جدید GPT-4 Omni برای ChatGPT امروز معرفی شد و به صورت رایگان در دسترس همه است! ✔️مدل جدید بسیار هوشمندتر و بهتر از تمام نسخه های قدیمی است. 🔊📸📝لازم به ذکر است این مدل روی صوت، تصویر و متن نیز کار میکنه. https://openai.com/index/hello-gpt-4o	3 152	186	Loading...
18 https://twitter.com/OpenAI/status/1790072174117613963	354	5	Loading...
19 ⚡️ GPT-4 Omni برای ChatGPT معرفی شده است و به صورت رایگان در دسترس همه است! مدل جدید بسیار هوشمندتر و بهتر از تمام نسخه های قدیمی است. لازم به ذکر است این مدل روی صوت، تصویر و متن نیز کار میکنه. https://openai.com/index/hello-gpt-4o	2 343	100	Loading...
20 جهت اطلاع رسانی دوره‌ها، کلاس‌های آنلاین، تخفیف‌ها و غیره مبوط به کلاس ویژن، کانال دیگری نیز ایجاد گردیده که این اطلاعیه ها در بین پستهای این کانال گم نشه! https://t.me/class_vision	2 165	3	Loading...
21 https://www.linkedin.com/posts/axelmdz_mlops-machinelearning-datascience-activity-7194637600861618176-iQaF?utm_source=share&utm_medium=member_desktop	2 168	36	Loading...
22 https://learnopencv.com/sdxl-inpainting/	1	0	Loading...
23 فریم‌ورک FeatUp به‌طور مشترک توسط پژوهش‌گران MIT و Microsoft و Berkeley و Google در سمینار ICLR 2024 معرفی شده. این فریم‌ورک فارق از تسک یا مدل، ویژگی‌های ازدست‌رفته‌ی داده‌ی بینایی (تصویر) در ژرفای مدل را بدون تاثیر در semantic مدل، با دقت قابل‌توجهی بازسازی می‌کند. سایت: https://mhamilton.net/featup.html مقاله: https://arxiv.org/pdf/2403.10516 کد: https://github.com/mhamilton723/FeatUp	1 673	61	Loading...
24 ❌ دیگر از ویدیوهای تار خبری نیست روش جدید Deblur-GS ویدیوهای تار را بازیابی می کند. این روش ادعا میکند عملکرد و کیفیت رندر بالاتری را در مقایسه با روش های قبلی ارائه کرده است. [I3D 2024] Deblur-GS: 3D Gaussian Splatting from Camera Motion Blurred Images https://github.com/Chaphlagical/Deblur-GS مرتبط با MAXIM	2 356	65	Loading...
25 BLIP3, a series of large multimodal models (LMMs) developed by Salesforce AI Research. It is a new SOTA model under 5B on few-shot learning and multimodal benchmarks. Check out the HF release: https://huggingface.co/Salesforce/blip3-phi3-mini-instruct-r-v1 Key Takeaways: BLIP3 is trained at scale on high-quality image caption data and image-text interleaved data. BLIP3 exhibits strong few-shot learning capability as pre-trained base model and impressive visual chat ability after SFT. BLIP3 supports more efficient token usage compared to methods like LLaVA (more than 5x less).	3 121	42	Loading...
26 دیتاست سایت باسلام شامل اطلاعات فروش و مشخصات 2.4 میلیون محصول موجود در سایت باسلام به همراه دیتاست 3.3 میلیونی کامنت محصولات. 🔗لینک دیتاست در هاگینگ فیس 🔗لینک دیتاست در کگل	4 932	157	Loading...
27 📢جهت اطلاع برای علاقه مندان، سایت مکتب‌خونه روی دوره OpenCV فروش فوق العاده و تخفیف 55 درصدی گذاشته است.	5 112	20	Loading...
28 جهت اطلاع برای علاقه مندان، سایت مکتب‌خونه روی دوره OpenCV فروش فوق العاده و تخفیف 55 درصدی گذاشته است	844	16	Loading...
29 ✳️ دوره‌های Deep-Learning گروه آموزشی class vision 📢🎉کد تخفیف 10 درصدی cvision ویژه اعضای محترم کانال تلگرامی: cvision اگر تا کنون دوره ها را تهیه نکرده اید توصیه میشه حتما فایل مصاحبه با شرکت کنندگان را ببینید و همچنین با قسمت های رایگان شروع کنید! کلی ویدیوی رایگان دیگر نیز در کانال آپارات وجود داره! 0️⃣ ویدیوهای رایگان آشنایی با هوش مصنوعی و پایتون 0️⃣ دوره رایگان Python(پایتون) برای هوش مصنوعی 1️⃣ دوره جامع یادگیری عمیق 2️⃣ دوره‌ی شبکه ها عصبی بازگشتی ( LSTM , GRU و RNN) ▫️مشاهده قسمت‌های رایگان 3️⃣ دوره شبکه عصبی گرافی (GNN و GCN) ▫️ویدیو‌ی معرفی دوره \| فیلم ارائه معرفی GCN در دانشگاه شریف 4️⃣ دوره‌ی بازشناسی و تشخیص چهره ▫️ مشاهده قسمت‌های رایگان \| ثبت‌نام 5️⃣بینایی کامپیوتر با OpenCV ▫️دوره منتشر شده در مکتب خونه 6️⃣وبینارهای مرتبط رایگان 🔺 اطلاعات بیشتر در کانال و یا سایت class.vision 🔻 هر گونه سوال: @classvision_support برای خرید گروهی، یا خرید برای اعضای یک کلاس با پشتیبانی تماس بگیرید.	6 079	121	Loading...
30 اگه عکسی دارید که دوسش دارید ولی دستتون لرزیده و مات شده، یا پلاک ماشینی از دوربین مدار بسته گرفتید و ناخوانا افتاده، سری به این ریپو بزنید!	5 049	81	Loading...
31 About [CVPR 2022 Oral] Official repository for "MAXIM: Multi-Axis MLP for Image Processing". SOTA for denoising, deblurring, deraining, dehazing, and enhancement. https://github.com/google-research/maxim Online demo: https://replicate.com/google-research/maxim	5 256	166	Loading...
32 پژوهش زیر به بررسی Graph Machine Learning در عصر LLMها می‌پردازد. https://arxiv.org/pdf/2404.14928	5 029	65	Loading...
33 Top 10 out of 79 models by 134 k votes	5 835	52	Loading...
34 MOMENT: A Foundation Model for Time Series Forecasting, Classification, Anomaly Detection Git: https://anonymous.4open.science/r/BETT-773F/README.md Blog post: https://towardsdatascience.com/moment-a-foundation-model-for-time-series-forecasting-classification-anomaly-detection-1e35f5b6ca76	4 706	91	Loading...
35 ابررایانه (Supercomputer) هوش مصنوعی جدید شرکت NVIDIA به‌نام DGX H200 امروز شخصا توسط Jensen Huang (مدیرعامل و موسس NVIDIA) به OpenAI برای پیش‌برد هوش مصنوعی، محاسبات و بشریت اهدا شد. - 256 H100 GPUs, - 32 Grace Neoverse V2 72-core CPUs, - 32 OSFT single-port ConnectX-7 VPI of with 400Gb/s InfiniBand and 16 dual-port BlueField-3 VPI with 200Gb/s of Mellanox	3 777	45	Loading...
36 Transform your simple scribbles into architectural designs using style transfer with Stable Diffusion, LCM, IP Adapters and ControlNet. Scribble Architect combines creativity with generative AI technology, improving the inspiration process. https://github.com/s-du/ScribbleArchitect	4 949	70	Loading...
37 دوستان این برنامه منتورشیپ توسط تیم کلاس ویژن یا آقای اخوان‌پور انجام نمیشه و بنده همه‌ی کارها و هماهنگی‌هاش رو انجام میدم، پس لطفا به ایشون یا تیم پشتیبانی کلاس ویژن در این مورد پیام ندید. همونطور که در پیام قبلی هم گفتم، برای آشنایی با بنده میتونید صفحه من رو توی لینکدین ببینید. این برنامه برای کسانی بیشتر مفید هست که تازه با حوزه هوش مصنوعی آشنا شدن و دنبال کمک برای ادامه مسیر هستند. تا الان تعداد خوبی فرم رو پر کردند، تا فردا فرم رو باز میزارم و بعد میبندم و شروع میکنم به بررسی رزومه‌ها و انتخاب افراد. در حال حاضر برای فاز اول این برنامه زمان من برای تعداد ۵ تا ۱۰ نفر اجازه ارائه منتورشیپ میده. بعد از ارزیابی رزومه‌ها، با این افراد از طریق ایمیل تماس میگیرم و اطلاعات بعدی رو خدمتشون میگم. موفق باشید.	5 321	7	Loading...
38 سلام دوستان چند وقتی بود براساس پیام‌هایی که توی لینکدین میگرفتم قصد داشتم یه برنامه منتورشیپ رایگان ارایه بدم به کسایی که فکر میکنن من میتونم توی حوزه هوش مصنوعی کمکشون کنم. پس اگر تمایل دارید از این برنامه استفاده کنید و فکر میکنید که میتونه براتون مفید باشه این فرم رو پر کنید. این برنامه بیشتر به درد کسایی میخوره که میخوان یادگیری هوش مصنوعی رو شروع کنن یا تازه شروع کردن و دنبال راهنمایی برای ادامه مسیر هستن. تاکید میکنم این برنامه کاملا رایگان هست و به دلیل محدودیت زمانی بنده فقط به افرادی که بعد از ارزیابی انتخاب شوند، ارایه می‌شود. لینک فرم: https://docs.google.com/forms/d/e/1FAIpQLSf8I7vXoNkTPSXtHFMnU3vB2TG1qav5GNGn_cw-IUppouZK5Q/viewform اگه دوس دارید بیشتر در مورد تجارب و حوزه کاری من آشنا بشید و بهتر ارزیابی کنید که این برنامه برای شما مفید هست، میتونید صفحه لینکدین من رو در این آدرس ببینید: https://ca.linkedin.com/in/vahid01 موفق و موید باشید	4 872	66	Loading...
39 یوشوا بنجیو جزو ۱۰۰ چهره‌ی تاثیرگذار سال در مجله‌ی TIMES قرار گرفت. https://mila.quebec/en/yoshua-bengio-named-to-times-annual-time100-list-of-the-100-most-influential-people-in-the-world/	4 095	13	Loading...

Repost from School of AI

Photo unavailableShow in Telegram

اگر دموهای GPT-4o براتون جذاب بود، احتمالا تا الان به مدل‌های بینایی-زبان (Vision-Language Models) هم علاقه‌مند شده‌اید. مدل‌هایی که تصویر و نوشتار را به‌صورت هم‌زمان دریافت و درک کرده و متنی مرتبط را در خروجی تولید می‌کنند. امروز گوگل خانواده‌ای از مدل‌های VLM اوپن‌سورس به نام PaliGemma معرفی کرد. این مدل از کد‌کننده‌ی تصویر موجود در مدل SigLip-So400m برای کدکردن تصویر ورودی استفاده کرده و به‌کمک مدل Gemma-2B که یک مدل decoder-only است، متن خروجی را تولید می‌کند. گیت‌هاب: https://github.com/google-research/big_vision/blob/main/big_vision/configs/proj/paligemma/README.md هاگینگ‌فیس: https://huggingface.co/blog/paligemma

إظهار الكل...

👍 4

Photo unavailableShow in Telegram

چشم به آینده با هوش مصنوعی Astra گوگل! در رویداد Google I/O 2024، شاهد رونمایی از پروژه‌ی Astra، یک دستیار هوش مصنوعی فوق‌العاده، بودیم. پروژه Astra با استفاده از هوش مصنوعی قدرتمند Gemini، به شما کمک می‌کند تا با دنیای اطرافتان به گونه‌ای جدید تعامل داشته باشید. این دستیار هوشمند می‌تواند: ♨️ محیط اطراف شما را درک کند و به سوالات در مورد آن پاسخ دهد. ♨️ اشیاء گمشده شما را پیدا کند. ️‍♀️ ♨️ منابع ایجاد صدا را در محیط تان مشخص کند. ... و بسیاری کارهای شگفت‌انگیز دیگر! پروژه Astra نه تنها روی گوشی‌های هوشمند، بلکه روی عینک‌های هوشمند نیز قابل استفاده است. ️ این امر تجربه‌ای کاملاً جدید و فراگیر از هوش مصنوعی را به ارمغان می‌آورد. پروژه‌ی Astra هنوز در مراحل اولیه توسعه قرار دارد و به برنامه‌‌ی انتشار عمومی آن اشاره‌ای نشده است. ♨️♨️♨️♨️♨️ 〰️〰️〰️〰️〰️ 💡 @cvision 💡 〰️〰️〰️〰️〰️

إظهار الكل...

❤ 6👍 3🔥 1🤩 1

Photo unavailableShow in Telegram

با AI Overviews، دنیای اطلاعات در دستان شماست! این قابلیت جدید گوگل، به شما کمک می‌کند تا به سرعت و به سادگی، خلاصه‌ای جامع و دقیق از هر موضوعی که به آن علاقه دارید، دریافت کنید. AI Overviews با استفاده از هوش مصنوعی قدرتمند گوگل، منابع مختلف مانند مقالات، وب‌سایت‌ها و حتی کتاب‌ها را تجزیه و تحلیل می‌کند و مهم‌ترین نکات را به صورت خلاصه‌ای خواندنی به شما ارائه می‌دهد. با AI Overviews می‌توانید: 💢 در زمان خود صرفه‌جویی کنید و به سرعت به اطلاعات مورد نیازتان دسترسی پیدا کنید. ⏳ 💢 دانش خود را در هر زمینه‌ای افزایش دهید، بدون اینکه نیاز به مطالعه‌ی حجم زیادی از مطالب داشته باشید. 💢 موضوعات پیچیده را به سادگی درک کنید و از جزئیات مهم آنها آگاه شوید. AI Overviews در حال حاضر به زبان انگلیسی در دسترس است، اما به زودی به زبان‌های دیگر نیز ترجمه خواهد شد.

إظهار الكل...

👌 3

Photo unavailableShow in Telegram

Ask Photos: جستجوی هوشمندانه در دنیای تصاویرتان! قابلیت Ask Photos، که به تازگی توسط گوگل در Google Photos معرفی شده، انقلابی در نحوه جستجو و مدیریت تصاویر ایجاد کرده است. این قابلیت به شما امکان می دهد تا با استفاده از زبان طبیعی و به جای کلمات کلیدی، به سادگی و به سرعت تصاویر مورد نظرتان را پیدا کنید. تصور کنید: می خواهید عکس هایتان را بر اساس مکان، زمان، افراد حاضر در عکس یا حتی اشیاء موجود در آنها جستجو کنید. Ask Photos با درک دقیق محتوای تصاویر، به شما کمک می کند تا به راحتی به این خواسته خود برسید. علاوه بر این، Ask Photos می تواند برای یافتن تصاویر مشابه، بهترین عکس از یک رویداد خاص و یا حتی خاطراتتان در مورد یک مکان خاص نیز مورد استفاده قرار گیرد. این قابلیت در حال حاضر برای مشترکین Google One در زبان انگلیسی در دسترس است و به زودی برای سایر زبان ها و کاربران نیز ارائه خواهد شد.

إظهار الكل...

👌 5👍 1

Photo unavailableShow in Telegram

⚡️ گوگل I/O 2024: هوش مصنوعی، اندروید 15 و دنیایی از نوآوری ها! ⚡️ غول فناوری، گوگل، در رویداد I/O 2024، از جدیدترین دستاوردهای خود در زمینه هوش مصنوعی، اندروید و موارد دیگر رونمایی کرد. اندروید 15 نیز با آپدیت های جذاب و کارآمد، تجربه کار با گوشی های هوشمند را متحول خواهد کرد. ♨️♨️♨️

إظهار الكل...

🔥 1

خلاصه ارائه دیروز OpenAI و شفاف‌سازی برخی اصطلاحات و زمان‌بندی دیروز OpenAI ارائه خیلی جالبی داشت که سریع ترند شد! بیایید باهم خلاصه‌وار به اون نگاهی بندازیم و چند تا اصطلاح و زمان‌بندی رو روشن کنیم. پیشنهاد می‌کنم دو تا سند کوتاه رو که دیروز منتشر شدن بخونید: [لینک اول توضیح دسترسی به GPT-4، GPT-4 Turbo و GPT-4o][1] [لینک دوم درباره قابلیت‌های صوتی جدید چت‌جی‌پی‌تی و رایگان شدن آن][2] شاید با دیدن قابلیت‌های صوتی جدید در چت‌جی‌پی‌تی وسوسه شدید اون رو امتحان کنید، ولی متاسفانه باید فعلا صبر کنید😩. چت‌جی‌پی‌تی فعلا به روش قدیمی جواب شما رو میده. یعنی متن رو به صوت و برعکس تبدیل می‌کنه، نه با اون سرعت و هوشمندی‌ای که توی نمایش‌ها دیدیم. در حال حاضر، چت‌جی‌پی‌تی از قابلیت “حالت صوتی” که از اول وجود داشته برای پشتیبانی از صدا استفاده می‌کنه. قابلیت‌های صوتی و تصویری جدید GPT-4o به زودی به چت‌جی‌پی‌تی اضافه میشه. (بیشتر در این مورد پایین توضیح میدیم). یعنی مدل هوشمند جدید با روش قدیمی (کندتر) با شما صحبت می‌کنه. مدل سریع‌تر و جدیدتر به زودی در دسترس قرار می‌گیره، بله، و حتی بعدا می‌تونه آواز هم بخونه! اون اپلیکیشن با تمام امکاناتی که توی نمایش دیدیم، آماده‌ست، ولی فعلا فقط برای مک. به تدریج در مناطق و حساب‌های کاربری مختلف عرضه میشه. چت‌جی‌پی‌تی به شما اطلاع میده. برای ویندوز فعلا خبری نیست: قراره اواخر امسال نسخه ویندوز هم عرضه بشه. درباره محدودیت پیام: "کاربران پلاس می‌تونن تا ۸۰ پیام هر ۳ ساعت با GPT-4o و تا ۴۰ پیام هر ۳ ساعت با GPT-4 ارسال کنن. ممکنه این محدودیت در ساعات اوج ترافیک برای اینکه GPT-4 و GPT-4o برای تعداد بیشتری از افراد در دسترس باشه، کاهش پیدا کنه." برای حساب‌های رایگان، این محدودیت می‌تونه خیلی کم باشه، مخصوصا اگه سرور نزدیک شما شلوغ باشه. حتی گاهی اوقات فقط ۲ تا ۴ پیام. اول از همه محدودیت حساب‌های رایگان کم میشه و به ۳.۵ تا پیام در هر ۳ ساعت تغییر می‌کنه. ظرفیت حافظه مدل GPT-4o هم 128 کیلوبایت هست. خیلی زیاده. برای ۹۵ درصد از کاربران خیلی زیاده. به طور کلی این مقدار، حجم متن و پیام‌های یه چت رو شامل میشه که مدل برای پاسخ دادن به شما توی حافظه نگه میداره تا بر اساس اطلاعاتی که "تو مغزش داره" جواب بده. مدل جدید تصاویر رو بهتر درک می‌کنه: قابلیت‌های تصویری GPT-4o عملکرد بهتری نسبت به GPT-4 توربو داره. دو برابر سریع‌تره (این توی چت‌جی‌پی‌تی قابل توجهه): GPT-4o دو برابر سریع‌تر از GPT-4 توربو هست. پشتیبانی GPT-4o از زبان‌های غیرانگلیسی نسبت به GPT-4 توربو بهبود پیدا کرده. برای علاقه‌مندان به API: قیمت: GPT-4o نسبت به GPT-4 توربو ۵۰ درصد ارزون‌تره و قیمتش ۵ دلار به ازای هر یک میلیون توکن ورودی و ۱۵ دلار به ازای هر یک میلیون توکن خروجی هست. @cvision محدودیت سرعت: محدودیت سرعت GPT-4o پنج برابر بیشتر از GPT-4 توربو هست - تا ۱۰ میلیون توکن در دقیقه. این قابلیت‌های چندوجهی به تدریج فعال میشن. مثلا تبدیل صدا به صدا، تصویر به تصویر، و مکالمه با ویدیو. فکر می‌کنم به زودی شاهد آپدیت DALL·E 3 یا یه روش کاملا جدید برای تولید تصویر باشیم. باید صبر کنیم. در همین حال، GPT-4o در تست‌های مختلف عملکرد بهتری نسبت به مدل‌های دیگه داره و به صورت رایگان در چت‌جی‌پی‌تی در دسترسه.

إظهار الكل...

How can I access GPT-4, GPT-4 Turbo and GPT-4o? | OpenAI Help Center

Learn how to get access to GPT-4o in ChatGPT and GPT-4, GPT-4 Turbo, and GPT-4o the OpenAI API

👌 5👍 4

ویدیو اصلا شد.

إظهار الكل...

❤ 3👏 1🎉 1

Repost from Class vision

Photo unavailableShow in Telegram

اگر دوست داشتید ما را در اینستاگرام نیز دنبال کنید: @class.vision 🙏https://www.instagram.com/class.vision/

إظهار الكل...

❤ 3🔥 3

Repost from School of AI

Photo unavailableShow in Telegram

توسعه‌دهندگان از همین امروز می‌توانند در فریم‌ورک LangChain از مدل GPT-4o از طریق API استفاده کنند. در این کد نمونه، آدرس یک تصویر به مدل داده شده و از مدل خواسته شده محتوای تصویر را شرح دهد. https://python.langchain.com/v0.1/docs/integrations/chat/openai/

إظهار الكل...

👍 3

00:06

Video unavailableShow in Telegram

پاسخ روشن ایلان ماسک به یک خبرنگار 🔥 سوال: به نظر شما چه کسی برنده کاخ سفید در سال 2024 خواهد بود؟ پاسخ ایلان ماسک: فکر می کنید چه کسی برنده کاخ سفید در سال 2032 خواهد شد؟ کدام نوع هوش مصنوعی؟ ترنسفورمر یا دیفیوژن؟

إظهار الكل...

🔥 17💯 4😁 2🤔 2👍 1