Tensorflow(@CVision)
اخبار حوزه یادگیری عمیق و هوش مصنوعی مقالات و یافته های جدید یادگیری عمیق بینایی ماشین و پردازش تصویر TensorFlow, Keras, Deep Learning, Computer Vision سایت دوره http://class.vision 👨💻👩💻پشتیبان دوره ها: @classvision_support
Ko'proq ko'rsatish12 678
Obunachilar
+2724 soatlar
+2357 kunlar
+85130 kunlar
Post vaqtlarining boʻlagichi
Ma'lumot yuklanmoqda...
Find out who reads your channel
This graph will show you who besides your subscribers reads your channel and learn about other sources of traffic.Nashrni tahlil qilish
Postlar | Ko'rishlar | Ulashishlar | Ko'rish dinamikasi |
01 ظاهرا شرکت هواوی که خواسته از این هیاهوی هوش مصنوعی سهمی داشته باشه بدجوری ضایع شده!
هواوی اخیراً تولید کننده تصویر یا image generator خود را ارائه کرده و معلوم شد که این شرکت آنقدر در مورد آن نامطمئن بوده که هاردکدی را نوشته بوده که با 6 ثانیه تاخیر، یه تصویر از پیش آماده شده را از یک پوشه بر میداشته و نشون میداده که ارور داده و با متن ارور لو رفتن!!
البته خبرو فقط تو ردیت دیدم، جای معتبری هنوز تایید نکرده!
https://www.reddit.com/r/facepalm/comments/1csuf74/huawei_just_accidentally_revealed_that_their_new/ | 1 357 | 31 | Loading... |
02 با این ابزار جدید گوگل در واقع میتونید می تونید روی مقالات علمی گفت و گوی صوتی داشته باشید و مباحثه کنید
https://illuminate.withgoogle.com/ | 1 691 | 94 | Loading... |
03 همونطور که میدونید، استارتاپ Neuralink بهتازگی تایید FDA برای کاشت ایمپنت خود در مغز انسان رو گرفت و اون رو در مغز اولین انسان قرار داد.
این ایمپلنت تعداد ۶۴ نخ (نازکتر از مو) دارد که روی هر کدام از آنها ۱۶ عدد الکترود نصب شده که قادرند سیگنالهای الکتریکی ناشی از فعالشدن یاختههای عصبی را اندازهگیری کنند.
این نخها توسط یک روبات جراح، وارد بخش Motor Cotex مغز که مسئول تبدیل فکر به عمل و حرکت دادن اندامهاست، میشود. بنابراین در هر لحظه که شخص به عملی فکر میکند، ۱۰۲۴ سیگنال از سلولهای motor cortex خوانده شده و با بلوتوث به اپلیکیشن موبایل ارسال میشود.
پردازش این سیگنالها و آموزش مدلهای یادگیری ماشین روی آنها امکان کنترل کامپیوتر توسط ذهن (Brain-Computer Interface) را میدهد.
با اینکه در اولین آزمایش انسانی، تعدادی از نخها خودبهخود از مغز بیمار خارج شده، اما پژوهشگران همچنان مشغول جمعآوری داده از سایر الکترودها اند و امروز اطلاع دادند که بیمار توانسته بازی Webgrid رو با امتیاز ۸/۰۱ (که بسیار نزدیک به انجام با دست است) انجام دهد.
شما هم میتونید از لینک زیر این بازی رو انجام بدید:
https://neuralink.com/webgrid/
به نظرتو شما هدف Neuralink از انتشار این بازی چیست؟ جمع آوری داده از بازیهای انجام شده یا تبلیغات؟! | 1 072 | 15 | Loading... |
04 پژوهشگرها (و دانشجوها) همیشه دلشون میخواد که یه نفر باشه که هر مقالهای رو که میگن بره بخونه، بیاد خلاصهشو بهشون بگه و انقدری خوب مقاله رو فهمیده باشه که پرسشهاشون رو هم پاسخ بده و خلاصه یه پارتنری باشه که بشینن در مورد مقاله با هم صحبت کنن.
خوب گوگل زحمت این رو هم کشید ☺️
https://illuminate.withgoogle.com/ | 1 193 | 173 | Loading... |
05 اگه از خوراکهای تکراری خسته شدی میتونی به کمک هوش مصنوعی جدید گوگل دستور پخت خوراکهای ترکیبی از دو کشور مختلف رو امتحان کنی!
https://artsandculture.google.com/ | 1 281 | 42 | Loading... |
06 Media files | 1 862 | 48 | Loading... |
07 . | 2 | 0 | Loading... |
08 گوگل با Veo رقیبی قدرتمند برای SORA معرفی کرد
Google just released VEO, the SORA competitor.
https://deepmind.google/technologies/veo/ | 1 680 | 13 | Loading... |
09 اگر دموهای GPT-4o براتون جذاب بود، احتمالا تا الان به مدلهای بینایی-زبان (Vision-Language Models) هم علاقهمند شدهاید. مدلهایی که تصویر و نوشتار را بهصورت همزمان دریافت و درک کرده و متنی مرتبط را در خروجی تولید میکنند.
امروز گوگل خانوادهای از مدلهای VLM اوپنسورس به نام PaliGemma معرفی کرد.
این مدل از کدکنندهی تصویر موجود در مدل SigLip-So400m برای کدکردن تصویر ورودی استفاده کرده و بهکمک مدل Gemma-2B که یک مدل decoder-only است، متن خروجی را تولید میکند.
گیتهاب:
https://github.com/google-research/big_vision/blob/main/big_vision/configs/proj/paligemma/README.md
هاگینگفیس:
https://huggingface.co/blog/paligemma | 1 683 | 65 | Loading... |
10 چشم به آینده با هوش مصنوعی Astra گوگل!
در رویداد Google I/O 2024، شاهد رونمایی از پروژهی Astra، یک دستیار هوش مصنوعی فوقالعاده، بودیم.
پروژه Astra با استفاده از هوش مصنوعی قدرتمند Gemini، به شما کمک میکند تا با دنیای اطرافتان به گونهای جدید تعامل داشته باشید.
این دستیار هوشمند میتواند:
♨️ محیط اطراف شما را درک کند و به سوالات در مورد آن پاسخ دهد.
♨️ اشیاء گمشده شما را پیدا کند. ️♀️
♨️ منابع ایجاد صدا را در محیط تان مشخص کند.
... و بسیاری کارهای شگفتانگیز دیگر!
پروژه Astra نه تنها روی گوشیهای هوشمند، بلکه روی عینکهای هوشمند نیز قابل استفاده است. ️ این امر تجربهای کاملاً جدید و فراگیر از هوش مصنوعی را به ارمغان میآورد.
پروژهی Astra هنوز در مراحل اولیه توسعه قرار دارد و به برنامهی انتشار عمومی آن اشارهای نشده است.
♨️♨️♨️♨️♨️
〰️〰️〰️〰️〰️
💡 @cvision 💡
〰️〰️〰️〰️〰️ | 2 249 | 26 | Loading... |
11 با AI Overviews، دنیای اطلاعات در دستان شماست!
این قابلیت جدید گوگل، به شما کمک میکند تا به سرعت و به سادگی، خلاصهای جامع و دقیق از هر موضوعی که به آن علاقه دارید، دریافت کنید.
AI Overviews با استفاده از هوش مصنوعی قدرتمند گوگل، منابع مختلف مانند مقالات، وبسایتها و حتی کتابها را تجزیه و تحلیل میکند و مهمترین نکات را به صورت خلاصهای خواندنی به شما ارائه میدهد.
با AI Overviews میتوانید:
💢 در زمان خود صرفهجویی کنید و به سرعت به اطلاعات مورد نیازتان دسترسی پیدا کنید. ⏳
💢 دانش خود را در هر زمینهای افزایش دهید، بدون اینکه نیاز به مطالعهی حجم زیادی از مطالب داشته باشید.
💢 موضوعات پیچیده را به سادگی درک کنید و از جزئیات مهم آنها آگاه شوید.
AI Overviews در حال حاضر به زبان انگلیسی در دسترس است، اما به زودی به زبانهای دیگر نیز ترجمه خواهد شد. | 1 888 | 30 | Loading... |
12 Ask Photos: جستجوی هوشمندانه در دنیای تصاویرتان!
قابلیت Ask Photos، که به تازگی توسط گوگل در Google Photos معرفی شده، انقلابی در نحوه جستجو و مدیریت تصاویر ایجاد کرده است. این قابلیت به شما امکان می دهد تا با استفاده از زبان طبیعی و به جای کلمات کلیدی، به سادگی و به سرعت تصاویر مورد نظرتان را پیدا کنید.
تصور کنید: می خواهید عکس هایتان را بر اساس مکان، زمان، افراد حاضر در عکس یا حتی اشیاء موجود در آنها جستجو کنید. Ask Photos با درک دقیق محتوای تصاویر، به شما کمک می کند تا به راحتی به این خواسته خود برسید.
علاوه بر این، Ask Photos می تواند برای یافتن تصاویر مشابه، بهترین عکس از یک رویداد خاص و یا حتی خاطراتتان در مورد یک مکان خاص نیز مورد استفاده قرار گیرد.
این قابلیت در حال حاضر برای مشترکین Google One در زبان انگلیسی در دسترس است و به زودی برای سایر زبان ها و کاربران نیز ارائه خواهد شد. | 1 712 | 15 | Loading... |
13 ⚡️ گوگل I/O 2024: هوش مصنوعی، اندروید 15 و دنیایی از نوآوری ها! ⚡️
غول فناوری، گوگل، در رویداد I/O 2024، از جدیدترین دستاوردهای خود در زمینه هوش مصنوعی، اندروید و موارد دیگر رونمایی کرد.
اندروید 15 نیز با آپدیت های جذاب و کارآمد، تجربه کار با گوشی های هوشمند را متحول خواهد کرد.
♨️♨️♨️ | 1 748 | 3 | Loading... |
14 خلاصه ارائه دیروز OpenAI و شفافسازی برخی اصطلاحات و زمانبندی
دیروز OpenAI ارائه خیلی جالبی داشت که سریع ترند شد! بیایید باهم خلاصهوار به اون نگاهی بندازیم و چند تا اصطلاح و زمانبندی رو روشن کنیم.
پیشنهاد میکنم دو تا سند کوتاه رو که دیروز منتشر شدن بخونید:
[لینک اول توضیح دسترسی به GPT-4، GPT-4 Turbo و GPT-4o][1]
[لینک دوم درباره قابلیتهای صوتی جدید چتجیپیتی و رایگان شدن آن][2]
شاید با دیدن قابلیتهای صوتی جدید در چتجیپیتی وسوسه شدید اون رو امتحان کنید، ولی متاسفانه باید فعلا صبر کنید😩.
چتجیپیتی فعلا به روش قدیمی جواب شما رو میده. یعنی متن رو به صوت و برعکس تبدیل میکنه، نه با اون سرعت و هوشمندیای که توی نمایشها دیدیم.
در حال حاضر، چتجیپیتی از قابلیت “حالت صوتی” که از اول وجود داشته برای پشتیبانی از صدا استفاده میکنه. قابلیتهای صوتی و تصویری جدید GPT-4o به زودی به چتجیپیتی اضافه میشه. (بیشتر در این مورد پایین توضیح میدیم).
یعنی مدل هوشمند جدید با روش قدیمی (کندتر) با شما صحبت میکنه. مدل سریعتر و جدیدتر به زودی در دسترس قرار میگیره، بله، و حتی بعدا میتونه آواز هم بخونه!
اون اپلیکیشن با تمام امکاناتی که توی نمایش دیدیم، آمادهست، ولی فعلا فقط برای مک. به تدریج در مناطق و حسابهای کاربری مختلف عرضه میشه. چتجیپیتی به شما اطلاع میده.
برای ویندوز فعلا خبری نیست: قراره اواخر امسال نسخه ویندوز هم عرضه بشه.
درباره محدودیت پیام: "کاربران پلاس میتونن تا ۸۰ پیام هر ۳ ساعت با GPT-4o و تا ۴۰ پیام هر ۳ ساعت با GPT-4 ارسال کنن. ممکنه این محدودیت در ساعات اوج ترافیک برای اینکه GPT-4 و GPT-4o برای تعداد بیشتری از افراد در دسترس باشه، کاهش پیدا کنه." برای حسابهای رایگان، این محدودیت میتونه خیلی کم باشه، مخصوصا اگه سرور نزدیک شما شلوغ باشه. حتی گاهی اوقات فقط ۲ تا ۴ پیام. اول از همه محدودیت حسابهای رایگان کم میشه و به ۳.۵ تا پیام در هر ۳ ساعت تغییر میکنه.
ظرفیت حافظه مدل GPT-4o هم 128 کیلوبایت هست. خیلی زیاده. برای ۹۵ درصد از کاربران خیلی زیاده. به طور کلی این مقدار، حجم متن و پیامهای یه چت رو شامل میشه که مدل برای پاسخ دادن به شما توی حافظه نگه میداره تا بر اساس اطلاعاتی که "تو مغزش داره" جواب بده.
مدل جدید تصاویر رو بهتر درک میکنه: قابلیتهای تصویری GPT-4o عملکرد بهتری نسبت به GPT-4 توربو داره.
دو برابر سریعتره (این توی چتجیپیتی قابل توجهه): GPT-4o دو برابر سریعتر از GPT-4 توربو هست.
پشتیبانی GPT-4o از زبانهای غیرانگلیسی نسبت به GPT-4 توربو بهبود پیدا کرده.
برای علاقهمندان به API:
قیمت: GPT-4o نسبت به GPT-4 توربو ۵۰ درصد ارزونتره و قیمتش ۵ دلار به ازای هر یک میلیون توکن ورودی و ۱۵ دلار به ازای هر یک میلیون توکن خروجی هست.
@cvision
محدودیت سرعت: محدودیت سرعت GPT-4o پنج برابر بیشتر از GPT-4 توربو هست - تا ۱۰ میلیون توکن در دقیقه.
این قابلیتهای چندوجهی به تدریج فعال میشن. مثلا تبدیل صدا به صدا، تصویر به تصویر، و مکالمه با ویدیو. فکر میکنم به زودی شاهد آپدیت DALL·E 3 یا یه روش کاملا جدید برای تولید تصویر باشیم. باید صبر کنیم.
در همین حال، GPT-4o در تستهای مختلف عملکرد بهتری نسبت به مدلهای دیگه داره و به صورت رایگان در چتجیپیتی در دسترسه. | 2 250 | 61 | Loading... |
15 ویدیو اصلا شد. | 1 919 | 0 | Loading... |
16 اگر دوست داشتید ما را در اینستاگرام نیز دنبال کنید:
@class.vision
🙏https://www.instagram.com/class.vision/ | 1 939 | 2 | Loading... |
17 توسعهدهندگان از همین امروز میتوانند در فریمورک LangChain از مدل GPT-4o از طریق API استفاده کنند.
در این کد نمونه، آدرس یک تصویر به مدل داده شده و از مدل خواسته شده محتوای تصویر را شرح دهد.
https://python.langchain.com/v0.1/docs/integrations/chat/openai/ | 1 454 | 53 | Loading... |
18 پاسخ روشن ایلان ماسک به یک خبرنگار 🔥
سوال: به نظر شما چه کسی برنده کاخ سفید در سال 2024 خواهد بود؟
پاسخ ایلان ماسک: فکر می کنید چه کسی برنده کاخ سفید در سال 2032 خواهد شد؟
کدام نوع هوش مصنوعی؟
ترنسفورمر یا دیفیوژن؟ | 2 181 | 42 | Loading... |
19 https://twitter.com/danielkempe/status/1790096679384883217 | 2 169 | 19 | Loading... |
20 این مدل، GPT-4o می تواند کمیک نیز تولید کند!
یاد گرفته است که شخصیت های شما را به خاطر بسپارد و آنها را در صحنه های مختلف خلق کند. | 2 087 | 28 | Loading... |
21 یکی از ویژگی های برجسته این مدل جدید صدای واقعی آن است که مطابق با ترجیحات شما سازگار می شود.
@cvision | 2 028 | 26 | Loading... |
22 این مدل، GPT-4o می تواند کمیک نیز تولید کند!
یاد گرفته است که شخصیت های شما را به خاطر بسپارد و آنها را در صحنه های مختلف خلق کند. | 225 | 4 | Loading... |
23 یکی از ویژگی های برجسته این مدل جدید صدای واقعی آن است که مطابق با ترجیحات شما سازگار می شود.
@cvision | 213 | 3 | Loading... |
24 میدانید دیروز شرکت OpenAI از GPT-4o جدیدترین نسخه ChatGPT رو نمایی کرد 🤖
🆕 با GPT-4o، آخرین پیشرفت OpenAI، که برای عملکرد فوق العاده سریع و کیفیت استثنایی در 50 زبان طراحی شده است، آشنا شویم...
1️⃣ با GPT-4o به راحتی متون، تصاویر و صدا را میتوان مدیریت کرد و به توسعه دهندگان این امکان را می دهد تا با استفاده از OpenAI API به راحتی نوآوری کنند.
2️⃣ مدل ارائه شده ی GPT-4o با سرعتی دو برابر ولی هزینه ی معادل نیمی از هزینه نسل قبلی خود، یعنی GPT-4 Turbo، نوید کارایی بی نظیر و مقرون به صرفه را می دهد.
3️⃣ هوش مصنوعی OpenAI با افتخار "هوش عاطفی" GPT-4o را برجسته می کند، که به طرز ماهرانه ای تعاملات و وقفه های کاربر را مدیریت می کند.
4️⃣ فراتر از ترجمه، GPT-4o با توانایی خود در تغییر تن صدا، افزودن درام یا ...، تحت تاثیر قرار میدهد.
5️⃣ اما این همه ماجرا نیست – اعضای تیم مهارت های ریاضی و کمک های کدنویسی GPT-4o را به نمایش گذاشتند و آن را به عنوان رقیب قدرتمندی برای GitHub Copilot مایکروسافت معرفی کردند.
@cvision | 2 476 | 61 | Loading... |
25 ⚡️مدل جدید GPT-4 Omni برای ChatGPT امروز معرفی شد و به صورت رایگان در دسترس همه است!
✔️مدل جدید بسیار هوشمندتر و بهتر از تمام نسخه های قدیمی است.
🔊📸📝لازم به ذکر است این مدل روی صوت، تصویر و متن نیز کار میکنه.
https://openai.com/index/hello-gpt-4o | 3 445 | 196 | Loading... |
26 https://twitter.com/OpenAI/status/1790072174117613963 | 354 | 5 | Loading... |
27 ⚡️ GPT-4 Omni برای ChatGPT معرفی شده است و به صورت رایگان در دسترس همه است!
مدل جدید بسیار هوشمندتر و بهتر از تمام نسخه های قدیمی است.
لازم به ذکر است این مدل روی صوت، تصویر و متن نیز کار میکنه.
https://openai.com/index/hello-gpt-4o | 2 537 | 103 | Loading... |
28 جهت اطلاع رسانی دورهها، کلاسهای آنلاین، تخفیفها و غیره مبوط به کلاس ویژن، کانال دیگری نیز ایجاد گردیده که این اطلاعیه ها در بین پستهای این کانال گم نشه!
https://t.me/class_vision | 2 336 | 4 | Loading... |
29 https://www.linkedin.com/posts/axelmdz_mlops-machinelearning-datascience-activity-7194637600861618176-iQaF?utm_source=share&utm_medium=member_desktop | 2 311 | 38 | Loading... |
30 https://learnopencv.com/sdxl-inpainting/ | 1 | 0 | Loading... |
31 فریمورک FeatUp بهطور مشترک توسط پژوهشگران MIT و Microsoft و Berkeley و Google در سمینار ICLR 2024 معرفی شده.
این فریمورک فارق از تسک یا مدل، ویژگیهای ازدسترفتهی دادهی بینایی (تصویر) در ژرفای مدل را بدون تاثیر در semantic مدل، با دقت قابلتوجهی بازسازی میکند.
سایت:
https://mhamilton.net/featup.html
مقاله:
https://arxiv.org/pdf/2403.10516
کد:
https://github.com/mhamilton723/FeatUp | 1 784 | 63 | Loading... |
32 ❌ دیگر از ویدیوهای تار خبری نیست
روش جدید Deblur-GS ویدیوهای تار را بازیابی می کند. این روش ادعا میکند عملکرد و کیفیت رندر بالاتری را در مقایسه با روش های قبلی ارائه کرده است.
[I3D 2024] Deblur-GS: 3D Gaussian Splatting from Camera Motion Blurred Images
https://github.com/Chaphlagical/Deblur-GS
مرتبط با MAXIM | 2 523 | 68 | Loading... |
33 BLIP3, a series of large multimodal models (LMMs) developed by Salesforce AI Research. It is a new SOTA model under 5B on few-shot learning and multimodal benchmarks.
Check out the HF release:
https://huggingface.co/Salesforce/blip3-phi3-mini-instruct-r-v1
Key Takeaways:
BLIP3 is trained at scale on high-quality image caption data and image-text interleaved data.
BLIP3 exhibits strong few-shot learning capability as pre-trained base model and impressive visual chat ability after SFT.
BLIP3 supports more efficient token usage compared to methods like LLaVA (more than 5x less). | 3 342 | 43 | Loading... |
34 دیتاست سایت باسلام
شامل اطلاعات فروش و مشخصات 2.4 میلیون محصول موجود در سایت باسلام به همراه دیتاست 3.3 میلیونی کامنت محصولات.
🔗لینک دیتاست در هاگینگ فیس
🔗لینک دیتاست در کگل | 5 045 | 160 | Loading... |
35 📢جهت اطلاع برای علاقه مندان،
سایت مکتبخونه روی دوره OpenCV فروش فوق العاده و تخفیف 55 درصدی گذاشته است. | 5 193 | 20 | Loading... |
36 جهت اطلاع برای علاقه مندان،
سایت مکتبخونه روی دوره OpenCV فروش فوق العاده و تخفیف 55 درصدی گذاشته است | 844 | 16 | Loading... |
37 ✳️ دورههای Deep-Learning گروه آموزشی class vision
📢🎉کد تخفیف 10 درصدی cvision ویژه اعضای محترم کانال تلگرامی: cvision
اگر تا کنون دوره ها را تهیه نکرده اید توصیه میشه حتما فایل مصاحبه با شرکت کنندگان را ببینید و همچنین با قسمت های رایگان شروع کنید! کلی ویدیوی رایگان دیگر نیز در کانال آپارات وجود داره!
0️⃣ ویدیوهای رایگان آشنایی با هوش مصنوعی و پایتون
0️⃣ دوره رایگان Python(پایتون) برای هوش مصنوعی
1️⃣ دوره جامع یادگیری عمیق
2️⃣ دورهی شبکه ها عصبی بازگشتی ( LSTM , GRU و RNN)
▫️مشاهده قسمتهای رایگان
3️⃣ دوره شبکه عصبی گرافی (GNN و GCN)
▫️ویدیوی معرفی دوره | فیلم ارائه معرفی GCN در دانشگاه شریف
4️⃣ دورهی بازشناسی و تشخیص چهره
▫️ مشاهده قسمتهای رایگان | ثبتنام
5️⃣بینایی کامپیوتر با OpenCV
▫️دوره منتشر شده در مکتب خونه
6️⃣وبینارهای مرتبط رایگان
🔺 اطلاعات بیشتر در کانال و یا سایت class.vision
🔻 هر گونه سوال: @classvision_support
برای خرید گروهی، یا خرید برای اعضای یک کلاس با پشتیبانی تماس بگیرید. | 6 228 | 121 | Loading... |
38 اگه عکسی دارید که دوسش دارید ولی دستتون لرزیده و مات شده، یا پلاک ماشینی از دوربین مدار بسته گرفتید و ناخوانا افتاده، سری به این ریپو بزنید! | 5 151 | 81 | Loading... |
39 About
[CVPR 2022 Oral] Official repository for "MAXIM: Multi-Axis MLP for Image Processing". SOTA for denoising, deblurring, deraining, dehazing, and enhancement.
https://github.com/google-research/maxim
Online demo:
https://replicate.com/google-research/maxim | 5 372 | 167 | Loading... |
Photo unavailableShow in Telegram
ظاهرا شرکت هواوی که خواسته از این هیاهوی هوش مصنوعی سهمی داشته باشه بدجوری ضایع شده!
هواوی اخیراً تولید کننده تصویر یا image generator خود را ارائه کرده و معلوم شد که این شرکت آنقدر در مورد آن نامطمئن بوده که هاردکدی را نوشته بوده که با 6 ثانیه تاخیر، یه تصویر از پیش آماده شده را از یک پوشه بر میداشته و نشون میداده که ارور داده و با متن ارور لو رفتن!!
البته خبرو فقط تو ردیت دیدم، جای معتبری هنوز تایید نکرده!
https://www.reddit.com/r/facepalm/comments/1csuf74/huawei_just_accidentally_revealed_that_their_new/
😁 22😱 2👍 1🤔 1
Photo unavailableShow in Telegram
با این ابزار جدید گوگل در واقع میتونید می تونید روی مقالات علمی گفت و گوی صوتی داشته باشید و مباحثه کنید
https://illuminate.withgoogle.com/
👍 11🔥 1
Repost from School of AI
همونطور که میدونید، استارتاپ Neuralink بهتازگی تایید FDA برای کاشت ایمپنت خود در مغز انسان رو گرفت و اون رو در مغز اولین انسان قرار داد.
این ایمپلنت تعداد ۶۴ نخ (نازکتر از مو) دارد که روی هر کدام از آنها ۱۶ عدد الکترود نصب شده که قادرند سیگنالهای الکتریکی ناشی از فعالشدن یاختههای عصبی را اندازهگیری کنند.
این نخها توسط یک روبات جراح، وارد بخش Motor Cotex مغز که مسئول تبدیل فکر به عمل و حرکت دادن اندامهاست، میشود. بنابراین در هر لحظه که شخص به عملی فکر میکند، ۱۰۲۴ سیگنال از سلولهای motor cortex خوانده شده و با بلوتوث به اپلیکیشن موبایل ارسال میشود.
پردازش این سیگنالها و آموزش مدلهای یادگیری ماشین روی آنها امکان کنترل کامپیوتر توسط ذهن (Brain-Computer Interface) را میدهد.
با اینکه در اولین آزمایش انسانی، تعدادی از نخها خودبهخود از مغز بیمار خارج شده، اما پژوهشگران همچنان مشغول جمعآوری داده از سایر الکترودها اند و امروز اطلاع دادند که بیمار توانسته بازی Webgrid رو با امتیاز ۸/۰۱ (که بسیار نزدیک به انجام با دست است) انجام دهد.
شما هم میتونید از لینک زیر این بازی رو انجام بدید:
https://neuralink.com/webgrid/
به نظرتو شما هدف Neuralink از انتشار این بازی چیست؟ جمع آوری داده از بازیهای انجام شده یا تبلیغات؟!
Play Webgrid | Neuralink
Play Neuralink's Webgrid game and test your clicking skills against our first clinical trial participant's brain control.
👍 4❤ 1
Repost from School of AI
Photo unavailableShow in Telegram
پژوهشگرها (و دانشجوها) همیشه دلشون میخواد که یه نفر باشه که هر مقالهای رو که میگن بره بخونه، بیاد خلاصهشو بهشون بگه و انقدری خوب مقاله رو فهمیده باشه که پرسشهاشون رو هم پاسخ بده و خلاصه یه پارتنری باشه که بشینن در مورد مقاله با هم صحبت کنن.
خوب گوگل زحمت این رو هم کشید ☺️
https://illuminate.withgoogle.com/
👍 10❤ 2
Repost from School of AI
Photo unavailableShow in Telegram
اگه از خوراکهای تکراری خسته شدی میتونی به کمک هوش مصنوعی جدید گوگل دستور پخت خوراکهای ترکیبی از دو کشور مختلف رو امتحان کنی!
https://artsandculture.google.com/
👍 4
گوگل با Veo رقیبی قدرتمند برای SORA معرفی کرد
Google just released VEO, the SORA competitor.
https://deepmind.google/technologies/veo/
Veo
Veo is our most capable video generation model to date. It generates high-quality, 1080p resolution videos that can go beyond a minute, in a wide range of cinematic and visual styles.
👍 1
Repost from School of AI
Photo unavailableShow in Telegram
اگر دموهای GPT-4o براتون جذاب بود، احتمالا تا الان به مدلهای بینایی-زبان (Vision-Language Models) هم علاقهمند شدهاید. مدلهایی که تصویر و نوشتار را بهصورت همزمان دریافت و درک کرده و متنی مرتبط را در خروجی تولید میکنند.
امروز گوگل خانوادهای از مدلهای VLM اوپنسورس به نام PaliGemma معرفی کرد.
این مدل از کدکنندهی تصویر موجود در مدل SigLip-So400m برای کدکردن تصویر ورودی استفاده کرده و بهکمک مدل Gemma-2B که یک مدل decoder-only است، متن خروجی را تولید میکند.
گیتهاب:
https://github.com/google-research/big_vision/blob/main/big_vision/configs/proj/paligemma/README.md
هاگینگفیس:
https://huggingface.co/blog/paligemma
👍 8
Photo unavailableShow in Telegram
چشم به آینده با هوش مصنوعی Astra گوگل!
در رویداد Google I/O 2024، شاهد رونمایی از پروژهی Astra، یک دستیار هوش مصنوعی فوقالعاده، بودیم.
پروژه Astra با استفاده از هوش مصنوعی قدرتمند Gemini، به شما کمک میکند تا با دنیای اطرافتان به گونهای جدید تعامل داشته باشید.
این دستیار هوشمند میتواند:
♨️ محیط اطراف شما را درک کند و به سوالات در مورد آن پاسخ دهد.
♨️ اشیاء گمشده شما را پیدا کند. ️♀️
♨️ منابع ایجاد صدا را در محیط تان مشخص کند.
... و بسیاری کارهای شگفتانگیز دیگر!
پروژه Astra نه تنها روی گوشیهای هوشمند، بلکه روی عینکهای هوشمند نیز قابل استفاده است. ️ این امر تجربهای کاملاً جدید و فراگیر از هوش مصنوعی را به ارمغان میآورد.
پروژهی Astra هنوز در مراحل اولیه توسعه قرار دارد و به برنامهی انتشار عمومی آن اشارهای نشده است.
♨️♨️♨️♨️♨️
〰️〰️〰️〰️〰️
💡 @cvision 💡
〰️〰️〰️〰️〰️
❤ 6👍 3🔥 1🤩 1