nVision Digital AI בינה מלאכותית, טכנולוגיה חידושים, vibe coding ומה שבינהם
Kanalga Telegram’da o‘tish
הערוץ שמביא לכם חדשות על כל מה שחדש בתחום הAI, וה vibe coding , מודלים, כלים, וחידושים
Ko'proq ko'rsatish464
Obunachilar
+124 soatlar
+37 kunlar
+530 kunlar
Postlar arxiv
וזה כבר מהיום
:ערב טוב לכולם,
טוב, אז אתמול יצא פייבל, היה איפוס מכסות וביממה האחרונה עבדתי עליו לא מעט, בכל מני תצורות
כשאני מנסה לעשות QA לפרוייקט שלי וכמובן לאתר תקלות.
החלטתי לחלוק איתכם כמה מסקנות ומחשבות,
טוב, זה לא יהיה מפתיע אם נגיד שהוא חזק
מאוד חזק. אני לא אוהב להשוות "הוא פי X מאופוס", לא סתם לא הצגתי את הבנצ'מרקים, לא קונה את כל המספרים, בסוף השאלה היא בתכל'ס מה הוא עושה שמודל אחר לא עושה. אז יש המון אנשים שעושים מבחני קוד, מבקשים ממנו לעשות ONE SHOT של משהו, ומשווים את זה לתוצאות של מודלים דומים, אם תרצו ניתן לכם ערוצים כאלה שעושים השוואות (למרות שאני בטוח שאתם מסוגלים לאתר אותם לבד)
אבל אם נדבר תכל'ס, - אני לא אגיד משפטים כמו הוא לוקח את אופוס בהליכה או לא רואה אותו ממטר,
כן ברור, שכשאתה נותן להם לעבוד, הFABLE גומר טוקנים במהירות מטורפת, מי שיתרגל אליו - יתחיל לשלם לאנתרופיק חזק.
ממש ממש חזק.
ממש לפני כמה דקות צחקתי שכשאתה יורד מפייבל לאופוס, אתה מרגיש איך הוא מאט את צריכת הטוקנים,
וגם מרגיש כאילו ירדת מאופוס לסונט... :)
הוא עובד מעולה עם WORKFLOWSחוקר לעומק, מביא תוצאות
הוא עובד מעולה גם בלי WORKFLOWS ומסוגל לבצע עבודה יסודית
גם OPUS 4.8 היה LONG HORIZON (דהיינו יכל לרוץ הרבה) גם פייבל ממשיך את המסורת.
והשוס, ביקשתי ממנו להקצות עבודה לGPT 5.5 שהוא מעולה, והוא בדק אותו ומצא לו טעויות
עכשיו, אני לא תמים, גם הפוך בטוח היה קורה, אבל אין ספק שהוא יסודי.
יש לכם קלוד? נצלו אותו בחוכמה עד ה22 ליוני, אז זה ייגמר
לשאלות, אני פה.
אתמול כתבתי (מתנצל על העיכוב )
לכל מי שלא נרדם,
כמה הערות על מה שקורה הערב עם אנתרופיק:
1. לפני כמה ימים הם הודיעו על מכסות כפולות ל COWORK עד יולי... אז אם אתם בעניין של COWORK - זה הזמן שלכם לזרוח
2.
2. הושק מודל המיתוס המוגבל (שעדיין שובר את אופוס 4.8) - שימו לב שיש מחיר השקה - עד ה22 ליוני, אח"כ הוא יהיה זמין רק בEXTRA USAGE, וגם זה במחיר שכבר הספקנו לשכוח של 50 דולר למיליון טוקן OUTPUT. אם שכחתם, 4.8 רץ על 25 דולר, וGPT 5.5 רץ על 30 דולר... רק מודלים ישנים יותר בסדרת הOPUS 4.X רצו על 85 דולר אם אני זוכר נכון, אבל כבר מזמן שכחנו מהם... אז זה הזמן להנות ממנו באותו מחיר, עד שהוא עובר ל"מחסן" הEXTRA USAGE. כמובן שהם מבטיחים לנסות לשלב מכסות שלו אם יהיה להם COMPUTE (שזה די מצחיק כי א - הם הכפילו מכסות לקו וורק) ב'- סגרו עם XAI \ SPACE X שימוש בקולוסוס - זוכרים?)
3. אה, לא פחות חשוב, המכסות אופסו הלילה. זה אומר שאם נניח כמוני האיפוס שלכם היה בשבת בבוקר, הוא עדיין בשבת בבוקר, פשוט יש לכם 100 אחוז לנצל עד אז... ואם האיפוס מחר, באסה... בקיצור - תאריך האיפוס נשאר זהה כמו קודם, פשוט עכשיו יש לכם 100 אחוז לנצל שוב.
4. כמעט שכחתי - איך פייבל? אין לי מושג, בינתיים הוא רץ אצלי בריצות ארוכות... אבל אין לי יכולת להשוות אותו ל4.8 - מתנצל משאיר את זה ליוטוברים שזה התפקיד שלהם.... חבל לי על הטוקנים (גם עם איפוס :) ) אבל נראה סבבה בינתיים.
לילה טוב
או קיי
אז פייבל הוא גרסה מצונזרת של מיתוס
מיועד למנוע מאיתנו להשתמש בו לרעה (בתחומי סייבר, ביולוגיה וכו)
השרשור (די מעניין) פה
https://x.com/claudeai/status/2064394146916229443?s=46
עכשיו opencode מאפשרת שימוש חינם במודל קוד פתוח של nvidia עם 1m קונטקסט.
אין תירוצים 😱
https://openai.com/index/chatgpt-memory-dreaming/
ועכשיו גם OpenAI משפרת את הזיכרון.
מתחילים בארה״ב
הם עברו לdreaming v3
שרשור מלא :
https://x.com/openai/status/2062567556524003631?s=46
ביקשתי מגרוק לסכם את זה , ולכתוב מה החידוש?
במקום פשוט לשמור את ההיסטוריה, המערכת עכשיו מסנתזת ומבינה את ההקשר באופן אוטומטי, זה מאפשר ל-ChatGPT להמשיך שיחות בצורה הרבה יותר טבעית ורציפה לאורך זמן.
הוא זוכר שינויים בזמן (למשל: שלבים שונים של טיול), לומד את ההעדפות והמגבלות שלך בלי שתצטרך להזכיר לו כל פעם, ומתאים את עצמו אליך טוב יותר.
תכונות חדשות:
• סיכום זיכרון – אתה יכול לראות מה המערכת זוכרת, לערוך, למחוק או להנחות אותה מה כדאי שתזכור.
• פי 2 יותר זיכרון בהשוואה ללפני.
הזכרתי כמה פעמים את warp
הפלטפורמה שניסתה להתחרות בגדולות , ועדיין פעילה אבל היום היא גם קוד פתוח.
הם פיתחו מערכת זיכרון
לטענתם על ובין כלל הפלטפורמות
אחד הדברים הכי מעצבנים זה להיכנס לשיחה חדשה עם קלוד / קודקס והוא לא יודע על מה אתה מדבר.
נסו ותעדכנו מה דעתכם
(רשימת המתנה כרגע )
https://www.warp.dev/oz/agent-memory#waitlist
כמעט שכחתי,
היה גם את זה :)
אמלק : מודל מולטי מודאלי חדש של גוגל כולל שמע , שיכול לרוץ על מחשב ביתי.
והינה מה שיש ל ai להגיד אחרי עריכה אינטנסיבית שלי :
גוגל הכריזה היום על Gemma 4 12B, מודל קוד פתוח חדש שמסמן כיוון מעניין מאוד בעולם ה־AI המקומי. בניגוד למרוץ הרגיל סביב מודלים גדולים יותר ויותר, כאן המטרה היא אחרת: להביא יכולות מתקדמות של reasoning, עבודה עם תמונות, אודיו וסוכני AI (Agents) ישירות למחשב האישי, בלי להסתמך על שרתי ענן.
Gemma 4 12B הוא מודל מולטימודלי עם 12 מיליארד פרמטרים, שממוקם באמצע משפחת Gemma. מצד אחד הוא קטן משמעותית ממודלים גדולים כמו Gemini, GPT או Claude שרצים בענן, ומצד שני הוא מציע יכולות שמתחילות להתקרב לרמות ביצועים של מודלים גדולים בהרבה. לפי גוגל, הביצועים שלו מתקרבים ל־Gemma 4 26B, תוך שימוש בפחות ממחצית ממשאבי הזיכרון.
אחד הנתונים המרשימים ביותר הוא שניתן להריץ את המודל באופן מקומי עם כ־16GB בלבד של VRAM או Unified Memory. המשמעות היא שמחשבי Mac מודרניים, לפטופים עם כרטיסי מסך צרכניים ומערכות פיתוח ביתיות יכולים להריץ מודל מולטימודלי מתקדם ללא צורך בתשתיות יקרות.
אבל הסיפור האמיתי בהכרזה הוא הארכיטקטורה החדשה. רוב המודלים המולטימודליים כיום משתמשים ברכיבים נפרדים לעיבוד תמונות וקול לפני שהמידע מועבר למודל השפה עצמו. הגישה הזו אמנם עובדת היטב, אבל היא מוסיפה השהיה, מגדילה את צריכת הזיכרון ומסבכת את המערכת.
ב־Gemma 4 12B גוגל בחרה בגישה שונה לחלוטין. במקום להשתמש במקודדי תמונה ואודיו נפרדים, המודל מעבד את סוגי המידע הללו כמעט ישירות בתוך מודל השפה עצמו.
בתחום הראייה (Vision), גוגל החליפה את מקודד התמונות המסורתי במודול embedding קל במיוחד, שמאפשר לליבת מודל השפה לבצע בעצמה חלק גדול מעיבוד המידע הוויזואלי. בתחום האודיו היא הלכה אפילו צעד נוסף קדימה והסירה לחלוטין את מקודד הקול. במקום זאת, אות השמע הגולמי ממופה ישירות לאותו מרחב ייצוג שבו נמצאים טוקני הטקסט.
מדובר במהלך ארכיטקטוני משמעותי, משום שהוא מנסה לאחד את כל סוגי המידע תחת מודל אחד במקום לחבר מספר מודלים שונים יחד. אם הכיוון הזה יצליח לאורך זמן, הוא עשוי להשפיע על הדרך שבה ייבנו מודלים מולטימודליים בעתיד.
בהשוואה למודלים אחרים בשוק, Gemma 4 12B מתחרה בעיקר בקטגוריית המודלים המקומיים המתקדמים. הוא נכנס לאותו מרחב שבו נמצאים כיום Qwen 3 בגרסאות הביניים, Mistral Small ודגמי Llama המכוונים להרצה מקומית. הוא לא נועד להתחרות ישירות במודלי הדגל הענקיים של OpenAI, Anthropic או Google עצמה, אלא לתת למפתחים ולארגונים יכולות מתקדמות על חומרה נגישה בהרבה.
נקודה נוספת שחשוב לציין היא הרישיון. כמו שאר משפחת Gemma 4, גם Gemma 4 12B מופץ תחת רישיון Apache 2.0, אחד הרישיונות הפתוחים והידידותיים ביותר לשימוש מסחרי. המשמעות היא שמפתחים, סטארטאפים וארגונים יכולים להשתמש בו, לשלב אותו במוצרים ולהתאים אותו לצרכים שלהם ללא המגבלות שמאפיינות חלק מהמודלים הפתוחים האחרים.
https://blog.google/innovation-and-ai/technology/developers-tools/introducing-gemma-4-12B/?utm_source=tw&utm_medium=social&utm_campaign=og&utm_content=&utm_term=
כמה קטנות אחרונות להיום :
1. יש IDEOGRAM חדש - מודל קוד פתוח לתמונות
הדגמות, פרטים ואיך להשתמש בזה בחינם (כמובן עלויות GPU) או דרך תוכנית ענן פה https://x.com/ideogram_ai/status/2062202208700313872?s=20
2. חברת MINIMAX מתגאה שהם שידרגו את M3 והפכו אותו מהיר עוד יותר (תיקונים)
3. מיקרוסופט ביטלה את המנויים של קלוד קוד, ועכשיו העובדים הולכים להשתמש במודל של מיקרוסופט מלמעלה דרך גיטהאב קו פיילוט (קצת מצחיק, כי הוא לא אופוס בדיוק)
4. עבור גרוק, יוצא היום גם TTS \ STT, וגם.... IMAGINE 1.5
תוכלו למצוא מידע פה https://t.co/x4Yt13xRu7
5. לV0 יש אינטגרצה עם SNOWFLAKE למקרה שאתם עובדים עם נתונים ותרצו להרכיב דשבורדים וUI על הדאטה שלכם
https://t.co/x4Yt13xRu7
6. חברת OPENAI שיחררה אתמול רצף של אינטגרציות לCODEX, מאנליסט נתונים ועד ל.... פלאגינים למכירות, לשירות לקוחות, אנליזות, הכל.
לא מזמן, קובץ הMD לעיצוב design.md הפך לסטנדרט בתעשיה להחזיק את העיצוב שלכם לסוכן.
ועכשיו, frame.md הקובץ החדש לייצר סרטונים
עוד מידע, פה
https://x.com/HeyGen/status/2062211458042347520?s=20
אנתרופיק יומי : קלוד קוד בקטנה,
https://x.com/ClaudeDevs/status/2061947411141169494?s=20
קלוד קוד, פקודת הברנצ' הוחלפה ל FORK ותפתח לכם בעצם ענף מקביל שאליו תוכלו לשלוח סוכן חדש עם כל הקונטקסט, שיסיים לעבוד ויתמזג לראשי ויחסוך לכם לכאורה טוקנים.
אני חושב שאולי יש אנשים שלא הבינו עד כמה זה מצחיק ועצוב בו זמנית, בואו נדבר שניה על איך מיקרוסופט הרסה את גיטהאב קו פיילוט, שזה עצוב כי הם ממש התגאו שהם התוכנית הכי זולה שיש...
אז בואו נדבר על זה שניה (וזה סופר מצחיק, כי רק אתמול הם אירחו מיטאפ בתל אביב על איך עובדים עם גיטאהב קו פיילוט)
אז מה היה עד עכשיו?
10 דולרים לחודש, חודש ראשון חינם, קיבלתם 300 קרדיטים, כל מודל, תמחור אחר של קרדיטים כולל מודלים ב0.
למשל GPT 5.4 = קרדיט אחד, GPT5.5 קיבל 7.5 קרדיטים ואופוס, טוב די ברור ש15 קרדיטים, נכון? הרמה של החשיבה לא הושפעה מכמות הקרדיטים.
יש עוד מנוי של 40 דולר שכולל את ספארק, יש מנוי עסקי שזה ה10 דולר רק ב20 דולר, ואם הלכתם על המנוי של ה40, הוא עדיין 40 בעסקי אבל מקבלים במקום פי 5, רק פי 3.
מה שנקרא "כייף".
עכשיו, יש מודל תמחור חדש.
קרדיט AI = 0.01 דולר
מודל תמחור חדש (10,39 ו100 דולר לפרטיים)
שם תקבלו 1500, 7,000 ו 20,000 קרדיטים בהתאמה
https://docs.github.com/en/copilot/concepts/billing/usage-based-billing-for-individuals
אם אתם מנויים עסקיים קיימים, אז זה 19 דולר, ו.... 1900 קרדיטים.
(3 חודשים הקרובים, עד 1 לספטמבר זה 3000 קרדיטים, איזה כייף???)
https://docs.github.com/en/copilot/concepts/billing/usage-based-billing-for-organizations-and-enterprises
ובכל זאת, איך משתמשים בזה?
Models and pricing for GitHub Copilot - GitHub Docs
תוכלו לבדוק את המחירים, אבל אם נהיה כנים?
אני אעשה ניסוי, כי הכסף כבר שולם החודש,
אבל אם זה מה שאני חושב שזה, כנראה שאין שום היגיון וטעם לעבוד יותר עם GITHUB CO PILOT, אמנם יצאה אפליקציה חדשה לדסקטופ, ואמנם יש שם שכלולים, אבל ברצינות, ברגע שהם עברו למודל של חיוב לפי טוקנים ולפי עלויות API, אין בהם שום ייתרון, ועדיף לחסוך את הכסף ולהוציא אותו על AI אחר.
אבל ניתן לו צ'אנס, ונדווח
והינה תמונה לספר המחזור :)
בואו נדבר חצי שניה על ... מיקרוסופט
התלבטתי עד כמה לכתוב על זה לעומק. כי יש מה לכתוב.
אבל אני תוהה על האפקטיביות - בכללי , מיקרוסופט שלפה כמה שפנים מהכובע ויצרה כמה שת״פים מעניינים
למשל עם מאיו קליניק לפתח מודל בינה מלאכותית שמתמחה ברפואה.
למשל עם nvidia מחשב חדש ומעניין, שאמור להיות הפתרון למי שרוצה להריץ מודלים מקומיים.
למשל, לעובדה שהם הריצו אתמול 7 מודלים חדשים
אז...
בקצרה, אפשר לראות פה כמה מודלים, כולל מודל של יצירת תמונות, ומודלים של VOICE, ומודל של תכנות, כולל מודל של 1T (זה 1 טריליון!!!) שהוא MOE (זוכרים מה זה? אם נפשט באמת הכי בעולם, במקום לעבוד עם כל ה1T פרמטרים המודל מורכב מאוסף של "מומחים" שכל פעם נבחרים צוות של מומחים (במקרה הזה בגודל 36 ביליון) שרצים כדי להחזיר תשובה, ככה אפשר להשיג יותר בפחות.
הייחוד של מיקרוסופט (מעבר לעובדה שמסתבר שלא חסר שם כסף, כי למרות שהם בעלים של לא מעט מניות של OPENAI בחרו לצאת לדרך למסלול פיתוח מלא) זו הטענה שהם עבדו רק על דאטה נקי ולא דאטה של מודלים אחרים.
הערה שלי - אין פה שובר שיוויון.
אם אתם עם אופוס או GPT 5.5 כנראה שלא תעברו לפה, ובכל זאת, עוד חברה זורקת את הכובע לזירה, ואנחנו צריכים לשמוח כי תחרות זה דבר חיובי
קצת מילים שלהם על חלק מהמודלים:
המודל הכי חזק
MAI-Thinking-1: A powerful reasoning model developed from scratch that is competitive with models of similar size on STEM reasoning and coding tasks. Our pre-training focused on a simple scaling emphasizing data-driven iterative improvements to our architecture and data. Our reinforcement learning (RL) framework is optimized for sustained log-linear climbs over many thousands of steps We are openly sharing all technical details and learnings to build a transparent and science-driven approach to further development in AI Read More: msft.it/6011vj86J
מודל קטן, מקביל להייקו
AI-Code-1-Flash beats Claude Haiku 4.5 on every coding benchmark we tested:
מודל התמונות
MAI-Image-2.5 + MAI-Image-2.5-Flash are here.
🥈 #2 on Arena for image editing
🥉 #3 on Arena for text-to-image
🎯 Surpasses Nano Banana Pro 2K and GPT-Image-1.5 on Arena scores
🏷 Supports precise, controllable edits preserving faces, logos and fine details
⚡️ Strong performance on H100s
Two tiers, same family:
MAI-Image-2.5 → premium fidelity for your most demanding work
MAI-Image-2.5-Flash → same Arena-class quality, faster and lower cost at $1.75 per 1M text input, $19.50 per 1M image output
Live in PowerPoint. Rolling out on OneDrive.
מודל STT (מודל תמלול)
MAI-Transcribe-1.5: the only model in the top group of both Accuracy and Speed on Artificial Analysis. #1 on FLEURS averaged across 43 languages #1 on Artificial Analysis Accuracy x Speed Pareto Frontier #3 on Artificial Analysis-WER at 2.4% up to 5x faster than rival models 1 hour of audio in under 15 seconds Read More: msft.it/6017vj86P
המודל ההפוך, TTS (מודל טקסט לדיבור)
MAI-Voice-2 + MAI-Voice-2-Flash. Our most expressive text-to-speech model yet: 15 languages with emotion control (excited, whispered, embarrassed and more) Stable speaker identity across long-form content Code-switching for Hindi-English and Spanish-English Preferred over MAI-Voice-1 in 72% of evals MAI-Voice-2-Flash coming soon, built for real-time agents and high-volume workloads where latency and cost matter most. Read More: msft.it/6018vj86u
אם שרדתם עד לפה, שתדעו שפה יש מידע נוסף
Models and pricing for GitHub Copilot - GitHub Docs
ושבגדול, תוכלו להשתמש בזה בשלל דרכים, כולל GITHUB קו פיילוט
לא יודע מה איתכם אותי זה קרע מצחוק עצוב ונכון
מישהו בגוגל החליט על רעיון חדש בשם Dreambeans,
אפליקציה לסלולרי, שאם אני קורא נכון, חוץ מלהיות רק למי שיש לו ULTRA בארהב, אז גם הולכת להיות סופר אישית ולגרום לגוגל להכיר אתכם עוד יותר טוב (פרסום מישהו?)
יתפוס או יעלם כמו כל מני אפליקציות אחרות של גוגל שנקברו?
https://x.com/GoogleLabs/status/2062206479026069544?s=20
Dreambeans is a new, experimental mobile app that uses Personal Intelligence to connect to your Google apps. Every day, it delivers collections of personalized stories, surfacing things you might otherwise miss, alongside topics that are relevant to you, to help you dive deeper into the things you care about most. Available starting today for eligible US-based Google AI Ultra users (+18), with an open waitlist found on our website below! Learn more at labs.google/dreambeans
ערב טוב חברים,
כרגיל, ערב מלא חידושים וחדשנות
נתחיל עם סיפור של PIVOT, לא זה מהאקסל.
אחד הIDE הידועים, הוא WINDSURF,
לפני קצת פחות משנה - עסקה ענקית, OPENAI עומדים לקנות אותם בתמורה ל3 מיליארד דולר. אפשר לשאול - למה לעזאזל חברה כמו OPENAI עומדת לקנות IDE? הרי VSCODE הוא גם ככה קוד פתוח, לא כזו בעיה לפתח. התשובה? DATA.
אתם משתמשים, הם אוגרים דאטה ויודעים בדיוק איך אתם משתמשים במודלים, ויותר מזה, איך המודלים מגיבים אליכם.
העולם כמרקחה, אנתרופיק חוסמת את המודלים שלה מWINDSURF (כי כביכול הם עוברים למתחרים) ובינתיים, הכל מתפרק, פתאום הבכירים של ווינדסרף עוברים לגוגל, גוגל משלמת ל WINDSURF 2 מיליארד דולר (ובהמשך מבססת על WINDISRF את ANTIGRAVITY) ומייד חברת קונטיגון, הבעלים של DEVIN, שהוא מתכנת AI רוכשת \ מתמזגת עם WINDSURF.
מאז, הרבה מים זרמו בנהר, WINDSURF השתכלל, הוסיף עוד פיצ'רים, ועכשיו - מגיע פרק האיחוד, ובעצם WINDSURF הופך להיות אפליקציית הדסקטופ של DEVIN, והעלמות של WINDSURF והטמעה שלה בתוך DEVIN.
ומעכשיו, יש מתחרה חזק על הכיס שלכם, יחד עם CURSOR.
https://x.com/windsurf/status/2061889084541509922?s=20
החבר׳ה ב antigravity מסבירים שהם שיפרו את המודל של Gemini 3.5 flash והוציאו גירסה חדשה שלו + איפסו את הrate limit שוב.
אני לא זוכר מתי חברה כלשהי הודתה שהיא שיפצה מודל קיים.
עוד שני דברים נחמדים :
עכשיו אפשר לעבור בין ה antigravity לבין ה antigravity cli ולהמשיך לעבוד בלי הפרעה בין שניהם.
https://x.com/jackwoth98/status/2061853206515167466?s=46
כמו כן הם הוציאו סקילים מגניבים לשימוש מדעי
https://github.com/google-deepmind/science-skills
ועכשיו גם ל Hermes יש אפליקציה משלו לדסקטופ.
נ.ב
הcodex שלי שחט 25 אחוז על ניסיון לפרוס ב sites ואז ויתר ופשוט הציע לי לפרוס דרך netify
ROTFL
באמת שאין לי מילים.
המלצתי לא פעם ולא פעמיים על factory - רתמה ממש טובה שמאפשרת להשתמש ב BYOK ולתת חוויה (יותר טובה מ) Claude code עם כל LLM שתבחרו.
עכשיו הם הכניסו סוג של ראוטינג שמאפשר להם לבחור לבד את המודל כי איך הם אמרו ? אתה לא צריך את אלברט איינשטיין כדי לפתור בעיית תנועה במתמתיקה.
ציינתי שהם גייסו לאחרונה 600 מיליון דולר ?
Endi mavjud! Telegram Tadqiqoti 2025 — yilning asosiy insaytlari 
