YUV.AI - בינה מלאכותית בעברית
Open in Telegram
YUV.AI - בינה מלאכותית בעברית 👉 https://yuv.ai 👈
Show more2 426
Subscribers
-124 hours
+27 days
+5830 days
Posts Archive
האם מי שקורא יותר מאמרים הוא בהכרח כלי מחקרי טוב יותר? זה מה שניסיתי לבדוק השבוע כשכלי המחקר המעמיק של קוד שוחרר לכולם, השוויתי אותו מול GPT. לשניהם נתתי את אותו פרומפט שמכיל רשימה של כ-12 קישורים לאתרים וסרטוני יוטיוב. שניהם יצאו למחקר מעמיק, רק מה?
אצל GPT, מספר המקורות עלה ל-31
בעוד שאצל קלוד, מספר המקורות עלה ל-358!!!!
מצויד בהתלהבות הזו, חיכיתי מאוד לתוצרים. כששניהם סיימו את המחקר המעמיק, התלהבתי מאוד ממה שקיבלתי מקלוד - עד שקראתי את מה שקיבלתי מ-GPT. המחקר שלו היה הרבה יותר מדויק והרבה יותר ממוקד למה שביקשתי. זה מעניין. הוא קרא כ-10% בלבד מהמאמרים שקלוד קרא (ז"א שקלוד קרא בערך פי 10(!) ממנו), והיה מדויק יותר.
האם זה אומר משהו גורף? כנראה שלא. יש מדדים מסודרים כדי להשוות ולא רק התחושה שלי או מבחן אחד הם מה שקובעים. עם זאת, במשימה הזו, GPT ניצח, כך שייתכן שמספר המאמרים לא בהכרח יהפוך את התוצר שלנו לטוב או חכם יותר, מה שמוכיח את הטענה העקבית שלי: בסוף מי שיש לו קונטקסט רלוונטי יותר בחלון ההקשר שלו - הוא זה שינצח, ולא רק מי שמנסה לדחוס כמה שיותר מידע לתוכו.
אם ניסיתם גם את הכלים אשמח לקרוא את הרושם שלכם מהם!
שבת שלום לכולם.
היכולת החדשה של קלוד ו-GPT להתחבר למאגרי מידע ארגוניים כמו Sharepoint, Atlassian וכדומה - פשוט מחקה ומחצה כמות אדירה של חברות שכל המוצר שלהן התבסס על פיתרון נקודת הכאב הזו של חיבור LLM למאגרי מידע פנימיים
חלף הרבה זמן מהתופעה הזו. ב-2022 כאשר הושק GPT, מהר מאוד חברות הטמיעו את ה-API שלהם במוצר והפכו את המוצרים ל״מבוססי AI״, גם אם זה היה רק צ׳טבוט בשפה טבעית. באופן כמעט מיידי צצו מוצרים בכמות אדירה ש״פותרים״ את הבעיה שה-AI לא התחבר לשירותים נוספים. מהר מאוד הושקו הפלאגינים, ו-GPT מחקו את החברות שעסקו בזה.
דבר נוסף שהושק הוא מודל התמלול, Whisper, שגם הוא מחץ חברות שהשירות שלהן היה תמלול. במקביל, חברות אחרות החלו לפרסם שירותי ״יצירת סוכני AI בקלות וללא קוד״. ואז הושקו GPTs וגם AI Assistants ששוב מעכו את החברות שעסקו בזה.
מאז ועד לאחרונה, החל גל נוסף של מוצרים שמתחבר לג׳ירה, לקונפלואנס, לסלאק, לסוויטת המוצרים של גוגל, לגיטהאב, לביט-באקט וכדומה. כפטריות אחר הגשם כך צצים מוצרים כאלה. גם GPT וקלוד הכניסו זאת במעין השקה שקטה. והשבוע האחרון כלל עדכון משמעותי של חיבור לכלים משמעותיים נוספים, שמאפשרים הבאת קונטקסט לשיחה ממאגרי מידע פנימיים, זה מכפיל כוח עוצמתי ברמות שקשה לתאר. כבר לא צריך לשבור את הראש לפתח לבד חיבורים. עוד גל של חברות נמחק.
ולא רק זה. גם גל אדיר של סוכני קוד וסוכנים שפועלים לבד בדפדפן מציף אותנו. זה roo, cline, augment code, Claude code, aws developer Q, GitHub copilot, ועכשיו גם OpenAI Codex שיודע להתחבר לאינטרנט. שוב נוק אאוט.
זה גורם לי להיזכר בשיחה שלי עם Sharon Kinory , משקיעה חכמה מאוד, ולתהות: איך משקיעים יכולים לקבל כיום ביטחון שההשקעה שלהם משתלמת ושהמוצר לא יהפוך ללא רלוונטי תוך מספר שבועות או חודשים לכל היותר? כפי שקורה כיום?
המודלים כבר הגיעו לרמה מאוד גבוהה של ידע. אין איך לשפר אותו כמעט. מה שכן אפשר לשפר זה את המעטפת. את הפיצ׳רים מסביב. את היכולות האג׳נטיות. את ריבוי הקריאות בין הסוכנים השונים. זה מה שחברות מנסות ליישם: תשאול על קודבייס גדול, מבחני ביצועים בין מודלים שונים של Embeddings, Chunking, הנדסת פרומפטים, השוואות של Zero Shot מול Few Shots או Chain of Thoughts וכדומה. שימו לב כמה שרתי MCP צצו בין לילה, ובאיזו מהירות OpenAI וקלוד הכניסו את הקונקטורים בשבוע האחרון. כדי שוב לתת בראש. זה מירוץ מטורף שכדי לנצח בו צריך לפתור נקודת כאב אמיתית - ובעיקר גם לרוץ מהר מאוד. המירוץ הופך להיות מירוץ ספרינט לטווח קצר מאשר פיתוח ארוך טווח.
בקיצור, לפני שמפתחים את הסוכן הבא או את האפליקציה שמאפשרת לתשאל קודבייס שלם, גם עם מודל פרטי בתשתית סגורה, כדאי שנשאל את עצמנו: האם כדאי לנו ״לבזבז״ על זה את הזמן או שכבר קיים פיתרון כזה? או אולי זה עניין של שבועות ספורים עד שהפיתרון יצוץ? ואז בכל מקרה חבל להשקיע את הזמן על זה? הדילמות האלה גורמות לנו לחשוב הרבה יותר קשה, שעה שיותר קל לנו לרוץ מהר עם הדימיון שלנו. אבל האמת היא שהעצירה, ההתבוננות, החשיבה, התכנון - כל זה זה מה שיוביל להצדקה ״לבזבז״ את הזמן שלנו. תמיד כדאי לחשוב בעיניים של ״משקיע AI״, ועל אחת כמה וכמה שהמשאב הכי יקר שלנו להשקעה, הוא הזמן שלנו. עם ניצול נכון ויעיל של הזמן, ובחירה נבונה של ״איך להשתמש בו״, נוכל לרוץ מהר יותר - אבל בצורה מתוכננת ומחושבת.
הפוסט הזה נכתב לאחר שיחות עם משקיעים, חברות, ייעוץ וליווי, הקשבה לכאב ולתסכול שנגרם בשל ״הנוק אאוט״ של הגדולות שוב ושוב.
סיימתי להעביר סדנא של 3 שעות על GitHub Copilot לעומק אצל Applied Materials הנפלאים! תמיד אני חושש לפני סשן למפתחים/ות - אבל היה כל כך כיף, שאלות חכמות, צלילה לעומק, שיתוף פעולה ומעורבות שבאמת הרגיש לי כיף מתמשך כל הסשן.
דיברתי על Context Window Limit, LLMs, RAG, Embeddings, Agents, MCP, Copilot Custom Insteuctions, והכל גם בסביבת ג׳אווה עם IntelliJ וגם במקביל עם PyCharm ו-VSCode. אני באמת חסיד של מקרי בוחן פרקטיים ותמיד כיף להתחבר לשטח ולהרגיש את הצורך האמיתי של חברות וארגונים, ובעיקר לפגוש את האנשים והנשים ולהתפעל מכמה שהם חכמים.
מפתחים/ות הם כל כך חכמים, אבל ברגע שהבנתי שאני לא בא להתחרות כאלגוריתמאי הכי טוב, אלא אני מגיע על תקן זה שמאוהב ב-AI ״עמוק״, כזה שמתחבר לסוכנים, לקוד, לארכיטקטורה מעניינת, כזה שמשחק עם כל הכלים בתשוקה אמיתית - ומדבר עליהם, זה עושה את כל ההבדל. אני מגיע גם כדי לשתף מהניסיון שלי, ובמקביל זוכה ללמוד גם בעצמי מהמשתתפים/ות.
תודה גדולה ל Ofir Rozenfeld על החיבור ועל הבמה ועל ההזדמנות! תודה גדולה גם לכל מי שלקח/ה חלק, Ofir Rabinian , Noga Hecht , Idan Reuven
למה נמאס לי מ-n8n או make והעדפתי לפתח הכל בקוד עם קרסר? כי אם רוצים לעבוד בסקייל ולא על התשתית שלהם זה הופך להיות בלתי נסבל.
תחשבו על זה. ראיתם תרחיש אוטומציה מעניין, עובד מצוין בענן שלהם או אפילו לוקאלית. איך אתם הופכים אותו למשהו שרץ ועובד בסקייל אמיתי?
במייק בניתי אוטומציות שנשברו בשלב מסוים והייתי צריך מדי פעם להפעיל אותן שוב. הן נשברו בגלל שהתשובות של ה-LLM לא תמיד זהות במבנה שלהן וזה שובר את השרשרת לפעמים. מעצבן. אבל קורה. במייק ו-n8n מאוד נוח לעבוד אונליין, אבל בפועל בסופו של דבר אני מרגיש שאין תחליף לפיתוח עם קרסר ולפרוס את האוטומציה על איזו Azure Functions או AWS Lambda וכדומה.
כדי לפרוס בעצמנו אוטומציה שפיתחנו עם n8n כנראה נצטרך להתעסק עם דוקר, קוברנטיס, אולי ec2, טרה-פורם. לא כיף. לא נעים. לא נחמד. ואם אפשר לעשות את זה קל יותר אז למה לא?
נחמד שיש משחקים עם אוטומציות וזה עובד יפה לתרחיש קטן שלנו, אבל כשרוצים מראש משהו שבאמת יעבוד לאורך זמן מבלי להתעסק בהגדרות של הברזלים שוב ושוב - כאן כבר (לדעתי האישית) הכלים האלה מאוד מאכזבים, ומנגד - סוכני הקוד זורחים.
ומה הרושם שלכם מפריסה של תהליכי אוטומציות? האם יש לכם העדפה לפיתרון כלשהו?
סדר בבאלגן המודלים של OpenAI: בואו נפרק את זה בפשטות - מתי להשתמש בכל מודל ולאיזו מטרה?
אז אתמול אנדרי קארפתי הגאון פרסם ציוץ שעושה סדר בכל המודלים של OpenAI: בואו נפרק את זה:
1. מודל GPT-4o הוא המודל הקלאסי שמספיק לנו לרוב המשימות היום-יומיות, לרבות יצירת תמונות, ניסוח מיילים, תשאול כללי ועוד. עובד מהר. עובד טוב.
2. מודל o3 הוא ה-מודל ה-חכם של OpenAI ונשתמש בו למשימות מורכבות של קוד, חשיבה, מתמטיקה, עומק. מדובר במודל שאומן להשיב ע"י פירוק התשובה לתהליכי "חשיבה" ולכן לוקח לו זמן רב יותר. לא צריך אותו כל הזמן וזה לא אומר שהוא הכי "טוב".
3. אם רוצים להפעיל חיפוש באינטרנט - יש כפתור בשורת הצ'אט של Search, פשוט להפעיל אותו
4. אם רוצים מחקר מעמיק - יש כפתור של Deep Research בשורת הצ'אט - פשוט ללחוץ עליו
5. מודל שזמין למנויי פרו הוא o1 pro mode ואין מה להשתמש בו, בנוסף מודלים o4-mini, o4-mini-high, GPT-4.1-mini הם מודלים שלא מומלץ להשתמש בהם ולא ברור מה התועלת מהם בכלל
6. מודל נוסף הוא GPT-4.5 שמאוד טוב בהתנסחות או סתם צ'אט כללי כלשהו, לא דרמטי מדי, אין מה להתאמץ להשתמש בו כשיש את 4o שהוא מספיק מהיר וטוב
7. מודל GPT-4.1 הוא אחלה ל-Vibe Coding במה שכרוך בשינויים של קטעי קוד קטנים. אם צריך לעבוד על קודבייס גדול, תשתמשו ב-o3, אם אתם יודעים מה אתם רוצים לשנות או לתקן ואתם ממוקדים - לכו על 4.1
והנה התמונה שהוא העלה, מספרת את כל הסיפור בקצרה.
מה מהניסיון שלכם עובד הכי טוב - ולאיזה צורך? אני אישית משתמש בעיקר ב-4o עם המודל הקולי, או לשאלות כלליות או כשאני גם משתמש בחיפוש דרכו (כבר כמעט לא נוגע במנועי חיפוש רגילים), ב-o3 אני משתמש לשאלות שצריכות Debug של קוד או הבנה משמעותית מתוך קרסר.
את סוכן הקוד של קלוד הכרתם? סופסוף לקחתי אותו לסיבוב אחרי ההמלצה של אביץ הגאון , התקנתי אותו בתוך הסביבה של Cursor ומה אגיד לכם? סוכן על! לא יודע איך לא ניסיתי אותו קודם!
👈 הוא יודע לתכנן לעצמו סט של משימות
👈 הוא מתחיל לבצע משימה אחר משימה
👈 הוא מעדכן סטטוס של כל משימה שהוא ביצע
👈 הוא עדיין מרגיש לי פחות נוח כי הוא רץ ב-CLI (שורת הפקודה) ולא בחלון צ'אט נפרד כמו Cursor אבל זה רק עניין של הרגל
הבא בתור שאנסה (בלי נדר) זה Amazon Q שגם נראה מאוד מעניין! בקיצור, קבלו כמה דקות על Claude Code האדיר!
את הכלי של גוגל שמפתח אתרים מאוד מהר הכרתם? גיליתי אותו לא מזמן וכנראה באיחור, אבל הוא זמין ב-Google AI Studio והוא ממש אחלה! מצרף לכם הדגמה בווידאו כדי לחסוך במילים. בשורות טובות לכולנו ו״אחרי החגים״ שמח! >>>
שדרגתי את Logan AI ועכשיו הוא לא סתם סוכן, הוא חיבור של MCP עם A2A, שזה אומר: יש סוכן על שמנהל את האינטראקציה בין סוכני AI באמצעות MCP!
חיברתי 2 באזוורדס ביחד. MCP מאפשר למודל שפה לבחור איזה כלי להפעיל, ו-A2A זה ״רשימת הסוכנים״, ה״כלים״, שיש ב-MCP. למה זה טוב? כי כל סוכן הוא יישות נפרדת שאפשר לפרוס בנפרד, יש לו API משלו, והתקשורת בין הסוכנים מתבצעת בהתאם.
כאשר משתמש שולח פנייה, היא עוברת לסוכן העל, מודל שפה, שבהתאם לסוג הפנייה יודע איזה כלי עליו להפעיל. זה ה-MCP. לאחר שהוא בוחר את הכלי, הוא בעצם מפעיל סוכן שהוא הכלי. וכך מתנהלת האינטראקציה בין כולם. כמה זה טוב יותר, כמה זה משפר דברים אם בכלל, עוד אצטרך לבדוק לעומק. כרגע לצורך המחקר זה מאוד מעניין.
אין ספק שזה הדבר הכי גדול שקורה כרגע. אפשר לקחת את זה למיליארד כיוונים, אבל זה מרתק. תזכרו את השילוב, MCP ו-A2A. חג שבועות שמח!!
איך פיתחתי סוכן AI לטלגרם שיוצר תמונות, מתמלל קבצי מדיה ואפילו סרטונים מיוטיוב, מחפש באינטרנט, מבצע פעולות מתמטיות ומשיב בשפה טבעית?
נתחיל מהסוף. כבר פיתחתי משהו דומה לפני שנתיים. לקח לי כמה ימים ולא מעט צלילה לדוקומנטציות. והפעם? בערך שעה עם Cursor והכל כבר היה באוויר ומשם רק עוד כל מיני כיוונונים. הקסם נעוץ בדרך שבה אנחנו עובדים עם סוכן קוד, ובעיקר - להבין מה אנחנו רוצים ואיך אנחנו רוצים.
אני קורא המון לאחרונה את הספר המדהים של Tal Florentin הענק (שאגב, אני מציין שוב ושוב שהקרדיט למצגות היפות שלי הולך אליו כי הוא המקור של העיצוב הזה!), ובספר שלו הוא מדבר המון על חוויית משתמש, וזה הוריד לי אסימונים גם בהקשר של פיתוח. לא מספיק לפתח. צריך לתכנן, להבין מה אנחנו רוצים מבחינת פיצ'רים אבל בעיקר גם איך להנגיש את זה נכון למשתמש. אנחנו לא המשתמשים. המשתמשים הם אלה שקובעים האם המוצר שלנו מצליח או לא. עם הגישה הזו בראש, החלטתי במקום לפתח אפליקציה או אתר, ללכת על ממשק פשוט, בוט בטלגרם, מאוד ידידותי למפתחים, קל ונוח, וגם לא אהיה תלוי ב-n8n או אחרים לפריסה שלו בפועל.
החלטתי שלבוט שלי יהיו הפיצ'רים הבאים: יצירת תמונות, תמלולים, מענה בשפה טבעית, מתמטיקה וחיפוש באינטרנט. ניסיתי להיעזר ב-LLMs כדי לבנות תשתית. קיבלתי תוצאות גרועות. בסוף חשבתי עם עצמי והחלטתי:
חיפוש באינטרנט - עם Brave API, עד 2000 חיפושים חינם כל חודש
יצירת תמונות - עם API של Freepik, זה מאוד שווה וקל ונוח
תמלולים לרבות מיוטיוב - עם AssemblyAI שאני מאוד אוהב
מענה בשפה טבעית - עם Cohere האגדיים שנותנים API Key חינמי לשימוש סביר
מתמטיקה - יכולת הרצת Python
זה בעצם סוכן AI מבוסס Cohere עם כלים שהוא יכול להריץ. כל יכולת כזו זה עוד כלי שהסוכן קיבל. את כל הטוב הזה חיברתי לבסיס נתונים של MongoDB, כדי להוסיף שכבת ״מטמון״, Cache. למה? כי אם אני מנסה לתמלל משהו שכבר תמללתי, או לחפש מידע על משהו שכבר חיפשתי, למה לבצע את זה שוב? פשוט לבדוק ב-DB ולהחזיר את מה שקיים. ועם מונגו זה כל כך קל. בלי מיגרציות. בלי סכמות. פשוט להתחבר למונגו אטלס, לפתח וליהנות. MongoDB
והנה הסרטון שבו אני מאוד מתלהב, ברמה שהקלטתי עוד לפני שהסתפרתי והתגלחתי לכבוד החג! ובנימה זו - חג שמח לכולם!!!
זה מאוד(!) מרשים: כלי AI מקבל קובץ CSV עם 11 אלף שורות של נתונים מספריים - מנתח *הכל* ומייצר מצגת עם גרפים! 📊
יש לנו אתגר גדול בניתוח נתונים בסקייל. ונכון שאפשר לקחת מודלים עם קונטקסט גדול ולהעלות קבצים ולבקש לנתח, אבל הדרך שבה כל מודל ניגש למשימות היא אחרת. כאן, בכלי הזה שנקרא סונה של חברת Kortix, נראה שהם כיוונו לעקוף את ManusAI ומאוד הצליחו, והקטע שהם שחררו את הסוכן שלהם כקוד מקור פתוח (חפשו Kortix Suna GitHub), ושם הם הגדירו את סונה כ״AI Employee״. להגיד לכם שזה מפיל מהרגליים וחידוש שלא ראינו? לא.
להגיד לכם שיש פה פוטנציאל מאוד טוב למשימות שנדרש בהן עומק? כן. אם יש לכם משימות מחקריות, או כאלה שמאוד חשוב לצלול לכל אות, נראה שהם מנצחים את כל השאר כרגע. גם את Manus גם את Abacus וגם אחרים, והצליחו למשל לכתוב דוח מקיף ומעמיק אחרי חילוץ של מידע של חברות מ Y Combinator (הם היחידים שהצליחו לחלץ את המידע על כל 99 החברות שהיו באתר בניגוד לכל שאר הכלים).
כל הישועות וכל הברכות! שבת שלום 🫶
וואו וואו וואו!! 🤯🤯🤯 עזבו הכל ותפעילו ווליום: מודל הטקסט לדיבור הזה בעברית יפיל לכם את הלסת לרצפה! הוא זמין ב-API ותומך באומניות שונות כמו צעקות, לחישות, פאניקה, ואפילו שכפול קול!
זה אשכרה קרה. לא מאמין שהגענו לשלב הזה. אפשר לפתח עכשיו סוכנים קוליים בעברית! זה לא יהיה מושלם כי צריך לפתור בעיות של זכר ונקבה אבל זה הכי טוב בפער אדיר על כל מה שיצא לי לבחון. וואו וואו ושוב וואו! זכרו את השם: deepdub!!
ואם אהבתם תנו קרדיט! 😬🫶
Deepdub
קלוד אחד ביום: הרבה זמן לא הקלטתי על קלוד ומאז קרו המון דברים כמו למשל האפשרות לחבר את ה-Gmail ואת היומן וקלוד מנהל הכל מאפליקציית הדסקטופ. כך למשל שאלתי אותו האם יש זימונים לפגישות שדיברתי עליהם עם לקוחות במייל אבל טרם שלחתי?
קלוד התחבר למייל, חיפש תכתובות, אחרי 2 דקות בערך זיהה מקרה, לאחר מכן בדק ביומן לגבי הזמינות שלי וסיכם לי הכל. זה חוסך לי את הצורך לחפור במייל בעצמי וזו רק דוגמה קטנה ומאוד מועילה עבורי אישית. תחשבו כמה דבר כזה קטן מייעל דברים קטנים במהלך היום שגורמים לתחושת עול כבד. פה כל הקסם טמון.
עדכון לכל מי שרכש\ה כרטיס לכנס ה-AI שלי: לפני כמה דקות הפצתי במייל את הפרטים (נשלח דרך מערכת רב מסר)
בראש ובראשונה - ברצוני להודות לשותפיי לאירוע:
שותפים בדרגת יהלום - חברת Amazon Web Services (AWS) Amazon Web Services (AWS)
שותפים בדרגת זהב - החברות eBay, Microsoft, Bit Cloud eBay Microsoft Bit
שותפים נוספים - GitHub, Base44, AT&T, NeuronVision
להלן פרטי האירוע
תאריך: 30.6.2025
שעות: 09:00-16:00
מיקום: מרכז ענב לתרבות, תל-אביב (חניה עצמאית בתשלום ברחבי המתחם)
כשרות: המזון שיוגש באירוע הינו כשר חלבי
לוח הזמנים המשוער לאירוע ויתר הפרטים - אצלכם במייל.
בעזרת השם נתראה בקרוב,
יובל
קבלו את StagewiseAI: תוסף שמשתלט על סביבת הפיתוח ועוזר לשנות אלמנטים בעיצוב על ידי בחירת העיצוב והזנת פרומפט לסוכן הקוד בצורה אוטומטית!
נחשפתי לזה בפוסט המעולה של Elad Cohen האדיר והנדיר, וגם בהתייחסות של אברהם יצחק מאיר הגאון וגם בקהילות המדהימות שלי בקבוצת הדיונים ובקבוצת ה-Vibe Coding החדשה, וכפי שהבטחתי, אני קודם לוקח לסיבוב בעצמי ורק אח"כ מפרסם במידה ומצאתי ערך. וכאן לגמרי מצאתי ערך, אהבתי את זה מאוד וממליץ בחום לנסות! צפו בסקירה שלי ובעוד כמה טיפים >>>
Available now! Telegram Research 2025 — the year's key insights 
