YUV.AI - בינה מלאכותית בעברית
前往频道在 Telegram
2 427
订阅者
无数据24 小时
+67 天
+5930 天
帖子存档
+2
רגע של נחת: אחד מסוכני ה-AI בסטודיו החדש שלי זיהה בהצלחה פער בין תמונת הרפרנס לבין התוצר, הסביר את הבעיה והעביר לסוכן אחר להמשך טיפול. הוא שם לב לניואנסים רבים, אבל דוגמא יפה ובולטת זה כפל בלוגו של גיטהאב על הג'קט שלי (בתמונת המקור יש רק אחד בצד שמאל).
הפרומפט היה תיוג של הדמות שלי, ואז קאבר לסרטון יוטיוב עם הטקסט בצורת פיצוץ בצד ימין, הדמות מצד שמאל, ושורות קוד בצבע ניאון ברקע. וכן, הסטודיו יכול לקבל פרומפטים בכל שפה, לרבות בעברית!
תוצר 1 זה מה שהסוכן זיהה, ו-2-3 זה סגנונות נוספים שהוא יצר לי על בסיס הפרומפט שלי. כל זה עם קלוד קוד ו-וייב קודינג, ובעיקר, עם הבנה של מה אני רוצה לבנות ואיך התקשורת והארכיטקטורה אמורה להיראות. גן עדן של משחקים
יכולת יצירת התמונות והווידאו החדשה של גרוק פשוט יוצאת דופן ודורשת פוסט 🤯
אנחנו בתקופה שבה קנבס ציור לבן מונח מולנו כל הזמן, ובכל רגע אפשר ליצור כל מה שנרצה. לא הייתה תקופה כזו. לא משנה כמה דברים יתפתחו, אני תמיד אשאר פעור פה בכל פעם שה-AI ייצור לי תמונה עם קומפוזיציה בלתי אפשרית שמעולם לא קרתה במציאות.
לאחרונה, מאסק הפציר להוריד את Grok למובייל, ושם יש מצב שנקרא Imagine שמאפשר ליצור תמונות בקצב מסחרר, וגם להפוך אותן לווידאו. הקצב הבלתי נתפס, כמו גם היכולת לדבר כדי ליצור תמונות (גם בעברית) ולקבל הכל כמעט בזמן אמת ובאופן מיידי - לא נראה כדבר הזה.
גרוק גם מתייחס בזה שהוא מאפשר ליצור כל סגנון. ממש כל סגנון בלי להגביל כמו כלים אחרים. זה כאילו לא אכפת לו מזכויות יוצרים. שלא יודע איך זה אפשרי מבחינתם אבל מבחינתנו זה הכי כיף.
רגעים ספורים ליצור כל תמונה של כל דמות ובכל סגנון. ורגעים ספורים נוספים להפוך את זה גם לווידאו. טירלול מוחלט. איזה כיף!
קבלו 5 VIBE TIPS שלמדתי בדרך הקשה! 🤫
1. השתמשו בחוקי AI לגיבויים, אל תתעצלו. חוק שמבצע גיבוי אחרי כל שינוי קוד, אוטומטית, הוא מציל פרויקטים!
2. תכננו את הארכיטקטורה לפני הכל!! אל תתחילו ב"יהיה בסדר" כי לא יהיה! סוף מעשה - במחשבה תחילה
3. השתמשו בשאלות או מצב תכנון ואל תרוצו סתם בלי להבין מה סוכן הקוד הולך לבצע, כמה שזה עלול להיות הרסני שלא תדעו. בהתחלה זה לא נורא, אבל ככל שפרויקט הופך רציני יותר - זה קריטי
4. השתמשו בקלוד קוד. עולם אחר מכל כלי אחר. תתמקדו. חבל על הזמן לבחון סתם כלים כי אין לזה סוף ואין כמו גישה ישירה דרך אנתרופיק בעצמם שהינדסו את קלוד קוד פשוט נפלא וכל הזמן משפרים אותו לפי תגובות המשתמשים
5. השתמשו ב-MCP, זה חוסך זמן ועוזר לרוץ פי 1000 (x1000!), במעשים ולא בדיבורים!
ולבסוף, ימים אחרונים למבצע ההשקה של הקורס שלי 😮
קנו את וייב קודינג עם קלוד קוד וקבלו גם הנחה של כ-30% וגם מתנה: שני מיני-קורסים על סביבות פיתוח (IDE) ומבוא לפיתוח WEB! הכל באקדמיה שלי. מוזמנים לגלוש לקישור שמופיע בתמונה האחרונה - או להגיב ואשלח לכם.
שבת שלום!
סיימתי לאמן לורה ל-Flux Kontext ושרדתי כדי לספר שלא צריך פוטושופ כבר לאינפיינטינג 🤯
לא באמת מבינים את המודל עד שמאמנים עליו. זה מודל Inpaint בלי מסיכות. זה הכל. תראו למשל כאן, שחזור תמונות ישנות והוספת צבע. רוב המודלים לא מצליחים מספיק טוב. אבל פלאקס קונטקסט במקרה הזה אומן על זוגות זוגות של תמונות: תמונת מקור, תוצר איכותי והפרומפט שיצר אותו.
אם היינו צריכים לבצע את זה ידנית זה היה צורך זמן רב. מנגד, מספיק שנאמן פעם אחת, וזהו. לא צריך פוטושופ ולא מסיכות ולא inpaint ולא כלום. מעלים תמונה, במקרה הזה של ניקולאס טסלה, עם הנחיה עליה אימנו את המודל, כמו פה: ״צבע את התמונה״ (Colorize this image) - ושלום על ישראל!
עכשיו שהבנתי בידיים את המודל, איישם כמה דברים בסטודיו שלי ואחרי זה למשימה הבאה: fine tune למודל video to video של wan. ולשואלים, אני משתמש ב ai-toolkit אבל כל זה זמין גם ב-Fal
איזו תמונה נוצרה מתמונת רפרנס בודדת עם Ideogram ואיזו ממודל שאומן על עשרות תמונות שלי ב-Flux? התשובה בקוד בינארי בפינת התמונה. כדי לפענח (אחרי שתחשבו על זה כמובן) - פשוט תעלו את התמונה לקלוד \ גרוק \ ג'יפיטי ותבקשו את הפיענוח.
אגב, היום חקרתי אודות היכולת של ליצור תמונות מתמונה בודדת. יש את DreamO של ByteDance (טיקטוק), קוד מקור פתוח ומטורף שמאפשר את זה ועוד המון יכולות. שווה לבדוק.
משהו בסרטונים קצרים שמראה תהליך שאנחנו יודעים שאמור לקרות בו משהו אבל לא יודעים מה - מגרה את המוח שלנו ואת הסקרנות שלנו.
המוח שלנו עובד על פרשנות וניבוי. הוא רגיל לקבל פריימים חסרים ולהשלים את התמונה על פי פרשנות שלו, ובסרטונים כאלה יש גירוי למוח: גם סקרנות של מה יקרה בעת הפיצוץ, גם אסתטיקה, גם שימוש בוויז׳ואל מושך ובאפקטים קוליים משלימים, וגם תוצאה שמשתנה בכל פעם ויוצרת חוסר יכולת לחזות באופן עקבי את התוצר במדויק.
בקיצור, יחד עם קלוד והרבה מחשבה, הגענו לתוצר הזה שאמור לנגן על התכונות האנושיות ולעודד התמכרות. את התמונות יצרתי ב-Ideogram, את המעבר מתמונה לווידאו יצרתי עם המודל החדש (v2) של Hailuo AI (MiniMax), עריכה וסאונדים עם CapCut. אז האם קלוד ואני הצלחנו או לא? עוד נצטרך לבחון את זה.
עד אז אשמח לדעת מה חשבתם ואם יש לכם המלצות על סרטונים ממכרים שאי אפשר להפסיק לצפות בהם?
הצצה לקייטנת AI חדשה: ללמוד את יסודות הפיתוח ואימון מודלים של AI (ללא קוד!)
החופש הגדול כאן והוא מביא איתו מבול של הזדמנויות כמו לנצל את הזמן ללמידה איכותית ומעמיקה. לשם כך החלטתי להקליט מיני-קורס שהוא גם מעין קייטנת AI שמלמדת את יסודות הפיתוח תוך שימוש באתר הנפלא Sctrach שממחיש איך מפתחים ללא קוד אבל עם הבנה של מה זה פיתוח ואיך הוא עובד.
לא נסתפק בזה, ונשלב גם Machine Learning למתחילים. נאמן מודל, ללא קוד, נשלב אותו בפיתוח ללא קוד, וזה יהיה כיף גדול שאין לתאר ובסופו נצא עם ידע על פיתוח ועל אימון מודלים של AI (שזה בעצם למידת מכונה, Machine Learning, שזה ענף ה-AI האמיתי).
קבלו הצצה, הולך להיות כיף!!
ואני מזכיר לכם שהקורס שלי על וייב קודינג עם קלוד קוד עדיין במבצע ובמחיר השקה!!!! המבצע מסתיים בסוף אוגוסט וחבל לפספס. שלא תגידו לא ידענו. הכל פה: האקדמיה לבינה מלאכותית של יובל אבידני - YUV.AI Academy https://academy.yuv.ai
ריבוי סוכנים בעולם האמיתי: הסטודיו החדש שלי שועט קדימה ותראו את ההבדל שבין לעבוד עם קריאות API רגילות + סוכן שאחראי על הקומפוזיציה, לבין אותו הדבר אבל עם סוכן נוסף שאחראי גם על אחידות בלבוש שתתאים לתמונת הרפרנס בדיוק של 99.9%!
כמו שאתם בטח רואים, אני רץ עם הסטודיו שלי בקצב מסחרר והלילה (הלבן) הוליד ריבוי סוכנים מאוד מעניינים:
1. יכולת לייצר טקסט עם אפקטים מרהיבים במגוון סגנונות (זוכרים את ההולי ש*ט של קלוד אתמול?!)
2. יכולת לעשות את הנ״ל אבל גם להוסיף דמות מתמונת רפרנס
3. יכולת לעשות את הנ״ל וגם לשלוט בקומפוזיציה של התמונה ולוודא מיקום אלמנטים היכן שרצינו
4. יכולת לעשות את הנ״ל וגם לשלוט בעקביות הלבוש של הדמות שאנחנו מג׳נרטים
5. וגולת הכותרת: יכולת לעשות את כל הנ״ל - על ריבוי דמויות מפרומפט אחד ומבלי לאמן מודל! 🤩
הדרך להגיע לזה מלאה חתחתים ועולה בתשלום על שימוש במספר כלים במקביל, מה שמאט את הזמן לקבלת התמונה, ומייקר את העלות לתמונה בודדת. מנגד, כמה זמן זה חוסך? כמה ג׳ינרוטים אנחנו מבזבזים רק כדי להגיע למה שיש לנו בראש?
לא השתמשתי פה ב-framework קיים של סוכנים. מה שעשיתי הוא שבחרתי מראש באיזה מודלים של אימג׳ או LLMs אני רוצה להשתמש ומתי, והתחלתי לבנות עם קלוד קוד את כל החיווט הזה ואת כל התשתית. אני משתמש ב-Fal כדי להתחבר לשירותים שונים, וב-API ל-LLMs אחרים כדי לבצע פעולות אחרות.
היופי פה הוא שאפשר לזלזל ולהגיד ״אה זה כולה כמה חיבורי API, שטויות״, אבל אז בחיים לא תתקבל התוצאה הזו. כי עשיתי פה עוד כל כך הרבה חיבורים נוספים על בסיס הידע והניסיון שלי, והקסם האמיתי פה זה ההינדוס של התשתית והחיבור בין הסוכנים והתקשורת והאינטרקציה ביניהם. או במילים פשוטות: היצירתיות. כי זה לא משנה שיש כל כך הרבה כלים זמינים, מה שמשנה הוא לאן היצירתיות לוקחת אותנו. לכבישים חרושים או לסלילת שבילים משלנו?
זה כמו קנבס עם לוח ריק ומלא צבעים. לכולם יש את זה מולם. אבל כל אחד מייצר יצירה אחרת. ויש גם מי שמעתיק יצירות של אחרים. שזה בסדר. אבל אפשר יותר. וכך גם אף פעם לא באמת יוצרים. זה בסדר גמור להתחלה ללמידה אבל מתישהו צריך לפרוש כנפי דימיון ולעוף גבוה.
זה מזכיר לי שוב את המוח האנושי. יש דיונים קדחתניים מהי ההכרה שלנו. כשאדם מאבד את ההכרה הוא לא פה. כשההכרה שלו קיימת הוא פה. כשאדם מורדם הוא לא פה. כשהוא ער הוא פה. אז מה זו ההכרה הזו? לפי חוקרי מוח, ההכרה היא פעולת התקשורת הנוירו-כימית וחשמלית בין הנוירונים במוח. עצם העברה המידע עצמה. היא היא ההכרה. התקשורת בין הנוירונים ברשת הנוירונים במוח. הסיפור הוא לא להכיר את הנוירונים אלא לדעת ליצור את ההכרה האנושית, זו החכמה האלוקית של לגרום לתקשורת הזו במוח. ולהבדיל כך גם ב-AI. החכמה הגדולה זה לא הכלים - אלא זה איך אנחנו מהנדסים את העבודה עם הכלים במוצרים שלנו.
הרגע הזה שאני מראה לקלוד תמונה מהסטודיו החדש שלי והוא אומר הולי ש*ט! 🤣🤣🤣
האם AI בעיקר מבזבז כסף לארגונים או גם הופך לרווחי? התשובה לא כזו פשוטה.
לפני כמה ימים פרסמתי על החברה הסקוטית ששכרה את שירותי לפתח MVP במקום בית תוכנה. אותה חברה סקוטית מתעסקת במחקרים שעוזרים לארגונים לאמץ טכנולוגיות. סיפור מעניין שקשור לזה הוא חברה שפיתחה טכנולוגיה מטורפת עם AI, הכל שם AI, השקיעו, ראו לפי כל המספרים שאם יאמצו את ה-AI ישפרו סביב 80% מהתפוקה והדילוור. הביאו את טובי המוחות לעצב את המערכת, מבחינת מוצר, UX UI ומה שתרצו. אלא מאי?
בפועל, שיעור האימוץ בקרב המשתמשים עמד על 12% בלבד. מוצר מטורף שהושקע בו ערך מטורף שגם הוכח כמייעל את העבודה - פשוט לא הצליח לחדור מבעד לחומות האימוץ של העובדים. מה שגרם ל״פרארי״ הזו לחנות החניה במקום לדהור במסלולי מירוץ.
סקרים של מקינזי הוכיחו שמפתחים שמאמצים את ה-AI מרגישים יותר סיפוק משמעות ואפילו שמחה. 90% ומעלה דיווחו שהם רצים מהר יותר שמחים ומאושרים יותר. 90%! אז למה לא מצליחים לקחת את זה לשלב הבא?
מסתבר שיש היבטים פסיכולוגיים שהם לא פחות חשובים. המוח האנושי יודע להסתגל לשינויים. הוכח שהוא נוירופלסטי. יכול להתאים את עצמו מחדש. אבל לנו, כגורם אנושי, קשה עם שינויים. אולי אנחנו מפחדים, אולי אין לנו זמן, אולי אנחנו מרגישים שלא בא לנו ללמוד משהו חדש עכשיו כשאנחנו שולטים בקיים.
לצד ההשקעה של הארגונים על פיתוחים - חשוב לא פחות להבין גם את הגורם האנושי. את הפסיכולוגיה שמאחורי אימוץ שינויים בכלל - וטכנולוגיות AI בפרט. דגש על הצד הזה - ישפר פלאים את האימוץ.
מסתבר שכאשר לצד פיתוח מואץ דואגים להראות כל הזמן את הערך שמתקבל, מדברים על נקודות כאב אמיתיות שהטכנולוגיה הזו פותרת - תוך כדי הדגמת מקרי בוחן מעשיים - למשל, להראות איך אפשר להשתמש בחבילות פיתוח פנימיות בפרויקטים, איך להגדיר חוקי AI שמשקפים את ה-Best Practice הארגוני? כמו commits במבנה מסוים, הרצת פקודות של בדיקות לאחר פיתוח באופן אוטומטי וכדומה.
כאשר משתמשים מבינים - הם מרגישים בנוח - ומאמצים. אי אפשר לבוא עם פטיש על הראש. אפשר לתת המון ערך - ואז זה עובד כמו קסם! כמו ניגון שחודר לנפש - כך ה-AI יכול לנגן על המיתרים שלנו.
והנה זה פה: האג׳נדה לכנס שלי ב-15.9 זמינה עכשיו בכתובת 159.yuv.ai
איזה מרגש! עוד קצת וזה קורה. בתקווה שהפעם לא יהיו איראנים ותימנים בדרך!
הראיון המלא שקיימתי עם נירו, סמנכ"ל בגיטהאב, על קופיילוט, MCP, וייב קודינג ועוד - זמין עכשיו ביוטיוב שלי! מוזמנים לצפות >>>
https://www.youtube.com/watch?v=LNMhtvX819I
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
