YUV.AI - בינה מלאכותית בעברית

Відкрити в Telegram

YUV.AI - בינה מלאכותית בעברית 👉 https://yuv.ai 👈

Ізраїль1 508 Технології та додатки28 410

2 427

Підписники

Немає даних24 години

+67 днів

+5930 день

841

Перегляди допису

~ 43824 години

~ 53248 годин

34.64%

Коефіцієнт залучення

~ 2

Дописів на день

Ads index

beta

Архів дописів

2 427

אנחנו חיים בחושך. המוח לא רואה ולא שומע ולא מריח. הוא חי בתוך גולגולת חשוכה. מידע זורם אליו והוא אמור לנחש מה המידע הזה אומר. חתיכת תפקיד. דמיינו שאתם נכנסים לנעליים של המוח. אתם בחשיכה. כל רגע שליח אחר מגיע עם מידע חדש. עליכם מוטלת האחריות לפרש את המידע ולשלוח את התשובה - יחד עם הוראות הפעלה - להמשך טיפול. אתם מקבלים מידע מקולטני הראייה, ואמורים לנחש שאתם עומדים לפני איום. או בפני מישהו שאתם אוהבים. ואז מגיע המידע מהשמיעה, ואז עוד מיליארד נתונים והכל במקביל. כך המוח שלנו עובד. וכך AI עובד. להבדיל. שלב מתן הפרשנות נקרא שלב ה-Inference. גם במדעי המוח וגם בלמידת מכונה. על בסיס ידע מוקדם - מתבצעת פרשנות. לכן יכולות להיות שגיאות - הזיות. כשמבינים את זה, מבינים שכנראה אנחנו חיים את המציאות לא כפי שהיא באמת אלא כפי שהיא בעיניו של המוח שלנו. ולגבי AI, הפרשנות מתבססת על האימון. מה שהיה שם - על בסיסו נקבל תשובות. אם הדאטה של האימון לא היה מאוזן, או עם הטיות, או לא מגוון וכדומה - גם התוצאות יהיו לא טובות. זה נכון למודלים של שפה, לג׳ינרוט תמונות, חיזוי רעש, מוזיקה, וידאו, וכל דבר שמצריך פרשנות על בסיס אימון של רשת נוירונים. חקר המוח והבינה המלאכותית משלימים את ההבנה. לא לחינם יש תהליך חדש יחסית שנקרא Brain on a chip. טכניקה שלוקחים תאי מוח אמיתיים ומחברים למחשבים ומאמנים תאי מוח בהכלאה עם המחשוב. טירוף! לכן גם כאשר אנחנו נותנים פרשנות לדברים, או כאשר ה-AI עושה זאת - כדאי שנהיה עם חוש ביקורת. אצלנו, חוסר הביטחון שלנו, ההעדפות שלנו - הכל משפיע, ב-AI הטיות האימון משפיעות. ככל שננסה להסתכל מתוך ביקורת - יוטב לנו. איך כל זה קשור לסשן שלי בכנס שלי השבוע? עוד תגלו, אני מתרגש מאוד ולא יכול לחכות. אחלה ליינאפ. אחלה אוכל. אחלה אנשים. אחלה תוכן. רק לבוא וליהנות! שבוע טוב ובשורות טובות לכולם בתפילה לשובם 🙏

2 427

חשוב! כל מי שמגיע/ה לכנס שלי ב-15.9 שבוע הבא ולא קיבל/ה את הפרטים - בניתי עמוד נחיתה עם הלו״ז ומה שצריך לדעת. גם הפצתי במייל מספר פעמים אבל מצרף לכם פה את הלינק שיהיה לכם, אם רכשתם יותר מכרטיס אחד תוודאו שהעברתם לי את הפרטים של כל המוזמנים (עברתי כבר על הרשימות ושלחתי מייל למי שהיה צריך להשלים - אבל כותב ליתר ביטחון). וקבלו כמה יפה יצא התג. לא מאמין שאני עיצבתי אותו לבד בעצמי. קולטים כמה ידע זה כוח? אני לא מעצב, אני כן יודע להשתמש בכלי AI ויש לי דימיון. לי זה מוכיח שדימיון + ידע = ובעזרת השם אפשר לעשות הכל!!! כל מי שרכש כרטיס יקבל תג יפהפה כזה בעמדת הרישום כמזכרת. ויש גם ברקודים מיוחדים בצד השני. מעוצבים להפליא. איזה מרגש! קישור למידע אודות הכנס: https://agenda.yuv.ai תנו לייק או תגובה אם אתם באים, ובע״ה אני כבר שוקד על המיטאפ הבא 💪

2 427

מילה אחת בלבד גרמה לפרומפט להצליח כאן. כשמבינים את הנוסחא לפרומפט המוצלח של פלאקס הכל מצליח יותר טוב. אני זוכר את הנוסחא כך: SASC. נושא - SUBJECT - מי מרכז התמונה? דמות? חפץ? פעולה - ACTION - מה אנחנו רוצים שיקרה? למשל פה, שהעשן יתפוצץ סגנון - STYLE - למשל, ריאליסטי, דרמטי הקשר נוסף - CONTEXT - מה עוד אנחנו רוצים שהמודל ידע? למשל, פיצוץ אדיר שגורם לעשן ולצבעים להתפוצץ לכל עבר בהתפרצות של צבעים תתרגלו את זה עוד ועוד ואז תבינו איך גם אתם יכולים לקבל תוצאות שומטות לסתות במקום תוצאות בינוניות. ולגבי המילה שהובילה להצלחה? בפרומפט הלא מוצלח (יחסית), השתמשתי בתיאור של הסצנה ובסוף כתבתי שאני רוצה שהטקסט יופיע מתוך העשן אבל כתבתי forms the text. ואז קיבלתי מה שאתם רואים עם הטקסט השחור במרכז. מנגד, כאשר כתבתי morphs to the text - קיבלתי את מה שרציתי. אז זה שילוב של הנוסחא של פלאקס + ההתנסחות הברורה *שלנו* (ולא בהכרח של מודל שפה!) שמביאה תוצאות טובות.

2 427

*שימו לב: הזדמנות להצטרף לכנס בשבוע הבא! 15 כרטיסים בלבד, כל הקודם זוכה!* https://meshulam.co.il/purchase?b=9a8779d1dfccbcadeadcad0c7765deea האג'נדה מופיעה בעמוד הנחיתה. לפרטים נוספים אפשר לגלוש לכתובת agenda.yuv.ai (עמוד הנחיתה של האירוע)

2 427

זה העמוד ששינה לי את הכל. לכל מודל יש Best Practice משלו בהתאם לטכניקת האימון שלו. עבור FLUX זו הנוסחא המושלמת: נושא + פעולה + סגנון + הקשר. ניסיתי הכל והתאכזבתי. פה סופסוף מרגיש לי פיצוח אמיתי - ומשתף גם לכם.

2 427

בגוגל סטודיו יש אפליקציה בשם Past Forward שמעלים תמונה של אדם ומקבלים איך הוא היה נראה בשנים שונות מבחינת סגנון לבוש ושיער (סטייל שנות ה-70,80 וכו). בגדול מסתבר שבשנות ה-80 אני מתן גרומי כהן 🤣 תודה לבוריס מרגולד מגוגל, הידוע כ-Ask Boris, על ההמלצה!

2 427

הכנס שלי עוד 8 ימים וזה סופר מרגש! יש אג'נדה ופרטיה יעודכנו השבוע בלינק שבתמונה. ובבקשה: בואו נמנע מאי נעימויות, אי אפשר לפנות אלי שבוע לפני הכנס ולבקש לקבל החזר. חייבים להבין פה כמה דברים: - הפקת כנס זה אירוע לכל דבר. כמו חתונה. ברית. בר מצווה. בת מצווה. פדיון הבן. ומה שתרצו. יש התחייבויות רבות והמון(!!) הוצאות ועלויות שמתחייבים לשלם אותן לפי כמות המוזמנים. אי אפשר להזמין כרטיס לאירוע ובדקה ה-90 להחליט שרוצים החזר. בלתי אפשרי. לא כי אני לא רוצה לעזור, אלא כי יש התחייבויות רבות וזה לא אפשרי. צריך לקחת את זה בחשבון כשקונים כרטיסים. - פרסמתי בלי סוף ומעל לכל במה ופלטפורמה שאפשר לקבל החזר בתקופה בה פרסמתי. מי שפנה קיבל. זאת למרות שכבר בעת רכישת הכרטיסים ציינתי שניתן יהיה לבטל כרטיסים לפי המועד החוקי של קניות אונליין. - למרות כל הנ"ל ניסיתי לעזור בכל דרך, לחבר בין מי שאפשר, אבל אין לי קיבולת או פניות להגיע לכך. מישהו\י רוצים למכור או לקנות, מציע להגיב על הפוסט הזה ותנסו לתקשר ישירות. ואם יש למישהו\י שאלה אתם יכולים לפנות אלי למייל שמופיע על גבי החשבונית שקיבלתם. חשוב: מי שקנה יותר מכרטיס אחד - שלחתי מיילים למי שחסרים פרטים לגבי המוזמנים. נא להשיב ולהשלים, אחרת יהיו מוזמנים ללא תגי שם. בואו ננסה להמנע מטעויות ואי נעימויות. והכי חשוב בואו נהנה ונקווה לטוב, ועוד יותר טוב, ועוד יותר טוב. בהצלחה לכולנו ובעזרת השם נתראה בקרוב!

2 427

תשמרו לכם טיפים טריים של גוגל DeepMind לשימוש מתקדם עם ננו בננה! עברתי על זה וזה בומבה ובאמת עזר לי לקבל תוצאות מדהימות. וה-API שלהם נגיש וקליל בטירוף 🤯

2 427

חברת Qwen הכריזה על מודל שפה חדש וענק של *טריליון* פרמטרים שצריך 25 כרטיסי H100 כדי להריץ אותו לוקאלית. רק מה? המודלים הגדולים של ה-AI (של שפה) לא באמת יכולים להשתפר כבר כי הם למדו מכל הידע הגלוי. אין עוד ידע חדש - אין מה לשפר במודל הבסיס עצמו. מה כן משפרים? את המעטפת. מוסיפים פיצ׳רים כמו ״חשיבה עמוקה״, או מצב ״למידה״ או גימיקים מגניבים כמו NotebookLM, או משלבים אותם במחוללי תמונות כמו ננו בננה, או מנסים לשלב אותם ברובוטיקה פרקטית, או שמאמנים רשת גדולה יותר עם מספר גדול יותר של פרמטרים. כל מניפולציה עובדת כדי לנסות להראות שהשתפרנו. בניגוד לכך, המודל הכי חזק שיש לנו היום בקוד, קלוד אופוס 4.1, לצד קלוד סונט 4, ולצד GPT 5 או לצד המודלים הקוליים של GPT, מרגישים שמשהו מאוד לא טוב עובר עליהם. הם לא עונים לעניין, לא משיבים כהלכה, פתאום יוצאים מהקשר, משלבים שפות זרות בתשובות (ערבית באמצע משפטים בעברית, עברית שבורה ורצוצה). הניגוד הזה, של שחרור מודלים חדשים כשבמקביל המודלים הקיימים יורדים באיכות - אומרים דרשני. ובתוך כל זה אנתרופיק מגייסת 15 מיליארד דולר של השקעה, כשהיא אפילו לא רווחית. ספק תהיה בשנים הקרובות. כל זה רק מעלה שוב את השאלה הגדולה: האם מעבר לכיף - AI משתלם בכלל לארגונים? ועזבו ארגונים, האם לחברות ה-AI עצמן משתלם להשאיר את האורות דולקים או שאנחנו לקראת קריסה של החברות האלה שרק תחזוקת המודלים תדרוש בקרוב יותר חשמל ממה שיש לכדור הארץ להציע, שלא לדבר על הנזק לאקלים, ולכן כבר מדברים על ייצור חשמל בטכניקות שונות לרבות מהחלל 🤯 שיהיה לנו שבוע טוב ובשורות טובות, ותזכרו. לא להתלהב מגודל מודלים, מהכרזות שמעוררות פומו. תמיד להסתכל בעומק הדברים ולנסות להבין מתי באמת יש חידוש גדול ומתי זה עוד בלוף. למשל פה עם Qwen, בטבלה שהם פרסמו הם משווים לקלוד אבל במודל ישן יותר וללא חשיבה. העיקר שיש טריליון פרמטרים 🤣 ואגב. רק כדי שנבין. בדר״כ פרמטר הוא בפורמט float32, ז״א 32 סיביות, 32 ביטים, שהם 4 בתים (בייטים). לפרמטר אחד! עכשיו תכפילו את זה בטריליון ותקבלו את המשקל של המודל ותבינו כמה חשמל או כוח מחשוב צריך כדי להריץ אותו וכמה עלה לאמן אותו. מטורף. וכל זה בשביל מה?

2 427

קבלו קסם: האוכל שבתמונות האלה נראה כמו אוכל מקרוב. גם אם מתרחקים, המוח לא רואה את הכתב. אבל! ברגע שאתם מבינים מה כתוב פה, המוח משפר באופן מיידי את הניחוש הכי טוב שלו לפרשנות של מה שהוא רואה, מה שאומר שמהרגע שהמוח ראה והבין - אין איך לחזור אחורה ו"למחוק" את זה. ברגע שתראו את הכיתוב - לא תוכלו לחזור אחורה. פלא הבריאה וכמה יש לנו ללמוד מיצירותיו של השם יתברך. מבשרי אחזה א-לוק. יצרתי את זה באמצעות יצירת תמונת טקסט בקנבה, לאחר מכן השתמשתי בסטייבל דיפיוז'ן 1.5 עם קונטרול נט של QR ועם משחק בפרמטרים ובפרומפטים קיבלתי את מה שמופיע כאן. שבת שלום!!

2 427

טירוף ה-QR עם AI 🤯😱

2 427

איך יכול להיות שמודל מלפני 3 שנים מייצר את הברקודים היפים האלה והוא מנצח את ננו בננה החדש והמטורף של גוגל? ולמה מודלים פתוחים לעולם יהיו עוצמתיים יותר עבורנו מכל מודל דגל אחר? לקראת הכנס שלי אני מעצב בעצמי את מה שצריך. אני לא מעצב אבל אני יודע לנגן על כלי AI כך שזה אפשרי יותר. כחלק מהעיצוב רציתי ברקוד מעניין ולא משעמם. נזכרתי בטרנד חזק שהיה לפני שנתיים ובו משתמשים במודל של סטייבל דיפיוז׳ן הישן (1.5) יחד עם מודל ששולט ביצירת התמונות (ControlNet). ניסיתי להיזכר איך עובדים איתו שוב, ובמקביל פתחתי את ננו בננה. צריך לומר, כל מודל והחוזקות שלו. ננו בננה הוא מודל עריכה. ככזה, הוא אמור להיות מודל שמקבל משימה לבצע שינוי בתמונה ולבצע אותה בהצלחה. והוא באמת עושה את זה. אלא מאי? מה אם אנחנו רוצים שהעריכה של התמונה תהיה ליצור ברקודים מרהיבים ויפהפיים? כאן אנחנו בבעיה. מהניסוי שלי ברור שהוא לא אומן על זה. ובניגוד לפלאקס שניתן לאמן לורות בקלות, לננו בננה אי אפשר, ולפלאקס אין מודל קיים שיכול לבצע את זה. וכך, למרות שקיים מודל ישן מאוד, מסתבר שבגלל שבזמנו אימנו מודל על טכניקות של QR, זה הכי טוב שיש לנו כיום! מודל מ-2022 מנצח את המודלים שנתנו לו נוק אאוט ב-2024-2025! איך זה קורה בפועל? - מתקינים את אוטומטיק 1111 הישן והטוב - מתקינים תוספים של ControlNet - מורידים את המודלים של סטייבל 1.5, ואת המודלים השונים שרוצים - מורידים את מודל הקונטרול נט שיודע להסתיר טקסטים ותמונות ולשלב אותם בתמונות חדשות - משחקים עם המשקולות של הנחיות המודל ושל ה-ControlNet הרלוונטי עד שמגיעים לזה! וכשמגיעים לזה מרגישים ששערי השמיים נפתחו. זה מה שגרם לי להיות ער עד 4 בלילה מהתלהבות ממש כמו בימים ההם. ועכשיו? יש לי כבר רעיונות לאמן מודל כזה שיתאים למודלים החדשים שיש כיום ויהפכו הכל ליותר קל. זו הסיבה שלעולם המודלים הפתוחים יהיו יותר עוצמתיים, כמו qwen, wan, flux, מאשר המודלים הסגורים והמצויינים. לא כי הם מבצעים טוב יותר - אלא כי אפשר לאמן אותם על מה שאנחנו רוצים! מה ששוב מחזיר אותנו למקום של ידע זה כוח, ואימון מודלים זה לחולל קסמים עם AI!!!! מה חושבים על הברקודים שלי? (ייתכן ועד הכנס אחליף לאחרים)

2 427

אחרי כמה ימים אינטנסיביים מאוד שלי עם ננו בננה: אמאלה ואבאלה! קבלו תמונה אמיתית מהספריה הלאומית של ה״בן איש חי״, רבנו יוסף חיים זכר צדיק לברכה. תוך שניה המודל הפך את התמונה לבצע ושמר על תווי הפנים, ובפרומפט נוסף הוא גם העיף את הקו השחור המציק שיש בתמונה המקורית. שני פרומפטים בלבד, ותמונות מקוריות מקבלות חיים. אין טירוף כזה בעולם. שנים שאני מנסה אחזור צבע באיכות גבוהה ולוקח את הבן איש חי כניסיון, וזו פעם ראשונה שנשמטה לי הלסת עד כדי כך! המודל זמין דרך aigoogle studio בחינם, פשוט אין דברים כאלה. רק חבל שאיכות התוצר מאוד ירודה יחסית. ואין upscale איכותי שלא מעוות את הפנים.

2 427

משהו מאוד טוב עובר על ComfyUI, התוכנה אחת הכי מסובכות ולא אינטואיטיביות שקיימות המאפשרות להשתמש במודלים פתוחים לג'נרט תמונות ו\או סרטונים ו\או אודיו עם AI! המשהו הטוב הזה הוא שבגרסא העדכנית יש תפריט שאפשר פשוט לבחור מה רוצים - ומקבלים מיד workflow מוכן! רק לאשר להוריד את המודלים הנחוצים - וזהו. בהינתן מחשב חזק מספיק, הכל הפך לנגיש בטירוף!