cookie

We use cookies to improve your browsing experience. By clicking «Accept all», you agree to the use of cookies.

avatar

בינה מלאכותית (AI) - חדשות ועדכונים

בינה מלאכותית, טכנולוגיה, חדשות, טרנדים, וכל השיט הזה... ליצירת קשר @Haim113 לקבוצה 🦾 https://t.me/+Q89psGMHpZEyN2Q8

Show more
Advertising posts
10 327
Subscribers
+1824 hours
+937 days
+32130 days
Posting time distributions

Data loading in progress...

Find out who reads your channel

This graph will show you who besides your subscribers reads your channel and learn about other sources of traffic.
Views Sources
Publication analysis
PostsViews
Shares
Views dynamics
01
אז מה מונח לפתחנו בתחום הבינה המלאכותית (היוצרת) עד סוף שנת 2024?? נתחיל מהדברים הידועים ונמשיך לספקולציות. מוזיקה - פריחה משמעותית שהתחלנו לראות בחודשים האחרונים. ממצב של סאונד צורמני ולא שמיש למשהו שאפשר להנות ממנו ואפילו לבטא דרכו את עצמנו באופן יצירתי ומרגש. שחקנים חדשים נכנסו לזירה ובעיקר הראו איכויות גבוהות שלעיתים קשה להבחין בין הקלטה אמיתית ל-AI. הדבר הבא זה שליטה טובה יותר ויכולת עריכה מתקדמת שתוכל לשרת טוב יותר מוזיקאים ויוצרים. סונו כבר הציגו שילוב של פרומפט קולי שיגיע בקרוב ומן הסתם נראה עוד יכולות שליטה בעתיד הקרוב. וידאו - על מסלול האצה ברור. תחום מורכב, יקר, דורש הרבה מאמצים כדי להשיג איכות מושלמת. באופק כרגע יש לנו את ״סורה״ כמובן שצפויה להגיע אלינו לפני סוף השנה. וגוגל הציגו מודל משלהם שנראה מאוד טוב בשם Veo. גם פה נשאלת שאלת השליטה ויכולות עריכה (שינוי עצמים, מחיקה וכו׳). אבל זה תחום מאוד מרכזי וברור שמושקעים בו משאבים ודי בטוח שהוא יתקדם... כשוידאו יפרוץ את סף האיכות הנדרשת - יהיה לזה השלכות על תחומים רבים. מודלי שפה - השנה נראתה האטה מסויימת במודלים הגדולים והכבדים. יש כמה מובילים והם די שוהים שם. לעומת זאת - ראינו שגשוג בקוד פתוח, מודלים קטנים, ותחילת הטמעה של מודלים במכשירים, מחשבים, פלאפונים, והנגשה לציבור (GPT-4o לכולם) וכו׳.. וזה ימשיך לעוד ועוד מכשירים ושימושים. יש מיצוי מסויים של מה שניתן לעשות עם LLM לכאורה, מחכים לפריצה נוספת שעלולה להגיע בקרוב. סיכוי טוב ש-GPT-5 שיגיע לקראת סוף שנה יביא בשורה מעניינת חדשה. סוכנים - התחום הכי מדשדש ומורכב, שיש ממנו גם תקוות גדולות שרובן עוד לא הוכיחו את עצמן. הסיבה היא שיש פה הרבה הנדסה שהיא לא AI. נסיון לפתח מודלי שפה לכיוון של הפעלת מערכות ופתרון בעיות בעולם האמיתי כמו גם שימושים שרלוונטיים לידע סגור, ארגוני או תחום ידע ספציפי שדורש דיוק. כל הדברים האלה קשים למימוש ולהערכתי פריצה תגיע מכיוון אחר. דווקא בתחום הקוד, שזה תחום שקורה כולו בתוך המחשב - יש התפתחות מעניינת של Devin אבל זה עדיין בשלבים מאוד ראשוניים גם כן. מודל-עולם - משהו שיאן לה-קון לא מפסיק לפטפט עליו. תשתית טכנולוגית שאולי תאפשר את הסוכנים או את הקפיצה המשמעותית הבאה של בינה מלאכותית והרלוונטיות שלה לחיים שלנו. יש כנראה הרבה מחקר בשלב הזה ולא ממש רואים משהו בשל בחוץ. רובוטיקה ונהיגה אוטונומית - הרבה הדגמות מעניינות של רובוטים מסוגים שונים. יש איזו אינפלציה של דמואים ואבות טיפוס שכנראה עדיין לא כלליים מספיק או לא מספיק יעילים להפוך לידידינו הטובים ביותר במסגרת משק הבית או המפעל. נהיגה אוטונומית - נושא שהושלם באחוזים גבוהים אבל הדיוק ב10% האחרונים דורש המון הנדסה וטכנולוגיה שעדיין לא כולה נפתרה. חומרת AI וחומרה לבישה - נעשו נסיונות ראשוניים. עדיין משאלת לב שלא ממש מתממשת. יש לזה השפעה גדולה כיון שהשימוש בטכנולוגיה הוא דו כיווני וזה לא רק מזין אותנו אלא גם אנו מזינים את הטכנולוגיה במידע חדש. כך שאם תהיה הטמעה נרחבת והמונית של חומרת AI על הבגד או הגוף - יש לזה השלכות. אבל זה עוד לא קורה. סוכן קולי - התפתחות מרשימה של OpenAI מבשרת עידן חדש, שמן הסתם יהיו לו עוד הרבה חיקויים ותחרות והתפתחויות. יש סיכוי שזה יהיה ChatGPT Moment אבל תוך מספר חודשים נבין עד כמה הגירסה הראשונה היתה פרימיטיבית... מה עם AGI? המושג הזה חמקמק מאוד. מבחן התוצאה הוא המבחן החשוב. אם תהיה השפעה דרמטית על החברה והכלכלה אז יש לזה חשיבות. אם יתגלו סיכונים משמעותיים שצריך לפעול לעומתם - זה חשוב. המהות של AGI פחות חשובה. באופן כללי התחושה היא שזה רחוק מעט יותר ממה שנדמה בהתחלה. כלומר - אימפקט גורף וקיצוני עדיין לא קורה וזה בנתיים שאלה של הטמעה, שלוקחת זמן. כשמדברים על רעיון ה-AGI זה יכול לדלג על צורך בהטמעה ולפרוץ בבת אחת בגלל יכולת מאוד כללית שנגישה באופן מאוד אינטואיטיבי שלא דורשת עקומת למידה. עניינים נוספים בכיוון של GenAI שכנראה יגיעו אחרי וידאו: יצירת עולמות תלת מימדיים בזמן אמת, יצירת עולמות משחק אינטראקטיביים (אתגרים של כח מיחשוב)
4743Loading...
02
סונו משחררים לנו הצצה שנייה לפיצ׳ר המדליק של יכולת ליצור שיר מסאונד שלנו! והפעם זה ברור: ניתן יהיה לתת לו לחן והוא יוסיף עליו שכבות עיבוד. מ-ט-ו-ר-ף!!! קשה לחכות יאללה
9089Loading...
03
Media files
1 2382Loading...
04
החלום הציוני הולך להתגשם בקרוב!! מודל שמייצר דיבור טבעי *בעברית!* הכולל אפשרות לאמן אותו על הקול ש-ל-כ-ם... זו הטכנולוגיה ש-OpenAI (הקומוניסטים, כן?) הולכים לשחרר לנו ככל הנראה לקראת סוף השנה. הנה הפרטים: לפני חודשיים OpenAI הציגו מודל שמסוגל לשכפל קול אנושי מתוך דגימה של 15 שניות בלבד. המודל לומד את הקול שלכם ומאותו רגע ניתן לייצר באמצעותו כל דיבור שרוצים דרך טקסט כתוב. ב-OpenAI הביעו חשש (מוצדק כנראה) שהמודל עלול לשמש לרעה, וכנראה עיקר החשש הוא מפני מערכת הבחירות הקרבה בארה״ב. ולכן המודל לא שוחרר לציבור אלא רק הציג יכולות. הם הציגו דוגמאות בכמה שפות, אך עברית לא נראתה שם... מה גורם לי להאמין שהם מסוגלים לעשות זאת גם בעברית? במאמר נכתב שהם כבר בשיתוף פעולה עם אתר HeyGen בתור מאמצים מוקדמים של הטכנולוגיה הזו, ובאמת באתר של HeyGen יש אווטארים שמדברים באופן חי וטבעי עם רגשות וכו׳ ומצליחים לדבר במגוון שפות ואפילו בעברית סבירה בהחלט! מה זה ׳סבירה בהחלט׳? בואו נאמר שאף פעם לא שמעתי דיבור טבעי כזה ממודל דיבור בעברית. עד כדי כך סבירה... כיום OpenAI מנגישים לנו את המודל ליצירת דיבור בדומה למה שיש באפליקציה שלהם שמדבר איתנו, דרך API אבל הוא כולל רק מספר קטן של קולות (ואחד מהם הורד מאחר שסקארלט ג׳והאנסון איימה בתביעה) ולרובם יש מבטא אמריקאי, כזה או אחר. אבל: היכולת לאמן את המודל על הקול שלנו, זו שטרם נפתחה לציבור - הוצגה כחלק משימוש לגיטימי בכלים של OpenAI בתערוכת הטכנולוגיה בצרפת VivaTech לפני מספר ימים. כחלק מהדמו שהציג את היכולות שעתידות להגיע לציבור לקראת סוף השנה (כנראה) הוצג שימוש במחולל הוידאו ״סורה״ יחד עם יצירת קריינות מהקול של המציג, שאימן את המודל בזמן אמת על - 15 שניות מהקול שלו. מכל זה אני מתרשם שלקראת סוף השנה נוכל לקבל מודל דיבור על הקול שלנו, שיישמע טבעי יותר מאי-פעם. גאולה. בסרטון: יצרתי בHeyGen על וידאו שלי, אבל מודל הדיבור הוא של אחת הדמויות שאומנו מראש בטכנולוגיה של OpenAI
1 2074Loading...
05
היי חבר׳ה. סרטון חדש, הפעם על שערורית הבטיחות בAI בOpenAI, על בטיחות בAI בכללי ועל GPT5. מוזמנים לפרגן בקצת טראפיק בטוויטר: https://x.com/tsoofbaror/status/1795709420158296077 צוף
1 5566Loading...
06
הסרטון לצפיה כאן
20Loading...
07
היי חבר׳ה. סרטון חדש, הפעם על שערורית הבטיחות בAI בOpenAI, על בטיחות בAI בכללי ועל GPT5. מוזמנים לפרגן בקצת טראפיק בטוויטר: https://x.com/tsoofbaror/status/1795709420158296077 צוף
30Loading...
08
הלן טונר, לשעבר חברה בבורד המנהלים של OpenAI (מוסד ללא כוונת רווח) מדברת במפורש על הסיבות שהביאו לפיטורים של סאם אלטמן (נסיון שנכשל) לפני כחצי שנה, וחוזרת על הטענות הרשמיות לאי-אמון בשל רצף של שקרים קטנים או מידע שאלטמן לא שיקף להם. טונר שייכת לתנועת האלטרואיזם האפקטיבי, ובעבר פירסמה מאמר ביקורתי על OpenAI המעלה חששות בטיחותיים, בעודה מכהנת בבורד. עולים רמזים רבים שהניהול של סאם אלטמן, שמשדר לכאורה שיתוף פעולה עולמי, דאגה לאנושות, שקיפות ורצון להיטיב ללא תמורה - הוא לא הסיפור האמיתי. כדאי להישאר חשדנים ולחזק מגמות נוספות שנותנות שיווי משקל לשליטה בלעדית של הארגון בנסיונו לנהל את התפתחות הטכנולוגיה והקצאת ההרשאות לשימוש בה. הפודקאסט המלא של הראיון עם הלן טונר (אודיו): https://link.chtbl.com/di73tYlK
1 5902Loading...
09
מחקר מגניב של אדובי מפענח: סביבה תלת מימדית, תנועת דמות ותנועת מצלמה - כל זה מצילום וידאו פשוט.. * זוכרים את Wonder Studio ?? הכלי הזה שמאפשר ליוצרי סרטים לצלם שחקן ואח״כ להחליף אותו בדמות CGI (כלומר אנימציה ממוחשבת)?? אז הטריק הוא לפענח את תנועת השחקן, למחוק אותו, לנתח במקביל גם את תנועת המצלמה, ואז להציב במקומו מודל תלת מימדי של איזושהי דמות שרוצים. כדי שזה יתאפשר צריך כמובן לנתח את תנועת השחקן ותנועת המצלמה, אז המחקר של אדובי עושה את אלה - אבל בנוסף גם בונה מחדש את הסצנה עצמה, דרך ניתוח הוידאו. שזה מאוד מעניין. מאפשר לאחר מכן לבצע כל מיני שיחזורים מניפולציות ייצובים ועוד... https://paulchhuang.github.io/synchmr/
1 7974Loading...
10
כמה נקודות על מודלי שפה מובילים: א. GPT-4o מפתיע בעברית הטוקינייזר הטוב ביותר לעברית עד היום. מסוגל לנסח שירים בחרוזים בעברית באופן הכי פחות גרוע ביחס למתחרים. מבריק בכמה תחומים, ועם זאת מרגיש לעיתים לא אפוי. ב. קלוד 3 עברית פצצה עומק רגשי ופילוסופי הבנה תרבותית שפה טבעית ועשירה ג. ג׳מיני מאורגן קורקטי מצויין בעברית יעיל נוטה לזהות הרבה ד. פרפלקסיטי הדרך היעילה ביותר לקבל מידע מתוקף ברשת עבודה באנגלית בלבד ה. קורל Command+R מצויין בעברית מצויין ב-RAG (יישומים הכוללים ידע חיצוני) לא הכי חד בקלמר ו. למה 3 LLaMA מודל פתוח באיכות כללית טובה ניתן להרצה על Groq במהירות מאוד גבוהה עובר שיפורים ואימוני משנה ע״י הקהילה
1 71514Loading...
11
מהפך בסקרים!!!! ג׳מיני של גוגל מתברר כמודל שדורג במקום שני (!) בזירת ההתגוששות בה המשתמשים בוחרים את התשובה המועדפת עליהם באופן עיוור. זה לא אומר שהוא המודל ׳הכי טוב׳ או מקום שני הכי טוב - זה אומר שאנשים העדיפו את התשובה שלו מתוך עשרות אלפי פרומפטים שונים מול מתחרים שונים... איך זה הגיוני? אולי יש פער בין השימוש הממוצע של מודלי שפה למקרי קצה מאתגרים. יכול להיות שבהרבה שימושים של אנשים שהם בוחרים פרומפטים סטנדרטיים - ג׳מיני עושה עבודה טובה ביחס למודלים אחרים, ורק במקרי קצה מאתגרים במיוחד - הוא נופל. אם זה כך - הציון הגבוה בזירה הוא דבר מסתבר שכן הוא מבוסס על פרומפטים שאנשים מכניסים בעצמם לפי בחירתם. ג׳מיני זוכה להערכה נמוכה בשל היותו מודל שמרגיש מזדחל מאחורי המובילים (ChatGPT / Claude) כאשר אנו מצפים מגוגל להרבה יותר.. אבל -- ג׳מיני הוא עדיין מודל מצויין, ויש לו כמה תכונות יחודיות שהופכות אותו למודל מוביל ובחירה מושלמת עבור שימושים מסויימים (למשל איפה שנצרך הוצאה של מידע מהמון קונטקסט, ופחות הסקת מסקנות מתוחכמות).
1 8263Loading...
12
יש במודלי דיפוזיה (כמו סטייבל דיפיוז׳ן) טכניקה שנקראת LoRA שזה אימון קליל לסגנון או דמות או כל רעיון ספציפי שרוצים שמחולל התמונה יכיר. אחרי שיצרנו את האימון הזה אפשר להלביש אותו על מודל אחר וזה יוצר מיזוג. וככה למשל אפשר לבנות סגנון קונספט מסויים, ולשלב אותו בכל תמונה שיוצרים, לא משנה באיזה מודל (הכוונה ל׳תת-מודל׳ של סטייבל דיפיוז׳ן) אז בדוגמה הזו למשל אני משתמש באתר לאונרדו באופצייה שנקראת Elements שזה תכל׳ס LoRA ובחרתי מודל שמשלב אפקט אש על גבי התמונה, ומה שיפה שיש לי שליטה על המינון. אז הדמות שלי זה לא באמת דומה לי כי ככה זה כשעובדים עם תמונת רפרנס אחת אבל עדיין אהבתי שזה הוסיף עליי להבות והכניס קצת חמימות לתמונה. חבל שעבר ל״ג בעומר דווקא זה היה מאוד מתאים 🔥🔥
2 2922Loading...
13
בואו נדבר רגע על ה-Voice Mode החדש של OpenAI בשבועות הקרובים הוא יגיע למשתמשי האלפא, והוא אמור להציג חוויה חדשה של בינה מלאכותית אינטואיטיבית הרבה יותר ו׳אנושית׳ יותר. ברמה הטכנית זה מורכב מכמה דברים: - זמן אמת (Real-time): כדי שזמן התגובה (latency) של המודל יהיה מינימלי (באיזור 300 מילישניות) יש צורך לעשות אופטימיזציה לכל השרשרת: הקול שאנו מפיקים נקלט ע״י האפליקציה ומועבר דרך טכנולוגיית WebRTC (כמו שיחת זום) בהזרמה מיידית לשרת. השרת מפרק את ההזרמה למקטעים ומקודד אותם לטוקנים, בדומה לרעיון של פירוק שפה לטוקנים. הטוקנים נכנסים למודל GPT-4o ומעובדים שם במהירות תוך כדי ההזרמה (streaming) - זו הסיבה שהמודל הזה צריך להיות מהיר, והוא אכן כזה. המודל פולט בחזרה טוקנים חדשים שמייצגים את הדיבור שניתן בתור תשובה, ואלו מפוענחים בחזרה לגלי קול שמוזרמים אלינו בחזרה דרך ה-WebRTC. הטכנולוגיה שהיתה עד היום דרשה לתמלל את הקול קודם כל לטקסט, לשלוח אותו למודל שפה, להמתין למענה ואז ליצור ממנו דיבור בחזרה דרך מודל נוסף. אמנם גם את זה אפשר לעשות באמצעות הזרמה מלאה, כך שתוך כדי שאנו מדברים כבר הופכים ההברות למילים (כמו שאפשר לראות בכפתור המקרופון במקלדת בסמרטפון שלנו), המילים יכולות להיות מעובדות ברגע שאנו מסיימים לדבר (צריך זיהוי של רגע ׳שקט׳) והדיבור שנוצר יכול להיות מוזרם אלינו בתור קול גם כן יחסית מהר. כל זה יכול לתת לנו latency די מהיר של כחצי שניה (500 מילי שניות) שזה במדד אנושי-סביר - בהחלט מספיק. לכאורה במושגים של latency בלבד - הטכנולוגיה החדשה לא בהכרח מביאה הישג ניכר... - ניואנסים קוליים: הטכנולוגיה החדשה מסוגלת ׳להבין׳ וליצור אינסוף ניואנסים קוליים שנמצאים בדיבור שלנו, ובדיבור של הסייען הקולי. באופן הזה הוא יכול להתייחס לרגשות שלנו, להבין צלילים נוספים שאינם דיבור (למשל את הנשימה שלנו), גם אם נשיר נצעק נצחק - היא תבין ותוכל לעבד את זה בהתאם למודל שאומן על דיאלוג קולי מגוון. מהצד השני היא תוכל ליצור ניואנסים קוליים מגוונים, לדבר בקצב משתנה, בטון מותאם, לעשות חיקויים, לשיר, לצחוק וכל זה... ביחס לטכנולוגיה שהיתה עד היום: גם פה ההתקדמות לא תמיד תורגש. כיון שגם היום מודלים שמייצרים קול מדיבור יודעים איך להתאים את הטון הנכון דרך ההקשר של הטקסט ולהישמע יחסית אנושיים (ע״ע eleven labs). אבל: מה שלא רמוז בטקסט, המודל לא יכול להתייחס אליו. למשל קצב דיבור זה משהו שמודל שמייצר קול מטקסט אין לו הרבה מנעד לגביו. הדבר הכי קרוב לזה ממה שראינו היה מודל bark (של חברת סונו, שהיום ממוקדים במודל המוזיקה באופן בלעדי) - כאשר הוא קיבל בפרומפט הנחיות לגבי טון דיבור וצלילים נוספים - הוא ידע ליצור אותם. אלו בגדול החידושים של הטכנולוגיה החדשה. כפי שאמרנו: לא כולם בהכרח ירגישו בשינוי ברמה ׳כמותית׳. הוא לא תמיד קפיצה, ובמובנים מסויימים היינו כבר קרובים לביצועים דומים גם אם הטכנולוגיה היתה שונה באופן מהותי. עם זאת - יתכן שנראה פה מעבר של ׳סף קריטי׳ כמו שקרה עם כלים אחרים שברגע שהם נראו אמיתיים יותר מהרגיל - זה פרץ.
3 8903Loading...
14
סונו הודיעו לפני כמה ימים שהשלימו גיוס של 125 מליון דולר, ושהולכים להיות הרבה שיפורים בשבועות והחודשים הקרובים... סונו אינה רואה את עצמה כפלטפורמה שנועדה ליצור חיקוי מדוייק של אמנות קיימת או להוכיח יכולות של עד כמה מוזיקה בבינה מלאכותית נשמעת אמיתית - סונו היא בראש ובראשונה פלטפורמה ליצירה, הנאה, וקהילה. https://suno.ai
3 4163Loading...
15
מודלים של בינה מלאכותית זקוקים לשלושה דברים: 1. אלגוריתמים 2. דאטה 3. כח עיבוד כל אלמנט כזה ניתן לשפר ובכך לחפש דרכים שונות לשפר את המודלים עוד ועוד. ניתן לראות ש-OpenAI שמים הרבה מאמצים בתחום ׳כח העיבוד׳. באופן מובהק ראינו את זה בהדגמה של Sora, כאשר גם במאמר הטכני שהם פירסמו הם הדגישו שההצלחה של Sora תלויה בהקצאות עיבוד, ולפי טענתם ניתן להגיע לתוצרים טובים עוד יותר - עם עוד הקצאות שכאלה. בנוסף סם אלטמן נוהג לדבר על ״חוק הגודל״ או Scaling Law שאומר שככל שמגדילים מודלים ומקצים להם עוד עיבוד - הם משתפרים ומפתחים יכולות חדשות. ההצהרה הזו שנויה במחלוקת ויש על זה ניתוחים שונים אבל הבהירות שסאם נוקט בנושא היא לא סתם. הגדלת עיבוד - בגדול זה עניין של כסף. כלומר זה מסלול שנוכל להמשיך לצעוד בו בביטחה בשנים הקרובות. אם רוצים לרתום משקיעים כדי לפתח טכנולוגיה - הדבר הנכון ביותר הוא להגיד להם: תתנו לנו כסף ונביא להתקדמות. ולכן ההצגה שהכל תלוי בעוד עיבוד - היא מובינת לאור זה. עם זאת, לפי מומחים אחרים, גם להגדלת העיבוד יש גבול, ויתכן שהוא קרוב. כלומר גם אם נגדיל ונגדיל עוד - כנראה שניפגש באיזשהם חסמים ולא נראה התפתחות משמעותית משלב מסויים בביצועים של המודלים. זו מסקנה מבאסת נורא כי היא תולה את ההתפתחות בגורמים אחרים שאין לנו שליטה או צפי לגביהם כמו שיש לנו בנושא העיבוד. ולכן המשקיעים יהיו חששניים יותר - מה שעלול להביא לדעיכה של כל המחקר והפיתוח בתחום. אבל מלבד זה - יתכן שלסאם אלטמן יש אינטרס נוסף להציג את הדברים באופן חד משמעי שכזה. העולם כיום מתחלק ל״עשירי GPU״ ו״עניי GPU״ מאחר שכח עיבוד של בינה מלאכותית (כרגע GPU אבל זה כינוי כללי) נחשב ״הכסף החדש״ המשאב שהעולם יתחרה עליו - אם כן חברת OpenAI כיום היא אחת העשירות בGPU, כח עיבוד, ולכן יש לה אינטרס מובהק להצעיד ההתפתחות בתחום על ציר העיבוד דווקא. הם רוצים לנצל את היתרון הייחודי שלהם ולעקוף את המתחרים. אבל זה לא רק תחרות הנושא זה שליטה ורגולציה. מאחר ש-OpenAI מנסים לשלוט בסוג המודלים שיפותחו, הטכנולוגיות שיונגשו לציבור, מבחני הבטיחות וההתאמות שהן יעברו - כל זה יכול לעבוד רק אם הפיתוחים הללו הם בלעדיים ל-OpenAI. אם למשל הקוד הפתוח יפתח מודל כמו סורה אחד לאחד, רק בלי כל הצנזורה ש-OpenAI הכניסו: אז המאמצים של הבטיחות הם חסרי טעם. אנשים יוכלו תמיד למצוא גירסה לא מצנוזרת אצל המתחרים. וזה לא רק במודל כמו Sora אלא בכל סוג של מודל. גם מודלי שפה למשל. ואם כך - כדי לשלוט צריך למצוא נקודת יתרון ייחודית שהמתחרים לא יכולים להשיג. כדי להשיג פצצת אטום למשל יש לבצע תהליך כימי שרק מעטים מצליחים להשלים אותו. אבל אם כל אחד היה יכול לייצר פצצת אטום היינו בבעיה. אז אם המודלים של הדור הבא של הבינה המלאכותית יתבססו על המון כח עיבוד דווקא - אז זה יהיה שם המשחק, ובמשחק הזה OpenAI יכולים לנצח ולשלוט בצורת ההתפתחות. אבל זה לא אומר שאי אפשר לייצר מודלים טובים, ואפילו טובים מאוד עם פחות כח עיבוד. קהילת הקוד הפתוח יכולה למשל לייצר אוספים של מידע באופן שחברות עם קוד סגור לא תמיד יכולות. מאמצים שיתופיים נרחבים יכולים להביא לפירות, דרך גישה לידע אקסלוסיבי ושימוש בכח ההמונים באופן שלפעמים חברה גדולה לא מצליחה לעשות. מודלים שנשענים על דאטה שלוקט בצורה ייחודית, שלא זמין ככה סתם, שעבר סידור וארגון - יכולים להפקיע את השלטון המונופולי של OpenAI על בינה מלאכותית מתקדמת. במידה ואכן יצליחו להשיג את זה. אם כן - ראינו שהסיפור שבינה מלאכותית בדור הבא תתבסס על המון עיבוד הוא לא חד משמעי. זה מה שסאם אלטמן מספר לנו ויש לו אינטרס ברור בצורת ההצגה הזו. אך אם הקוד הפתוח ישכיל לא להיכנס לאותו מירוץ בדיוק אלא לחפש דרכים יצירתיות חדשות לפתח יכולות מתקדמות - יתכן שהוא יצליח לנצח חברות חזקות אפילו כמו OpenAI.
3 34811Loading...
16
שלום לכולם, כאן אביץ! הצטרפתי לצוות הכותבים פה בקבוצה. ואני אשמח לשתף פה רעיונות או חידושים או טיפים מפעם לפעם. זהו,תהנו 🙂 והנה פוסט ראשון:
2 4390Loading...
17
היי חברים, שלום לכולם! קיבלתי גישת ניהול לערוץ ולכבוד זה קבלו טיפ קטן לשיפור התוצאות שלכם בצ׳אט ג׳יפיטי: טיפ לשיפור ביצועי מודלי ChatGPT ״תחזור על השאלה לפני שאתה נותן תשובה״ בניסוי שנערך על מספר מודלים שונים, נמצא כי בקשה מהמודל לחזור על השאלה לפני מענה משפרת משמעותית את הדיוק והאמינות של התשובות. בתוצאות הבדיקה, מודלים כמו GPT-4 Turbo, GPT-4o, Claude 3 Opus ו-WizardLM-2 8x22B נכשלו במתן תשובות מדויקות ללא חזרה על השאלה. אולם, כאשר התבקשו לחזור על השאלה לפני מענה, כל המודלים הללו עברו את הבדיקה בהצלחה. המודל היחיד שלא הצליח לשפר את ביצועיו עם חזרה על השאלה היה Llama 3 8B Instruct. המחקר מצביע על כך שחזרה על השאלה מסייעת למודל להתרכז ולהבין טוב יותר את המשימה, בדומה לתהליך שעובר אדם בזמן חשיבה. תהנו, ותודה לחיים על הבמה 🙏
2 65915Loading...
18
חדשות צהובות שמנבאים שחורות 🐝 ארז רובינשטיין כותב 👇 הידיעה הבאה אולי מרגישה מעט רכילותית, אבל לדעתי היא נותנת הצצה חשובה לדרך המחשבה של המנכ״ל של החברה המשפיעה והחזקה ביותר בעולם ה-Ai כיום. לפני כשבוע חברת OpenAi השיקה את הגירסה החדשה של מודל ה-ChatGPT4o ואיתו הגיעה המחשה מרשימה של הצ׳ט הקולי שיכול להבין מה הוא רואה בווידאו בלייב וגם יכול לדבר בצורה מאד אנושית. לפני ההשקה מנהלי החברה זרעו רמזים שההשקה קשורה לסרט Her. בסרט הזה בחור מתאהב בדמות בינה מלאכותית שהקול שלה משוחק ע״י סקרלט ג׳והנסן. חזרה להשקה מלפני שבוע. כאשר הם הדגימו את המוצר, כולם היו בטוחים שהקול של Sky בו הם השתמשו הוא הקול של סקרלט ג׳והנסן. גם בני המשפחה שלה. והאמת לא הייתה יכולה להיות יותר רחוקה וקרובה מכך. הנה השתלשלות העניינים: 1. לפני מספר חודשים פנה סאם אלטמן (המנכ״ל ומייסד של OpenAi) לסקרלט כדי לשכנע אותה לתת את הקול שלה (תמורת תשלום נאה כנראה) לאפליקציה החדשה, וזאת כדי לגרום לאנשים תחושת נוחות בשיחה עם הבינה. היא שקלה בכובד ראש ולבסוף סירבה. 2. יומיים לפני ההשקה הם שוב פנו אליה כדי שתשקול מחדש. הם לא המתינו לתשובתה והשיקו, עם קול שכאמור נשמע ממש כמו שלה. 3. סקרלט מאד הופתעה כשכולם סיפרו לה שהיא הקול החדש של הצ׳ט. היא מיהרה להוציא לחברה מכתב מעורכי הדין שלה בבקשה לקבל הסבר איך השיגו את הקול המדובר. 4. חברת OpenAi הסירו את הקול המדובר מהצ׳ט 5. סאם אלטמן הוציא פוסט בו הוא מסביר שהקול הוא של שחקנית אשר פנו אליה הרבה לפני שהוא פנה לסקרלט. אך כדי להתחשב ברגשותיה של הגב׳ ג׳והנסן, הם הסירו את הקול לפנים משורת הדין. 6. חרטא! זה מה שאני חושב על הפוסט שלו. אני בטוח ב-1000% שעורכי הדין המופתעים לא פחות של סאם אלטמן אמרו לו שכדאי לו להסיר את הקול כבר אתמול, כי ברגע שהוא פנה אליה והיא סירבה, גם אם הקול המדובר לא שלה אלא של שחקנית/חקיינית אחרת, היא יכולה לתבוע את הת#ת שלו ורק היח״צ השלילי לבדו יעשה נזק עצום לחברה. אז למה הסיפור הזה מטריד אותי? זה המשך ישיר להתנהלות הבעייתית של אלטמן בהמשך לפוסט הקודם, בו סיפרתי לכם על העזיבה של אחראי הבטיחות בחברה שהוציא את הכביסה המלוכלכת בטוויטר. המנהל שהתפטר סיפר שלחברת OpenAi יותר חשוב להשיק מוצרים נוצצים מאשר לדאוג לכלי בטוח שנבדק כמו שצריך. נראה שלסאם אלטמן יש שגעון גדלות לא קטן ומבחינתו מותר לו לעשות מה שבא לו, גם בדריסת עקרונות או זכויות. וזה מטריד, כי כאמור זה האיש שבגדול אמור לקבוע כיצד תיראה הבינה המלאכותית בעשור הקרוב. מהצד השני של הכביש, נראה שאחד האנשים הכי מאושרים כיום זה מארק צוקרברג, עד לאחרונה המנכ״ל (של פייסבוק/מטא) המושמץ ביותר על כדור הארץ, שהעלו על הגריל בוועדה בסנאט והאשימו אותו בכל החולות הרעות של המדיה החברתית (ובצדק). מאז שהבליח סאם אלטמן, התפקיד של הנבל הועבר אחר כבוד אליו (ובצדק). @AI_tg_il
2 9135Loading...
19
Media files
2 8591Loading...
20
שלום לכל אוהבי הAI! קיבלתי את המפתח לערוץ כדי להזמין אתכם לעוד ערוץ ״משלים״. קוראים לי צוף, יכול להיות שראיתם כאן את הסרטון שלי מדבר על ההכרזות של OpenAI. אני דאטה סאיינטיסט שמאד אוהב להנגיש את ה״בפנוכו״ של הAI לאמיצים שמעניין אותם להכנס קצת לעומק. התחלתי בטוויטר ולאחרונה עברתי יותר ויותר לטלגרם. הנה קישור ערוץ: https://t.me/AITsoof והנה משהו בין סרטון לפודקאסט על כל ההכרזות האחרונות של גוגל: https://x.com/tsoofbaror/status/1791495575508066807 תודה ענקית לחיים על הבמה, צופה עוד שיתופי פעולה בין הערוצים!
4 5891Loading...
21
Media files
5 27754Loading...
22
אחרי שנעלם לתקופה ארוכה - איליה סוצקבר, מייסד שותף ומדען ראשי ב-OpenAI, עוזב רשמית את החברה. @AI_tg_il
5 0024Loading...
23
הצצה נדירה לקהל בזמן האירוע של גוגל. @AI_tg_il
4 5154Loading...
24
המודל החדש לתמונות נקרא Imagen 3. הוא מבין טוב יותר הנחיות ארוכות ויכול ליצור בתמונה גם טקסט. @AI_tg_il
4 9532Loading...
25
מודל הוידיאו של גוגל נקרא Veo. הוא יכול ליצור וידאו באיכות גבוהה 1080p באורך עד 60 שניות. רשימת ההמתנה @AI_tg_il
3 9684Loading...
26
סיכום ההכרזה הערב של גוגל: מודל יצירת תמונות חדש - שלא זמין לאף אחד מודל וידאו חדש - שלא זמין לאף אחד מודל מוזיקה חדש - שלא זמין לאף אחד משאבי ענן חדשים יותר - שלא זמינים לאף אחד יכולת של ג׳ימיני לחפש באמצעות סימונים על תמונות - זמין לאנדרואיד בלבד יכולת של ג׳ימיני לנתח וידאו בזמן אמת בדומה למה שהוצג אתמול ע״י OpenAI - לא זמין לאף אחד יכולת של ג׳ימיני לראות את העולם עם משקפיים של גוגל ולהשיב - מוצר שלא קיים ותוכנה שלא זמינה לאף אחד מה כן היה? אחלה דמואים מוכנים מראש, קישור להרשמה לבקשת גישה מוקדמת לכלים, שלא זמינים לאף אחד וספק מתי בכלל יהיו. לדברי גוגל רק מעטים מאוד יקבלו גישה בשבועות הקרובים. אחלה אירוע השקה ואחלה הכרזות!!!!
3 57810Loading...
27
להזכירכם, הערב מתקיים ה Google I/O, הכנס השנתי של גוגל. אתמול, גוגל פרסמה את הסרטון הזה בטוויטר, אפליקציית Gemini מולטי-מודאלית לאנדרואיד שעושה לכאורה מה ש-GPT-4o עושה. אבל זה גוגל, 🙈 אז אני לא ממהר לבנות על זה. מה דעתכם? @AI_tg_il
3 0333Loading...
28
שימו לב שלחלק מהמשתמשים (גם אלו שלא משלמים) כבר זמין המודל החדש גם בגרסת האינטרנט וגם באפליקציה, אבל הדבר האמיתי שהוא עוזרת קולית עם רגשות וטונציה עדיין לא זמינה, @AI_tg_il
2 7800Loading...
29
צוף בר אור מדבר בטוויטר על ההכרזה הערב והמשמעויות שלה, אם זה מעניין אתכם - לכו לצפות, מומלץ. https://twitter.com/tsoofbaror/status/1790111528055718327 @AI_tg_il
2 9582Loading...
30
לקבוצת הדיונים 👇 ‏https://t.me/+Q89psGMHpZEyN2Q8 נא לשמור על שיח ענייני ומכבד
2 8550Loading...
31
Media files
2 97121Loading...
32
בעוד כשעה יתחיל השידור של חברת OpenAI, לינק לצפייה @AI_tg_il
2 8854Loading...
33
בלומברג מדווחת שאפל סגרה על הסכם עם OpenAI לשימוש בטכנולוגיה של החברה במכשירי אייפון, @AI_tg_il
3 0015Loading...
34
סם אלטמן מצייץ בטוויטר לגבי יום שני שלא מדובר במנוע חיפוש או ב GPT5 אז מה כן? השערות שלכם בתגובות 👇 @AI_tg_il
3 1690Loading...
אז מה מונח לפתחנו בתחום הבינה המלאכותית (היוצרת) עד סוף שנת 2024?? נתחיל מהדברים הידועים ונמשיך לספקולציות. מוזיקה - פריחה משמעותית שהתחלנו לראות בחודשים האחרונים. ממצב של סאונד צורמני ולא שמיש למשהו שאפשר להנות ממנו ואפילו לבטא דרכו את עצמנו באופן יצירתי ומרגש. שחקנים חדשים נכנסו לזירה ובעיקר הראו איכויות גבוהות שלעיתים קשה להבחין בין הקלטה אמיתית ל-AI. הדבר הבא זה שליטה טובה יותר ויכולת עריכה מתקדמת שתוכל לשרת טוב יותר מוזיקאים ויוצרים. סונו כבר הציגו שילוב של פרומפט קולי שיגיע בקרוב ומן הסתם נראה עוד יכולות שליטה בעתיד הקרוב. וידאו - על מסלול האצה ברור. תחום מורכב, יקר, דורש הרבה מאמצים כדי להשיג איכות מושלמת. באופק כרגע יש לנו את ״סורה״ כמובן שצפויה להגיע אלינו לפני סוף השנה. וגוגל הציגו מודל משלהם שנראה מאוד טוב בשם Veo. גם פה נשאלת שאלת השליטה ויכולות עריכה (שינוי עצמים, מחיקה וכו׳). אבל זה תחום מאוד מרכזי וברור שמושקעים בו משאבים ודי בטוח שהוא יתקדם... כשוידאו יפרוץ את סף האיכות הנדרשת - יהיה לזה השלכות על תחומים רבים. מודלי שפה - השנה נראתה האטה מסויימת במודלים הגדולים והכבדים. יש כמה מובילים והם די שוהים שם. לעומת זאת - ראינו שגשוג בקוד פתוח, מודלים קטנים, ותחילת הטמעה של מודלים במכשירים, מחשבים, פלאפונים, והנגשה לציבור (GPT-4o לכולם) וכו׳.. וזה ימשיך לעוד ועוד מכשירים ושימושים. יש מיצוי מסויים של מה שניתן לעשות עם LLM לכאורה, מחכים לפריצה נוספת שעלולה להגיע בקרוב. סיכוי טוב ש-GPT-5 שיגיע לקראת סוף שנה יביא בשורה מעניינת חדשה. סוכנים - התחום הכי מדשדש ומורכב, שיש ממנו גם תקוות גדולות שרובן עוד לא הוכיחו את עצמן. הסיבה היא שיש פה הרבה הנדסה שהיא לא AI. נסיון לפתח מודלי שפה לכיוון של הפעלת מערכות ופתרון בעיות בעולם האמיתי כמו גם שימושים שרלוונטיים לידע סגור, ארגוני או תחום ידע ספציפי שדורש דיוק. כל הדברים האלה קשים למימוש ולהערכתי פריצה תגיע מכיוון אחר. דווקא בתחום הקוד, שזה תחום שקורה כולו בתוך המחשב - יש התפתחות מעניינת של Devin אבל זה עדיין בשלבים מאוד ראשוניים גם כן. מודל-עולם - משהו שיאן לה-קון לא מפסיק לפטפט עליו. תשתית טכנולוגית שאולי תאפשר את הסוכנים או את הקפיצה המשמעותית הבאה של בינה מלאכותית והרלוונטיות שלה לחיים שלנו. יש כנראה הרבה מחקר בשלב הזה ולא ממש רואים משהו בשל בחוץ. רובוטיקה ונהיגה אוטונומית - הרבה הדגמות מעניינות של רובוטים מסוגים שונים. יש איזו אינפלציה של דמואים ואבות טיפוס שכנראה עדיין לא כלליים מספיק או לא מספיק יעילים להפוך לידידינו הטובים ביותר במסגרת משק הבית או המפעל. נהיגה אוטונומית - נושא שהושלם באחוזים גבוהים אבל הדיוק ב10% האחרונים דורש המון הנדסה וטכנולוגיה שעדיין לא כולה נפתרה. חומרת AI וחומרה לבישה - נעשו נסיונות ראשוניים. עדיין משאלת לב שלא ממש מתממשת. יש לזה השפעה גדולה כיון שהשימוש בטכנולוגיה הוא דו כיווני וזה לא רק מזין אותנו אלא גם אנו מזינים את הטכנולוגיה במידע חדש. כך שאם תהיה הטמעה נרחבת והמונית של חומרת AI על הבגד או הגוף - יש לזה השלכות. אבל זה עוד לא קורה. סוכן קולי - התפתחות מרשימה של OpenAI מבשרת עידן חדש, שמן הסתם יהיו לו עוד הרבה חיקויים ותחרות והתפתחויות. יש סיכוי שזה יהיה ChatGPT Moment אבל תוך מספר חודשים נבין עד כמה הגירסה הראשונה היתה פרימיטיבית... מה עם AGI? המושג הזה חמקמק מאוד. מבחן התוצאה הוא המבחן החשוב. אם תהיה השפעה דרמטית על החברה והכלכלה אז יש לזה חשיבות. אם יתגלו סיכונים משמעותיים שצריך לפעול לעומתם - זה חשוב. המהות של AGI פחות חשובה. באופן כללי התחושה היא שזה רחוק מעט יותר ממה שנדמה בהתחלה. כלומר - אימפקט גורף וקיצוני עדיין לא קורה וזה בנתיים שאלה של הטמעה, שלוקחת זמן. כשמדברים על רעיון ה-AGI זה יכול לדלג על צורך בהטמעה ולפרוץ בבת אחת בגלל יכולת מאוד כללית שנגישה באופן מאוד אינטואיטיבי שלא דורשת עקומת למידה. עניינים נוספים בכיוון של GenAI שכנראה יגיעו אחרי וידאו: יצירת עולמות תלת מימדיים בזמן אמת, יצירת עולמות משחק אינטראקטיביים (אתגרים של כח מיחשוב)
Show all...
👍 16
00:36
Video unavailableShow in Telegram
סונו משחררים לנו הצצה שנייה לפיצ׳ר המדליק של יכולת ליצור שיר מסאונד שלנו! והפעם זה ברור: ניתן יהיה לתת לו לחן והוא יוסיף עליו שכבות עיבוד. מ-ט-ו-ר-ף!!! קשה לחכות יאללה
Show all...
🔥 33 5🤯 5👍 3🤩 1
00:54
Video unavailableShow in Telegram
10🤩 5👍 4
החלום הציוני הולך להתגשם בקרוב!! מודל שמייצר דיבור טבעי *בעברית!* הכולל אפשרות לאמן אותו על הקול ש-ל-כ-ם... זו הטכנולוגיה ש-OpenAI (הקומוניסטים, כן?) הולכים לשחרר לנו ככל הנראה לקראת סוף השנה. הנה הפרטים: לפני חודשיים OpenAI הציגו מודל שמסוגל לשכפל קול אנושי מתוך דגימה של 15 שניות בלבד. המודל לומד את הקול שלכם ומאותו רגע ניתן לייצר באמצעותו כל דיבור שרוצים דרך טקסט כתוב. ב-OpenAI הביעו חשש (מוצדק כנראה) שהמודל עלול לשמש לרעה, וכנראה עיקר החשש הוא מפני מערכת הבחירות הקרבה בארה״ב. ולכן המודל לא שוחרר לציבור אלא רק הציג יכולות. הם הציגו דוגמאות בכמה שפות, אך עברית לא נראתה שם... מה גורם לי להאמין שהם מסוגלים לעשות זאת גם בעברית? במאמר נכתב שהם כבר בשיתוף פעולה עם אתר HeyGen בתור מאמצים מוקדמים של הטכנולוגיה הזו, ובאמת באתר של HeyGen יש אווטארים שמדברים באופן חי וטבעי עם רגשות וכו׳ ומצליחים לדבר במגוון שפות ואפילו בעברית סבירה בהחלט! מה זה ׳סבירה בהחלט׳? בואו נאמר שאף פעם לא שמעתי דיבור טבעי כזה ממודל דיבור בעברית. עד כדי כך סבירה... כיום OpenAI מנגישים לנו את המודל ליצירת דיבור בדומה למה שיש באפליקציה שלהם שמדבר איתנו, דרך API אבל הוא כולל רק מספר קטן של קולות (ואחד מהם הורד מאחר שסקארלט ג׳והאנסון איימה בתביעה) ולרובם יש מבטא אמריקאי, כזה או אחר. אבל: היכולת לאמן את המודל על הקול שלנו, זו שטרם נפתחה לציבור - הוצגה כחלק משימוש לגיטימי בכלים של OpenAI בתערוכת הטכנולוגיה בצרפת VivaTech לפני מספר ימים. כחלק מהדמו שהציג את היכולות שעתידות להגיע לציבור לקראת סוף השנה (כנראה) הוצג שימוש במחולל הוידאו ״סורה״ יחד עם יצירת קריינות מהקול של המציג, שאימן את המודל בזמן אמת על - 15 שניות מהקול שלו. מכל זה אני מתרשם שלקראת סוף השנה נוכל לקבל מודל דיבור על הקול שלנו, שיישמע טבעי יותר מאי-פעם. גאולה. בסרטון: יצרתי בHeyGen על וידאו שלי, אבל מודל הדיבור הוא של אחת הדמויות שאומנו מראש בטכנולוגיה של OpenAI
Show all...
👍 12🤯 5
35:19
Video unavailableShow in Telegram
היי חבר׳ה. סרטון חדש, הפעם על שערורית הבטיחות בAI בOpenAI, על בטיחות בAI בכללי ועל GPT5. מוזמנים לפרגן בקצת טראפיק בטוויטר: https://x.com/tsoofbaror/status/1795709420158296077 צוף
Show all...
12👍 4 3
Repost from AITsoof
35:19
Video unavailableShow in Telegram
הסרטון לצפיה כאן
Show all...
היי חבר׳ה. סרטון חדש, הפעם על שערורית הבטיחות בAI בOpenAI, על בטיחות בAI בכללי ועל GPT5. מוזמנים לפרגן בקצת טראפיק בטוויטר: https://x.com/tsoofbaror/status/1795709420158296077 צוף
Show all...
Tsoof Bar Or (@tsoofbaror) on X

על שערורית הבטיחות בOpenAI, בטיחות בAI באופן כללי וGPT5. * מחילה שוב על איכות התפוח אדמה, מגבלות ההעלאה עם אינטרנט מילואים. אין באמת מה לראות, מוזמנים לקחת כפודקאסט לאיזו נסיעה. טראפיק, תגובות ושיתופים יתקבלו בברכה 🫡 (גם אם אתם שומרים לצפיה מאוחרת, ״תודה״ בתגובה יתן בוסט לפוסט).

00:52
Video unavailableShow in Telegram
הלן טונר, לשעבר חברה בבורד המנהלים של OpenAI (מוסד ללא כוונת רווח) מדברת במפורש על הסיבות שהביאו לפיטורים של סאם אלטמן (נסיון שנכשל) לפני כחצי שנה, וחוזרת על הטענות הרשמיות לאי-אמון בשל רצף של שקרים קטנים או מידע שאלטמן לא שיקף להם. טונר שייכת לתנועת האלטרואיזם האפקטיבי, ובעבר פירסמה מאמר ביקורתי על OpenAI המעלה חששות בטיחותיים, בעודה מכהנת בבורד. עולים רמזים רבים שהניהול של סאם אלטמן, שמשדר לכאורה שיתוף פעולה עולמי, דאגה לאנושות, שקיפות ורצון להיטיב ללא תמורה - הוא לא הסיפור האמיתי. כדאי להישאר חשדנים ולחזק מגמות נוספות שנותנות שיווי משקל לשליטה בלעדית של הארגון בנסיונו לנהל את התפתחות הטכנולוגיה והקצאת ההרשאות לשימוש בה. הפודקאסט המלא של הראיון עם הלן טונר (אודיו): https://link.chtbl.com/di73tYlK
Show all...
👍 10😢 5🤯 1
00:27
Video unavailableShow in Telegram
מחקר מגניב של אדובי מפענח: סביבה תלת מימדית, תנועת דמות ותנועת מצלמה - כל זה מצילום וידאו פשוט.. * זוכרים את Wonder Studio ?? הכלי הזה שמאפשר ליוצרי סרטים לצלם שחקן ואח״כ להחליף אותו בדמות CGI (כלומר אנימציה ממוחשבת)?? אז הטריק הוא לפענח את תנועת השחקן, למחוק אותו, לנתח במקביל גם את תנועת המצלמה, ואז להציב במקומו מודל תלת מימדי של איזושהי דמות שרוצים. כדי שזה יתאפשר צריך כמובן לנתח את תנועת השחקן ותנועת המצלמה, אז המחקר של אדובי עושה את אלה - אבל בנוסף גם בונה מחדש את הסצנה עצמה, דרך ניתוח הוידאו. שזה מאוד מעניין. מאפשר לאחר מכן לבצע כל מיני שיחזורים מניפולציות ייצובים ועוד... https://paulchhuang.github.io/synchmr/
Show all...
🔥 14👍 6👌 3 1🆒 1
כמה נקודות על מודלי שפה מובילים: א. GPT-4o מפתיע בעברית הטוקינייזר הטוב ביותר לעברית עד היום. מסוגל לנסח שירים בחרוזים בעברית באופן הכי פחות גרוע ביחס למתחרים. מבריק בכמה תחומים, ועם זאת מרגיש לעיתים לא אפוי. ב. קלוד 3 עברית פצצה עומק רגשי ופילוסופי הבנה תרבותית שפה טבעית ועשירה ג. ג׳מיני מאורגן קורקטי מצויין בעברית יעיל נוטה לזהות הרבה ד. פרפלקסיטי הדרך היעילה ביותר לקבל מידע מתוקף ברשת עבודה באנגלית בלבד ה. קורל Command+R מצויין בעברית מצויין ב-RAG (יישומים הכוללים ידע חיצוני) לא הכי חד בקלמר ו. למה 3 LLaMA מודל פתוח באיכות כללית טובה ניתן להרצה על Groq במהירות מאוד גבוהה עובר שיפורים ואימוני משנה ע״י הקהילה
Show all...
👍 22 5