10 מחוללי התמונות המובילים ב-2024: מה חדש בעולם ה-AI?

10 מחוללי התמונות המובילים ב-2024: מה חדש בעולם ה-AI?

3 min read

מודלי הבינה המלאכותית הגנרטיבית ממשיכים להתפתח בקצב מסחרר, וגם מחוללי התמונות אינם יוצאי דופן. במסגרת ה- Text to Image Arena , חברת Artificial Analysis, המתמחה בניתוח מודלי בינה מלאכותית, עוקבת מקרוב אחר ההתפתחויות הטכנולוגיות בתחום הזה. כמידי חודש, גם בדירוג של אוקטובר 2024 ישנם שינויים מסקרנים ולא מעט מסתורין. בואו נעשה סדר!

רד פאנדה (Red Panda) : המודל המסתורי שעומד בראש הדירוג

בחודש שעבר חוותה Text to Image Arena טלטלה עם כניסתו של מודל חדש בשם Blueberry, שבשתי גרסאותיו (blueberry\_0 ו-blueberry\_1) הצליח להגיע לצמרת הדירוג. מה שהפתיע במיוחד הוא שאף אחד לא הצליח לזהות באופן חד משמעי מהו המודל הזה. באוקטובר 2024, המסתורין רק הולך וגובר: Blueberry נעלם לחלוטין מהדירוג, ומודל חדש ומסתורי תפס את מקומו בראש הטבלה – red\_panda, עם 72% ניצחונות.

גם הפעם אין מידע מהימן לגבי זהות המפתחים של red\_panda, מה שלא מונע מהמומחים להעלות השערות. בעוד שחלק מהמשקיפים ראו ב-Blueberry שם קוד עבור המודל הבא של Black Forest Labs (ככל הנראה FLUX.2), שמועות אחרות מקשרות את red\_panda לגרסה עתידית של Midjourney, ייתכן V7, וישנם גם כאלה שחושבים שמדובר בכינוי לדגם מתקדם של DALL-E 4. חברת Artificial Analysis מוסיפה למסתורין, וכמו בחודש שעבר, משחקת את המשחק. בציוץ בטוויטר, החברה מטפחת את הסקרנות לגבי טיבו של המודל החדש, מה שמעלה את האפשרות כי היא משתפת פעולה עם החברות הגדולות כדי להציע להן פלטפורמת בדיקה אנונימית לדגמים חדשים.

> What is red\_panda? 👀

>

> See red\_panda in the Artificial Analysis Image Arena. Link in the tweet below ⬇️ pic.twitter.com/0VGFYleZI0

>

> — Artificial Analysis (@ArtificialAnlys) October 27, 2024

עשרת מחוללי התמונות המובילים באוקטובר 2024

שני מודלים של Flux, FLUX1.1 ו-FLUX.1, משלימים את הפודיום. המודלים מבית Black Forest Labs, אשר עדיין לא פועלים על פלטפורמה עצמאית, מתחילים לבסס את מעמדם כמרכיב חשוב בתחום מחוללי התמונות באמצעות בינה מלאכותית. החברה הגרמנית היא אחת משלושת הנציגים האירופיים בדירוג, הכולל גם שתי חברות בריטיות, Stability.ai ו-Recraft.ai, מה שמוכיח שארצות הברית עדיין לא שולטת באופן מוחלט בשוק הזה. Midjourney, שהובילה את הדירוג בתחילת הקיץ, מתקשה לשמור על תנופה ונמצאת כעת במקום החמישי עם המודל Midjourney V6.1. אלא אם כן, כמובן, היא זו שעומדת מאחורי המודל המסתורי red\_panda…

10 מחוללי התמונות המובילים באוקטובר 2024:

- red\_panda : ציון Elo של 1,181

- FLUX1.1 \[pro\] : ציון Elo של 1,142

- FLUX.1 \[pro\] : ציון Elo של 1,119

- Ideogram v2 : ציון Elo של 1,096

- Midjourney v6.1 : ציון Elo של 1,089

- FLUX.1 \[dev\] : ציון Elo של 1,086

- Ideogram v2 Turbo : ציון Elo של 1,086

- Midjourney v6 : ציון Elo של 1,075

- Stable Diffusion 3.5 Large : ציון Elo של 1,066

- Stable Diffusion 3.5 Large Turbo : ציון Elo של 1,064

צפייה בדירוג המלא

קריטריוני הדירוג של Text to Image Arena

Text to Image Arena מאמצת את קונספט הדו-קרב שהוצג ב-Chatbot Arena, כאשר היא מציבה שני מודלים ליצירת תמונות זה מול זה, מבלי לחשוף את זהותם. המשתמשים מתבקשים להכריע איזה מהשניים מספק את התגובה הטובה ביותר לאותו פרומפט. ביצועי כל מודל נמדדים באמצעות ציון Elo, שיטה פופולרית מעולם השחמט המתעדכנת לאחר כל עימות: אם מודל A מפסיד למודל B עם ציון נמוך יותר, A מאבד נקודות ו-B מרוויח, ולהפך. לפי חברת Artificial Analysis, הדירוג מתעדכן בכל שעה.

- דירוג בזמן אמת: Text to Image Arena משתמשת בדו-קרבים אנונימיים להערכת מחוללי התמונות המובילים באוקטובר 2024.

- שיטת דירוג Elo: כל מודל זוכה או מאבד נקודות בהתאם לביצועיו מול מודלים אחרים, עם עדכונים שוטפים.

- מנהיג מסתורי: המודל red\_panda, שמוביל את הדירוג, מעורר עניין רב ללא מידע רשמי על יוצרו.