Reddit יוצאת לקרב נגד Perplexity
רדיט, פלטפורמת הפורומים הפופולרית בעולם, יוצאת לקרב משפטי נגד חברת הבינה המלאכותית Perplexity. על פי הדיווחים, רדיט טוענת כי החברה אספה באופן בלתי חוקי כמויות אדירות של נתונים מפוסטים ותגובות באתר, והשתמשה בהם לאימון המודלים שלה.
התביעה, שהוגשה ב־23 באוקטובר 2025, כוללת גם את Oxylabs UAB, AWMProxy ו־SerpApi, שנחשדות בשיתוף פעולה במסגרת תהליך שאיבת מידע תעשייתי (industrial-scale scraping).
“שאיבת מידע בקנה מידה תעשייתי”
על פי המסמכים שהובאו באתר Neowin, רדיט טוענת כי Perplexity עקפה במכוון את קובץ Robots.txt, הקובע אילו עמודים מותר או אסור לסורקים של אתרים לגשת אליהם.
רדיט אף מספרת כי הציבה מלכודת שבה נתפסו החברות הנתבעות והשוותה את התנהגותן לזו של האקרים מצפון קוריאה.
לטענת רדיט, Perplexity לקחה תכנים מתוך רדיט דרך תוצאות חיפוש בגוגל, שילבה אותם במודל ה־LLM שלה והציגה אותם כתוכן חדש לחלוטין.
לא מקרה ראשון
זו אינה הפעם הראשונה ש־Perplexity נתקלת בביקורת חריפה. באוגוסט האחרון חברת Cloudflare האשימה את Perplexity בפרקטיקות דומות. בתגובה החברה דחתה את הטענות וכינתה אותן שטויות שיווקיות.
עבור רדיט, שכבר שיתפה פעולה בעבר עם ענקיות כמו Google ו־OpenAI, המאבק הנוכחי הוא ניסיון להשיב שליטה על הנתונים שלה. סוגיה בוערת בעולם שבו מודלים של AI שואבים את הרשת ללא גבולות ברורים.
המשמעות גם לישראל
הסיפור הזה נוגע גם לזירה המקומית. בישראל צומחות עשרות חברות AI חדשות בתל אביב, חיפה וירושלים וחלקן משתמשות במידע ציבורי כדי לאמן את המודלים שלהן.
אם בית המשפט האמריקאי יקבע ש־Perplexity פעלה בניגוד לחוק, ייתכן שהדבר ישנה את כללי המשחק גם עבור מפתחות הבינה המלאכותית בישראל.
מה הלאה?
רדיט דורשת לא רק לעצור את הפרקטיקה אלא גם לקבל פיצוי על כל הרווחים הבלתי חוקיים שנצברו.
האם זה יספיק כדי לשים סוף לתופעת ה־scraping בעולם ה־AI? מוקדם לדעת, אבל דבר אחד בטוח: הקרב על הנתונים רק מתחיל.


