Reddit-მა სარჩელი შეიტანა Perplexity-ის, ასევე მონაცემთა ამოღების სამი ფირმის – Oxylabs UAB, AWMProxy და SerpApi-ის წინააღმდეგ, იმის გამო, რასაც კომპანია უწოდებს “ინდუსტრიული მასშტაბის” სქემას მისი პლატფორმის კონტენტის უკანონოდ ამოღებისთვის. სოციალური მედიის გიგანტი ამტკიცებს, რომ ეს კომპანიები ერთად მუშაობდნენ მონაცემთა დაცვის გვერდის ავლით, რათა მოეპარათ საავტორო უფლებებით დაცული მომხმარებლის საუბრები ხელოვნური ინტელექტის პროდუქტების წვრთნისა და ფუნქციონირებისთვის.
ნიუ-იორკის სამხრეთ ოლქში შეტანილ სარჩელში Reddit ამტკიცებს, რომ სამივე სკრეპინგის კომპანია თავს არიდებს Reddit-ის ანტი-სკრეპინგის ზომებს „უკანა კარიდან“ და ზოგიერთ შემთხვევაში, ისინი Reddit-ის კონტენტს უშუალოდ Google-ის საძიებო შედეგების გვერდებიდან იღებენ.
Reddit-მა Perplexity „ჩრდილოკორეელ ჰაკერს“ შეადარა, რომელიც ყველაფერს გააკეთებს იმ მონაცემების მისაღებად, რაც მის „საპასუხო ძრავს“ სასოწარკვეთილად სჭირდება, ნაცვლად იმისა, რომ პლატფორმასთან შეთანხმება გაეფორმებინა, როგორც ეს OpenAI-სა და Google-ის მსგავსმა კომპანიებმა გააკეთეს.
სარჩელმა Perplexity-ის ძირითადი ტექნოლოგია გააკრიტიკა, სადაც ნათქვამია, რომ მისი ტექნოლოგია „არაფერი რევოლუციური არაა“ და რომ ეს საპასუხო ძრავა აგებულია „ინფორმაციის ამოღებით გაძლიერებულ გენერაციაზე“ („RAG“), სადაც დაკოპირებული მონაცემები სხვა კომპანიის LLM-ის მიერ მუშავდება.
სხვა სიტყვებით რომ ვთქვათ, Perplexity-ის ბიზნეს მოდელი ეფექტურად იღებს Reddit-ის კონტენტს Google-ის საძიებო შედეგებიდან, კვებავს მას მესამე მხარის LLM-ში და ამას ახალ პროდუქტს უწოდებს. მიუხედავად იმისა, რომ ამ ბიზნეს მოდელმა როგორღაც $20 მილიარდის შეფასებამდე მიიყვანა, ის არ გამოხატავს მზადყოფნას გადაიხადოს ის, რაშიც სხვები (მათ შორის Google) იხდიან.
Reddit-მა ასევე განაცხადა, რომ 2024 წლის მაისში Perplexity-ს გაუგზავნა შეწყვეტის მოთხოვნის წერილი და Perplexity-მ მაშინვე დაჰპირდა, რომ პატივს სცემდა Reddit-ის robots.txt ფაილს. თუმცა, Reddit ამტკიცებს, რომ მისი პლატფორმიდან Perplexity-ზე ციტირების მოცულობა „ორმოცჯერ გაიზარდა“.
ცნობისთვის, Perplexity-ის ქცევის შესახებ მსგავსი საჩივარი აგვისტოში Cloudflare-მაც შეიტანა, სადაც ამტკიცებდა, რომ ხელოვნური ინტელექტის კომპანია უგულებელყოფდა robots.txt ფაილებს და იყენებდა ფარულ კრაულერებს ვებ აპლიკაციების ფაირვოლის (WAF) წესების გვერდის ავლით მას შემდეგ, რაც მომხმარებლებმა სცადეს მისი ცნობილი კრაულერების (PerplexityBot და Perplexity-User) დაბლოკვა.
დავუბრუნდეთ სარჩელს: Reddit Perplexity-ს ადანაშაულებს „საეჭვო“ სკრეპერებთან თანამშრომლობაში და აცხადებს, რომ ამის დასამტკიცებლად ხაფანგი დააგო: კომპანიამ შექმნა უნიკალური „სატესტო პოსტი“, რომელიც მხოლოდ Google-ის საძიებო კრაულერისთვის იყო მისაწვდომი და ონლაინ სხვაგან მიუწვდომელი. საათების განმავლობაში, ამ დამალული პოსტის კონტენტი გამოჩნდა Perplexity-ის საძიებო შედეგებში.
Reddit ითხოვს სასამართლოსგან, რომ შეაჩეროს მოპასუხეები მისი მონაცემების ამოღებაში და მიუსაჯოს ზიანის ანაზღაურება მიყენებული ზიანისთვის, მათ შორის ნებისმიერი „უკანონოდ მოპოვებული სარგებლის“ უკან დაბრუნება, რომელიც მიღებული იქნა მისი კონტენტის არასანქცირებული გამოყენებით.
Perplexity არის ხელოვნური ინტელექტის უახლესი ლაბორატორია, რომელსაც Reddit-მა სასამართლოში უჩივლა თავისი მონაცემების კონტროლისთვის ბრძოლაში. ჯერ კიდევ ივნისში, Reddit-მა უჩივლა Anthropic-ს მსგავსი არასანქცირებული მონაცემთა ამოღებისთვის, Claude-ის შემქმნელს უწოდა ორსახა კომპანია, რომელიც საჯაროდ ემხრობოდა პასუხისმგებლიან ხელოვნურ ინტელექტს, მაგრამ პირადად აგროვებდა მონაცემებს მომსახურების პირობების დარღვევით.