ایمیزون ویب سروسز نے اس بات کا تعین کرنے کے لیے تحقیقات شروع کر دی ہیں کہ آیا Perplexity AI اپنے قوانین کو توڑ رہا ہے۔ وائرڈ. واضح طور پر، کمپنی کا کلاؤڈ ڈویژن مبینہ طور پر ان الزامات پر غور کر رہا ہے کہ سروس ایک کرالر استعمال کر رہی ہے، جو اس کے سرورز پر ہوسٹ کیا جاتا ہے، جو روبوٹس کے اخراج پروٹوکول کو نظر انداز کرتا ہے۔ یہ پروٹوکول ایک ویب اسٹینڈرڈ ہے، جس میں ڈویلپرز ڈومین پر ایک robots.txt فائل ڈالتے ہیں جس میں یہ ہدایات ہوتی ہیں کہ آیا بوٹس کسی مخصوص صفحہ تک رسائی حاصل کر سکتے ہیں یا نہیں کر سکتے۔ ان ہدایات کی تعمیل رضاکارانہ ہے، لیکن معروف کمپنیوں کے کرالر عام طور پر ان کا احترام کرتے رہے ہیں جب سے ویب ڈویلپرز نے 90 کی دہائی میں اس معیار کو نافذ کرنا شروع کیا۔
ایک پہلے حصے میں، وائرڈ نے اطلاع دی کہ اس نے ایک ورچوئل مشین دریافت کی ہے جو اپنی ویب سائٹ کی robots.txt ہدایات کو نظرانداز کر رہی تھی۔ وہ مشین آئی پی ایڈریس 44.221.181.252 کا استعمال کرتے ہوئے ایمیزون ویب سروسز سرور پر ہوسٹ کی گئی تھی جو “یقینی طور پر پرپلیکسٹی کے ذریعہ چلائی جاتی ہے۔” مبینہ طور پر اس نے گزشتہ تین مہینوں میں دیگر Condé Nast پراپرٹیز کا دورہ کیا تاکہ ان کے مواد کو بھی کھرچ سکیں۔ دی سرپرست، فوربس اور نیو یارک ٹائمز متعدد بار ان کی اشاعتوں پر جانے سے بھی پتہ چلا تھا، وائرڈ کہا. اس بات کی تصدیق کرنے کے لیے کہ آیا Perplexity واقعی اس کے مواد کو ختم کر رہی تھی، وائرڈ کمپنی کے چیٹ بوٹ میں اس کے مضامین کی سرخیاں یا مختصر تفصیل درج کی ہے۔ ٹول نے پھر نتائج کے ساتھ جواب دیا جس نے اس کے مضامین کو “کم سے کم انتساب کے ساتھ” قریب سے بیان کیا۔
تازہ رائٹرز رپورٹ میں دعویٰ کیا گیا ہے کہ Perplexity وہ واحد AI کمپنی نہیں ہے جو بڑی زبان کے ماڈلز کو تربیت دینے کے لیے استعمال ہونے والے مواد کو اکٹھا کرنے کے لیے robots.txt فائلوں کو نظرانداز کر رہی ہے۔ تاہم، ایسا لگتا ہے وائرڈ صرف Amazon کو Perplexity AI کے کرالر کے بارے میں معلومات فراہم کیں۔ “AWS کی سروس کی شرائط بدسلوکی اور غیر قانونی سرگرمیوں کو ممنوع قرار دیتی ہیں اور ہمارے صارفین ان شرائط کی تعمیل کے ذمہ دار ہیں،” Amazon Web Services نے ہمیں ایک بیان میں بتایا۔ “ہمیں معمول کے مطابق متعدد ذرائع سے مبینہ بدسلوکی کی اطلاعات موصول ہوتی ہیں اور اپنے صارفین کو ان رپورٹس کو سمجھنے کے لیے مشغول کرتے ہیں۔” ترجمان نے مزید کہا کہ کمپنی کے کلاؤڈ ڈویژن نے بتایا وائرڈ یہ اشاعت کی فراہم کردہ معلومات کی چھان بین کر رہا تھا کیونکہ یہ ممکنہ خلاف ورزیوں کی تمام رپورٹس کرتا ہے۔
پریشانی کی ترجمان سارہ پلاٹنک نے بتایا وائرڈ کہ کمپنی نے پہلے ہی ایمیزون کے استفسارات کا جواب دیا ہے اور اس سے انکار کیا ہے کہ اس کے کرالر روبوٹس کے اخراج پروٹوکول کو نظرانداز کر رہے ہیں۔ “ہمارا PerplexityBot — جو AWS پر چلتا ہے — robots.txt کا احترام کرتا ہے، اور ہم نے تصدیق کی کہ Perplexity-controlled سروسز کسی بھی طرح سے رینگ نہیں رہی ہیں جس سے AWS کی سروس کی شرائط کی خلاف ورزی ہوتی ہے،” انہوں نے کہا۔ پلاٹنک نے ہمیں بتایا کہ ایمیزون نے دیکھا وائرڈ کا میڈیا انکوائری صرف ایک معیاری پروٹوکول کے حصے کے طور پر اپنے وسائل کے غلط استعمال کی رپورٹس کی تحقیقات کے لیے۔ کمپنی نے بظاہر ایمیزون سے پہلے کسی قسم کی تحقیقات کے بارے میں نہیں سنا ہے۔ وائرڈ کمپنی سے رابطہ کیا. پلاٹنک نے اعتراف کیا۔ وائرڈتاہم، یہ PerplexityBot robots.text کو نظر انداز کر دے گا جب کوئی صارف اپنی چیٹ بوٹ انکوائری میں ایک مخصوص URL شامل کرتا ہے۔
پرپلیکسٹی کے سی ای او اروند سری نواس نے بھی پہلے اس بات کی تردید کی تھی کہ ان کی کمپنی “روبوٹ کے اخراج پروٹوکول کو نظر انداز کر رہی ہے اور پھر اس کے بارے میں جھوٹ بول رہی ہے۔” سرینواس نے اعتراف کیا۔ فاسٹ کمپنی کہ Perplexity تیسری پارٹی کے ویب کرالرز کو اپنے اوپر استعمال کرتی ہے، اور وہ بوٹ وائرڈ شناخت ان میں سے ایک تھا.
اپ ڈیٹ، 28 جون، 2024، 2:20PM ET: ہم نے اس پوسٹ کو Pk Urdu News میں Perplexity کے بیان کو شامل کرنے کے لیے اپ ڈیٹ کیا ہے۔
اپ ڈیٹ، 28 جون، 2024، 8:27PM ET: ہم نے اس پوسٹ کو ایمیزون ویب سروسز کے ایک بیان میں اپ ڈیٹ کیا ہے۔