أول وكالة اخبارية خاصة انطلقت في الأردن

تواصل بلا حدود

أخر الأخبار
وزيرة التنمية: التكنولوجيا سرعت نمو أعمال النساء التجارية وسهلت العمل المرن السفيرة السقا تقدم أوراق اعتمادها للرئيس الفرنسي لدى إمارة أندورا الطاقة: الأردن سيخاطب العراق لتجديد مذكرة توريد النفط عشرات المستوطنين المتطرفين يقتحمون الأقصى بحراسة شرطة الاحتلال وزير المياه: حصة الأردني ستنخفض النصف دون الناقل الوطني وابوغوش تستجوبه الضمان تنشر قائمة الجهات الطبية المعتمدة لإصابات العمل ما مصير المقاتلين الأردنيين والأجانب في سورية؟ حسان يتفقد مدرسة مغاير مهنا ويوجه بصيانة شاملة النعيمات ينتقد تجاهل بعض الوزراء لاتصالات النواب التونسي قيس اليعقوبي مدربًا للوحدات رسميًا خميس عطية يقترح تعديلات على قانون السير ارتفاع حصيلة الشهداء في قطاع غزة إلى 48,515 منذ بدء العدوان 6 سلع صناعية تستحوذ على 57% من الصادرات الأردنية في 2023 الاردن متناغم بوعي شعبه وحكمة قيادته تجارة الأردن: استقرار أسعار المواد الغذائية بالسوق المحلية وانخفاض بعضها الشواربة: لا يحق إعطاء أي تعويض لمعتدٍ على أملاك الدولة النائب العتوم توجه 10 أسئلة لوزير التربية رئيس الوزراء يتفقد استثمارات في الموقر الصفدي: لا يوجد سجن في الجندويل طرح عطاء لشراء كميات من القمح
الصفحة الرئيسية علوم و تكنولوجيا أشهر روبوتات الدردشة لا يمكن الوثوق بها!

أشهر روبوتات الدردشة لا يمكن الوثوق بها!

أشهر روبوتات الدردشة لا يمكن الوثوق بها!

11-03-2025 09:58 PM

زاد الاردن الاخباري -

أكدت نتائج دراسة جديدة نصيحة لطالما ترددت وهي أن روبوتات الدردشة المعتمدة على الذكاء الاصطناعي لا ينبغي استخدامها للحصول على حقائق، أي أنه لا يمكن الوثوق بها في هذا الأمر.

وهناك مشكلتان رئيسيتان معروفتان عند محاولة استخدام نماذج اللغة الكبيرة مثل "شات جي بي تي" كبديل لعمليات البحث على الويب، وهما أن هذه النماذج غالبًا ما تكون مخطئة، وأنها غالبًا ما تكون واثقة جدًا من معلوماتها غير الصحيحة.





دراسة جديدة
وجدت دراسة استشهدت بها مجلة "Columbia Journalism Review" أنه حتى عندما تُعطى روبوتات الدردشة اقتباسًا دقيقًا من مقالة صحفية ويُطلب منها المزيد من التفاصيل، فإن معظمها يخطئ في أغلب الأحيان، بحسب تقرير لموقع "9TO5Mac".

وأجرى مركز تو للصحافة الرقمية اختبارات على ثمانية روبوتات دردشة تعمل بالذكاء الاصطناعي تدعي إجراء عمليات بحث على الويب للحصول على الحقائق.

وهذه الربوتات هي "شات جي بي تي" و"ديب سيك" و"غروك 2" و"غروك 3" و"Gemini" و"Copilot" و" Perplexity" و" Perplexity Pro".

وقدمت الدراسة لكل نظام اقتباسًا من مقال صحفي، وطلبت منه تنفيذ مهمة بسيطة: العثور على هذا المقال عبر الإنترنت وتوفير رابط إليه، مع العنوان والناشر الأصلي وتاريخ النشر.

وتم تصنيف روبوتات الدردشة على أساس ما إذا كانت صحيحة تمامًا، أو صحيحة ولكن مع بعض المعلومات المطلوبة مفقودة، أو غير صحيحة جزئيًا، أو غير صحيحة تمامًا، أو لا يمكنها الإجابة.

كما لاحظ القائمون على الدراسة مدى ثقة روبوتات الدردشة في عرض نتائجها. على سبيل المثال، هل قدموا إجاباتهم كحقائق فقط، أم استخدموا عبارات مؤهلة مثل "يبدو" أو تضمنوا اعترافًا بأنهم لم يتمكنوا من العثور على تطابق دقيق للاقتباس.


نتائج صادمة
في المتوسط، كانت أنظمة الذكاء الاصطناعي صحيحة في أقل من 40% من الوقت، وكان الأكثر دقة هو "Perplexity" بنسبة 63%، والأسوأ كان "غروك 3" الموجود عبر منصة "إكس" بنسبة 6% فقط.

كانت روبوتات الدردشة سيئة بشكل عام في رفض الإجابة على الأسئلة التي لا يمكنها الإجابة عليها بدقة، وعرضت إجابات غير صحيحة أو تخمينية بدلًا من ذلك.

وفي حين كان أداء "Perplexity" هو الأفضل، يبدو أن هذا يرجع إلى الغش. ويمكن للقائمين على المواقع الإلكترونية استخدام ملف "robots.txt" على مواقعهم لإخبار روبوتات الدردشة ما إذا كان ينبغي لها الوصول إلى الموقع أم لا.

وقد وجد "Perplexity" بشكل صحيح جميع الاقتباسات العشر على الرغم من حقيقة أن المقالات كانت محمية بجدار دفع ولم يكن لدى الشركة اتفاقية ترخيص.

ومن بين البقية، قدم "شات جي بي تي" أفضل النتائج على هذا الصعيد، أو بشكل أكثر دقة، كان الأقل سوءًا.

وعلى الرغم من ذلك، توضح الدراسة بالتأكيد ما كنا نعرفه بالفعل: أنه ينبغي استخدام روبوتات الدردشة للإلهام والأفكار، ولكن ليس أبدًا للحصول على إجابات للأسئلة حول الحقائق.








تابعونا على صفحتنا على الفيسبوك , وكالة زاد الاردن الاخبارية

التعليقات حالياً متوقفة من الموقع