جوهانا كابيلدو: إدمان شركات التكنولوجيا الكبرى على البيانات يُدمر الذكاء الاصطناعي
في سطور إن اعتماد شركات التكنولوجيا الكبرى على البيانات الاصطناعية يؤدي إلى تدهور جودة الذكاء الاصطناعي، وترسيخ التحيز، ومركزية السيطرة، في حين يكمن الحل الحقيقي في إعادة بناء نظام بيئي عادل وشفاف للبيانات ويركز على الإنسان.
ميتا LLaMAتم إطلاق -4 بتوقعات عالية. بدلاً من ذلك لقد خيبت الآمال مقارنةً بسابقه، كان أداؤه أضعف، وتسبب في هلوسات أكثر، وتراجعًا عامًا في الأداء. وفقًا للرئيس التنفيذي لشركة D-GN جوهانا كابيلدو لم يكن السبب هو الافتقار إلى الحوسبة أو الابتكار، بل كان السبب هو البيانات.
بعد استنفاد مخزون الإنترنت من النصوص الواضحة والمتنوعة وعالية الجودة، لجأت ميتا إلى البيانات التركيبية: محتوى مُولّد بالذكاء الاصطناعي يُستخدم لتدريب الذكاء الاصطناعي الأحدث. هذا يُنشئ حلقةً تتعلم فيها النماذج من نفسها، فتفقد دقتها وعمقها مع كل دورة.
اللاعبون الرئيسيون الآخرون—OpenAIتواجه جوجل وأنثروبيك نفس المعضلة. انتهى عصر بيانات التدريب الوفيرة والواقعية. ما تبقى هو حشو صناعي ونتيجة لذلك، فإن التقدم يتوقف، والوهم بالتقدم يخفي وراءه تراجعاً هادئاً.
من يملك البيانات؟
أفاد مؤشر ستانفورد للذكاء الاصطناعي لعام 2024 تسيطر ثماني شركات الآن على 89% من بيانات وبنية تدريب الذكاء الاصطناعي العالمية. لا يقتصر الأمر على قوة السوق فحسب، بل يؤثر أيضًا على نوعية المعرفة المُضمنة في الذكاء الاصطناعي، ومن تُستبعد آراؤهم.
يمكن للنماذج المُدرَّبة على مجموعات بيانات متحيزة أو ضيقة أن تُعزِّز الضرر الواقعي. تُخطئ أدوات الذكاء الاصطناعي المُصمَّمة على سجلات الرعاية الصحية الأمريكية في تشخيص المرضى في دول أخرى. أنظمة التوظيف معاقبة المتقدمين الذين يحملون أسماء غير غربية . يكون التعرف على الوجه أقل دقة على البشرة الداكنة، وخاصةً للنساء. تُسكت المرشحات اللهجات الأقلية باعتبارها مسيئة أو غير ذات صلة.
مع اعتماد النماذج بشكل أكبر على البيانات الاصطناعية، تتفاقم الأخطاء. ويحذر الباحثون من حلقات متكررة التي تُنتج "هراءً مُصقولاً" - نص يبدو صحيحًا ولكنه يحتوي على حقائق مُلفّقة. بحلول أوائل عام ٢٠٢٥، استعراض كولومبيا للصحافة وُجِد أن جوجل جيميني يُعطي استشهادات دقيقة تمامًا في 10% فقط من الحالات. كلما تدربت هذه الأنظمة على مُخرجاتها المُعيبة، زادت سرعة تدهورها.
مغلق، مغلق خارج
بنت شركات الذكاء الاصطناعي نماذجها على أساس المعرفة المتاحة للعامة - الكتب، Wikiموسوعة، ومنتديات، وحتى مقالات إخبارية. لكن الآن، تُغلق الشركات نفسها نماذجها وتستغل الوصول إليها.
في أواخر عام 2023، نشرت صحيفة نيويورك تايمز دعوى قضائية ضد OpenAI ومايكروسوفت بسبب الاستخدام غير المصرح به لمحتواها. في غضون ذلك، اتهمت ريديت وستاك أوفرفلو أبرمت صفقات ترخيص حصرية ، إعطاء OpenAI الوصول إلى المحتوى الذي ينشئه المستخدم والذي كان مفتوحًا للجميع في السابق.
هذه الاستراتيجية واضحة: جمع المعرفة العامة المجانية، وتنميتها، وحصرها في واجهات برمجة التطبيقات. الشركات نفسها التي استفادت من النظم البيئية المفتوحة تُقيّد الآن الوصول إليها، بينما تُروّج للبيانات الاصطناعية كبديل مستدام، على الرغم من الأدلة المتزايدة على أنها تُضعف أداء النماذج. لا يمكن للذكاء الاصطناعي أن يتطور بالتعلم من نفسه. لا توجد رؤية واضحة في المرآة.
مسار مختلف
إن حل أزمة بيانات الذكاء الاصطناعي لا يتطلب المزيد من الحوسبة أو نماذج أكبر - بل يتطلب تحولاً في كيفية جمع البيانات وتقييمها وإدارتها.
Web3 تُقدم التقنيات سبيلاً مُمكناً للمضي قدماً. يُمكن لتقنية البلوك تشين تتبع مصدر البيانات. كما يُمكن للأنظمة المُرمزة تعويض الأشخاص الذين يُساهمون بمعرفتهم بشكل عادل. وقد استخدمت مشاريع مثل مختبرات مورفيوس هذه الأدوات لتحسين أداء الذكاء الاصطناعي للغة السواحيلية بنسبة 30%، وذلك ببساطة من خلال تحفيز مُساهمة المجتمع.
تُضيف أدوات الحفاظ على الخصوصية، مثل إثباتات المعرفة الصفرية، مستوىً آخر من الثقة. فهي تُمكّن من تدريب النماذج على معلومات حساسة، كالسجلات الطبية، دون الكشف عن البيانات الخاصة. وهذا يضمن قدرة النماذج على التعلم بشكل أخلاقي مع الحفاظ على الأداء العالي.
هذه الأفكار ليست مجرد تكهنات. فالشركات الناشئة تستخدم بالفعل أدوات لامركزية لبناء أنظمة ذكاء اصطناعي دقيقة ثقافيًا وتحترم الخصوصية حول العالم.
استعادة المستقبل
يُشكّل الذكاء الاصطناعي الأنظمة التي تُشكّل المجتمع - التعليم، والطب، والعمل، والاتصالات. لم يعد السؤال المحوري هو: هل سيُهيمن الذكاء الاصطناعي؟ بل من يتحكم في مصيره؟
مع مواجهة صناعة الذكاء الاصطناعي لقيود البيانات الاصطناعية والبنية الأساسية الاحتكارية، تقدم منصات مثل D-GN مسارًا واضحًا للمضي قدمًا: مسار يتم فيه تدريب الذكاء الاصطناعي من قبل الناس، ولصالح الناس، وفي خدمة مستقبل أكثر عدالة وذكاءً.
هل سنسمح لعدد قليل من الشركات بإعادة تدوير مخرجاتها، وتدهور جودة نماذجها، وترسيخ التحيز؟ أم سنستثمر في بناء نظام بيئي جديد للبيانات - نظام يُقدّر الشفافية والإنصاف والملكية المشتركة؟
المشكلة ليست في عدم امتلاك الآلات لبيانات كافية، بل في أن البيانات التي تستخدمها أصبحت مصطنعة وضيقة الأفق ومُتحكّم بها بشكل متزايد. يكمن الحل في إعادة السلطة لمن يُنتجون محتوى هادفًا، ومكافأتهم على ذلك. الذكاء الاصطناعي الأفضل يبدأ ببيانات أفضل، والبيانات الأفضل تبدأ بنا.
إخلاء المسؤولية: يعكس محتوى هذه المقالة رأي المؤلف فقط ولا يمثل المنصة بأي صفة. لا يُقصد من هذه المقالة أن تكون بمثابة مرجع لاتخاذ قرارات الاستثمار.
You may also like
الإحتياطي الفيدرالي يُلغي توجيهاته المُشددة للبنوك بشأن العملات الرقمية
“سيتي غروب” تتوقع تزايد حيازة مُصدري العملات المستقرة لسندات الخزانة الأميركية
سوق العقارات المُمثلة رقمياً عالميًا قد يقفز إلى 4 تريليونات دولار
تعيين “بول دواليبي” رئيسًا تنفيذيًا لواحة رأس الخيمة للأصول الرقمية
Trending news
المزيدأسعار العملات المشفرة
المزيد








