وحدة المعالجة المركزية الفردية تتفوق على الفائزين بالميداليات الذهبية في المنظمة الدولية للرياضيات (IMO)، وشركتي OpenAI وAdobe تستخدمان بيانات YouTube وبيانات Midjourney
أخبار الذكاء الاصطناعي الأخيرة
شهدت هذا الأسبوع جولة جديدة من التطورات الملحوظة في عالم الذكاء الاصطناعي، حيث أصبحت OpenAI وAdobe غامضتين فيما يتعلق ببيانات التدريب، وتفوقت النماذج على بعضها البعض وعلى الفائزين بميداليات المنظمة الدولية للرياضيات (IMO). أعلنت الشركات التكنولوجية العملاقة Google وMeta استثماراتها في رقاقات الذكاء الاصطناعي، بينما قامت Mistral وX.ai بإطلاق نماذج كبيرة جديدة، وتتقدم النماذج اللغوية الصغيرة مرة أخرى.أبرز المستجدات لهذا الأسبوع تشمل:
- قدمت Google وMeta رقاقات ذكاء اصطناعي جديدة قوية، بينما قدمت Intel مسرع ذكاء اصطناعي جديد، الذي يقدم تحسينات كبيرة على نماذج Nvidia.
- قد يواجه OpenAI دعوى قانونية من Google بسبب ادعاء استخدامه أكثر من مليون ساعة من مقاطع فيديو YouTube لتدريب GPT-4، مما قد ينتهك شروط خدمة YouTube، بينما استخدمت Adobe Midjourney لتدريب Firefly.
- قامت X.ai بتقديم نموذجها المتعدد الوسائط Grok-1.5V، الذي قدم تقدمًا كبيرًا في فهم ومعالجة المعلومات البصرية.
- أطلقت Mistral LLM الجديدة الخاصة بهم، Mistral8x22B، التي تفوقت على GPT-3.5 ولكنها لا تزال تتأخر وراء GPT-4 عبر مختلف المقاييس.
- أجرت Anthropic دراسة تقيس إقناعية النماذج اللغوية الطويلة (LLMs)، وتشير إلى أن النماذج الحديثة قد تنافس إقناعية البشر.
قدمت Google وMeta رقاقات ذكاء اصطناعي جديدة قوية، بينما قدمت Intel مسرع ذكاء اصطناعي جديد، الذي يقدم تحسينات كبيرة على نماذج Nvidia.
سوق رقائق الذكاء الاصطناعي يشهد نموًا سريعًا مع إطلاق شركتي التكنولوجيا العملاقتين Google وMeta لأحدث رقائقهما.
في مؤتمر Google Cloud Next، أعلنت Google عن إطلاق Cloud TPU v5p، أحدث رقاقة ذكاء اصطناعي لديها، والتي يمكنها تدريب النماذج اللغوية الطويلة (LLMs) بسرعة تقريبًا ثلاث مرات أسرع من الجيل السابق، TPU v4.
كما قامت Meta بتقديم رقاقتها الأحدث التي تحمل اسم Meta Training and Inference Accelerator (MTIA)، وهي رقاقة مخصصة تم تصميمها لتعزيز كفاءة التدريب والاستنتاج لنماذج التصنيف والتوصيات في Meta.
علاوة على ذلك، تهدف الرقاقة الجديدة MTIA إلى تحسين الأداء بشكل كبير، مع دعم خوارزميات التصنيف ونماذج الذكاء الاصطناعي الإنتاجية مثل نماذج اللغة LLaMa.
كما كشفت إنتل عن مسرعها الذكاء الاصطناعي الجديد الذي يحمل اسم Gaudi 3، الذي يوفر أداءً في الاستنتاج يصل إلى 50% أفضل وكفاءة طاقة تصل إلى 40% أفضل من رقاقة Nvidia H100 بتكلفة أقل.
قام الرئيس التنفيذي لشركة إنتل، بات جيلسينجر، بتقديم Gaudi 3 في حدث Intel Vision. (المصدر) |
قد يواجه OpenAI دعوى قانونية من Google بسبب ادعاء استخدامه أكثر من مليون ساعة من مقاطع فيديو YouTube لتدريب GPT-4، مما قد ينتهك شروط خدمة YouTube، بينما استخدمت Adobe Midjourney لتدريب Firefly.
OpenAI تستخدم مقاطع فيديو من YouTube لتدريب مُنشئ الفيديو Sora
5% من مجموعة بيانات تدريب Firefly من Adobe كانت من منصة Midjourney
قامت X.ai بتقديم نموذجها المتعدد الوسائط Grok-1.5V، الذي قدم تقدمًا كبيرًا في فهم ومعالجة المعلومات البصرية.
تم تقديم Grok 1.5 Vision من X.ai
جدول مقارنة الأداء لنموذج Grok-1.5V. (المصدر) |
أطلقت Mistral LLM الجديدة الخاصة بهم، Mistral8x22B، التي تفوقت على GPT-3.5 ولكنها لا تزال تتأخر وراء GPT-4 عبر مختلف المقاييس.
طرحت شركة Mistral نموذجها الجديد، Mixtral8x22B
إنه نموذج للغة طويل الأمد جديد يحتوي على 176 مليار معلمة ونافذة سياقية تصل إلى 65,000 رمز، بهدف تجاوز سابقته والمنافسين مثل GPT-3.5 من OpenAI.
يتفوق Mixtral 8x22B على GPT-3.5 ولكنه يبقى دون GPT-4 في مقارنة الأداء. (المصدر) |
يعتبر Mixtral مفتوح المصدر، مما يساعد على تمكين الوصول إلى نماذج LLM ذات آخر تقنية لأن أي شخص يمكنه الوصول إليها وتعديلها. يتزامن هذا الإصدار الجديد مع إصدارات أخرى كبيرة من نماذج LLM، بما في ذلك Google Gemini Pro 1.5 في Google Cloud Next و GPT-4 Turbo من OpenAI.
أجرت Anthropic دراسة تقيس إقناعية النماذج اللغوية الطويلة (LLMs)، وتشير إلى أن النماذج الحديثة قد تنافس إقناعية البشر.
مشروع قانون الشفافية في تدريب الذكاء الاصطناعي من شيف
مشروع القانون الجديد الذي قدمه النائب آدم شيف يتطلب من شركات الذكاء الاصطناعي الكشف عن المواد المحمية بحقوق الطبع والنشر المستخدمة في مجموعات بيانات التدريب إلى مكتب حقوق الطبع والنشر قبل إطلاق أنظمة الذكاء الاصطناعي.
التقدم في أبحاث الذكاء الاصطناعي
LLMs مقنعة كبشر؟
مقارنة إقناع النماذج. (المصدر) |
كان قياس إقناع محتوى الذكاء الاصطناعي بدقة أمرًا صعبًا. لقد واجهت صعوبات في تعميم النتائج المختبرية إلى سيناريوهات العالم الحقيقي حيث تؤثر العوامل الديناميكية على الإقناع.
تقوم الورقة الجديدة من Anthropic بتقييم إقناع نماذج اللغة عبر أجيال مختلفة من نماذجها وتقارنها بالحجج المكتوبة من قبل البشر. كما أبرزت أن النماذج الأحدث والأكبر حجمًا أكثر إقناعًا.
كان ذلك واضحًا مع النموذج الأحدث، Claude 3 Opus، الذي كان قريبًا من إقناع البشر في التجارب المُجراة بشكل مُحكم.
الحد من مخاطر مخرجات LLM المستقلة
السلامة والثقة في نماذج اللغة الطويلة الذاتية التشغيل التي تقوم بأعمال في العالم الحقيقي دون إشراف مستمر من البشر هي مصدر قلق كبير.
تطور نماذج اللغة الطويلة من الروبوتات الدردشة إلى التطبيقات والخدمات المصغرة. (المصدر) |
تهدف هذه الورقة إلى معالجة هذه المسألة من خلال تقديم مفهوم "التحقق بعد الحقيقة" لتطبيقات نماذج اللغة الطويلة الذاتية التشغيل. وهو يركز على التحقق من الإجراءات بعد التنفيذ بدلاً من قبله، مما يساعد في التعامل مع عدم التنبؤ والمخاطر في إخراج هذه النماذج.
كما تقترح آليات مثل "التراجع" و"حصر الأضرار" للتخفيف من المخاطر الناتجة عن الإجراءات غير المقصودة.
يتم تقديم محرك التنفيذ جوريلا (GoEX) كحل تشغيلي يستخدم هذه المفاهيم لجعل نماذج اللغة الطويلة الذاتية التشغيل أكثر أمانًا وموثوقية في النشر.
اتمنى ان ينال المقال اعجابكم و حرصناً منا على تزويدكم ب مصدر المعلومة وضعنا لكم العديم من الروابط للمصادر, اذا اعجبك المقال اتمنى منك ترك تعليق لكي تشجعنا على نشر المزيد
اكتب تعليقك هنا من فضلك