قصص العملاء/البرامج والإنترنت/الولايات المتحدة

2024
شعار Perplexity

Perplexity تسرِّع تدريب نماذج التأسيس بنسبة 40% من خلال خدمة HAQM SageMaker HyperPod

تعرّف على كيفية قيام شركة Perplexity الناشئة في مجال الذكاء الاصطناعي المولّد بتدريب النماذج بشكل أسرع وأكثر كفاءة باستخدام خدمة HAQM SageMaker HyperPod.

تخفيض يصل إلى 40%

في وقت التدريب

أكثر من 100000 استعلام في الساعة

مدعومة

الحفاظ على

زمن استجابة منخفض 

تحسين

تجربة المستخدم

نظرة عامة

الذكاء الاصطناعي المولّد من التقنيات القوية التي أحدثت تحولاً جذريًا، ويضم خوارزميات تعلّم الآلة (ML) القادرة على إنشاء محتوى جديد، من الصور إلى النصوص، من خلال التعلّم من كميات هائلة من البيانات. وتستغل شركة Perplexity، التي تعمل حاليًا على إنشاء أحد أوائل محركات الإجابة الحوارية في العالم، قوة الذكاء الاصطناعي المولّد لمساعدة المستخدمين في العثور على المعلومات ذات الصلة.

احتاجت شركة Perplexity، عند مواجهتها التحدي المتمثل في تحسين نماذجها من حيث الدقة والتحديد، إلى حل قوي قادر على التعامل مع متطلباتها الحسابية. وفي ظل انتهاج شركة Perplexity رؤية تهدف إلى الارتقاء بتجربة المستخدم، تحوّلت إلى استخدام HAQM Web Services (AWS). باستخدام البنية التحتية المتقدمة لتقنية تعلّم الآلة ومكتبات التدريب وأدوات الاستدلال المقدمة من AWS، اكتسبت Perplexity مستويات المرونة والأداء والكفاءة المطلوبة لتقديم الخدمات إلى مستخدميها العالميين على نطاق واسع.

فرصة | استخدام خدمات AWS لتحسين تجربة المستخدم

على عكس محركات البحث التقليدية، التي غالبًا ما تعطي الأولوية للإعلانات ولكلمات أساسية محددة على حساب النتائج الأكثر صلة، تم تحسين حل Perplexity بحيث يربط المستخدمين بالمعلومات التي يبحثون عنها. يعتمد ما يقرب من 10 ملايين مستخدم نشط شهريًا على Approximately للتعرّف على مفاهيم جديدة والتغلب على التحديات والعثور على إجابات.

وفي هذا السياق، أدلى Aravind Srinivas،‏ الرئيس التنفيذي والشريك المؤسس لشركة Perplexity بتصريح قال فيه: "باستخدام نماذج اللغة الكبيرة (LLM)، يمكننا تجميع قدرات الاستدلال والفهم للغة البشرية في نموذج واحد. وقد ساعدنا هذا، جنبًا إلى جنب مع الحقائق المتاحة على الإنترنت، في إنشاء محرك الإجابات لدينا" وأضاف قائلاً: "ببساطة، دمجنا فهرس البحث التقليدي (محرك الحقائق) مع محرك الاستدلال (نموذج اللغة الكبير) لإنشاء أول محرك إجابات حواري في العالم".

استخدمت Perplexity، منذ تأسيسها في عام 2022، خدمات AWS الأساسية مثل HAQM Elastic Compute Cloud (HAQM EC2) — التي توفر سعة حوسبة آمنة وقابلة لتغيير الحجم لأي عبء عمل تقريبًا — لتشغيل الواجهة الخلفية والواجهة الأمامية ومكونات البحث لمنتجها. ومع نضوج شركة Perplexity وارتفاع عدد نماذج تعلّم الآلة لديها، احتاجت إلى قوة حوسبة هائلة لتتمكن من تقديم الخدمة للمستخدمين.

تحدثت Perplexity إلى خبراء AWS وعلمت أن خدمة HAQM SageMaker HyperPod، وهي عبارة عن بنية تحتية مصممة خصيصًا للتدريب الموزّع على نطاق واسع، يمكنها تلبية احتياجاتها فيما يتعلق بتدريب النماذج على نطاق واسع. تم تكوين HAQM SageMaker HyperPod مسبقًا باستخدام مكتبات التدريب الموزّع من HAQM SageMaker التي جرى تحسينها لتشغيل مهام تدريب التعليم العميق المخصصة والفعالة من حيث التكلفة والقابلة للتوسعة بدرجة كبيرة، الخاصة بالمعالجة المتوازية للبيانات (تقسيم البيانات على وحدات معالجة الرسومات) أو المعالجة المتوازية للنماذج (تقسيم النماذج على وحدات معالجة الرسومات)، بسرعات ربط بيني تتجاوز 1600 جيجابت في الثانية. وتمنع خدمة HAQM SageMaker HyperPod أيضًا الانقطاعات في تدريب نماذج التأسيس عن طريق حفظ نقاط التحقق بشكل دوري. وعند حدوث عطل في الأجهزة أثناء التدريب، تتولى هذه الخدمة المقدمة من AWS الاكتشاف التلقائي للعطل أو إصلاح المثيل المعيب أو استبداله، وتستأنف التدريب من آخر نقطة تحقق محفوظة. هذه العملية تسهِّل تدريب النماذج لأسابيع أو أشهر دون انقطاع في بيئة موزعة.

kr_quotemark

"في AWS، القوة بين يدي العميل. لا توجد متطلبات تُلزِمك باستخدام خدمات معينة".

Aravind Srinivas
الرئيس التنفيذي والشريك المؤسس لشركة Perplexity

الحل | تقليل وقت تدريب النماذج بنسبة تصل إلى 40% باستخدام HAQM SageMaker HyperPod

عرضت AWS على شركة Perplexity نسخة تجريبية مدتها شهر واحد لإظهار قدرات التدريب الموزّع، واكتشفت الشركة خلالها مزايا استخدام AWS. على سبيل المثال، اكتسبت Perplexity مرونة أكبر في تخصيص الموارد؛ فهي تستخدم أنواعًا مختلفة من مثيلات HAQM EC2 ووحدات معالجة الرسومات المصممة خصيصًا لتناسب مهام محددة.

لتدريب نماذج تعلّم الآلة، تتطلب Perplexity مساحات كبيرة من الذاكرة لكي تتمكن من تشغيل كميات هائلة من البيانات وتخزين التدرجات المختلفة. ووقع اختيارها على مثيلات HAQM EC2 P4de - التي توفر أعلى مستوى من الأداء في تدريب نماذج تعلّم الآلة وتطبيقات الحوسبة عالية الأداء - لتشغيل مهام التدريب، مما يمكنها من تلبية متطلبات الذاكرة والنطاق الترددي. وباستخدام HAQM SageMaker HyperPod، تتمكن Perplexity من نقل البيانات بين وحدات معالجة الرسومات المختلفة بشكل أسرع بكثير، مما أثمر عن تقليص وقت تدريب نماذج تعلّم الآلة بنسبة تصل إلى 40 بالمائة.

وفي ضوء ذلك، يقول Srinivas: "ساعدتنا مكتبات المعالجة المتوازية للبيانات والنماذج في SageMaker HyperPod على تحسين وقت التدريب في وحدات معالجة الرسومات ومضاعفة معدل نقل البيانات للتدريب". وأضاف قائلاً: "ونتيجة لذلك، يمكن الآن إجراء تجاربنا التدريبية بسرعة مضاعفة، وهذا يعني أن المطورين لدينا يمكنهم التكرار بسرعة أكبر، مما يؤدي إلى تسريع وتيرة تطوير تجارب الذكاء الاصطناعي الجديدة لعملائنا. ونظرًا إلى أن HAQM SageMaker HyperPod تتولى المراقبة التلقائية لكفاءة الكتلة ومعالجة أعطال وحدة معالجة الرسومات (GPU)، يتمتع مطورونا بالقدرة على التركيز على إنشاء النماذج بدلاً من إمضاء الوقت في إدارة البنية التحتية الأساسية وتحسينها".

تهدف Perplexity إلى تقديم استجابات سريعة ودقيقة لاستعلامات المستخدمين، الأمر الذي يتطلب إمكانات استدلال شبه فورية. وباستخدام مثيلات HAQM EC2 P5 — المستندة إلى وحدة معالجة الرسومات والتي تقدم أعلى مستوى من الأداء وتناسب تطبيقات التعليم العميق — بمقدور Perplexity إنشاء إجابات بإنتاجية أعلى بكثير من ذي قبل. وفي الواقع، يمكن للشركة التعامل في فترات الذروة مع 10000 مستخدم في وقت واحد وأكثر من 100000 استعلام في الساعة دون التأثير على زمن الاستجابة أو تجربة المستخدم. وتستضيف Perplexity أيضًا نموذج Llama 2 المتاح للجمهور على مثيلات HAQM EC2 P5، وتستخدم خدمة HAQM SageMaker HyperPod من أجل الضبط الدقيق لهذا النموذج المفتوح المصدر باستخدام بياناتها الخاصة. بالإضافة إلى أن الضبط الدقيق للنماذج يساعد في تحسين دقة الاستجابات ومدى صلتها، مما يؤدي إلى تخصيص هذا النموذج ليلبي احتياجات محرك الإجابات التابع لـ Perplexity.

النتيجة | الارتقاء بمستوى الذكاء الاصطناعي المولّد باستخدام خدمات الذكاء الاصطناعي/تعلّم الآلة والبنية التحتية لـ AWS

تستعد Perplexity لتحقيق إنجازات جديدة في مجال الذكاء الاصطناعي المولّد، استنادًا إلى نجاحاتها السابقة. وفي إطار استراتيجيتها المتطلعة للمستقبل، ستجري الشركة تجارب على AWS Trainium، وهو عبارة عن مسرّع تدريب لنماذج تعلّم الآلة يقدم مستوى أداء عاليًا، بهدف تحسين معدل نقل البيانات للتدريب بشكل أكبر. وأطلقت Perplexity أيضًا واجهة برمجة تطبيقات لمنح المستخدمين إمكانية الوصول إلى الخاصة بها، التي تعمل بالكامل على AWS وتم تحسينها بواسطة HAQM SageMaker HyperPod.

لتوسيع قاعدة المعرفة لدى Perplexity وتقديم إجابات أكثر دقة لمستخدميها، اعتمدت Perplexity أيضًا HAQM Bedrock، وهي خدمة مُدارة بالكامل تقدم مجموعة مختارة من نماذج التأسيس صاحبة الأداء العالي من شركات رائدة في مجال الذكاء الاصطناعي باستخدام واجهة برمجة تطبيقات واحدة. على سبيل المثال، بدأت شركة Perplexity في استخدام Claude 2 من خلال HAQM Bedrock لدمج القدرات المتقدمة للرياضيات وكتابة التعليمات البرمجية والاستدلال في خدمتها.

وفي هذا السياق، يقول Srinivas: "في AWS، القوة بين يدي العميل". ويضيف قائلاً: "لا توجد متطلبات تُلزِمك باستخدام خدمات معينة. ودائمًا ما يقول لنا فريق AWS: "عليك أن تفعل الأفضل لعملائك. عليك أن تفعل الأفضل لعملك". هذه المواءمة مع احتياجات العميل هي ما نحبه حقًا في AWS".

نبذة عن Perplexity

تعمل شركة Perplexity في الوقت الحالي على إنشاء محرك إجابات عملي وحواري يتم تحسينه لمساعدة المستخدمين في العثور على المعلومات بدلاً من الترويج للإعلانات ولكلمات أساسية محددة.

خدمات AWS المُستخدمة

HAQM SageMaker HyperPod

تمنحك HAQMSageMaker HyperPod ميزة التخلص من الأعباء الروتينية الشاقة المرتبطة بإنشاء البنية التحتية للتعلّم الآلة (ML) وتحسينها عند تدريب نماذج التأسيس، مما يثمر عن تقليص وقت التدريب بنسبة تصل إلى 40%.

معرفة المزيد »

مثيلات HAQM EC2 P5

توفر مثيلات HAQM Elastic Compute Cloud (HAQM EC2) P5، المدعومة بأحدث وحدات معالجة الرسومات من نوع NVIDIA H100 Tensor Core، أعلى مستوى من الأداء في مثيلات HAQM EC2 لتطبيقات الحوسبة عالية الأداء (HPC) والتعليم العميق.

معرفة المزيد »

مثيلات HAQM EC2 P4de

تعمل مثيلات P4de بواسطة 8 وحدات معالجة رسومات من نوع NVIDIA A100 مزودة بذاكرة عالية الأداء من نوع HBM2e بسعة 80 جيجابايت لوحدة معالجة الرسومات، وهي أعلى بمقدار الضعفين من وحدات معالجة الرسومات في مثيلات P4d الحالية.

معرفة المزيد »

HAQM Bedrock

HAQM Bedrock هي خدمة مُدارة بالكامل توفر مجموعةً من نماذج التأسيس (FM) عالية الأداء مقدمة من شركات رائدة في مجال الاصطناعي، مثل AI21 Labs وAnthropic وCohere وMeta وStability AI وHAQM من خلال واجهة برمجة تطبيقات واحدة، إلى جانب مجموعة واسعة من الإمكانات التي تحتاج إليها لإنشاء تطبيقات الذكاء الاصطناعي المولّد مع التمتع بالأمان والخصوصية والذكاء الاصطناعي المسؤول.

معرفة المزيد »

المزيد من قصص عملاء البرامج والإنترنت

لا توجد عناصر 

1

بدء استخدام HAQM SageMaker على الطبقة المجانية

ضِمن الطبقة المجانية من AWS، يمكنك بدء استخدام HAQM SageMaker مجانًا. تبدأ النسخة التجريبية المجانية التي مدتها شهران اعتبارًا من الشهر الأول الذي تنشئ فيه مورد SageMaker الأول.