شغبت (ChatGPT) وغيرها من الدردشات التي تعمل بتجهيز اللغة الطبيعية (الـ NLP) قد دمّرت وصولًا ديمقراطيًا إلى نماذج لغوية ضخمة (LLMs)، تقديم أدوات تسهل تقنيات الاستثمار المتطورة والقابلية للتوسع. هذا يغير كيف نفكر في الاستثمار ويعيد تشكيل الأدوار في مهنة الاستثمار.
جلست مع برايان بيسانيشي، CFA، عالم بيانات الاستثمار كبير في معهد CFA، لمناقشة تقريره الأخير، الذي يوفر للمحترفين في الاستثمار الراحة اللازمة لبدء بناء LLMs في مجتمع مفتوح المصدر.
سيجذب التقرير مديري المحافظ ومحللي البيانات الذين يرغبون في التعرف على المزيد حول البيانات البديلة وغير المهيكلة وكيفية تطبيق تقنيات تعلم الآلة (ML) على سير العمل الخاص بهم.
“البقاء على اطلاع على الاتجاهات التكنولوجية، وإتقان لغات البرمجة لتجزئة البيانات المعقدة، وكون الواعي بالأدوات التي تعزز سير العمل الخاص بنا هي ضرورات تسهم في دفع الصناعة للأمام في مجال الاستثمار التقني المتزايد…”، يقول بيسانيشي.
“البيانات غير المهيكلة والذكاء الاصطناعي: ضبط الـ LLMs لتعزيز العملية الاستثمارية” تغطي بعض التفاصيل الحساسة لإحدى المجالات التي تحدد بسرعة العمليات الاستثمارية الحديثة – البيانات البديلة وغير المهيكلة. البيانات البديلة تختلف عن البيانات التقليدية – مثل التقارير المالية – وغالباً ما تكون في شكل غير هيكل مثل ملفات PDF أو مقالات الأخبار، كما يوضح بيسانيشي.
ينصح بضرورة استخدام أساليب خوارزمية أكثر تطورًا للحصول على رؤى من هذه البيانات. يضيف أن الـ NLP، الفرع الفرعي لتعلم الآلة الذي يحلل اللغة المنطوقة والمكتوبة، مناسب تحديدًا للتعامل مع العديد من مجموعات بيانات البديل وغير المهيكلة.
دراسة حالة ESG تظهر قيمة الـ LLMs
تجمع التقدمات في الـ NLP، وزيادة هائلة في قوة الحوسبة، ومجتمع مفتوح المصدر بناء النماذج الاصطناعية الذكية المولدة (GenAI). من الحرج جديًا أن GenAI، على عكس سلفه، لديه القدرة على إنشاء بيانات جديدة من خلال التمديد من البيانات التي يتم تدريبه عليها.
في تقريره، يظهر بيسانيشي قيمة بناء الـ LLMs من خلال تقديم دراسة حالة للاستثمار في البيئة والاجتماع والحوكمة (ESG)، تعرض استخدامها في تحديد الكشفات المهمة المتعلقة بالـ ESG من خلال تغذية وسائل التواصل الاجتماعي للشركة. يعتقد أن مجال الـ ESG هو مجال جاهز لاعتماد الذكاء الاصطناعي والذي يمكن استخدام البيانات البديلة لاستغلال الفجوات لالتقاط عوائد الاستثمار.
دفعت قدرة الـ NLP المتزايدة والإدراك المتزايد للتحقيقات من البيانات على وسائل التواصل الاجتماعي بيسانيشي لإجراء الدراسة. ومع ذلك، يشير إلى أن بعض البيانات المنشورة على وسائل التواصل الاجتماعي التي استخدمت في الدراسة لم تعد مجانية. هناك اعتراف متزايد بقيمة البيانات التي تتطلبها شركات الذكاء الاصطناعي لتدريب نماذجها، يوضح.
ضبط الـ LLMs لتعزيزها
تحتوي الـ LLMs على استخدامات لا حصر لها بسبب قدرتها على التخصيص في عملية تسمى ضبط الـ fine-tuning. خلال عملية الضبط، يقوم المستخدمون بإنشاء حلول حسب الطلب تدمج تفضيلاتهم الخاصة. يستكشف بيسانيشي هذه العملية من خلال تحديد التقدمات في الـ NLP وإنشاء نماذج جبهة مثل ChatGPT. كما يقدم هيكلًا لبدء عملية الضبط.
لقد تغيّرت ديناميات الضبط الجيد للنماذج اللغوية الصغيرة مقابل استخدام النماذج الجبهية الكبرى لأداء المهام التصنيفية منذ إطلاق ChatGPT. “هذا لأن الضبط الجيد التقليدي يتطلب كميات كبيرة من البيانات التي قام الإنسان بتسميتها، بينما يمكن للنماذج الجبهية أن تؤدي المهام التصنيفية باستخدام أمثلة قليلة فقط من مهمة التسميه.” يوضح بيسانيشي.
لا يزال الضبط الجيد التقليدي على النماذج اللغوية الصغيرة يمكن أن يكون أكثر كفاءة من استخدام النماذج الجبهية الكبيرة عندما تتطلب المهمة كمية كبيرة من البيانات المسماة لفهم الدقة بين التصنيفات.
قوة البيانات البديلة على وسائل التواصل الاجتماعي
تسلط البحث لبيسانيشي الضوء على قوة تقنيات تعلم الآلة التي تحلل البيانات البديلة المستمدة من وسائل التواصل الاجتماعي. قد تكون القيمة الخاصة بالـ ESG أكثر مكافأة في الشركات قليلة الرأسمالية، بسبب القدرة الجديدة على الحصول على معلومات أقرب إلى الوقت الحقيقي من إفصاحات وسائل التواصل الاجتماعي من التقارير المستدامة أو مكالمات المؤتمرات للمستثمرين، يشير. “إنه يؤكد على الإمكانيات التي تتيحها البيانات العديدة الاختلافات في بيانات ESG عندما تُطبق على شركة صغيرة.”
يضيف: “يعرض البحث الأرض المثمرة لاستخدام وسائل التواصل الاجتماعي أو المعلومات العامة في الوقت الفعلي الأخرى. ولكن بشكل أكبر، يؤكد على كيف بمجرد أن لدينا البيانات، يمكننا تخصيص بحوثنا بسهولة عن طريق تقطيع البيانات والبحث عن أنماط أو تناقضات في الأداء.”
ينظر البحث في الفرق في الجدوى حسب حجم رأس المال السوقي، ولكن بيسانيشي يقول إنه يمكن تحليل فرق آخر، مثل الفروق في الصناعة، أو آلية تزيين مختلفة في الفهرس لإيجاد أنماط أخرى.
“أو يمكننا توسيع مهمة التسمية لتضمن فصولًا أخرى جوهرية أو التركيز على تفاصيل الإفصاح. الإمكانيات محدودة فقط بالإبداع في الباحث”، يقول.
استبيان المعهد المصرفي المهني ومركز البحث والسياسات لعام 2023 – الذكاء الاصطناعي الجينيراتيف/البيانات غير المهيكلة، والمصدر المفتوح – دليل قيم للمحترفين في الاستثمار. يستكشف 1،210 استجابة، فيما ينغمس في البيانات البديلة التي يستخدمها المحترفون في الاستثمار وكيفية استخدام GenAI في سير عملهم.
يغطي الاستبيان المكتبات ولغات البرمجة الأكثر قيمة لأجزاء مختلفة من سير عمل المحترف في الاستثمار المتعلقة بالبيانات غير المهيكلة ويوفر موارد قيمة من مصادر بيانات بديلة مفتوحة المصدر أعدها مشاركو الاستبيان.
مستقبل مهنة الاستثمار يتجذر بقوة في التعاون المشترك بين الذكاء الاصطناعي والبشري وقدراتهم الإدراكية المكملة لبعضها البعض. يمكن أن يرمز إلى إدخال GenAI إلى مرحلة جديدة من المقولة الإضافية للذكاء الاصطناعي بالجانب البشري.
Leave a reply