kotak-logo
Products
Platform
Research
Market
Learn
Partner
Support
IPO
स्टॉक स्क्रीनेर (stock screener) यूज़िंग एआई (using AI) Logo Light Mode

Kotak

Stockshaala

Module 8
टेस्टिंग & ऑप्टिमाइजेशन (testing & optimization)
Course Index
Read in
English
हिंदी

Chapter 2 | 2 min read

फाइनेंशियल एआई (financial AI) में ओवरफिटिंग (overfitting) से बचाव

AI models पैटर्न्स को पहचानने में बहुत अच्छे होते हैं।

लेकिन कभी-कभी, वे पुराने डेटा में पैटर्न्स को इतना अच्छे से पहचानने लगते हैं कि वे भविष्य के लिए सबक सीखने के बजाय अतीत को ही याद करने लगते हैं।

इस समस्या को ओवरफिटिंग (overfitting) कहा जाता है।

ओवरफिटिंग तब होता है जब एक AI मॉडल पिछले डेटा की हर छोटी-छोटी डिटेल को सीख लेता है, जिसमें रैंडम नॉइज़ भी शामिल होता है।

यह ऐतिहासिक आंकड़ों पर शानदार प्रदर्शन करता है लेकिन नए, अनदेखे डेटा पर असफल हो जाता है।

सोचिए एक स्टूडेंट जो पिछले साल के प्रश्न पत्र की हर लाइन याद कर लेता है। वह प्रैक्टिस टेस्ट में टॉप कर सकता है लेकिन नए सवालों के आने पर बुरी तरह से फेल हो सकता है।

यह बिल्कुल वैसे ही है जैसे एक ओवरफिटेड स्क्रीनेर का व्यवहार होता है।

मार्केट्स नॉइज़ी होते हैं। कंपनी के नतीजे, वैश्विक समाचार, और यहां तक कि अफवाहें भी स्टॉक प्राइस को प्रभावित करती हैं।

अगर AI इस पूरे नॉइज़ से "सीखना" शुरू कर देता है, तो यह ऐसे फिल्टर्स बना सकता है जो बैकटेस्ट्स में परफेक्ट दिखते हैं लेकिन लाइव मार्केट्स में ध्वस्त हो जाते हैं।

उदाहरण:

एक स्क्रीनेर जो 2020–2021 के बुल रन पर ट्रेंड करता है, यह मान सकता है कि "हर डिप एक खरीदारी है।" लेकिन एक साइडवेज़ या बेयरिश मार्केट में, यह नियम बुरी तरह से फेल हो जाएगा।

  • मॉडल पिछले डेटा पर बहुत उच्च एक्यूरेसी दिखाता है लेकिन नए डेटा पर खराब परिणाम देता है।
  • स्क्रीनेर जटिल कंडीशंस देता है जो स्मार्ट लगती हैं लेकिन वास्तविक ट्रेड्स में काम नहीं करतीं।
  • जब आप एक छोटा सा फिल्टर भी बदलते हैं, तो परिणाम नाटकीय रूप से बदल जाते हैं।
  • सरल नियमों का उपयोग करें: कम कंडीशंस आमतौर पर ओवरली कॉम्प्लेक्स वालों से बेहतर परफॉर्म करती हैं।
  • नए डेटा पर टेस्ट करें: हमेशा स्क्रीनेर को ऐसे डेटा पर चेक करें जो उसने पहले नहीं देखा हो।
  • क्रॉस-वैलिडेशन (cross-validation): एक पीरियड के बजाय, कई समय पीरियड्स में टेस्ट करें।
  • लॉजिक पर ध्यान दें: हर फिल्टर का एक मार्केट-बेस्ड कारण होना चाहिए, न कि सिर्फ एक सांख्यिकीय।

उदाहरण

मान लीजिए एक AI स्क्रीनेर पाता है कि “मिड-कैप IT स्टॉक्स जिनका RSI 25 से कम है और प्रॉफिट ग्रोथ 15% से ऊपर है, हमेशा 10 दिनों के भीतर बाउंस बैक करते हैं।”

यह एक लिमिटेड बैकटेस्ट में सही हो सकता है। लेकिन जब तक आप इसे विभिन्न वर्षों, सेक्टर्स, और कंडीशंस पर टेस्ट नहीं करते, यह सिर्फ एक संयोग की याददाश्त है।

ओवरफिटिंग AI को जितना स्मार्ट दिखाता है, उतना होता नहीं है।

फाइनेंस में, यह खतरनाक है क्योंकि मार्केट्स कभी भी अतीत को उसी तरह से नहीं दोहराते।

अपने प्रम्प्ट्स और रूल्स को सिंपल रखें, उन्हें ताजे डेटा पर टेस्ट करें, और हमेशा पूछें: “क्या यह फिल्टर वास्तविक जीवन में समझ में आता है, या यह सिर्फ पुराने चार्ट्स को फिट कर रहा है?”

लक्ष्य कल के डेटा पर परफेक्ट होना नहीं है, बल्कि कल के मार्केट्स के लिए उपयोगी रहना है।

This content has been translated using a translation tool. We strive for accuracy; however, the translation may not fully capture the nuances or context of the original text. If there are discrepancies or errors, they are unintended, and we recommend original language content for accuracy.

Is this chapter helpful?
Previous
ऐतिहासिक डेटा (historical data) के साथ बैकटेस्टिंग (backtesting)
Next
फॉल्स पॉजिटिव्स (False Positives) और फॉल्स नेगेटिव्स (False Negatives)

Discover our extensive knowledge center

Explore our comprehensive video library that blends expert market insights with Kotak's innovative financial solutions to support your goals.

PreviousCourse IndexNext