बिटकॉइन की कीमत की भविष्यवाणी - मॉडल की तुलना कैसे करें

हम बिटकॉइन मूल्य भविष्यवाणी के लिए सबसे अच्छी विधि कैसे चुन सकते हैं? इस टुकड़े में, हम 2019 में बिटकॉइन मूल्य भविष्यवाणी के लिए अलग-अलग मशीन सीखने के तरीकों के साथ प्रकाशित हमारे लेख की व्याख्या करते हैं। खोज की गई तकनीकों में LSTM, Wavenet, ARIMA, SVM और रैंडम फ़ॉरेस्ट हैं।

अगर चुने हुए मॉडल सबसे अच्छा है तो हम कैसे सुनिश्चित कर सकते हैं? मॉडल तुलनात्मक समस्या संभवतः डेटा वैज्ञानिक / मशीन लर्निंग इंजीनियरिंग के लिए मुख्य चिंताओं में से एक है। मूल्य पूर्वानुमान के क्षेत्र में, ऐसी विधियों का एक समूह है जो वैज्ञानिक आमतौर पर अनुसरण करते हैं। हम मॉडल की तुलना करने और उनके संचालन के अंतर्ज्ञान प्रदान करने के लिए कुछ तरीकों को सूचीबद्ध करने जा रहे हैं।

रोलिंग खिड़की

मशीन लर्निंग प्रयोगों में, प्रशिक्षण, सत्यापन और परीक्षण भाग में सेट किए गए डेटा को विभाजित करना एक मानक प्रक्रिया है। इस विभाजन के साथ, मॉडल को प्रशिक्षित किया जा सकता है, और प्रशिक्षण चरण के दौरान, उस मॉडल को खोजने के लिए मूल्यांकन किया जाता है जो समस्या से सामान्य रूप से निपटने से बचता है। अंत में, मॉडल का परीक्षण किया जाता है, और अन्य मॉडलों की तुलना में त्रुटि मैट्रिक्स उत्पन्न होती है।

त्रुटियों के वितरण को प्रदान करने के लिए k- गुना क्रॉस-वैधीकरण तकनीक का उपयोग करना भी आम है, जिससे यह पता लगाना संभव हो सके कि क्या मॉडल उस समय के बीच अलग हैं।

उदाहरण के लिए, यदि हम किसी मॉडल को टाइम-सीरीज़ के भविष्य की कीमत का अनुमान लगाने के लिए प्रशिक्षित करते हैं, तो हम एक श्रृंखला ओ-पूर्वानुमानित मान उत्पन्न करेंगे जिसकी तुलना मूल्यों के मूल सेट के साथ की जाएगी। फिर, उपलब्ध त्रुटि मेट्रिक्स के कई (जैसे, एमएपीई, एमपीई, आरएमएसई, एमएसई) में से एक त्रुटि उत्पन्न होती है।

हालांकि, एकमात्र समस्या परीक्षण सेट की पसंद के प्रति पूर्वाग्रह है। यह संभव है कि उपयोग किए गए परीक्षण सेट मॉडल के लिए उल्लेखनीय रूप से बेहतर थे, फलस्वरूप, इसके कारण असाधारण प्रदर्शन हुआ।

यदि हम एक परीक्षण सेट की त्रुटि मीट्रिक प्रदान नहीं करते हैं, लेकिन एक ही परीक्षा मीट्रिक में एक ही त्रुटि मीट्रिक का वितरण प्रदान करते हैं तो परीक्षण पूर्वाग्रह से बचना संभव है। K- गुना दृष्टिकोण इस वितरण को उत्पन्न कर सकता है।

k- गुना प्रतिनिधित्व - विकिपीडिया चित्रा

के-गुना ज्यादातर क्या करता है, डेटा सेट को कई प्रशिक्षण और परीक्षण सेटों में विभाजित करना है ताकि हम चुने हुए त्रुटि मैट्रिक का वितरण कर सकें। त्रुटियों के वितरण के साथ, माध्य और मानक विचलन की गणना करना संभव है, इसलिए हमारे पास विभिन्न समय-श्रृंखला शासनों के तहत एक बेहतर धारणा मॉडल व्यवहार है।

जिस रूप में के-फोल्ड प्रस्तावित है, वह समय-श्रृंखला की भविष्यवाणी की समस्या के लिए आवश्यक रूप से पर्याप्त नहीं है। एक परिकल्पना है कि प्रशिक्षण सेट में निरंतरता होनी चाहिए और प्रदर्शन को अधिकतम करने के लिए परीक्षण सेट से पहले होना चाहिए। इसलिए, रोलिंग विंडो दृष्टिकोण एक अलग तरह के k- गुना के रूप में बढ़ता है।

एक पूर्व निर्धारित आकार से प्रशिक्षण, सत्यापन और परीक्षण सेट को स्थानांतरित करके, निरंतरता बनाए रखने और परीक्षण सेट से पहले प्रशिक्षण सेट के साथ विभिन्न सेट प्राप्त करना संभव है। इस तकनीक को वॉक फॉरवर्ड टेस्टिंग के रूप में भी जाना जाता है।

रोलिंग विंडो विज़ुअलाइज़ेशन

हाइपरपरमेटर खोज

एक महत्वपूर्ण पहलू जिसे आमतौर पर विभिन्न प्रकाशनों के प्रति पूर्वाग्रह के रूप में नहीं देखा जाता है, वह है मॉडल की तुलना पर हाइपरपरमेटर का प्रभाव।

सबसे पहले, हम कैसे परिभाषित कर सकते हैं कि एक हाइपरपरमीटर क्या है? एक सीधी परिभाषा यह है कि हाइपरपरमीटर एक पैरामीटर है जिसका मूल्य सीखने की प्रक्रिया शुरू होने से पहले निर्धारित होता है। प्रशिक्षण चरण के दौरान, केवल मॉडल मापदंडों को फिट कार्यों के लिए संशोधित किया जाएगा, न कि हाइपरपरमेटर्स।

हमारे प्रकाशित काम में, हम सभी तुलनात्मक एल्गोरिदम के लिए हाइपरपैरमीटर के यादृच्छिक खोज अनुकूलन (यादृच्छिक खोज के उपयोग के लिए एक तर्क यहां देखें) का पता लगाते हैं। यह विधि हाइपरपरेटस पूर्वाग्रह से बचाती है। यह संभव है कि हाइपरपरमेटर्स के एक छोटे से नमूने के लिए, नए एल्गोरिथ्म परीक्षण में दूसरों की तुलना में बेहतर प्रदर्शन होता है। हालांकि, सभी संभावित परिणामों के लिए, नया एल्गोरिथ्म बिल्कुल बेहतर नहीं है।

कई अलग-अलग हाइपरपेरेटरी ऑप्टिमाइज़ेशन मेथड लागू किए जा सकते हैं, लेकिन वे सरल होने चाहिए जो सभी तुलना किए गए मॉडल के लिए उपयोग किए जा सकें।

छवि स्रोत: बर्गस्त्र, जे।, बेंगियो, वाई .: हाइपर-पैरामीटर अनुकूलन के लिए यादृच्छिक खोज। जर्नल ऑफ मशीन लर्निंग रिसर्च 13, 281–305 (2012)

मतभेदों का सांख्यिकीय महत्व

अब जब सर्वश्रेष्ठ हाइपरपैरेटर्स संयोजन के लिए त्रुटियों का वितरण स्थापित किया गया था, तो सभी मशीन लर्निंग एल्गोरिदम को खोजना संभव है, हम यह कैसे सुनिश्चित कर सकते हैं कि वितरण का मतलब अलग है?

सांख्यिकीय परीक्षणों का एक समूह है जो दो अलग-अलग वितरणों की तुलना करने के लिए निष्पादित किया जा सकता है। निम्नलिखित आंकड़ा एक भयानक सारांश व्यक्त करता है जिसका पालन किया जा सकता है:

स्रोत: वानिंग बी, मोंटगैन एम: फार्माकोएपिडेमियोलॉजी: सिद्धांत और अभ्यास: http://acesspharmacy.com

उपरोक्त आंकड़े से, यह निष्कर्ष निकालना संभव है कि हमारे कुछ मूलभूत प्रश्न हैं:

क्या मेरा डेटा निरंतर या असतत है? आमतौर पर, बिटकॉइन टाइम-सीरीज़ के लिए, हम मूल्य इतिहास का विश्लेषण कर रहे हैं, जो निरंतर डेटा है, और भविष्यवाणी भी निरंतर हो सकती है जैसे कि भविष्य की कीमत या भविष्य का रिटर्न। यदि मूल्य ऊपर या नीचे जा रहा है, तो वर्गीकृत करके निरंतर डेटा को एक असतत भविष्यवाणी में बदल दिया जा सकता है। इनपुट भी असतत डेटा हो सकता है जैसे कि एनएलपी समाचार की भावना या संपत्ति से जुड़ा कोई सामान्य श्रेणीबद्ध डेटा।

केवल एक चर के साथ निरंतर डेटा के लिए, एक आवश्यक परीक्षण सामान्यता परीक्षण है। कोल्मोगोरोव-स्मिरनोव या शापिरो-विल्क परीक्षण सामान्यता को सत्यापित कर सकते हैं। मामले में एक से अधिक स्वतंत्र चर हैं, तो आपको क्यू-स्क्वायर, जी परीक्षण, फिशर का सटीक परीक्षण या द्विपद परीक्षण का उपयोग करना चाहिए। नीचे दिया गया आंकड़ा एक और निर्णय प्रवाह दिखाता है जिसका अनुसरण किया जाना चाहिए (भाषा के लिए खेद है)।

स्रोत: मार्को मेलो (http://marcoarmello.wordpress.com)

अंतिम टिप्पणियाँ और निष्कर्ष

मॉडल की तुलना करने के लिए, कई संभावित तरीके हैं, और यहां केवल विवरणों को प्राप्त किए बिना, उनमें से कुछ का पता लगाया गया था। इसे एकजुट करना और सभी संभावित पूर्वाग्रहों और समस्याओं से निपटना कभी-कभी कम्प्यूटेशनल रूप से महंगा हो सकता है। शैक्षणिक उद्देश्यों के लिए, उपयोग किए जाने वाले तरीके अत्यधिक निर्भर करते हैं कि आप अपने पेपर और समस्या के प्रकार को प्रकाशित करने के लिए कहां जा रहे हैं।

सभी तरीकों को लागू करने के बाद, हम परिणाम उत्पन्न कर सकते हैं, जैसे कि हमारे लेख में दिखाया गया है।

हमारे प्रकाशित लेख से तालिका

ये परिणाम बिटकॉइन समय-श्रृंखला की भविष्यवाणी से अधिक हैं। पहले वर्णित सभी विधियों को लागू करने के बाद भी ARIMA और SVR का सर्वश्रेष्ठ प्रदर्शन था। इस अध्ययन के साथ एक मुख्य समस्या पूर्ण मूल्य मूल्यों का उपयोग है और रिटर्न नहीं है, जो मॉडल फिटिंग के लिए प्रभावशाली हो सकता है।

भविष्य के संदर्भ और अधिक विवरण के लिए, आप मूल प्रकाशन तक पहुँच सकते हैं: https://ieeexplore.ieee.org/abstract/document/8963009

इसके अलावा, परीक्षण और प्रजनन के लिए, GitHub में सभी कोड उपलब्ध हैं

डिस्कवर और सबसे अच्छा पेशेवर व्यापार सॉफ्टवेयर की समीक्षा करें