پردازش کلان داده با قابلیت هوش مصنوعی برای کاربردهای دنیای واقعی اینترنت اشیا
یک سیستم پیشنهادی معاملات سهام LSTM-GA جدید در اینترنت اشیا
چکیده
اینترنت اشیا (IoT) نقش مهمی در بخش مالی در دهههای اخیر بازی میکند، زیرا چندین مدل پیشبینی سهام را میتوان با دقت بر اساس خدمات مبتنی بر اینترنت اشیا انجام داد. در برنامه های بلادرنگ، دقت پیش بینی نوسانات قیمت سهام برای سرمایه گذاران بسیار مهم است و به سرمایه گذاران کمک می کند تا هنگام تدوین استراتژی های معاملاتی، سرمایه های خود را بهتر مدیریت کنند. استفاده از ابزارهای پیش بینی برای به دست آوردن مقادیر پیش بینی شده نزدیک به مقادیر واقعی از مجموعه داده های مالی معین، همیشه یک هدف و مشکل دشوار برای محققان مالی بوده است. شاخص های پیشرو مانند معاملات آتی و گزینه ها می توانند منعکس کننده تغییرات در بسیاری از بازارها مانند رونق صنعت باشند. افزودن مجموعه داده های شاخص های پیشرو می تواند روند قیمت سهام را به خوبی پیش بینی کند. در این تحقیق، یک استراتژی معاملاتی برای یافتن سیگنالهای معاملاتی سهام پیشنهاد شده است که شبکههای عصبی حافظه کوتاهمدت را با الگوریتمهای ژنتیک ترکیب میکند. این چارچوب جدید شبکه عصبی حافظه کوتاه مدت بلند مدت با شاخص پیشرو یا به اختصار LSTMLI نامیده می شود. بنابراین، ما بازارهای سهام ایالات متحده و تایوان را به عنوان اهداف تحقیق در نظر می گیریم و از داده های تاریخی، معاملات آتی و گزینه ها به عنوان مجموعه داده برای پیش بینی قیمت سهام این دو بازار استفاده می کنیم. پس از آن، از الگوریتم های ژنتیک برای یافتن سیگنال های معاملاتی برای سیستم معاملاتی سهام طراحی شده استفاده می کنیم. نتایج تجربی نشان میدهد که سیستم معاملات سهام پیشنهادی در این تحقیق میتواند به سرمایهگذاران در کسب بازده معین کمک کند.
1. مقدمه
مدل اینترنت اشیا (IoT) نقش مهمی را در سالهای اخیر بازی میکند، زیرا بسیاری از برنامهها و سرویسها به خدمات مبتنی بر اینترنت اشیا متکی هستند. در بخش مالی، خدمات مبتنی بر اینترنت اشیا [1] شامل بانکداری، بیمه و سرمایه گذاری است. پیشبینی یا پیشبینی [2] جالبترین چیز در بازار مالی است و بسیاری از مطالعات [3، 4] خدمات مبتنی بر اینترنت اشیا را برای دستیابی به دقت بالاتر مستقر میکنند. لی و همکاران[5] توسعه اینترنت اشیا را مورد مطالعه قرار داد و از یادگیری عمیق برای پیش بینی روند قیمت سهام استفاده کرد. یانگ و همکاران[6] یک الگوریتم داده کاوی جدید برای مطالعه اینترنت چند رسانه ای اشیا و پایداری سهام پیشنهاد کرد. بازار مالی مکانیزمی برای تعیین قیمت وجوه مالی و معاملات دارایی های مالی است. بازاری است که تامین مالی اوراق بهادار و داد و ستد اوراق بهادار را امکان پذیر می کند. بازار سرمایه را «بازار مالی بلندمدت» نیز مینامند که عمدتاً شامل بازار سهام، بازار سرمایه و بازار اوراق قرضه میشود. نوسانات آن می تواند میزان ریسک دارایی ها را منعکس کند. نوسان قیمت سهام نقش بسزایی در زمان بندی مناسب خرید و فروش سهام دارد [7]. برای سرمایه گذاران، معنای واقعی سرمایه گذاری در بازار سهام، کسب بازدهی فوق العاده از طریق خرید کم و فروش بالا است، بنابراین پیش بینی نوسانات قیمت سهام مورد توجه ویژه سرمایه گذاران خصوصی و شرکت های سرمایه گذاری قرار گرفته است [8]. با توجه به حجم زیاد داده ها در سهام، همبستگی پایین داده ها و بسیاری از عوامل موثر بر قیمت سهام، بازارهای مالی مملو از عدم قطعیت هستند که پیش بینی نوسانات قیمت سهام را نیز به یک مشکل مهم برای محققان سهام تبدیل می کند. در ابتدا، مردم چندین بار نوسانات قیمت سهام را پیشبینی کرده بودند [9، 10]، اما نتایج رضایتبخش نبود.
سرمایه گذاران کاملا منطقی نیستند. برای مثال، افراد ممکن است در لحظات خاصی احساسات مثبت یا منفی داشته باشند [11-15]. بنابراین، پس از طرح این فرضیه، هم حمایت و هم مخالفت وجود داشت، بنابراین به یکی از بحث برانگیزترین نظریه های سرمایه گذاری تبدیل شد [16، 17]. برخی از محققین بر این باورند که اگر بتوان سیگنال های معاملاتی [18] سهام را پیدا کرد، می توان سهام را در زمان مناسب خرید و فروش کرد تا سود نسبتاً بالایی به دست آورد. یافتن سیگنال های معاملاتی دقیق سهام، کلید کسب بازدهی عظیم است، یعنی در معاملات سهام، زمانی که سیگنال خرید ظاهر می شود، سهام خریداری می شود و زمانی که سیگنال فروش ظاهر می شود، سهام فروخته می شود. به عبارت دیگر، اگر می خواهید ارزش سود خوبی را در طول معامله به دست آورید، سهام باید با قیمت پایین تری خریداری شود اما با قیمت بالاتر فروخته شود. سیگنال های معاملاتی سهام همیشه هدف اصلی سرمایه گذاران و شرکت های سرمایه گذاری بوده است. محققان همچنین بارها سعی کرده اند بهترین سیگنال های خرید و فروش را پیش بینی کنند، اما از آنجایی که عوامل زیادی بر قیمت سهام تأثیر می گذارند، نتایج پیش بینی رضایت بخش نیست.
ماشین بردار پشتیبان (SVM) یک مدل طبقه بندی باینری [19] است و عملکرد طبقه بندی خوبی در زمینه یادگیری ماشین دارد. هوانگ و همکاران[20] در سال 2005 دریافتند که SVM نتایج پیشبینی بهتری نسبت به روشهای آماری سنتی دارد. نایاک و همکاران[21] یک مدل ترکیبی برای پیشبینی شاخصهای سهام هند پیشنهاد کرد. این مدل عمدتا از دو الگوریتم یادگیری ماشین، یعنی SVM و k-nearest همسایه (KNN) استفاده می کند. مطالعات نشان داده است که مدل ترکیبی پیشنهادی آنها مقیاس پذیری و قابل پیش بینی خوبی برای داده های با ابعاد بالا دارد. اگرچه نتایج پیشبینی SVM در مقایسه با سایر مدلها به طور قابلتوجهی بهبود یافته است [22، 23]، اما هنوز برای پیشبینی سهام رضایت بخش نیست. مدل شبکه عصبی توجه خاصی را به خود جلب کرده است. از آنجایی که مدلهای شبکه عصبی میتوانند روابط غیرخطی را در مجموعههای داده شناسایی کنند، بسیاری از محققان آن را تحلیل کردهاند و نوسانات قیمت سهام را بر اساس شبکههای عصبی مختلف پیشبینی کردهاند نیز نتایج نسبتاً خوبی به دست آوردهاند. برای سهام بورس توکیو، کیموتو و همکاران.[24] یک مطالعه سیستماتیک انجام داد. آنها یک سیستم پیش بینی سهام مبتنی بر شبکه های عصبی را پیشنهاد کردند و این سیستم در آموزش به سود نسبتا خوبی دست یافت.
با افزایش یادگیری ماشین ، یادگیری عمیق [25] توجه محققان مختلف سهام را به خود جلب کرده است. این مکانیسم مغز انسان را برای پردازش داده ها تحریک می کند و می تواند روابط غیرخطی را در داده ها تشخیص دهد. در این سند [26] ، استفاده از یادگیری ماشین در بازارهای مالی با جزئیات توضیح داده شده است. یک شبکه عصبی مکرر [27 ، 28] نوعی یادگیری عمیق مبتنی بر پیش بینی غیرخطی است. در سال 2017 ، فیشر و کراوس [29] یک مطالعه در مقیاس بزرگ انجام دادند. آنها روزانه استفاده می کردند
500 داده برای اندازه گیری عملکرد پیش بینی LSTM در مقایسه با سایر شبکه های عصبی. نتایج تحقیق نشان می دهد که عملکرد پیش بینی مدل LSTM بهترین است. در این مقاله [30] از RNN LSTM برای پیش بینی سهام و محاسبه بازده بر اساس قیمت های بسته شده استفاده می کند. نتایج تجربی نشان می دهد که عملکرد مدل LSTM بهتر از شبکه عصبی مصنوعی Feedforward است.
قبل از ظهور شبکه های عصبی مکرر ، هر دو شبکه عصبی مصنوعی و شبکه های عصبی حلقوی (CNN) به نتایج پیش بینی خوبی دست یافتند [31 ، 32]. به عنوان مثال ، با وارد کردن یک تصویر ، شبکه عصبی حلقوی می تواند به طور دقیق پیش بینی کند که تصویر گربه است یا یک سگ. با این حال ، از آنجا که ورودی های شبکه عصبی حلقوی مستقل از یکدیگر هستند و بر اساس داده های لحظه قبلی نمی توان پیش بینی کرد ، اثر پیش بینی CNN در مشکل سری زمانی چندان خوب نیست. بنابراین ، مردم یک شبکه عصبی مکرر با عملکرد حافظه ایجاد کرده اند. ورودی RNN از ورودی لحظه فعلی و خروجی لحظه قبلی تشکیل شده است ، بنابراین یک عملکرد حافظه ساده دارد. از طریق تکرارهای متعدد ، لایه ورودی و لایه پنهان ، لایه پنهان در لحظه قبلی و لایه پنهان در لحظه فعلی ، و وزن بین لایه پنهان و لایه خروجی به طور مکرر اصلاح می شود تا پارامترهای بهینه وزن را بدست آورید و به پیشرفت بهتر برسیدنتایج پیش بینیدر سال 2018 ، چن و همکاران.[33] از مدل RNN تقویت شده برای مطالعه شاخص سهام شانگهای-شنگن 300 (HS300) استفاده کرد. آنها حساب های رسمی را از Sina Weibo انتخاب می کنند و با استخراج ویژگی های عاطفی ، محتوای گرفته شده از این حساب ها را تجزیه و تحلیل می کنند. در مرحله بعد ، آنها ویژگی های استخراج شده و شاخص های فنی را در مدل RNN تقویت می کنند تا نوسانات قیمت سهام را پیش بینی کنند.
در حال حاضر، کاربردهای زیادی با RNN ها اجرا شده است، مانند تشخیص گفتار [34]، تولید متن [35]، ترجمه ماشینی [36] و غیره. اما در عین حال، RNN دو کاستی قابل توجه دارد: یکی اینکه توانایی یادگیری RNN محدود است. اگر اندازه دنباله نسبتاً طولانی باشد عملکرد پیشبینی تأثیر منفی خواهد داشت و دیگری این که گرادیان RNN ناپدید میشود و در نتیجه حافظه بلندمدت خراب میشود. بعداً، مردم RNN را بهبود بخشیدند و عمدتاً یک دروازه فراموشی، دروازه ورودی و دروازه خروجی برای حفظ و کنترل اطلاعات اضافه کردند. RNN بهبودیافته اثر پیشبینی بهتری روی توالیهای کوتاه و بلند دارد، بنابراین محققان آن را به عنوان حافظه کوتاهمدت بلند مدت یا بهاختصار LSTM تعریف میکنند.
این تحقیق [37] میانگین نشانگر فنی را با الگوریتم جستجوی TABU با الهام از کوانتومی با بهترین راهنمای Globe ترکیب می کند تا یک سیستم معاملاتی پویا جدید را پیشنهاد کند. در میان آنها ، از میانگین متحرک برای یافتن سیگنال های معاملات سهام استفاده می شود. در این مقاله ، روش پیشنهادی با استراتژی خرید و نگهدارنده مقایسه می شود ، و نتایج تجربی نشان می دهد که این روش به طور قابل توجهی بازده سرمایه گذاری را بهبود می بخشد. این مقاله به طور عمده به بررسی نحوه استفاده از الگوریتم های یادگیری عمیق و الگوریتم های بهینه سازی هوشمند برای یافتن بهترین سیگنال های تجاری پرداخته می شود. این چارچوب ویژگی های مفیدی را از داده های مختلف استخراج می کند و سپس یک مدل پیش بینی را بر اساس این ویژگی ها آموزش می دهد. در این مطالعه ، خروجی به دست آمده توسط مدل پیش بینی با الگوریتم بهینه سازی هوشمند برای به دست آوردن سیگنال خرید و فروش ترکیب می شود. در معاملات سهام ، یافتن بهترین سیگنال های خرید و فروش ، کلید دستیابی به درآمد است. در این کار از یک چارچوب جدید شبکه عصبی حافظه کوتاه مدت کوتاه استفاده می شود. این داده های جمع آوری شده را به شکل تصاویر ادغام می کند ، آنها را به صورت تصاویر وارد می کند و از این تصاویر برای آموزش شبکه های عصبی استفاده می کند. این تحقیق ترکیبی از چارچوب LSTMLI و GA برای تشکیل یک سیستم تجارت سهام است. از آزمایشات گسترده ، می توان مشاهده کرد که سیستم معاملات پیشنهادی سهام نسبت به سایر استراتژی های معاملاتی برتر است. اهمیت کلیدی این مقاله به شرح زیر است: (1) این تحقیق چارچوب LSTMLI را با الگوریتم های ژنتیکی ترکیب می کند و یک سیستم تجارت سهام را پیشنهاد می کند. این سیستم می تواند یک سیگنال معاملاتی سهام را نسبتاً خوب پیدا کند تا سرمایه گذاران بتوانند درآمد مشخصی کسب کنند.(2) در این مطالعه ، ما دو مجموعه داده اضافه کرده ایم: آینده و گزینه ها. شاخص های پیشرو شاخص هایی هستند که ابتدا قبل از رشد اقتصادی یا رکود اقتصادی تغییر می کنند. در این مقاله فقط از دو شاخص پیشرو ، یعنی آینده و گزینه ها استفاده می شود. آزمایش های گسترده نشان داد که پس از افزودن مجموعه داده های آینده و گزینه ها ، دقت پیش بینی بیشتر است.(3) یک چارچوب LSTMLI با یک تانسور دو بعدی به عنوان ورودی پیشنهاد شده است. این تحقیق بر اساس LSTM بهبود یافته است و خروجی به سه دسته تقسیم می شود: افزایش ، سقوط و بدون تغییر. نتایج تجربی نشان می دهد که چارچوب بهبود یافته عملکرد بهتری دارد.
این مقاله عمدتاً شامل قسمتهای زیر است. بخش 2 آثار مرتبط را معرفی می کند. بخش 3 روشهای مورد استفاده در این مقاله را معرفی می کند. بخش 4 عمدتاً چارچوب پیشنهادی در این تحقیق را توصیف می کند. بخش 5 نتایج تجربی این تحقیق است. سرانجام ، خلاصه ای از این تحقیق در بخش نتیجه گیری انجام شده است.
2. آثار مرتبط
پیش بینی قیمت سهام عمدتاً تجزیه و تحلیل رفتارهای تاریخی ، مانند احساسات تاریخی افراد ، اطلاعات بازار تاریخی و غیره است و سپس ویژگی های مفید از آنها برای آموزش مدل های پیش بینی بهتر استخراج می شود. ارزش قیمت سهام یک سری زمانی است. آشکار کردن توسعه و تغییر در قیمت سهام ، سابقه عینی از رفتار تاریخی سهام است. در اوایل بورس سهام ، تعداد زیادی از سرمایه گذاران به تجربه خودشان برای قضاوت در مورد حرکات قیمت سهام اعتماد کردند که به نظر می رسید بسیار ذهنی و فاقد مبنای علمی است. علاوه بر این ، قیمت سهام نیز تحت تأثیر بسیاری از عوامل دیگر قرار دارد. به عنوان مثال ، ژنگ و همکاران.[38] رابطه بین نرخ ارز و قیمت سهام در بورس اوراق بهادار هنگ کنگ را مورد بررسی قرار داد. آنها مدلی را برای تجزیه و تحلیل همبستگی بین سهام شرکت هنگ کنگ ، سهام شرکت های سرزمین اصلی و نرخ ارز ساخته اند. نتایج تجربی نشان می دهد که نرخ ارز با سهام شرکت های محلی در هنگ کنگ ارتباط منفی دارد و با سهام شرکت های سرزمین اصلی ارتباط مثبت دارد. قیمت سهام نیز تحت تأثیر اطلاعات خارجی و احساسات انسانی است [39]. بسیاری از محققان با تجزیه و تحلیل مطالب در انجمن ها یا Weibo برای پیش بینی دقیق تر نوسانات قیمت سهام ، احساسات انسانی را مطالعه کرده اند. همچنین می توانیم متوجه شویم که بسیاری از عوامل می توانند بر نوسانات قیمت سهام تأثیر بگذارند ، بنابراین برای تجزیه و تحلیل و پیش بینی سهام به برخی از ابزارها نیاز داریم. چندین مطالعه [40 ، 41] سپس برای بررسی مدل های یادگیری عمیق مورد استفاده در تجارت سهام تهیه شده است.
از الگوریتم های بهینه سازی هوشمند برای یافتن راه حل بهینه استفاده می شود. در سالهای اخیر ، محققان بیشتر از استفاده از الگوریتم های ژنتیکی برای حل مشکلات علاقه مند بوده اند. در بازار مالی ، بسیاری از محققان همچنین از الگوریتم های ژنتیکی (GAS) برای یافتن سیگنال های معاملات سهام استفاده می کنند. آلن و همکاران.[42] از گاز برای کشف قانون تجارت فنی با توجه به شاخص S& P 500 سوابق روزانه جمع آوری شده (قیمت) در طیف وسیعی از 1928 تا 1995 استفاده کرد. و فروش سیگنال ها ، از GA برای پیشنهاد یک استراتژی معاملاتی استفاده می شود. Hirabayashi و همکاران.[44] یک سیستم مبتنی بر GA را برای یافتن سیگنال های معاملاتی مناسب پیشنهاد داد و به طور خودکار قوانین معاملاتی را بر اساس شاخص های فنی تولید کرد. تمرکز این سیستم پیش بینی قیمت معامله نیست بلکه پیدا کردن فرصت معاملات مناسب است. لین و همکاران.[45] از یک مدل مبتنی بر GA برای تعیین مقادیر بهینه برای پارامترهای مشکل استفاده کرده و سهام را در زمان معاملات مناسب خریداری یا فروخته شده است.
قیمت سهام با گذشت زمان تغییر می کند و پدیده افزایش یا سقوط رخ می دهد ، بنابراین داده های قیمت سهام یک سری زمانی معمولی است. هنگامی که ما از مدل برای پیش بینی قیمت سهام استفاده می کنیم ، ورودی مدل نه تنها داده های دیجیتال بلکه داده های تصویر نیز می تواند باشد. در این زمان ، ما فکر می کردیم که از مدل CNN می توان برای پیش بینی قیمت سهام استفاده کرد. تحقیقات ثابت کرده است که CNN در تشخیص تصویر برجسته است و صحت آن بالاتر از سایر مدل ها است. دی پرسیو و همکاران.[46] مدلی را پیشنهاد کرد که از روش های موجک و CNN برای پیش بینی روند سهام بر اساس داده های چند روز گذشته استفاده می کند. نتایج تجربی نشان می دهد که روش جدید پیشنهادی نسبت به سایر مدل ها و شبکه های عصبی اساسی برتر است.
قیمت سهام معمولاً یک داده سری زمانی است. برای این نوع داده ها ، مدل شبکه عصبی LSTM تأثیر بهتری نسبت به سایر مدل ها دارد. مدل LSTM بهبود RNN است. LSTM برای حل مشکل ناپدید شدن شیب RNN ، یک دروازه فراموش ، دروازه ورودی ، دروازه خروجی و واحد حافظه را اضافه می کند. از آنجا که مدل LSTM از نظر سری زمانی عملکرد بهتری دارد ، بسیاری از محققان از LSTM برای پیش بینی نوسانات قیمت سهام استفاده می کنند. این سند [17] LSTM یکپارچه را برای تشخیص قیمت سهام در طی یک روز پیشنهاد می کند و از شاخص های فنی به عنوان ورودی به شبکه استفاده می کند. آنها قدرت پیش بینی مدل پیشنهادی را در چندین سهام ایالات متحده ارزیابی کردند و نتایج تجربی نشان داد که مدل LSTM یکپارچه پیشنهادی بهتر از مدل معیار است. نلسون و همکاران.[47] مدلی را ایجاد کرد که از شبکه عصبی LSTM برای پیش بینی روند قیمت سهام بر اساس شاخص های فنی و داده های قیمت تاریخی استفاده می کند. از طریق یک سری آزمایشات برای ارزیابی عملکرد مدل پیشنهادی و سایر الگوریتم های یادگیری ماشین ، نتایج تجربی نشان می دهد که دقت پیش بینی مدل پیشنهادی نسبتاً زیاد است و میانگین دقت 55. 9 ٪ است.
3. روش شناسی
در قسمت اول این بخش ، چارچوب SSACNN [48] ، LSTM و الگوریتم ژنتیکی به عنوان یک چارچوب تازه طراحی شده معرفی و یکپارچه می شوند. این چارچوب SSACNN در تحقیقات قبلی ما ارائه شده است. بخش دوم شبکه اصلی عصبی LSTM را معرفی می کند. در بخش سوم این بخش ، الگوریتم ژنتیکی مورد استفاده در این تحقیق را معرفی خواهیم کرد. این الگوریتم برای یافتن راه حل بهینه سیگنال های معاملات سهام برای به حداکثر رساندن بازده استفاده می شود.
3. 1شبکه عصبی آرایه توالی سهام
شبکه های عصبی Convolutional نتایج خوبی در تشخیص تصویر دارند ، مانند تشخیص رقم دست نوشته ، چندین تصویر از رقم دست نویس را وارد کرده و به طور مکرر پارامترهای وزن را از طریق آموزش های متعدد CNN تغییر دهید. مدل شبکه عصبی حاصل می تواند رقم های دستنویس را به طور دقیق تشخیص دهد. CNN شامل یک لایه حلقوی ، لایه استخر و لایه کاملاً متصل است. لایه حلقوی عمدتا ویژگی های محلی داده های ورودی را استخراج می کند. محقق یک هسته حلقوی را در داخل لایه حلقوی تعریف می کند. شکل آن یک ماتریس مربع است که برای استخراج یک ویژگی خاص استفاده می شود. هسته Convolution توسط بیت های مربوط به ماتریس ورودی دیجیتال ضرب می شود و سپس برای به دست آوردن مقدار خروجی یک لایه حلقوی اضافه می شود. هرچه مقدار خروجی بالاتر باشد ، میزان تطابق بین این دو بالاتر است. از آنجا که یک هسته Convolution یک ویژگی را به رسمیت می شناسد و داده های ورودی ممکن است دارای چندین ویژگی باشد ، ممکن است هسته های Convolution بیشماری در یک لایه حلقوی وجود داشته باشد تا چندین ویژگی را استخراج کند. از خروجی لایه حلقوی به دست آمده باید به عنوان ورودی لایه استخر استفاده شود.
با این حال ، قبل از ورود مقدار به لایه استخر ، معمولاً یک عملکرد فعال سازی برای حل مشکل غیرخطی اضافه می شود. در حال حاضر ، عملکرد فعال سازی RELU (واحد خطی اصلاح شده) معمولاً استفاده می شود. از لایه جمع آوری عمدتا برای کاهش تعداد پارامترهای آموزشی و کاهش ابعاد خروجی بردار ویژگی توسط لایه Convolution استفاده می شود. متداول ترین لایه های جمع آوری حداکثر استخر و میانگین استخر است. در این مقاله ، ما حداکثر استخر را انتخاب می کنیم ، یعنی حداکثر مقدار در یک منطقه مشخص برای نشان دادن کل منطقه انتخاب می شود. مقدار خروجی لایه استخر به عنوان ورودی لایه کاملاً متصل برای تولید خروجی نهایی گسترش می یابد. پس از چندین بار حل ، تحریک و جمع آوری ، مدل نقشه ویژگی با کیفیت بالا را یاد می گیرد و سپس از نقشه ویژگی به عنوان ورودی به لایه کاملاً متصل استفاده می شود تا خروجی نهایی را بدست آورد.
در این مطالعه، داده های سهام برای مدتی به تصویر تبدیل می شود و این تصویر به عنوان ورودی چارچوب CNN استفاده می شود. ورودی در اینجا داده های سهام 30 روزه است و "تصویر ورودی" تولید شده به لایه کانولوشن، لایه ادغام، لایه حذفی و لایه هنجار وارد می شود. سپس، این فرآیند سه بار حلقه می شود. پس از یک سری آزمایشات، به این نتیجه رسیدیم که وقتی از شبکه عصبی کانولوشن برای تشخیص تصویر استفاده می شود، اندازه هسته کانولوشن برابر است با
، و اندازه لایه pooling است
، اثر تجربی به دست آمده بهترین است. بنابراین، برای دستیابی به نتایج بهتر برای این تحقیق، اندازه لایه کانولوشن و لایه تلفیقی به ترتیب برابر با و تنظیم شده است.
3. 2. شبکه عصبی حافظه کوتاه مدت بلند مدت
اگر بخواهیم رویدادهایی را که در آینده اتفاق میافتد را پیشبینی کنیم، باید با حافظه خود تماس بگیریم تا آن را مرور کنیم، اطلاعات مفیدی را از آن انتخاب کنیم و بر اساس این اطلاعات مفید، پیشرفت رویدادها را پیشبینی کنیم. RNN یک شبکه عصبی با عملکرد حافظه است. برخلاف شبکه عصبی سنتی، یک حلقه در داخل RNN وجود دارد. می تواند اطلاعات حفظ شده در لحظه فعلی را به لحظه بعدی منتقل کند و از آن برای حفظ تداوم اطلاعات استفاده کند. LSTM یک شبکه عصبی بهبود یافته مبتنی بر RNN است که این مشکل را حل میکند که گرادیان RNN ناپدید میشود [27] و نمیتواند در درازمدت وابسته باشد. LSTM سه گیت (دروازه فراموشی، دروازه ورودی و دروازه خروجی) و یک حالت سلولی مبتنی بر RNN را برای فراموش کردن و حفظ اطلاعات اضافه می کند. ساختار داخلی LSTM در شکل 1 نشان داده شده است. چندین اطلاعات وضعیت LSTM به شرح زیر نشان داده شده است: