Figure 1 - uploaded by Duc-Hien Nguyen
Content may be subject to copyright.
Source publication
This paper proposed a model to predict the stock price based on combining
Self-Organizing Map (SOM) and fuzzy-Support Vector Machines (f-SVM). Extraction
of fuzzy rules from raw data based on the combining of statistical machine
learning models is base of this proposed approach. In the proposed model, SOM
is used as a clustering algorithm to partit...
Context in source publication
Similar publications
Earnings calls are hosted by management of public companies to discuss the company's financial performance with analysts and investors. Information disclosed during an earnings call is an essential source of data for analysts and investors to make investment decisions. Thus, we leverage earnings call transcripts to predict future stock price dynami...
Stock price movement is typically affected by a lot of hidden factors. Predicting stock price direction, especially short-term direction, is very challenging and consistently attracts researches. Deep recurrent neural networks, such as Long Short-Term Memory, typically outperform statistical time series models and traditional machine learning appro...
The Kohonen Self Organizing Map (SOM) is an unsupervised neural network method with a competitive learning strategy which has both clustering and visualization properties. Interval-valued data arise in practical situations such as recording monthly interval temper-atures at meteorological stations, daily interval stock prices, etc. Batch SOM algori...
Stock market prediction is important for investors seeking a return on the capital invested, though this prediction is a challenging task, due to the complexity of stock price time-series. This task can be performed by conducting two primary analyses: fundamental and technical. In this paper, we examine the predictability of these two analyses usin...
Citations
... However, the path toward forecasting the stock price is a challenging subject existing in the financial circle. Plenty of scholars use a variety of machine learning models [1] to predict the stock price. Nevertheless, as the financial market is a complex system with multiple agents, the stock price trend is affected by many factors. ...
... Combining SOM and Fuzzy-SVM The Authors [76] proposed a stock-price prediction model grounded on the amalgamation of SOM and fuzzy SVM and experimental conducted on the IBM, Apple Inc., S & P 500 and DJI stock dataset. The authors compared them with SOM-SVM, RBN and ANFIS and summed up the proposed model produced more accurate results. ...
Stock marketplace tradeoff is an endless investment implementation worldwide. It has capabilities to produce maximum profits on stockholders’venture. In the globe, the stock-market forecasting is a very puzzling job for the stock-market investors. The task is very challenging because of the ambiguity and precariousness of the stock market values. Due to commercialization and data mining modules the growth of stock marketplaces, it is essential to predict marketplace variations quick and easy way. Recently, ANN is very famous and attracted to investors for its easy-going process in the stock-market. ANN plays a very imperative part in today’s stock-market for decision making and prediction. The Multi-Layer-Perceptron methods are outperformed then other methods. Also, these approaches have countless likelihoods to envisage with high accuracy than other approaches. In this review paper, neural-based envisage implements are measured to foresee the imminent stock-prices and their enactment dimensions will be assessed. Here we deliver a broad impression of the soft computing based stock-market likelihood with emphasis on enabling technologies, issues and application issues. Soft computing is attracting a lot of researchers and industrial innovation. The purpose of this paper is to presents a survey of the existing soft computing method applied to stock market prediction, their comparison and possible solution. From the reviewed articles, it is obvious that investigators have resolutely intensive on the growth of fusion forecast representations and considerable effort has also been completed on the use of broadcasting data for stock marketplace forecast. It is also enlightening that most of the literature has focused on the forecast of stock prices in developing marketplace.
... They compared their result with the LS-SVM and artificial neural network. Duc-Hien Nguyen et al. [10] combined the Self-Organizing Map (SOM) and fuzzy -Support Vector Machines (f-SVM) Analysis levels. The extraction of fuzzy rules has been for the better results of stock market prediction . ...
... This feed is used for news article collection process. Here the R.S.S feed from hindustan times [10] is used for extracting business, financial and market related news. It will give the results by retrieving top news of BSE india which specifies particularly about the sensex points rise and fall. ...
Prognostication of stock market is an important issue in finance. Due to its financial gain, it has attracted much attention from academic and business. This paper proposes the combination of both Sentiment analysis and Sensex points. Thus the sentiment is analyzed from the stock related news then the result is combined with Sensex points calculation. This novel approach prognosticates the stock market more effectively and help the stock traders for making their decisions in stock market.
... ANFIS has covered both merits of neural network and fuzzy. So, ANFIS have been used for prediction purposes in many areas (Kaur et al. 2014a, b;Nikam et al. 2013;Thuillard 2001;Nguyen and Le 2014;Devadoss and Ligori 2013). ...
... Operation of ANFIS looks like feed-forward back propagation network. Consequent parameters are calculated forward while premise parameters are calculated in backward (Nguyen and Le 2014). There are two learning methods in neural section of the system: Hybrid learning method and back-propagation learning method. ...
Stock market prediction is one of the most important financial subjects that have drawn researchers’ attention for many years. Several factors affecting the stock market make stock market forecasting highly complicated and a difficult task. The successful prediction of a stock market may promise attractive benefits. Various data mining methods such as artificial neural network (ANN), fuzzy system (FS), and adaptive neuro-fuzzy inference system (ANFIS) etc are being widely used for predicting stock prices. The goal of this paper is to find out an efficient soft computing technique for stock prediction. In this paper, time series prediction model of closing price via fusion of wavelet-adaptive network-based fuzzy inference system (WANFIS) is formulated, which is capable of predicting stock market. The data used in this study were collected from the internet sources. The fusion forecasting model uses the discrete wavelet transform (DWT) to decompose the financial time series data. The obtained approximation and detailed coefficients after decomposition of the original time series data are used as input variables of ANFIS to forecast the closing stock prices. The proposed model is applied on four different companies’ previous data such as opening price, lowest price, highest price and total volume share traded. The day end closing price of stock is the outcome of WANFIS model. Numerical illustration is provided to demonstrate the efficiency of the proposed model and is compared with the existing techniques namely ANN and hybrid of ANN and wavelet to prove its effectiveness. The experimental results reveal that the proposed fusion model achieves better forecasting accuracy than either of the models used separately. From the results, it is suggested that the fusion model WANFIS provides a promising alternative for stock market prediction and can be a useful tool for practitioners and economists dealing with the prediction of stock market.
... Tuy nhiên với một tập luật có số lượng lớn thì việc hiểu và diễn dịch được chúng, đồng thời có thể phân tích và tích hợp chúng với các tri thức có tính chất tinh túy của chuyên gia, quả thật rất khó khăn. Phân cụm tập luật đã đề xuất trong [16] là một trong những giải pháp cho vấn đề đơn giản hóa tập luật của các mô hình mờ hướng dữ liệu. ...
... Để chứng tỏ hiệu quả của tri thức tiên nghiệm trong việc huấn luyện mô hình mờ, chúng tôi đã tích hợp tri thức tiên nghiệm về cấu trúc mô hình vào mô hình mờ TSK trích xuất từ máy học véc-tơ hỗ trợ (SVMs) [16], cụ thể là thông qua việc điều chỉnh tham số ε chúng ta có thể giới hạn số lượng SVs; và đây cũng chính là số lượng luật mờ trích xuất được. Chúng tôi tiến hành thực nghiệm giải quyết bài toán hồi quy phi tuyến sau: ...
Bằng cách thỏa mãn các điều kiện đề đồng nhất các hàm đầu ra của mô hình mờ TSK (Takagi-Sugeno-Kang) và máy học véc-tơ hỗ trợ hồi quy, chúng ta có thể xây dựng một thuật toán cho phép trích xuất mô hình mờ TSK từ máy học véc-tơ hỗ trợ. Những nghiên cứu trước đây cho thấy mô hình mờ trích xuất được vẫn tồn tại những hạn chế chất định. Bài báo này đề xuất một mô hình mờ dựa trên sự tích hợp tri thức tiên nghiệm với mô hình mờ TSK trích xuất từ máy học véc-tơ hỗ trợ cho bài toán dự báo hồi quy. Mô hình này tiếp cận theo hướng trích xuất các tập luật mờ "có thể diễn dịch được" cho hệ dự báo dựa trên sự kết hợp các mô hình máy học thống kê. Bằng cách tích hợp tri thức tiên nghiệm với mô hình mờ dựa trên SVM (Support Vector Machine), hệ thống luật mờ trích xuất được sẽ giảm tính phức tạp. Hiệu quả của giải pháp đề xuất được đánh giá thông qua các kết quả thực nghiệm và có sự so sánh với một số mô hình khác. Từ khóa: mô hình mờ; mô hình mờ TSK; luật mờ; máy học véc-tơ hỗ trợ; máy học véc-tơ hỗ trợ hồi quy; tri thức tiên nghệm 1 Đặt vấn đề Mô hình mờ được biết đến như là một mô hình khá hiệu quả trong việc xử lý những thông tin mơ hồ và không chắc đó chắn, đồng thời nó cũng thể hiện những lợi thế rõ ràng trong việc biểu diễn và xử lý tri thức. Hoạt động của mô hình mờ phụ thuộc chủ yếu vào hệ thống các luật mờ và quá trình suy diễn trên tập luật mờ đó. Đã có nhiều tác giả nghiên cứu và đề xuất các phương thức để xây dựng các mô hình mờ hướng dữ liệu. Nhìn chung các giải pháp này chủ yếu dựa trên kỹ thuật khai phá dữ liệu, các mô hình máy học thống kê như: Neural Network [6][7][8], Support Vector Machine (SVM) [1][4][5][11][12][16], Self Organizing Map (SOM) [8], Cây quyết định [15], Đại số gia tử [17], và các thuật toán Phân cụm, Phân lớp, Hồi quy,… [3][6]. Việc trích xuất tập luật mờ tự động từ dữ liệu thông qua học máy sẽ có nhiều khiếm khuyết do dữ liệu ngẫu nhiên có thể bị lỗi (nhiễu), thiếu tính đặc trưng, thiếu tính bao phủ. Vì vậy, việc hiểu được tập luật để hiệu chỉnh, bổ sung, tối ưu hóa là thật sự cần thiết. Các nghiên cứu nhằm tích hợp tri thức chuyên gia với mô hình mờ hướng dữ liệu có thể tìm thấy trong [2][9][12][13]. Tuy nhiên với một tập luật có số lượng lớn thì việc hiểu và diễn dịch được chúng, đồng thời có thể phân tích và tích hợp chúng với các tri thức có tính chất tinh túy của chuyên gia, quả thật rất khó khăn. Phân cụm tập luật đã đề xuất trong [16] là một trong những giải pháp cho vấn đề đơn giản hóa tập luật của các mô hình mờ hướng dữ liệu. Nghiên cứu lý thuyệt học dựa trên tri thức [14] cho thấy các kiểu khác nhau của tri thức tiên nghiệm (a priori knowledge) có thể sử dụng để cải thiện hiệu quả của mô hình máy học nói chung và mô hình mờ nói riêng. Bài báo này sẽ tập trung nghiên cứu về các kịch bản tích hợp tri thức tiên nghiệm trong việc học mô hình mờ để cải thiện mô hình mờ hướng dữ liệu trích xuất được. Các phần tiếp theo của bài báo bao gồm: phần 2 tìm hiểu về các nguồn tri thức tiên nghiệm trong việc học mô hình mờ. Trong phần 3, chúng tôi trình bày những kịch bản khác nhau của vệc tính hợp tri thức tiên nghiệm trong việc học mô hình mờ. Phần 4 trình bày một số kết quả thực nghiệm với một số ví dụ tích hợp tri thức tiên nghiệm trong việc huấn luyện mô hình mờ. Cuối cùng, trong phần 5, chúng tôi nêu lên một số kết luận và định hướng nghiên cứu tiếp theo. 2 Các nguồn tri thức tiên nghiệm trong việc học mô hình mờ Tri thức tiên nghiệm về hệ thống được nghiên cứu có thể ở dưới nhiều dạng khác nhau. Một khác biệt đầu tiên về tri thức của một mô hình là tri thức mô tả cơ chế hoạt động của mô hình và tri thức tinh túy có từ kinh nghiệm của chuyên gia. Cả hai kiểu khác nhau của tri thức này đều có thể kết hợp với nhau trong một mô hình mờ [9]. Tri thức về qui trình sẵn có có thể đưcọ sửu dụng để mô tả hệ thống phi tuyến phức tạp như là một bộ thu thập giản đơn, ví dụ như các hệ thống tuyến tính chỉ có giá trị trong chế độ hoạt động nhất định nào đó. Những thông tin này có thể mã hóa dưới dạng các qui tắc mờ. Các biến đặc trưng cho sự thay đổi các các chế độ hoạt động trở thành một phần của các đối tượng trong hệ thống các qui tắc mờ, và hàm thành viên được định nghĩa để xác định cho mỗi mô hình thành phần của một miền nhất định. Đối với vấn đề mô hình hóa hệ thống, các kiểu khác nhau của tri thức tiên nghiệm gồm có:-Tầm quan trọng của dữ liệu: trong nhiều ứng dụng thực tế, những mẫu dữ liệu nhất định có thể là ngoại lai và một số có thể bị nhiễu. Do vậy, mô hình xây dựng được từ dữ liệu có thể bị nhiễu hay mất ổn định.-Hành vi của các máy học: trong một quá trình học tập, không gian giả thuyết của máy học cần được hạn chế trước. Ví dụ, đối với mô hình mạng nơ-ron hồi quy, người ta phải xác định các nguyên mẫu của một vấn đề hồi quy và thiết kế trước các cấu trúc liên kết mạng của một mạng nơ-ron.-Mục tiêu của các máy học: tiêu chí như sự ổn định, độ bền vững, thời gian khởi động, thời gian thiết lập là các kiến thức phải có trước cho một nhà thiết kế hệ thống. 3 Các kịch bản học có tri thức tiên nghiệm Trong phần này chúng ta sẽ chứng tỏ vai trò của tri thức tiên nghiệm với việc học một mô hình mờ. Ở đây chúng ta cần làm rõ mối quan hệ logic giữa giả thuyết (Hypothesis), những mô tả mẫu (Descriptions) (dưới dạng các thuộc tính), và kết quả dự đoán (Predictions). Cho Descriptions là hội của tất cả các mô tả mẫu trong tập huấn luyện, và cho Predictions là hội của tất cả các tiên đoán. Khi đó, Hypothesis "giải thích các quan sát" phải thỏa mãn điều kiện sau (ký hiệu ╞ có nghĩa là kế thừa logic) [14]: Hypothesis ˄ Descriptions╞ Predictions Xét trong trường hợp học mô hình mờ, chúng ta có thể định nghĩa khái niệm Hypothesis như sau: Định nghĩa 1 (Hypothesis). Cho D={X,Y} là một tập dữ liệu huấn luyện (các quan sát), một mô hình mờ M là được gọi là Hypothesis nếu điều kiện sau thỏa mãn: (∀X ∈ D) (M(X)=Y) Ở các nội dung tiếp theo chúng ta sẽ giải thích và định nghĩa 3 phương thức học mô hình mờ theo [14]: Học dựa trên giải thích (EBL-Explanation-bassed learning), Học dựa trên sự thích hợp (RBL-Relevance-based learning) và Học quy nạp dựa trên tri thức (KBIL-Knowledge-based inductive learning). 3.1 Học dựa trên sự giải thích (EBL) Phương pháp học EBL là một phương thức trích xuất những luật mờ chung từ các quan sát riêng lẻ. Ý tưởng cơ bản của EBL là sử dụng tri thức tiên nghiệm để xây dựng cấu trúc ban đầu của Hypothesis, rồi sau đó xác lập Hypothesis chính thức dựa vào các quan sát thực nghiệm. Cụ thể theo định nghĩa của [14] như sau: Background╞ Hypothesis
... Bên cạnh đó, chúng tôi cũng thử nghiệm dự đoán trên cùng bộ dữ liệu Testing với các mô hình khác được đề xuất trước đó, bao gồm SVM, mô hình kết hợp SOM+SVM và SOM+f-SVM. Mô hình SOM+SVM là mô hình dựa trên sự kết hợp của SOM và SVM, được đề xuất để dự đoán xu hướng cổ phiếu trong [16]. Mô hình SOM+f-SVM là mô hình kết hợp SOM với f-SVM thuần túy (chưa tối ưu tham số ε và tích hợp kỹ thuật phân cụm k-Means). ...
Extracting Takagi-Sugeno-Kang (TSK) fuzzy rule set from the vector-support learning machine is one of the approaches to construct a fuzzy model for predictive math. Previous studies of this approach showed that fuzzy model is automatically trained based on input data sets, leading to major limitations such as large rule size, lack of specificity, coverage. In this article, the authors have supposed and experimented some solutions to reduce and optimize the extracted TSK fuzzy rule set but still ensure the predictive performance of the model
... Yu, Chen, Wang, & Lai, 2009), bacterial chemotaxis Optimization (BCO) (Yudong & Lenan, 2009), rough set-based pseudo outer-product (RSPOP) (Ang & Quek, 2006), and also predict the stock price from news driven models (Gusev et al., n.d.)using sentiment analysis (Trends, Chowdhury, Routh, & Chakrabarti, 2014) and other text mining methods (Mittermayer, 2004). Hybrid techniques like independent component analysis (Lu, 2010) with neural networks, genetic complementary learning (GCL) fuzzy neural network (Tan, Quek, & Ng, 2004) and self-organizing map (SOM) with Fuzzy SVM (f-SVM) (Nguyen & Le, 2014) have also been used for prediction. In (K. ...
Stock investors always consider potential future prices before investing in any stock for making a profit. A large number of studies are found on the prediction of stock market indices. However, the focus on individual stock closing price predictions well ahead of time is limited. In this chapter, a comparative study of machine-learning-based models is used for the prediction of the closing price of a particular stock. The proposed models are designed using back propagation neural networks (BPNN), support vector regression (SVR) with SMOReg, and linear regression (LR) for the prediction of the closing price of individual stocks. A total of 37 technical indicators (features) derived from historical closing prices of stocks are considered for predicting the future price of stock in a time window of five days. The experiment is performed on stocks listed on Bombay Stock Exchange (BSS), India. The model is trained and tested using feature values extracted from the past five-year closing price of stocks of different sectors including aviation, pharma, banking, entertainment, and IT.
... market data and used a combination of wavelet support vector machine and multivariate forecasting techniques to apply it to the prediction of stock prices. DH Nguyen, MT Le et al. (2014) [16] proposed a model to predict stock prices by combining self-organizing map (SOM) and fuzzy support vector machine (f-SVM). ...
... These works received relative success because they take advantage of SOM to cluster the relative data, which reduces the space and also the noise. In another case of SOM and SVM, a proposed approach is to directly use Fuzzy-SVM to improve the performance of prediction [13]. ...
... training phase), which means that more support vectors are expected to bring fa more accurate result but cause a problem of complexity. In the case of fuzzy SVM is used, the number of fuzzy rules must be increased [13] [8] [11] [9]. Thus, we should reduce "interpretability" of the fuzzy model. ...
... In the table, there are 5 rules which is extracted from only 1 cluster of data. The more clusters are generated by SOM, the more f-SVM approach (proposed in [13]) which outcomes more than 450 rules for each cluster. This result of experiment is acceptable for what we expected because less rules reduce complexity. ...
Prediction of stock price is always an interesting task. However, it is not easy to make this prediction with high accuracy. Recently, plenty of combinations of statistical methods have been proposed. The main direction of these methods is that combination of regression learner (e.g. SVM) and a clustering of data (e.g. SOM). While these methods make relative success, their extensibility is still under discussion. In this paper, we propose a Hybrid model of Self-Organized Map and Integrated Fuzzy Rules with Support Vector Machine. The proposition method is evaluated to be a good approach to apply to Stock price analysis. Moreover, this method provides interpretable rules which can be understood, calibrated and modified by experts in order to direct the learning phase.
... A model has proposed to predict the stock price based on the combining of Self-Organizing Map (SOM) and fuzzy -Support Vector Machines (f-SVM). This paper proposed the base for the extraction of fuzzy rules from the raw data based on the combining of statistical machine learning models [3]. ...
The Stock market forecasters focus on developing a successful approach to predict stock prices. The vital idea to successful stock market prediction is not only achieving best results but also to minimize the inaccurate forecast of stock prices. This paper attempts to design and implement a predictive system for guiding stock market investment. The novelty of our approach is the combination of both sensex points and Really Simple Syndication (RSS) feeds for effective prediction. Our claim is that the sentiment analysis of RSS news feeds has an impact on stock market values. Hence RSS news feed data are collected along with the stock market investment data for a period of time. Using our algorithm for sentiment analysis, the correlation between the stock market values and sentiments in RSS news feeds are established. This trained model is used for prediction of stock market rates. In our experimental study the stock market prices and RSS news feeds are collected for the company ARBK from Amman Stock Exchange (ASE). Our experimental study has shown an improvement of 14.43% accuracy prediction, when compared with the standard algorithm of ID3, C4.5 and moving average stock level indicator.