Please use this identifier to cite or link to this item: https://dspace.dsau.dp.ua/handle/123456789/10077
Title: Задача підготовки даних до економетричного аналізу
Other Titles: The Problem of Data Preparation for Econometric Analysis
Authors: Дмитрієва, Вікторія Анатоліївна
Dmytriieva, Viktoriia
Keywords: репрезентативність даних
representativeness of the data
валідність результату
validity of the result
адекватність моделі
adequacy of the model
точність прогнозу
accuracy of the forecast
препроцесинг даних
data preprocessing
Issue Date: 2024
Publisher: Дніпровський державний технічний університет
Citation: Дмитрієва В. А. Задача підготовки даних до економетричного аналізу / В. А. Дмитрієва // Економічний вісник Дніпровського державного технічного університету. – 2024. – № 1(8). – С. 78-85. – Режим доступу : http://econvisnyk.dstu.dp.ua/article/view/306473
Abstract: Економетричний аналіз ґрунтується на релевантних даних, які мають відповідати вимогам актуальності та репрезентативності. Під час формування інформаційної бази дослідник має вирішувати питання, пов’язані з їх повнотою, часовими рамками аналізу, масштабами досліджуваних об’єктів та процесів, неоднорідністю сукупності, різними рівнями агрегації показників та шкалами їх вимірювання, мультиколінеарністю факторів та іншими проблемами. Лише після ретельного вивчення джерел інформації та усунення цих проблем можна приступати до процесу моделювання. Подібний апріорний аналіз даних є першим важливим етапом в будь-якому дослідженні, яке претендує на отримання обґрунтованих результатів. Неправильно сформована база даних та наявність в ній недоліків призводить до отримання моделей, які можуть бути ідеальними на перший погляд, але не відповідати дійсності, що, як наслідок, призводить до хибних прогнозів та висновків. В статті висвітлено проблеми, які постають перед дослідником при формуванні бази даних для аналізу процесів в економіці. Розглянуто основні підходи щодо їх вирішення. Econometric analysis is based on the relevant data that should respond to the reality, representativeness and certain period or moment of time. Thus, such data must be first carefully revised by investigator with all meticulousness before the start of calculations and modelling. During the data base forming and filling the researcher should consider questions concerning to it completeness, time frame of analysis, scale of studied objects and processes, heterogeneity of the data set, different levels of aggregation of indicators and measurement scales, multicollinearity of factors and other problems. It is worth to begin research only after such a thorough study of the sources of information and elimination of these problems. Such a priori data analysis is the first important stage in any research that claims to obtain substantiated results. An incorrectly formed database and the presence of the listed shortcomings in it provide obtaining models that may be ideal at first glance, but do not correspond to reality, which as a result lead to the false predictions and conclusions. Scientists pay a lot of attention to the methodology for overcoming of such peculiarities of the data base as deficit or redundancy of information, type or format, optimal size of sample, sizes of training and test data sets, number of features for analysis. Such issues are proposed to be considered with appropriate statistical methods. Researchers can use program languages to enhance data preprocessing. Methods of coding, imputation, extra- or interpolation, normalization are applied to fill blanks and transform attributive features or data measured in various ways into quantitative data in certain format or scale. The next step, after overcoming all the shortcomings is the stage of modeling using methods of mathematical analysis for the reconstruction of causal mechanisms and further forecasting. However, after building the model, investigator deals with another set of problems that need to be solved. For instance, it is necessary to check the accuracy of the results and how model helps to reconstruct reality. The article highlights the problems are faced by the researcher when creating a database for representative analysis of processes in the economy. The main approaches to their solution are considered
URI: http://econvisnyk.dstu.dp.ua/article/view/306473
https://dspace.dsau.dp.ua/handle/123456789/10077
ISSN: ISSN 2709-2879 (Print) ISSN 2709-9024 (Online)
Appears in Collections:Наукові статті

Files in This Item:
File Description SizeFormat 
306473-Текст статті-707878-1-10-20240619.pdf154,64 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.