ANALISANDO A EFICÁCIA DE ALGORITMOS DE PREVISÃO DO WEKA PARA A PREVISÃO DO COMPORTAMENTO DO BITCOIN

Visualizações: 12

Autores

  • Daniel Pimenta Gonçalves da Fonte Universidade Tecnológica Federal do Paraná https://orcid.org/0009-0009-9846-4906
  • Sandro Carvalho Izidoro Universidade Federal de Itajubá https://orcid.org/0000-0001-5555-3321
  • José Donizetti de Lima Universidade Tecnológica Federal do Paraná https://orcid.org/0000-0001-5260-9035
  • Sergio Luiz Pessa Ribas Universidade Tecnológica Federal do Paraná
  • Matheus Henrique Dal Molin Ribeiro Universidade Tecnológica Federal do Paraná
  • Érick Oliveira Rogrigues Universidade Tecnológica Federal do Paraná

DOI:

https://doi.org/10.56579/rei.v8i2.2629

Palavras-chave:

BTC, Algoritmos, Séries Temporais, WEKA, Criptomoeda

Resumo

Este estudo investigou o desempenho preditivo do software WEKA na previsão de séries temporais do Bitcoin (BTC), comparando seus resultados com aqueles obtidos por meio do R, utilizando dados históricos de maio de 2013 a dezembro de 2024 (4.254 observações). A análise empregou múltiplos algoritmos de aprendizado de máquina avaliados através das medidas MAPE, RMSE e MAE. Os resultados revelaram que, embora o R obteve desempenho superior na maioria dos modelos, especialmente em termos de redução de erro, o WEKA apresentou desempenho competitivo e em alguns casos superior em modelos específicos: M5Rules alcançou MAPE de 2,25% e RMSE de $1.449,49, enquanto SMOreg obteve MAPE de 2,40% e RMSE de $1.450,25 na aba Forecast. Os modelos baseados em regras, M5Rules e M5P, apresentaram desempenho significativamente superior no R, com MAPE de 3,79% e RMSE de $2.112,25, em contraste com os resultados modestos no WEKA, onde apresentaram correlação próxima de zero na aba Classify. O teste KPSS confirmou a não-estacionariedade da série (p-valor = 0,01), e o teste de causalidade de Granger identificou dependência temporal significativa no lag 5 (p-valor = 8,7e-06). Os achados indicam que, embora o WEKA ofereça funcionalidade adequada para modelos específicos em tarefas de previsão sequencial, apresenta instabilidades e limitações na modelagem temporal abrangente, tornando o R uma alternativa mais robusta para aplicações financeiras complexas.

Downloads

Não há dados estatísticos.

Biografia do Autor

Daniel Pimenta Gonçalves da Fonte, Universidade Tecnológica Federal do Paraná

Aluno do Programa de Pós-graduação PPGEPS da Universidade Tecnológica Federal do Paraná. Brasil, Paraná, Pato Branco.

Sandro Carvalho Izidoro, Universidade Federal de Itajubá

Possui graduação em Tecnologia em Processamento de Dados pela Universidade José do Rosário Vellano (1993), graduação em Bacharelado em Ciência da Computação pela Universidade José do Rosário Vellano (1994), mestrado em Engenharia Elétrica pela Universidade Federal de Itajubá (2001) e doutorado em Bioinformática pela Universidade Federal de Minas Gerais (2015) com período sanduíche no Centre Nacional de Séquençage Genoscope (CEA - França). Atualmente é professor associado da Universidade Federal de Itajubá (Campus de Itabira). Tem experiência na área de Bioinformática Estrutural e Ciência da Computação, com ênfase em Inteligência Artificial, Algoritmos Genéticos e Predição de Função de Proteínas.

José Donizetti de Lima, Universidade Tecnológica Federal do Paraná

O Professor e Pesquisador da UTFPR José Donizetti de Lima possui Licenciatura em Matemática e Habilitação em Física pela Universidade Estadual Paulista (UNESP, 1995), Aperfeiçoamento em Formação Empreendedora na Educação Profissional pela Universidade Federal de Santa Catarina (UFSC, 2000), Mestrado em Métodos Numéricos em Engenharia pela Universidade Federal do Paraná (UFPR, 2002) e Doutorado em Engenharia de Produção pela Universidade Federal do Rio Grande do Sul (UFRGS). Atualmente é professor titular da Universidade Tecnológica Federal do Paraná (UTFPR - Campus Pato Branco), coordenou o Programa de Pós-Graduação em Engenharia de Produção e Sistemas (PPGEPS) de setembro de 2021 a janeiro de 2024 e atua em disciplinas relacionadas à área de Matemática, Probabilidade e Estatística e Engenharia de Produção nos cursos de Engenharias e Agronomia. Além disso, leciona a disciplina de Engenharia Econômica em curso de Pós-Graduação (lato e stricto sensu) na área de Engenharia de Produção, com orientação de trabalhos de graduação e pós-graduação, principalmente na área de custos e análise de viabilidade econômica de projetos de investimentos industriais e agropecuários. Tem experiência na área de Matemática, com ênfase em Programação Matemática para problemas do planejamento da produção agropecuária. Tem realizado trabalhos de pesquisa e publicações principalmente nos seguintes temas: decisões de investimentos, indicadores de viabilidade econômica, análise de viabilidade econômica de projetos de investimentos via Opções Reais, métodos de custeio e gestão estratégica de custos, com orientações de IC/IT, TCC, dissertações e doutorados acadêmicos. As principais áreas de interesse e linhas de pesquisa são: Engenharia Econômica, Sistemas de Custeio, Estatística Multivariada, Pesquisa Operacional, Análise Econômico-Financeira de Empresas, Reconhecimento de Padrões e Planejamento da Produção Agropecuária. É referee dos periódicos Energy, Heliyon, IJEME, IJMP, ABCustos, Exacta, Revista Gestão Industria, Engineering Management Journal, ENEGEP/ABEPRO, SEI/UTFPR, SIMPEP/UNESP, CBC/ABC, Professor permanente e coordenador do Programa de Pós-Graduação em Engenharia de Produção e Sistemas (PPGEPS) da UTFPR - Campus Pato Branco e membro do corpo editorial da Revista de Economia e Sociologia Rural e Frontiers in Sustainable Food Systems. Destaca-se que recebeu Research Award Joint Conference (CIO-ICIEOM-IIE) pela ABEPRO/ADINGOR (2014) e foi premiado pela Associação Brasileira de Custos (ABC, 2020 e 2024). É ex-bolsista em Bolsista de Produtividade em Pesquisa pela Fundação Araucária (2024/2025) e atual bolsista de Produtividade em Pesquisa pelo CNPq. Por fim, é Líder do Grupo de Pesquisa e Estudos em Engenharia Econômica (GPEEE).

Sergio Luiz Pessa Ribas, Universidade Tecnológica Federal do Paraná

Engenheiro Mecânico [UNISINOS-1988], Mestre em Engenharia e Ciência dos Materiais graduado [Universidade Estadual de Ponta Grossa-2005], Doutor em Engenharia de Produção [UFRGS-2010] Professor da Universidade Tecnológica Federal do Paraná nos cursos de: Graduação: - Tecnologia em Manutenção Industrial, - Engenharia Mecânica; Programa Pós Graduação Stricto Senso: - Engenharia de Produção e Sistemas - PPGEPS - UTFPR/PB. Pesquisas e atuação nas áreas: - Engenharia Mecânica: - Manutenção industrial (Gestão e Avaliação); - Manutenção e Avaliação de Frotas; - Desenvolvimento de Materiais Compósitos (Funcionais e Estruturais) - Ergonomia e Segurança do Trabalho, - Ageing e ICT, - Metodos de Avaliação Ergonômica e Ergonomia Ocupacional, - Gestão de Sistemas de Ergonomia e Segurança do Trabalho, - Gestão de Riscos em sistemas produtivos.

Matheus Henrique Dal Molin Ribeiro, Universidade Tecnológica Federal do Paraná

Licenciado em Matemática pela Universidade Tecnológica Federal do Paraná (UTFPR), mestre em bioestatística pela Universidade Estadual de Maringá, e Doutorado em Engenharia de Produção e Sistemas pela Pontifícia Universidade Católica do Paraná pelo qual recebeu Menção Honrosa no Prêmio CAPES de Tese 2022 da área de Engenharias III. Professor adjunto do Magistério Superior na UTFPR câmpus Pato Branco, lotado no departamento de Matemática (DAMAT). Professor Permanente do Programa de Pós-Graduação em Engenharia de Produção e Sistemas (PPGEPS) da UTFPR, câmpus Pato Branco. Tem experiência na área de matemática, probabilidade e estatística, e ciência de dados atuando principalmente nos seguintes temas: Ciências de Dados, inteligência artificial, aprendizado de máquina, análise e previsão de séries temporais, e métodos de otimização.

Érick Oliveira Rogrigues, Universidade Tecnológica Federal do Paraná

Professor adjunto de ciência da computação na Universidade Tecnológica Federal do Paraná (UTFPR) e professor permanente no programa de Pós-Graduação em Engenharia de Produção e Sistemas (PPGEPS) do campus Pato Branco e Curitiba. Tem doutorado em ciência da computação pela Universidade Federal Fluminense, com período de 6 meses no Instituto do Petróleo na Khalifa University em Abu Dhabi (foco: computação visual e aprendizado de máquina), onde trabalhou como pesquisador assistente. Recebeu menção honrosa da CAPES na tese de doutorado (uma das 3 melhores teses do Brasil em ciência da computação). Também ganhou prêmio de excelência de melhor tese de doutorado da UFF em ciência e tecnologia. Possui título de mestre em computação também pela Universidade Federal Fluminense e graduação em Sistemas de Computação, também na UFF. Na ocasião, também recebeu prêmio de melhor dissertação de mestrado nas ciências exatas e tecnológicas pela UFF. Já recebeu também outras premiações referentes a artigos e também à homenagens à docência (patrono e professor homenageado). Possui publicações nas melhores revistas internacionais de sua área de atuação. Já trabalhou com várias linguagens de programação ao longo dos mais de 20 anos de experiência com o tema. Já liderou e ajudou na criação de diversos projetos incluindo jogos, bibliotecas de imagens, software de inteligência artificial, processamento de imagens médicas, etc. As principais áreas de interesse são: processamento de imagens, reconhecimento de padrões, descoberta de conhecimento, aprendizado de máquina, mineração de dados, aplicações gerais da inteligência artificial, otimização (programação e processos), programação paralela em placas de video, aplicação da computação na saúde (informática médica, diagnóstico, sistemas de suporte, etc), simuladores, otimização, jogos e engines e aplicações multiplataforma (incluindo mobile, web e desktop). As principais linguagens de programação são Java, C/C++, CUDA, Javascript, PHP, CSS, GPU Shaders, etc.

Referências

ALI, A. et al. Network intrusion detection leveraging machine learning and feature selection. In: IEEE. 17th International Conference on Smart Communities: Improving Quality of Life Using ICT, IoT and AI (HONET), 2020, [S.l.]. Anais [...]. Piscataway: IEEE, 2020. p. 49–53. DOI: https://doi.org/10.1109/HONET50430.2020.9322813

BEHNOOD, A. et al. Prediction of the compressive strength of normal and high-performance concretes using M5P model tree algorithm. Construction and Building Materials, v. 142, p. 199–207, 2017. DOI: https://doi.org/10.1016/j.conbuildmat.2017.03.061

BREIMAN, L. Bagging predictors. Machine Learning, v. 24, p. 123–140, 1996. DOI: https://doi.org/10.1023/A:1018054314350

BREIMAN, L. Random forests. Machine Learning, v. 45, p. 5–32, 2001. DOI: https://doi.org/10.1023/A:1010933404324

CARUANA, R. et al. Ensemble selection from libraries of models. In: Proceedings of the Twenty-First International Conference on Machine Learning, 2004, [S.l.]. Anais [...]. [S.l.]: [s.n.], 2004. p. 18. DOI: https://doi.org/10.1145/1015330.1015432

CHOWDHURY, R. et al. An approach to predict and forecast the price of constituents and index of cryptocurrency using machine learning. Physica A: Statistical Mechanics and its Applications, v. 551, p. 124569, 2020. DOI: https://doi.org/10.1016/j.physa.2020.124569

CONTRERAS, R. C. et al. Genetic algorithm for feature selection applied to financial time series monotonicity prediction: Experimental cases in cryptocurrencies and Brazilian assets. Entropy, v. 26, n. 3, p. 177, 2024. DOI: https://doi.org/10.3390/e26030177

DERBENTSEV, V. et al. Forecasting cryptocurrency prices time series using machine learning approach. In: SHS WEB OF CONFERENCES, 2019, [S.l.]. Anais [...]. [S.l.]: EDP Sciences, 2019. v. 65, p. 02001. DOI: https://doi.org/10.1051/shsconf/20196502001

DERBENTSEV, V.; MATVIYCHUK, A.; SOLOVIEV, V. N. Forecasting of cryptocurrency prices using machine learning. In: Advanced Studies of Financial Technologies and Cryptocurrency Markets. [S.l.]: Springer, 2020. p. 211–231. DOI: https://doi.org/10.1007/978-981-15-4498-9_12

DERBENTSEV, V. et al. Forecasting cryptocurrency prices using ensembles-based machine learning approach. In: IEEE. International Conference on Problems of Infocommunications. Science and Technology (PIC S&T), 2020, [S.l.]. Anais [...]. Piscataway: IEEE, 2020. p. 707–712. DOI: https://doi.org/10.1109/PICST51311.2020.9468090

FANG, Q. et al. Prediction of blast-induced ground vibration in open-pit mines using a new technique based on imperialist competitive algorithm and M5Rules. Natural Resources Research, v. 29, n. 2, p. 791–806, 2020. DOI: https://doi.org/10.1007/s11053-019-09577-3

FRANK, E.; MAYO, M.; KRAMER, S. Alternating model trees. In: Proceedings of the 30th Annual ACM Symposium on Applied Computing, 2015, [S.l.]. Anais [...]. [S.l.]: [s.n.], 2015. p. 871–878. DOI: https://doi.org/10.1145/2695664.2695848

GNANAMBAL, S. et al. Classification algorithms with attribute selection: an evaluation study using WEKA. International Journal of Advanced Networking and Applications, v. 9, n. 6, p. 3640–3644, 2018.

HARYADI, D. et al. Implementation of support vector regression for polkadot cryptocurrency price prediction. JOIV: International Journal on Informatics Visualization, v. 6, n. 1-2, p. 201–207, 2022. DOI: https://doi.org/10.30630/joiv.6.1-2.945

HOROWITZ, J.; KLEMELÄ, J.; MAMMEN, E. Optimal estimation in additive regression models. Bernoulli, v. 12, n. 2, p. 271–298, 2006. DOI: https://doi.org/10.3150/bj/1145993975

KALEKAR, P. S. Time series forecasting using Holt-Winters exponential smoothing. Kanwal Rekhi School of Information Technology, v. 4329008, n. 13, p. 1–13, 2004.

KARGAR, K.; SAFARI, M. J. S.; KHOSRAVI, K. Weighted instances handler wrapper and rotation forest-based hybrid algorithms for sediment transport modeling. Journal of Hydrology, v. 598, p. 126452, 2021. DOI: https://doi.org/10.1016/j.jhydrol.2021.126452

KURNIAWAN, K.; MADELAN, S. Forecasting using time series analysis method in cryptocurrency period 2015–2022. International Journal of Innovative Science and Research Technology, v. 7, p. 1454–1459, 2022.

LV, L.-T.; JI, N.; ZHANG, J.-L. A RBF neural network model for anti-money laundering. In: International Conference on Wavelet Analysis and Pattern Recognition, 2008, [S.l.]. Anais [...]. Piscataway: IEEE, 2008. v. 1, p. 209–215. DOI: https://doi.org/10.1109/ICWAPR.2008.4635778

NEWSON, R. Parameters behind “nonparametric” statistics: Kendall’s tau, Somers’ D and median differences. The Stata Journal, v. 2, n. 1, p. 45–64, 2002. DOI: https://doi.org/10.1177/1536867X0200200103

NIRANJAN, A. et al. ERCR TV: Ensemble of random committee and random tree for efficient anomaly classification using voting. In: Proceedings of the 2018 3rd International Conference for Convergence in Technology (I2CT), 2018, [S.l.]. Anais [...]. Piscataway: IEEE, 2018. p. 1–5. DOI: https://doi.org/10.1109/I2CT.2018.8529797

PAUDEL, N.; BHATTA, J. Mushroom classification using random forest and REP tree classifiers. Nepal Journal of Mathematical Sciences, v. 3, n. 1, p. 111–116, 2022. DOI: https://doi.org/10.3126/njmathsci.v3i1.44130

POYRAZ, İ.; GÜRHANLI, A. Demand forecasting with time series analysis using drug sales data. International Journey of Engineering Research and Applications, v. 10, n. 7, p. 51-54, 2020.

RAMCHOUN, H. et al. Multilayer perceptron: Architecture optimization and training. International Journal of Interactive Multimedia and Artificial Intelligence, v. 4, n. 1, p. 26-30, 2016. DOI: https://doi.org/10.9781/ijimai.2016.415

REDDY, B. H. M.; REDDY, S. V.; SAROJAMMA, B. Data Mining Techniques for estimation of wind speed using WEKA. International Journal of Computer Sciences and Engineering (IJCSE), v. 9, n. 9, p. 49–53, 2021. DOI: https://doi.org/10.26438/ijcse/v9i9.4851

SABANCI, K.; ÜNLERŞEN, M. F.; POLAT, K. Classification of different forest types with machine learning algorithms. Research in Rural Development, v. 1, p. 254–260, 2016.

SAMSON, T. K. Comparative analysis of machine learning algorithms for daily cryptocurrency price prediction. Information Dynamics and Applications, v. 3, n. 1, p. 64–76, 2024. DOI: https://doi.org/10.56578/ida030105

SCHULZ, E.; SPEEKENBRINK, M.; KRAUSE, A. A tutorial on Gaussian process regression: Modelling, exploring, and exploiting functions. Journal of Mathematical Psychology, v. 85, p. 1–16, 2018. DOI: https://doi.org/10.1016/j.jmp.2018.03.001

SHI, L. et al. Signal prediction based on boosting and decision stump. International Journal of Computational Science and Engineering, v. 16, n. 2, p. 117–122, 2018. DOI: https://doi.org/10.1504/IJCSE.2018.090450

SINGH, P.; AGRAWAL, S. Node localization in wireless sensor networks using the M5P tree and SMOreg algorithms. In: 5th International Conference on Computational Intelligence and Communication Networks, 2013, [S.l.]. Anais [...]. Piscataway: IEEE, 2013. p. 104–104. DOI: https://doi.org/10.1109/CICN.2013.32

SKOWRON, A.; SURAJ, Z. A parallel algorithm for real-time decision making: a rough set approach. Journal of Intelligent Information Systems, v. 7, p. 5–28, 1996. DOI: https://doi.org/10.1007/BF00125520

SU, X.; YAN, X.; TSAI, C.-L. Linear regression. Wiley Interdisciplinary Reviews: Computational Statistics, v. 4, n. 3, p. 275–294, 2012. DOI: https://doi.org/10.1002/wics.1198

SUN, G. Cryptocurrency price prediction based on Xgboost, LightGBM and BNN. Applied and Computational Engineering, v. 49, p. 273–279, 2024. DOI: https://doi.org/10.54254/2755-2721/49/20241414

Downloads

Publicado

2026-04-21

Como Citar

Fonte, D. P. G. da, Izidoro, S. C., Lima, J. D. de, Ribas, S. L. P., Ribeiro, M. H. D. M., & Rogrigues, Érick O. (2026). ANALISANDO A EFICÁCIA DE ALGORITMOS DE PREVISÃO DO WEKA PARA A PREVISÃO DO COMPORTAMENTO DO BITCOIN . REVISTA DE ESTUDOS INTERDISCIPLINARES, 8(2), 01–25. https://doi.org/10.56579/rei.v8i2.2629

Métricas