Perbandingan alat pengekstrakan data teks janaan pengguna
List of Authors
  • Fatimah Rahmat , Nurul Shakirah Mohd Zawawi , Zuraihah Ngadengon

Keyword
  • Data teks, data yang dijana pengguna, media sosial, big data, perlombongan data

Abstract
  • Era Big Data dan perlombongan data telah mewarnai dunia penyelidikan data teks yang dijana pengguna. Peningkatan pengguna media sosial setiap tahun bermaksud pertambahan data dan maklumat yang dijana pengguna memenuhi ruang pelayan di kerangka utama laman sesawang terlibat. Data dan maklumat ini amat bernilai sekiranya digunakan untuk tujuan penyelidikan. Namun begitu, bagaimanakah untuk mengekstrak bilangan data teks dalam jumlah yang banyak dengan mudah? Terdapat alat-alat pengesktrakan data teks yang telah dicipta untuk menyelesaikan masalah ini. Malah, banyak kajian terdahulu yang menggunakan data teks sebagai data utama dalam kajiannya tetapi tiada penerangan jelas tentang cara menggunakan alat pengekstrakan data teks tersebut. Oleh itu, kajian ini membincangkan berkenaan lima alat pengesktrakan data teks, ciri-ciri alat pengekstrakan data teks dan perbandingan terhadap 5 alat tersebut. Kajian ini telah melalui fasa penerokaan penting iaitu pemasangan perisian, pengujianan dan hasil output bagi setiap alat tersebut. Hasil kajian ini mendapati bahawa, setiap penggunaan alat pengekstrakan data teks mempunyai ciri istimewa yang tersendiri iaitu jenis perisian, tahap penggunaan, asas pengetahuan pengguna dan jenis laman sesawang yang boleh diekstrak. Selepas melalui proses pengujian bagi setiap alat, kajian ini mendapati bahawa alat pengekstrakan data teks ini sangat memudahkan pengguna untuk mendapatkan data teks dalam kuantiti yang banyak secara sistematik. Oleh itu, semoga kajian ini dimanfaatkan sepenuhnya bagi membolehkan para penyelidik berinteraksi dan berkongsi idea dengan ramai orang serta menjadi rujukan untuk penyelidikan akan datang.

Reference
  • 1. Ahmad, F., Ismail, N. H., Aziz, A. A. (2015) The Prediction of Students’ Academic Performance Using Classification Data Mining Techniques. Applied Mathematical Sciences (Vol. 9 No 129): 6415-6426 http://dx.doi.org/10.12988/ams.2015.53289
    2. Amado, A., Cortez, P., Rita, P. & Moro, S. (2017) Research trends on Big Data in Marketing: A text mining and topicmodeling based literature analysis. European Research on Management and Business Economics 24: 1-7.
    3. About Octoparse. (n.d). Retrieved from https://www.octoparse.com/blog/what-is-octoparse. Handayani, D., Bakar, N.S.A.A & Abuzuraida, M.A (2018) Sentiment Analysis for Malay Language: Systematic Literature Review. 2018 International Conference on Information and Communication Technology for the Muslim World, 305-310.
    4. Hiltz, S.R. & Plotnick, L. (2013) Dealing with Information Overload When Using Social Media for Emergency Management: Emerging Solutions. Proceedings of the 10th International ISCRAM Conference, 823-827.
    5. Huang, S., Peng, W., Li, J. & Lee, D. (2013) Sentiment and Topic Analysis on Social Media: A Multi-Task Multi-Label Classification Approach. Proceedings of the 5th Annual ACM Web Science Conference, 172-181.
    6. Jalonen, H. (2014) Social Media – An Arena for Venting Negative Emotions. International Conference on Communication, Media, Technology and Design: 224-230.
    7. Kente, M. (2017) Social Network Analysis. Department of Computer Science and Engineering University Of Gothenburg Retrieved from https://pdfs.semanticscholar.org/ee6e/78eb34e0f6287aaec7c1293d3a4cdd8ed270.pdf Keyling, T & Junger, J. (2019) Facepager application. Retrieved from https://github.com/strohne/Facepager.
    8. Kim, A. J., & Johnson, K. K. P. (2016). Power of consumers using social media: Examining the influences of brand-related user-generated content on Facebook. Computers in Human Behavior, 58, 98–108. doi:10.1016/j.chb.2015.12.047
    9. Korde, V. & Mahendar, C.M. (2012). Text Classification And Classifiers : A Survey. International Journal of Artificial Intelligence & Applications (IJAIA Vol. 3, No. 2, March 2012): 85-99.
    10. Nasridinov, A & Park, Y. H. (2013) Visual Analytics for Big Data Using R. 2013 International Conference on Cloud and Green Computing, Karlsruhe, 564-565. doi: 10.1109/CGC.2013.96
    11. Singh, T & Maini, R. (2013) A Comprehensive Review On Search Engine Optimization. Journal of Global Research in Computer Science Volume 4 No 1: 49-54.
    12. Sharma, S. & Srivastava, S.K. (2016) Review on Text Mining Algorithms. International Journal of Computer Applications Volume 134: 39-43.
    13. Web Analysis for Exportcomments - exportcomments.com. (n.d.). Retrieved from https://exportcomments.com.cutestat.com/.