So sánh hiệu quả các thuật toán Random Forest, SVM và Naive Bayes trong phân loại lớp phủ bề mặt sử dụng dữ liệu Sentinel-2 trên Google Earth Engine: Trường hợp nghiên cứu tại khu vực Thái Nguyên, Việt Nam
DOI:
https://doi.org/10.5281/zenodo.19762302Từ khóa:
Sentinel-2, phân loại lớp phủ bề mặt, Random Forest, Support Vector Machine, GEETóm tắt
Nghiên cứu này đánh giá hiệu quả của ba thuật toán học máy gồm Random Forest (RF), Support Vector Machine (SVM) và Naive Bayes (NB) trong phân loại lớp phủ bề mặt từ dữ liệu ảnh vệ tinh Sentinel-2 tại tỉnh Thái Nguyên. Dữ liệu ảnh được xử lý trên nền tảng Google Earth Engine (GEE), kết hợp các kênh phổ, chỉ số phổ, yếu tố địa hình và đặc trưng kết cấu ảnh để xây dựng tập dữ liệu đầu vào cho mô hình phân loại. Tổng cộng 18.524 pixel mẫu được sử dụng, trong đó 70% số mẫu dùng để huấn luyện và 30% dùng để đánh giá độ chính xác mô hình. Kết quả cho thấy sự khác biệt rõ rệt về hiệu quả phân loại giữa các thuật toán. RF đạt độ chính xác cao nhất với độ chính xác tổng thể (OA) 90,27% và hệ số Kappa 0,880; SVM cũng cho kết quả tốt với OA đạt 88,78% và Kappa 0,862. Trong khi đó, NB cho độ chính xác thấp hơn đáng kể với OA 37,41% và Kappa 0,238. Điều này cho thấy RF và SVM có khả năng mô hình hóa tốt các mối quan hệ phi tuyến giữa các biến phổ và lớp phủ bề mặt, trong khi giả định độc lập giữa các biến đầu vào của NB chưa phù hợp với đặc trưng phổ phức tạp của dữ liệu viễn thám đa phổ. Nghiên cứu khẳng định tiềm năng của việc kết hợp dữ liệu Sentinel-2 với các thuật toán học máy trên nền tảng GEE trong phân loại và xây dựng bản đồ lớp phủ bề mặt, đồng thời cung cấp cơ sở cho việc lựa chọn thuật toán phù hợp trong các nghiên cứu viễn thám.
Downloads
Tài liệu tham khảo
[1] M. Herold, P. Mayaux, C. Woodcock, A. Baccini, and C. Schmullius, "Some challenges in global land cover mapping: An assessment of agreement and accuracy in existing 1 km datasets," Remote Sensing of Environment, vol. 112, no. 5, pp. 2538-2556, 2008, doi: https://doi.org/10.1016/j.rse.2007.11.013.
[2] J. A. Richards and X. Jia, Remote sensing digital image analysis: an introduction. Springer, 2006. FAO, "FAOSTAT Analytical Brief 88 – Land Statistics 2001–2022. Global, regional and country trends," 2023.
[3] S. Hu et al., "Converging trend of global urban land expansion sheds new light on sustainable development," arXiv preprint https://doi.org/10.48550/arXiv.2310.02293.
[4] H. A. Nguyễn, "Ứng dụng giải thuật trí tuệ nhân tạo phân loại và dự báo sự phân bố lớp phủ thực vật sử dụng ảnh Landsat – vùng nghiên cứu tại đới ven bờ của tỉnh Bà Rịa Vũng Tàu Tạp chí Khoa học Đại học Cần Thơ, vol. 61, no. 2, pp. 67-79, 2025, doi: https://doi.org/10.22144/ctujos.2025.032.
[5] G. A. Afuye et al., "Global trend assessment of land use and land cover changes: A systematic approach to future research development and planning," Journal of King Saud UniversityScience, vol. 36, no. 7, p. 103262, 2024, doi: https://doi.org/10.1016/j.jksus.2024.103262.
[6] J. Chen et al., "Global land cover mapping at 30 m resolution: A POK-based operational approach," ISPRS Journal of Photogrammetry and Remote Sensing, vol. 103, pp. 7-27, 2015, doi: https://doi.org/10.1016/j.isprsjprs.2014.09.002.
[7] M. A. Wulder, J. G. Masek, W. B. Cohen, T. R. Loveland, and C. E. Woodcock, "Opening the archive: How free data has enabled the science and monitoring promise of Landsat," Remote Sensing of Environment, https://doi.org/10.1016/j.rse.2012.01.010. vol. 122, pp. 2-10, 2012,
[8] T. S. Unger Holtz, "Introductory digital image processing: A remote sensing perspective," ed: Association of Environmental & Engineering Geologists, 2007.
[10] T. Lillesand, R. W. Kiefer, and J. Chipman, Remote sensing and image interpretation. John Wiley & Sons, 2015.
[11] S. Gadal and G. Mozgeris, "Advances of remote sensing in land cover and cand use mapping," vol. 17, ed: MDPI, 2025, p. 1980.
[12] T. P. T. Giang, T. T. H. Phạm, V. H. Phạm, and A. B. Nguyễn, "Đánh giá độ chính xác trong phân loại lớp phủ dự trên thuật toán học máy và dữ liệu viễn thám thông qua Google Earth Engine: Ápdụng tại tỉnh Đắk Lắk," Journal of Science on Natural Resources Environment, no. 46, pp. 55-65, 2021.
[13] T. T. H. Lê and T. P. T. Giang, "Sử dụng ảnh vệ tinh Sentinel-2 trong giám sát sự phát triển của cây lúa tại tỉnh Đồng Tháp, Việt Nam," Tạp chí Khí tượng thuỷ văn, vol. 764, pp. 93108, 2024, doi: ttps://doi.org/10.36335/VNJHM.2024(764).93-108.
[14] V. T. Nguyễn, T. N. P. Đoàn, and T. D. Bùi, "Sử dụng các chỉ số phổ của dữ liệu ảnh vệ tinh Sentinel-2 và Landsat-8 thành lập bản đồ mức độ cháy rừng ở xã Na Ngoi, Kỳ Sơn, Nghệ An," Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất, vol. 59, no. 5, pp. 44-54, 2018.
[15] T. N. T. N. Nguyễn, K. D. Nguyễn, and K. D. Phan, "Xây dựng bản đồ phân bố không gian hiện trạng sử dụng đất nông nghiệp huyện Tân Hưng, tỉnh Long An sử dụng kết hợp chuỗi ảnh Sentinel 2 và Sentinel 1," Tạp chí Khoa học Đại học Cần Thơ, vol. 61, pp. 144-154, 2025, doi: https://doi.org/10.22144/ctujos.2025.065.
[16] H. S. Nguyen, "Ứng dụng viễn thám và Google Earth Engine thành lập bản đồ hiện trạng sử dụng đất nông nghiệp năm 2023 ở huyện Hòa Vang, thành phố Đà Nẵng," Hue University Journal of Science: Agriculture and Rural Development, vol. 133, no. 3B, pp. 17–33-17–33, 2024, doi: https://doi.org/10.26459/hueunijard.v133i3B.7443.
[17] Đ. C. Nguyễn, Đ. C. Phạm, and V. B. Nguyễn, "Sử dụng ảnh Sentinel-2 và Google Earth Engine để đánh giá biến động diện tích rừng phòng hộ và đặc dụng tại huyện Võ Nhai, tỉnh Thái Nguyên," Tạp chí Khoa học Lâm nghiệp, vol. 1, pp. 106-114, 2022.
[18] T. T. H. Phạm, N. Q. Vũ, T. N. Lê, T. N. P. Đoàn, and M. H. H. Nguyễn, "Nghiên cứu khả năng ứng dụng thuật toán Random Forest và ảnh vệ tinh Sentinel-2 trong phân loại lớp phủ mặt đất tỉnh Quảng Bình trên nền tảng Google Colab," Tạp chí Khí tượng thuỷ văn, vol. 756, pp. 29-41, 2023, doi: https://doi.org/10.36335/VNJHM.2023(756).29-41.
[19] L. Ma, Y. Liu, X. Zhang, Y. Ye, G. Yin, and B. A. Johnson, "Deep learning in remote sensing applications: A meta-analysis and review," ISPRS journal of photogrammetry and remote sensing, vol. 152, pp. 166-177, 2019, doi: https://doi.org/10.1016/j.isprsjprs.2019.04.015.
[20] V. A. Trần et al., "Nghiên cứu một số phương pháp học máy trong thành lập bản đồ lớp phủ bề mặt tỉnh Cà Mau trên nền tảng Google Earth Engine," Tạp chí Khoa học Đo đạc và Bản đồ, no. 55, pp. 18-26, 2023.
[21] T. C. Nguyễn, Q. B. Trần, T. Đ. Trương, T. H. Nguyễn, V. D. Phạm, and H. H. Nguyễn, "Kết hợp trí tuệ nhân tạo (AI) và Google Earth Engine (GEE) để phân loại các lớp phủ từ ảnh Sentinel-2: trường hợp nghiên cứu tại xã Quảng Sơn và xã Tà Đùng, tỉnh Lâm Đồng," Tạp chí Khoa học và công nghệ Lâm nghiệp, vol. 14, no. 7, pp. 60-70, 2025, doi: https://doi.org/10.55250/jo.vnuf.14.7.2025.060-070.
[22] C. H. Phạm and T. N. Nguyễn, "Ứng dụng Google Earth Engine giám sát biến động không gian xanh tại thành phố Thủ Đức bằng ảnh Sentinel 2 giai đoạn 2019-2024," Tạp chí Trắc địa - Bản đồ, vol. 11, no. 3, pp. 25-39, 2025, doi: 0.5281/zenodo.15795229.
[23] T. O. Nông, X. T. Trần, H. T. Tạ, and V. N. Trịnh, "Mô hình tự động phân loại dữ liệu lớp phủ bề mặt phục vụ kiểm kê khí nhà kính bằng ảnh viễn thám," Tạp chí Khoa học Đo đạc và Bản đồ, no. 57, pp. 55-64, 2023.
[24] T. P. T. Đỗ, M. H. Lê, N. N. Nguyễn, T. T. H. Vũ, and K. V. Nguyễn, "Giám sát lớp phủ bề mặt khu dự trữ sinh quyển Cần Giờ sử dụng thuật toán Random Forest trên nền tảng điện toán đám mây," Tạp chí Khí tượng thuỷ văn, vol. 770, pp. 58-67, 2025, doi: https://doi.org/10.36335/VNJHM.2025(770).58-67.
[25] M. Belgiu and L. Drăguţ, "Random forest in remote sensing: A review of applications and future directions," ISPRS journal of photogrammetry and remote sensing, vol. 114, pp. 2431, 2016, doi: https://doi.org/10.1016/j.isprsjprs.2016.01.011.
[26] G. Mountrakis, J. Im, and C. Ogole, "Support vector machines in remote sensing: A review," ISPRS journal of photogrammetry and remote sensing, vol. 66, no. 3, pp. 247-259, 2011, doi: https://doi.org/10.1016/j.isprsjprs.2010.11.001.
Lượt tải xuống
Đã Xuất bản
Số
Chuyên mục
Giấy phép
Bản quyền (c) {copyrightHolder}

Tác phẩm này được cấp phép theo Giấy phép Creative Commons Ghi công 4.0 Quốc tế.
Giấy phép CC 4.0