نوع مقاله : مقاله پژوهشی
نویسندگان
1
دانشجوی دکتری گروه مهندسی علوم خاک، دانشکده کشاورزی، دانشگاه لرستان، خرم آباد، ایران
2
استادیار گروه مهندسی علوم خاک، دانشکده کشاورزی، دانشگاه لرستان، خرم آباد، ایران
3
استادیار گروه مرتع و آبخیزداری، دانشکده کشاورزی و منابع طبیعی، دانشگاه اردکان، اردکان، ایران
4
استاد گروه مهندسی علوم خاک، دانشکده کشاورزی، دانشگاه لرستان، خرم آباد، ایران
10.22092/ijsr.2024.364333.735
چکیده
بافت خاک یکی از مهمترین ویژگیهایی است که رفتار فیزیکی، شیمیایی و بیولوژکی خاک را کنترل میکند. روشهای مختلفی برای مدلسازی بافت خاک استفاده میشوند. یکی از راهکارهای سود بردن از مزایای این مدلها ترکیب تخمین آنها است. با توجه به این که بافت خاک یک داده مرکب است، وقتی اجزاء آن جداگانه تخمین زده میشوند تضمینی برای اینکه جمع سه جزء برابر 100 شود وجود ندارد، هرچند میتوان از تبدیلهای نسبت لگاریتمی (log-ratio) استفاده کرد. اطلاعات کمی در خصوص کارآیی مدلهای ترکیبی در مدلسازی دادههای تبدیلشده و نشده بافت خاک وجود دارد و به نظر میرسد بر اساس این رویکرد تا کنون مطالعهای روی بافت خاک انجام نشده است. در این بررسی، تعداد 200 نمونه خاکهای سطحی از منطقه کوهدشت برداشت شد. سه مدل جنگل تصادفی (RF)، k نزدیکترین همسایه (kNN) و ماشینهای بردار پشتیبان (SVM) و مدل حاصل از ترکیب آنها به روش Granger-Ramanathan (GR) برای مدلسازی، روشهای نسبت لگاریتمی جمعپذیر (alr)، نسبت لگاریتمی مرکزی (clr) و نسبت لگاریتمی ایزومتریک (ilr) برای تبدیل دادهها و دادههای حاصل از مدل رقومی ارتفاع (DEM) و تصاویر لندست 8 و سنتینل 2 به عنوان ورودی مدلها استفاده شد. نتایج نشان داد که متغیرهای استخراجشده از DEM اهمیت بیشتری در پیشبینی بافت خاک داشت. بهطور کلی، هر چهار مدل با استفاده از تبدیل alr منجر به تخمینهای بهتری نسبت به تبدیلهای clr و ilr و دادههای تبدیلنشده (UT) گردید. مدل ترکیبی(GR) با مقادیر RMSE برابر با 5/07، 4/21، 5/81 و 6/09 درصد برای رس، مقادیر 7/11، 5/15، 9/04 و 6/70 درصد برای سیلت و 9/20، 7/76، 11/69 و 8/74 درصد برای شن به ترتیب برای دادههای UT و تبدیلهای alr، clr و ilr منجر به بهبود تخمینها نگردید. بهطور کلی، کارآیی مدل SVM با دادههای تبدیل شده به روش نسبت لگاریتمی جمعپذیر کمی بیشتر از سایر مدلها بود. نتایج نشان داد که ترکیب چند مدل یادگیری ماشین الزاما باعث بهبود تخمینها نمیگردد و میتوان از یک مدل مناسب برای برآورد بافت خاک استفاده کرد.
کلیدواژهها
موضوعات
عنوان مقاله [English]
Using kNN, RF and SVM and their Combination Using GR for Soil Texture Modeling
نویسندگان [English]
-
Fereshteh Mirzaei
1
-
Alireza Amirian-Chakan
2
-
Ruhollah Taghizadeh-Mehrjardi
3
-
Hamid Reza Matinfar
4
1
Ph.D Student, Department of Soil Science, Faculty of Agriculture, Lorestan University, Khorramabad, Iran
2
Assitant Professor, Department of Soil Science, Faculty of Agriculture, Lorestan University, Khorramabad, Iran
3
Assitant Professor, Department of Rangeland and Watersghed Management, Faculty of Agriculture and Natural Resources, University of Ardakan, Ardakan, Iran.
4
Professor, Department of Soil Science, Faculty of Agriculture, Lorestan University, Khorramabad, Iran.
چکیده [English]
Soil texture is one of the most important soil properties that govern soil physical, chemical and biological behaviors. In modeling soil textural fractions, different models are used. To combine the benefits from different models, one approach is combining their predictions. Since soil texture is a compositional data, when its fractions are estimated separately there is no guarantee that the estimates will sum to 100. Log-ratio transformations before modeling are ways to deal with the problem. Little is known about modeling transformed and untransformed (UT) soil texture data using a combination of different models. In the present study, 200 surface soil samples (0-30 cm) were collected from Kuhdasht region. Random forest (RF), k-nearest neighbors (kNN) and support vector machines (SVM) and their combination using Granger-Ramanathan (GR) method were used to model soil texture data. Additive log-ratio (alr), centroid log-ratio (clr) and isometric log-ratio (ilr) transformations were used to transform texture data. Environmental variables derived from Landsat 8 and Sentinel-2 images and a digital elevation model (DEM) were used as input for all models. Results indicated that covariates derived from DEM were more important in modeling soil texture. All models improved the estimates of soil texture fractions when alr transformed data was compared to UT, clr, and ilr transformed data. The combined model (i.e. GR) did not show superiority over other models. Using GR model RMSE values for alr, clr, ilr transformed clay data and UT were 5.07%, 4.21%, 5.81%, and 6.09%, respectively. For silt RMSE values (in the same order as clay) were 7.11%, 5.15%, 9.04%, and 6.70%, and for sand were 9.20%, 7.67%, 11.69% and 8.74%, respectively. Generally, SVM using alr transformed data showed a slightly higher potential for modeling soil texture. Generally, results indicated that combining different machine learning algorithms did not necessarily improve the estimates. Therefore, it is possible to use a single appropriate model for modeling soil texture.
کلیدواژهها [English]
-
Compositional data
-
Ensemble model
-
Log-ratio transformation
-
Random forest