کارآیی سه مدل kNN، RF و SVM و مدل حاصل از ترکیب آنها به روش GR برای مدل‌سازی بافت خاک

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دکتری گروه مهندسی علوم خاک، دانشکده کشاورزی، دانشگاه لرستان، خرم آباد، ایران

2 استادیار گروه مهندسی علوم خاک، دانشکده کشاورزی، دانشگاه لرستان، خرم آباد، ایران

3 استادیار گروه مرتع و آبخیزداری، دانشکده کشاورزی و منابع طبیعی، دانشگاه اردکان، اردکان، ایران

4 استاد گروه مهندسی علوم خاک، دانشکده کشاورزی، دانشگاه لرستان، خرم آباد، ایران

10.22092/ijsr.2024.364333.735

چکیده

بافت خاک یکی از مهمترین ویژگی‌هایی است که رفتار فیزیکی، شیمیایی و بیولوژکی خاک را کنترل می‌کند. روش‌های مختلفی برای مدل‌سازی بافت خاک استفاده می‌شوند که هر کدام دارای مزایای خاص خود هستند. یکی از راهکارهای سود بردن از مزایای این مدل‌ها ترکیب تخمین آنها است. با توجه به این که بافت خاک یک داده مرکب است، وقتی اجزاء آن جداگانه تخمین زده می‌شوند تضمینی برای برابر 100 شدن جمع سه جزء تخمینی وجود ندارد. برای تضمین برابر با 100 شدن تخمین‌های سه جزء بافت می‌توان از تبدیل‌های log-ratio استفاده کرد. اطلاعات کمی در خصوص کارآیی مدل‌های ترکیبی در مدل‌سازی داده‌های تبدیل‌شده و نشده بافت وجود دارد و به نظر می‌رسد بر اساس این رویکرد تا کنون مطالعه-ای روی بافت خاک انجام نشده است. در این بررسی تعداد 200 نمونه سطحی از خاک‌های منطقه کوهدشت برداشت شد. سه مدل جنگل تصادفی (RF)، k نزدیکترین همسایه (kNN) و ماشین‌های بردار پشتیبان (SVM) و مدل حاصل از ترکیب آن‌ها به روش Granger-Ramanathan (GR) برای مدل‌سازی، روش‌های additive log-ratio (alr)، centred log-ratio (clr) و isometric log-ratio (ilr) برای تبدیل داده‌ها و داده‌های حاصل از مدل رقومی ارتفاع (DEM) و تصاویر لندست 8 و سنتینل 2 به عنوان ورودی مدل‌ها استفاده شدند. نتایج نشان داد متغیرهای استخراج‌شده از DEM اهمیت بیشتری در پیش‌بینی بافت خاک داشتند. به‌طور کلی، هر چهار مدل با استفاده از تبدیل‌ alr منجر به تخمین‌های بهتری نسبت به تبدیل‌های clr و ilr و داده‌های تبدیل‌نشده (UT) گردیدند. مدل ترکیبی(GR) با مقادیر RMSE برابر با 07/5، 21/4، 81/5 و 09/6 درصد برای رس، مقادیر 11/7، 15/5، 04/9 و 70/6 درصد برای سیلت و مقادیر 20/9، 67/7، 69/11 و 74/8 درصد برای شن به ترتیب برای داده‌های UT و تبدیل‌های alr، clr و ilr منجر به بهبود تخمین‌ها نگردید. به‌طور کلی، مدل SVM با داده‌های تبدیل شده به روش alr کارآیی کمی بیشتر از سایر مدل‌ها داشت. نتایج نشان داد ترکیب چند مدل یادگیری ماشین الزاما باعث بهبود تخمین‌ها نمی‌گردد و به جای ترکیب نتایج چند الگوریتم که ممکن است باعث پیچیدگی فرایند مدل‌سازی شود، می‌توان از یک مدل مناسب برای برآورد بافت خاک استفاده کرد.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Using kNN, RF and SVM and their Combination Using GR for Soil Texture Modeling

نویسندگان [English]

  • Fereshteh Mirzaei 1
  • Alireza Amirian-Chakan 2
  • Ruhollah Taghizadeh-Mehrjardi 3
  • Hamid Reza Matinfar 4
1 Ph.D Student, Department of Soil Science, Faculty of Agriculture, Lorestan University, Khorramabad, Iran
2 Assitant Professor, Department of Soil Science, Faculty of Agriculture, Lorestan University, Khorramabad, Iran
3 Assitant Professor, Department of Rangeland and Watersghed Management, Faculty of Agriculture and Natural Resources, University of Ardakan, Ardakan, Iran.
4 Professor, Department of Soil Science, Faculty of Agriculture, Lorestan University, Khorramabad, Iran.
چکیده [English]

Soil texture is one of the most important soil properties that governing soil physical, chemical and biological behaviors. In modeling soil textural fractions different models are used, each has its own advantages. To combine the benefit from different models, one approach is combining their predictions. Since soil texture is a compositional data, when its fractions are estimated separately there is no guarantee that the estimates will sum to 100. Log-ratio transformations before modeling are ways to deal with the problem. Little is known about modeling transformed and untransformed (UT) soil texture data using a combination of different models. In present study, 200 surface soil samples (0-30 cm) were collected from Kuhdasht region. Random forest (RF), k-nearest neighbors (kNN) and support vector machines (SVM) and their combination using Granger-Ramanathan (GR) method were used to model soil texture data. Additive log-ratio (alr), centroid log-ratio (clr) and isometric log-ratio (ilr) transformations were used to transform texture data. Environmental variables derived from Landsat 8 and Sentinel-2 images and a digital elevation model (DEM) were used as input for all models. Results indicated that covariates derived from DEM were more important in modeling soil texture. All models improved the estimates of soil texture fractions when used alr transformed data compare to when using UT, clr and ilr transformed data. The combined model (i.e. GR) did not show superiority over other models. Using GR model RMSE values for alr, clr, ilr transformed clay data and UT clay data were 5.07%, 4.21%, 5.81% and 6.09%, respectively. For silt RMSE values (in the same order as clay) were 7.11%, 5.15%, 9.04% and 6.70%, and for sand were 9.20%, 7.67%, 11.69% and 8.74%, respectively. Generally, SVM using alr transformed data showed a slightly higher potential for modeling soil texture. To sum up, results indicated that combining different machine learning algorithms does not necessarily improved the estimates. Therefore, instead of using a model combination approach that may result in more complexity, it is possible to use a single appropriate model for modeling soil texture.

کلیدواژه‌ها [English]

  • Compositional data
  • Ensemble model
  • Log-ratio transformation
  • Random forest