Conference PaperPDF Available

İHA Görüntülerinden Bireysel Ağaç Taç Segmentasyonunda YOLOv7, YOLOv8, Mask R-CNN ve Segment Anything Modelinin Karşılaştırmalı Performans Analizi

Authors:

Abstract

Ağaç sayımı, ürün gelişim takibi ve verim tahmini gibi birçok tarımsal uygulama için önemli veri kaynağı durumunda olan uzaktan algılama teknolojileri özellikle son yıllarda insansız hava aracı (İHA) teknolojileri ve yapay zeka alanındaki ilerlemeler ile birlikte hassas tarım uygulamalarında önemli bir rol oynamaktadır. Bu çalışmada, yüksek çözünürlüklü görüntüler üzerinden farklı ağaç türlerinin otomatik olarak tespiti ve taç alanı segmentasyonunda güncel derin öğrenme modellerinin (YOLOv7, YOLOv8 ve Mask R-CNN) ve son teknoloji segment anything modelin performanslarının karşılaştırmalı olarak analizi ele alınmıştır. Bu kapsamda, fıstık çamı ve zeytin ağacı yetiştirilen alanların bir arada bulunduğu Gebze Teknik Üniversitesi kampüsü içerisindeki çalışma alanına ait yüksek mekânsal çözünürlüklü İHA görüntülerinden üretilen ortomozaik temel veri seti olarak kullanılmıştır. Eğitim ve doğrulama veri seti olarak toplam 4105 örnek içeren 316 görüntü ile veri seti oluşturulmuştur. Performans analizinde standart model doğruluğu ölçütlerinin yanında, taç yapısını temsil eden segmentlerin kalitesi Alan Uyum Indeksi (AFI) ve Kalite Oranı (QR) ölçütleri yardımıyla analiz edilmiştir. Sonuç olarak, değerlendirmeye alınan üç derin öğrenme modelinden YOLOv7 ve YOLOv8 için F-Skor değerlerinde benzer sonuçlar elde edilirken (0.9745 ve 0.9669), Mask R-CNN ile en düşük F-Skor (0.9240) değeri hesaplanmıştır. Diğer taraftan, bireysel fıstık ağaçlarının taç yapısı segmentasyonunda, AFI ve QR indeksleri derin öğrenme tabanlı modellerin aksine SAM’ın daha başarılı olduğunu işaret ederken, Mask R-CNN modeli ile tahmin edilen segmentlerde hata oranının daha yüksek olduğu söylenebilir.
Türkiye Ulusal Fotogrametri ve Uzaktan Algılama Birliği (TUFUAB) XII. Teknik Sempozyumu - 24-26 Mayıs 2023 – Sivas, Türkiye
TUFUAB XII. TEKNİK
SEMPOZYUMU
https://tufuab2023.cumhuriyet.edu.tr/
İHA Görüntülerinden Bireysel Ağaç Taç Segmentasyonunda YOLOv7, YOLOv8, Mask R-CNN
ve Segment Anything Modelinin Karşılaştırmalı Performans Analizi
Mustafacan Saygı 1 , Osman Yavuz Altuntas 1, İsmail Çölkesen , Umut Güneş Sefercik
1Gebze Technical University, Engineering Faculty, Department of Geomatics Engineering, Kocaeli, Turkey
Anahtar Kelimeler ÖZ
Derin öğrenme,
Segment anything model,
Nesne segmentasyonu,
YOLO,
Mask R-CNN
Ağaç sayımı, ürün gelişim takibi ve verim tahmini gibi birçok tarımsal uygulama için önemli
veri kaynağı durumunda olan uzaktan algılama teknolojileri özellikle son yıllarda insansız
hava aracı (İHA) teknolojileri ve yapay zeka alanındaki ilerlemeler ile birlikte hassas tarım
uygulamalarında önemli bir rol oynamaktadır. Bu çalışmada, yüksek çözünürlüklü
görüntüler üzerinden farklı ağaç türlerinin otomatik olarak tespiti ve taç alanı
segmentasyonunda güncel derin öğrenme modellerinin (YOLOv7, YOLOv8 ve Mask R-CNN)
ve son teknoloji segment anything modelin performanslarının karşılaştırmalı olarak analizi
ele alınmıştır. Bu kapsamda, fıstık çamı ve zeytin ağacı yetiştirilen alanların bir arada
bulunduğu Gebze Teknik Üniversitesi kampüsü içerisindeki çalışma alanına ait yüksek
mekânsal çözünürlüklü İHA görüntülerinden üretilen ortomozaik temel veri seti olarak
kullanılmıştır. Eğitim ve doğrulama veri seti olarak toplam 4105 örnek içeren 316 görüntü
ile veri seti oluşturulmuştur. Performans analizinde standart model doğruluğu ölçütlerinin
yanında, taç yapısını temsil eden segmentlerin kalitesi Alan Uyum Indeksi (AFI) ve Kalite
Oranı (QR) ölçütleri yardımıyla analiz edilmiştir. Sonuç olarak, değerlendirmeye alınan üç
derin öğrenme modelinden YOLOv7 ve YOLOv8 için F-Skor değerlerinde benzer sonuçlar
elde edilirken (0.9745 ve 0.9669), Mask R-CNN ile en düşük F-Skor (0.9240) değeri
hesaplanmıştır. Diğer taraftan, bireysel fıstık ağaçlarının taç yapısı segmentasyonunda, AFI
ve QR indeksleri derin öğrenme tabanlı modellerin aksine SAM’ın daha başarılı olduğunu
işaret ederken, Mask R-CNN modeli ile tahmin edilen segmentlerde hata oranının daha
yüksek olduğu söylenebilir.
Comparitve Performance Analysis of YOLOv7, YOLOv8, Mask R-CNN and Segment Anything Model in
Individual Tree Crown Segmentation from UAV Images
Keywords ABSTRACT
Deep learning,
Segment anything model,
Object segmentation,
YOLO,
Mask R-CNN
Remote sensing technologies, primary data sources for many agricultural applications such
as tree counting, crop growth monitoring and yield estimation, play an important role in
precision agriculture applications, especially with the advances in unmanned aerial vehicle
(UAV) technologies and artificial intelligence in recent years. In this study, a comparative
analysis of the performance of state-of-art deep learning models (YOLOv7, YOLOv8, and
Mask R-CNN) and state-of-art segment anything model in automatically detecting different
tree species and individual tree species crown segmentation over high-resolution images is
discussed. In this context, the orthomosaic produced from high spatial resolution UAV
images of the study area within the Gebze Technical University campus, where pine and olive
trees are grown together, was used as the primary data set. Training and validation datasets
were created from the orthomosaic with 316 images containing 4105 samples. In the
performance analysis, in addition to the standard model accuracy measures, the quality of
the segments representing the individual tree crown was analysed with the help of Area Fit
Index (AFI) and Quality Rate (QR) measures. As a result, while similar F-Score results
(0.9745 and 0.9669) were obtained for YOLOv7 and YOLOv8 among the three deep learning
models evaluated, the lowest F-Score (0.9240) was calculated with Mask R-CNN. On the
other hand, in the crown structure segmentation of individual pine trees, AFI and QR indices
indicate that SAM is more successful than the others, while the error rate is higher in the
segments predicted by the Mask R-CNN model.
* Sorumlu Yazar Kaynak Göster (APA);
*(icolkesen@gtu.edu.tr) ORCID ID 0000-0001-9670-3023
(m.saygi2019@gtu.edu.tr) ORCID ID 0009-0003-6015-1273
(oyavuzaltuntas@gtu.edu.tr) ORCID ID 0000-0001-5940-4091
ResearchGate has not been able to resolve any citations for this publication.
ResearchGate has not been able to resolve any references for this publication.