
ABSTRAK
Perkembangan pesat teknologi visi komputer telah memberikan dukungan teknis baru untuk pertanian cerdas. Penyakit sayuran merupakan ancaman signifikan terhadap produksi pertanian, dengan tingkat keparahan yang tidak dapat diabaikan. Namun, melalui tindakan pencegahan dan pengendalian yang efektif secara ilmiah, dampak negatif ini dapat dikurangi secara signifikan. Sistem deteksi penyakit cerdas, sebagai metode canggih yang menggantikan pemeriksaan manual tradisional, telah menjadi sarana penting untuk mengembangkan pertanian cerdas dan meningkatkan efisiensi manajemen produksi sayuran. Meskipun demikian, deteksi manual tradisional tidak hanya memakan waktu dan padat karya tetapi juga menghadapi keterbatasan akurasi, sementara metode deteksi visi komputer yang ada masih menghadapi serangkaian tantangan saat menghadapi latar belakang yang kompleks, manifestasi penyakit yang beragam, dan berbagai tingkat oklusi dalam lingkungan budidaya nyata, termasuk kemampuan anti-interferensi yang tidak memadai, presisi deteksi yang terbatas, dan kinerja waktu nyata yang tidak optimal. Penelitian ini membahas tantangan praktis dari keterbatasan perolehan data dan kelangkaan sampel untuk penyakit sayuran yang dilindungi dengan mengusulkan strategi inovatif yang menerapkan kombinasi teknik penambahan data yang dibedakan untuk berbagai kategori sampel, yang secara signifikan meningkatkan ketahanan model terhadap gangguan lingkungan. Berdasarkan konsep terintegrasi visi mesin dan pembelajaran mendalam, kami mengembangkan jaringan deteksi penyakit sayuran ringan bernama VegetableDet. Jaringan ini secara inovatif menggabungkan Deformable Attention Transformer (DAT) dengan arsitektur backbone YOLOv8n, meningkatkan kemampuan persepsi untuk dependensi fitur jarak jauh. Secara bersamaan, Channel-Spatial Adaptive Attention Mechanism (CSAAM) diintegrasikan ke dalam jaringan Neck, mencapai lokalisasi yang tepat dan peningkatan fitur-fitur utama. Untuk mengatasi masalah efisiensi konvergensi model yang rendah, kami selanjutnya merancang strategi pelatihan pembelajaran transfer progresif hierarkis, yang secara efektif mempercepat proses adaptasi model dan meningkatkan akurasi deteksi. Evaluasi eksperimental menunjukkan bahwa pada kumpulan data penyakit sayuran terlindungi komprehensif khusus kami, model VegetableDet menunjukkan kinerja yang sangat baik dalam mendeteksi 30 penyakit dan sampel sehat di 5 jenis sayuran, dengan presisi (P), recall (R), dan presisi rata-rata (AP) semuanya melebihi 90%, dan Presisi Rata-rata (mAP) keseluruhan mencapai 94,31%. Model ini menunjukkan kemampuan beradaptasi yang kuat dalam kondisi lingkungan yang kompleks, memberikan dukungan teknis yang andal untuk pemantauan waktu nyata dan pencegahan serta pengendalian yang tepat terhadap penyakit sayuran terlindungi, dengan prospek aplikasi yang luas.
1 Pendahuluan
Dengan terus berkembangnya teknologi visi komputer, aplikasinya dalam skenario praktis telah menjadi semakin luas. Penyakit sayuran merupakan ancaman besar, dengan tingkat keparahan yang sebanding dengan bencana alam yang mempengaruhi manusia. Namun, tidak seperti bencana alam, dampak penyakit sayuran dapat dikurangi secara efektif melalui tindakan pencegahan dan pengendalian ilmiah (Liu, Zhu, dkk. 2021 ). Mengganti inspeksi visual manual dengan deteksi penyakit cerdas sangat penting untuk memajukan pertanian cerdas dan manajemen produksi sayuran, yang telah menjadi tugas utama yang dihadapi petani. Metode deteksi penyakit manual tradisional memakan waktu dan padat karya, sehingga menyulitkan manajemen yang efektif bagi petani. Akibatnya, metode visi komputer semakin banyak diterapkan untuk mendeteksi penyakit sayuran yang dilindungi di lingkungan yang terkendali (Upadhyay dkk. 2025 ).
Budidaya sayuran yang dilindungi biasanya terjadi di lingkungan yang terkendali seperti rumah kaca, yang, sambil mengatur suhu, kelembaban, dan konsentrasi karbon dioksida untuk meningkatkan pertumbuhan tanaman, juga menciptakan kondisi yang menguntungkan untuk reproduksi patogen, terutama di lingkungan bersuhu tinggi dan kelembaban tinggi (Friha et al. 2021 ). Penyakit sayuran yang dilindungi dapat menyebabkan penurunan hasil yang dramatis, dengan infeksi yang parah berpotensi menyebabkan kehilangan panen total. Meskipun terjadinya penyakit sayuran mengikuti pola spasiotemporal tertentu, keacakan dan tiba-tiba membuat pencegahan, diagnosis, dan pengobatan menjadi rumit (Zhang et al. 2024 ). Sayuran yang berbeda rentan terhadap berbagai jenis penyakit, masing-masing dengan karakteristik unik, membuat manajemen lebih menantang. Kesalahan diagnosis atau keterlambatan pengobatan dapat mengakibatkan kerugian yang sangat besar, yang secara serius mempengaruhi ekonomi dan mata pencaharian (Lin et al. 2024 ).
Dalam skenario budidaya aktual, mendeteksi penyakit sayuran menghadapi banyak tantangan, termasuk berbagai ukuran area yang terinfeksi, masalah oklusi, dan lingkungan latar belakang yang kompleks. Algoritme deteksi yang ada sering kali menunjukkan ketahanan yang buruk, akurasi yang rendah, dan kinerja waktu nyata yang tidak memadai dalam kondisi ini (Zhang et al. 2021 ). Karakteristik penting dari penyakit sayuran yang dilindungi adalah proses perkembangannya yang dinamis. Lokasi dan distribusi ukuran penyakit sayuran yang dilindungi menunjukkan keacakan dan ketidakpastian yang tinggi. Tidak seperti tugas visi komputer konvensional di mana ukuran objek relatif tetap dan hanya berskala proporsional dengan jarak pemotretan, penyakit sayuran yang dilindungi menunjukkan variasi skala yang signifikan selama proses perkembangannya. Seperti yang ditunjukkan pada Gambar 1 , penyakit awalnya muncul sebagai lesi kecil pada daun (Gambar 1A ), kemudian berkembang dengan cepat hingga menempati sebagian besar area daun (Gambar 1B ), dan akhirnya dapat menyebar ke seluruh tanaman (Gambar 1C ). Proses transisi yang cepat ini dari lesi kecil menjadi infeksi area yang luas menyulitkan model yang sama untuk secara efektif mengidentifikasi dan menemukan penyakit pada tahap perkembangan yang berbeda, dengan deteksi gejala minor awal menjadi sangat menantang.

Lebih jauh lagi, metode penanaman yang rapat pada sayuran yang dilindungi semakin meningkatkan kompleksitas deteksi penyakit. Faktor-faktor seperti oklusi timbal balik antara tanaman, tumpang tindih daun, dan pencahayaan yang tidak merata semuanya memengaruhi kinerja deteksi model. Terutama dalam kondisi tumpang tindih daun atau pencahayaan latar, karakteristik penyakit dapat dengan mudah dikaburkan, yang mengarah pada deteksi yang terlewat atau positif palsu (Yan dan Yang 2022 ). Sementara itu, gejala yang serupa antara penyakit yang berbeda juga meningkatkan kesulitan diagnosis yang akurat; misalnya, fenomena klorosis dapat disebabkan oleh beberapa patogen atau faktor lingkungan, yang memerlukan diferensiasi fitur yang lebih halus (Kang et al. 2024 ). Dai dan Fan ( 2022 ) menunjukkan bahwa solusi deteksi penyakit tanaman kelas industri perlu mempertimbangkan waktu pengenalan dan akurasi secara bersamaan, menyeimbangkan kinerja dan efisiensi dalam skenario pertanian yang sebenarnya.
Ferrag et al. ( 2022 ) menekankan peran penting pembelajaran mendalam dan visi komputer dalam Pertanian 4.0, khususnya mencatat bahwa aplikasi dalam deteksi penyakit perlu mempertimbangkan secara komprehensif teknologi Internet of Things (IoT) dan kinerja keamanan untuk membangun sistem pertanian cerdas yang lengkap. Sistem deteksi penyakit sayuran yang dilindungi, sebagai komponen penting dari pertanian cerdas, perlu terintegrasi secara efisien dengan sistem lain untuk mencapai manajemen proses penuh dari deteksi hingga pencegahan dan pengendalian (Yang et al. 2021 ). Wang et al. ( 2022 ) mengusulkan bahwa di bawah latar belakang Industri 5.0, model pertanian paralel berdasarkan sistem siber-fisik-sosial akan menjadi tren pengembangan masa depan, yang membutuhkan teknologi deteksi penyakit untuk beradaptasi dengan kebutuhan mode produksi pertanian baru ini.
Saat ini, pembelajaran mendalam telah menjadi fokus penelitian deteksi penyakit tanaman karena dapat meminimalkan bias dalam pemilihan fitur penyakit secara manual (Paul et al. 2024 ). Secara khusus, Jaringan Syaraf Tiruan Konvolusional (CNN) telah menunjukkan kemampuan yang kuat dalam tugas klasifikasi gambar dan deteksi objek, yang mampu secara otomatis mengekstraksi fitur yang efektif dari gambar. Namun, model CNN tradisional biasanya memiliki jumlah parameter yang sangat besar dan kompleksitas komputasi yang tinggi, sehingga sulit untuk diterapkan pada perangkat tepi yang terbatas sumber dayanya, yang merupakan terminal umum dalam skenario pertanian cerdas (Mhala et al. 2025 ). Selain itu, model CNN terutama berfokus pada fitur lokal gambar, cenderung mengabaikan informasi kontekstual global, yang menyebabkan penurunan akurasi deteksi di latar belakang yang kompleks (Bonora et al. 2021 ).
Liu, Min, dkk. ( 2021 ) secara signifikan meningkatkan akurasi pengenalan penyakit tanaman dengan membangun kumpulan data penyakit tanaman skala besar dan mengusulkan pendekatan pembobotan ulang wilayah visual dan kerugian, yang menunjukkan potensi pembelajaran mendalam dalam memecahkan masalah distribusi acak, gejala yang beragam, dan latar belakang penyakit tanaman yang kompleks. Namun, membangun model umum untuk jenis penyakit sayuran tertentu masih menghadapi tantangan, terutama dalam menangani jenis penyakit yang tidak terlihat, di mana kemampuan generalisasi perlu ditingkatkan (Barbedo 2019 ). Penelitian Barbedo ( 2018 ) menunjukkan bahwa faktor-faktor yang memengaruhi pembelajaran mendalam untuk pengenalan penyakit tanaman meliputi ukuran kumpulan data, kompleksitas latar belakang, keragaman gejala, dan kualitas gambar, yang memerlukan pertimbangan komprehensif dari berbagai aspek untuk meningkatkan efektivitas model.
Zhao et al. ( 2021 ) secara efektif memecahkan masalah ketidakseimbangan data dengan menggunakan Double Generative Adversarial Network (DoubleGAN) untuk menghasilkan citra daun tanaman yang tidak sehat, yang penting untuk menangani jenis penyakit langka. Khususnya untuk beberapa penyakit yang hidup berdampingan pada sayuran yang dilindungi, model generatif dapat membantu membuat sampel pelatihan yang lebih beragam (Rahman et al. 2020 ). Hu et al. ( 2020 ) berhasil meningkatkan akurasi pengenalan penyakit pinus pada citra UAV dengan menggabungkan jaringan saraf konvolusional dalam, jaringan adversarial generatif konvolusional dalam, dan pengklasifikasi AdaBoost, yang menunjukkan efektivitas strategi fusi multimodel pada latar belakang yang kompleks.
Meskipun jaringan deteksi objek tingkat lanjut seperti YOLOv8 secara bertahap memperluas bidang reseptif melalui operasi konvolusi multi-lapis, kernel konvolusi yang relatif kecil di setiap lapisan membuatnya mudah kehilangan dependensi fitur jarak jauh selama ekstraksi fitur, yang sangat penting untuk mengenali penyakit sayuran secara akurat pada berbagai tahap perkembangan. Terutama di lingkungan penanaman yang padat, gejala penyakit dapat tersebar di berbagai bagian tanaman, yang mengharuskan model memiliki kemampuan untuk menangkap asosiasi fitur yang jauh (Cheemaladinne dan Srinivasa Reddy 2024 ). Wu et al. ( 2020 ) mengusulkan untuk menggabungkan model segmentasi semantik Deeplab V3+ dengan algoritma pembesaran video berbasis fase, yang berhasil mencapai deteksi laju pernapasan untuk ternak, menyediakan pendekatan baru untuk deteksi penyakit sayuran yang dilindungi dengan menggabungkan teknologi dari berbagai domain.
Dalam beberapa tahun terakhir, arsitektur Transformer telah membuat kemajuan signifikan dalam bidang visi komputer berkat mekanisme self-attention yang kuat, yang secara efektif memodelkan dependensi jarak jauh dan menangkap informasi kontekstual global (Wójcik Gront et al. 2024 ). Vision Transformer (ViT) menunjukkan kemampuan pemahaman gambar yang kuat dengan membagi gambar menjadi patch berukuran tetap dan menghitung hubungan antara patch (Sun et al. 2025 ). Namun, Vision Transformer standar cenderung overfit saat memproses dataset skala kecil hingga menengah, dan kompleksitas komputasinya meningkat secara kuadrat dengan ukuran gambar, membatasi aplikasinya dalam skenario terbatas sumber daya. Toda dan Okura ( 2019 ) mengungkapkan mekanisme internal jaringan saraf konvolusional yang mendiagnosis penyakit tanaman melalui metode visualisasi, menemukan bahwa jaringan saraf dapat menangkap fitur warna dan tekstur penyakit tertentu, mirip dengan proses pengambilan keputusan manusia, yang menyediakan referensi penting untuk kecerdasan buatan yang dapat ditafsirkan dalam aplikasi pertanian.
Zhuang dan Zhang ( 2019 ) memperoleh hasil yang baik dalam mengenali status kesehatan ayam pedaging, menunjukkan penerapan pembelajaran mendalam dalam pemantauan kesehatan hewan, yang sama pentingnya untuk deteksi dini dan peringatan penyakit sayuran yang dilindungi. Penelitian Wang dkk. ( 2023 ) tentang penerapan termografi inframerah dan teknik pembelajaran mesin dalam penilaian kesehatan ternak menunjukkan bahwa metode deteksi non-kontak yang dikombinasikan dengan pembelajaran mesin dapat secara efektif menunjukkan perubahan sifat biologis termal dalam metabolisme hewan, memberikan ide-ide baru untuk deteksi non-destruktif penyakit sayuran yang dilindungi.
Untuk mengatasi masalah ini, para peneliti telah mengusulkan berbagai arsitektur Transformer yang ditingkatkan. Di antaranya, Vision Transformer dengan Deformable Attention (DAT) menunjukkan keuntungan tertentu dengan memilih posisi relatif kunci dan nilai dalam mekanisme perhatian dengan cara yang bergantung pada data, berfokus secara fleksibel pada wilayah yang relevan, dan menangkap informasi fitur yang lebih berguna (Xia et al. 2022 ). Dibandingkan dengan mekanisme perhatian jendela tetap, perhatian yang dapat dideformasi dapat secara adaptif menyesuaikan rentang dan bentuk perhatian berdasarkan konten input, beradaptasi lebih baik dengan fitur penyakit dengan ukuran dan morfologi yang berbeda (Zhu, Su, Lu, Li, et al. 2020 ). Su et al. ( 2020 ) memantau karat garis gandum dalam pertanian pintar menggunakan persepsi visual udara, menggabungkan penginderaan UAV, pencitraan multispektral, dan pembelajaran mendalam U-Net, membuktikan bahwa metode yang memanfaatkan informasi spektral dan spasial mengungguli pengklasifikasi spektral murni, menyediakan pendekatan fusi multi-moda untuk deteksi penyakit sayuran yang dilindungi.
Jelali ( 2022 ) melakukan tinjauan komprehensif terhadap jaringan saraf dalam untuk deteksi hama dan penyakit tomat menggunakan kumpulan data lapangan nyata, yang menunjukkan bahwa sebagian besar penelitian menggunakan kumpulan data PlantVillage yang dikumpulkan dalam kondisi terkendali, yang mengarah pada hasil yang terlalu optimis, sementara ada lebih sedikit penelitian yang mengevaluasi kinerja dalam latar belakang yang kompleks. Temuan ini menekankan pentingnya mengevaluasi kinerja model dalam lingkungan fasilitas yang sebenarnya. Jian dkk. ( 2025 ) mengusulkan metode pengenalan penyakit daun tomat berdasarkan DGP-SNNet, yang secara efektif memecahkan masalah kesamaan antara kategori penyakit melalui pembelajaran transfer progresif hierarkis dan modul konvolusi parsial, yang memiliki nilai referensi penting untuk membedakan berbagai jenis penyakit pada sayuran yang dilindungi.
Li et al. ( 2024 ) mengusulkan model YOLO-Leaf, memanfaatkan konvolusi ular dinamis (DSConv) untuk ekstraksi fitur, meningkatkan akurasi deteksi penyakit daun apel, dan menunjukkan potensi struktur konvolusional khusus dalam deteksi penyakit tanaman. Mathew dan Mahesh ( 2021 ) menggunakan YOLOv5 untuk mendeteksi penyakit bercak bakteri pada tanaman cabai, yang mampu mendeteksi lesi kecil pada daun dengan kecepatan dan akurasi yang sebanding, yang penting untuk diagnosis dini penyakit sayuran. Liu, Lin, et al. ( 2021 ) mengusulkan algoritma berbasis CNN yang secara efektif mengidentifikasi tiga penyakit daun mentimun yang berbeda, menunjukkan efektivitas pembelajaran mendalam dalam mendeteksi penyakit sayuran tertentu.
Untuk mengatasi kesulitan pengumpulan data penyakit sayuran dan terbatasnya ketersediaan sampel, para peneliti telah mencoba berbagai teknik augmentasi data dan transfer learning. Augmentasi data menciptakan sampel pelatihan baru dengan mengubah gambar asli, meningkatkan keragaman data, dan meningkatkan kemampuan generalisasi model (Lin et al. 2024 ). Transfer learning membantu model beradaptasi dengan cepat dan konvergen pada tugas target skala kecil dengan memanfaatkan pengetahuan dari model yang telah dilatih sebelumnya pada kumpulan data skala besar (Attri et al. 2025 ). Kumar et al. ( 2021 ) mengusulkan metode deteksi penyakit daun padi berdasarkan jaringan piramida perhatian fitur dua arah, mencapai hasil yang baik dalam kombinasi dengan model YOLOv5, secara efektif mengatasi masalah deteksi penyakit pada skala yang berbeda melalui ekstraksi fitur multi-skala.
Nagasubramanian dkk. ( 2021 ) mengusulkan sistem pemantauan penyakit tanaman berdasarkan klasifikasi ensemble dan IoT, yang menggabungkan SVM dan CNN untuk mencapai pengamatan berkelanjutan terhadap pertumbuhan tanaman dan penyakit daun, yang memberikan dukungan keputusan tepat waktu bagi petani. Penelitian Xin dan Wang ( 2021 ) tentang pengenalan citra hama dan penyakit tanaman berdasarkan pembelajaran mendalam menunjukkan bahwa model DCNN-G yang terintegrasi dengan analisis data Google berkinerja sangat baik dalam pengenalan penyakit, sekaligus menekankan dampak penting kualitas data pada kinerja model. Lin dkk. ( 2023 ) merancang model deteksi penyakit daun teh TSBA-YOLO berdasarkan jaringan piramida perhatian fitur dwiarah, yang meningkatkan kemampuan untuk memperoleh informasi global melalui mekanisme perhatian-diri, sementara jaringan fusi fitur BiFPN dan teknik fusi fitur spasial adaptif meningkatkan kemampuan fusi fitur multiskala penyakit daun teh, yang meningkatkan ketahanan model terhadap latar belakang yang kompleks.
Bao et al. ( 2023 ) meneliti deteksi penginderaan jarak jauh UAV terhadap penyakit bercak daun teh berdasarkan DDMA-YOLO yang mengusulkan metode pemantauan yang efektif, merekonstruksi citra daun teh beresolusi tinggi melalui jaringan saraf konvolusional resolusi super (RCAN) untuk mengatasi masalah resolusi yang tidak memadai pada citra penginderaan jarak jauh UAV, dan mengadopsi Retinex untuk meningkatkan kontras citra, mengurangi dampak pencahayaan yang tidak merata. Tian et al. ( 2023 ) mengusulkan metode VMF-SSD, meningkatkan informasi fitur tekstur melalui fusi fitur multiskala dan cabang posisi berbasis ruang-V, yang secara efektif meningkatkan kinerja deteksi penyakit daun apel, terutama untuk lesi dengan ukuran berbeda.
Tanveer dkk. ( 2025 ) mengusulkan proses ekstraksi fitur dua langkah yang menggabungkan jaringan VGG-16 dan model Gaussian Naive Bayes, yang berhasil meningkatkan akurasi deteksi status kesehatan tanaman jagung. Namun, bagaimana cara menerapkan transfer pengetahuan secara efektif dalam skenario khusus penyakit sayuran yang dilindungi masih menjadi tantangan yang harus dipecahkan. Zhou dkk. ( 2023 ) menunjukkan kemungkinan mempertahankan kinerja tinggi sambil mengurangi pekerjaan anotasi melalui gabungan metode pembelajaran mendalam yang diawasi dan diawasi secara lemah untuk analisis fenotipik penyakit daun tanaman, yang menyediakan pendekatan baru untuk konstruksi dan pemanfaatan kumpulan data penyakit sayuran yang dilindungi.
Dengan mengatasi masalah di atas, penelitian ini mengusulkan kerangka kerja jaringan inovatif khusus untuk pengenalan penyakit pada sayuran yang dilindungi. Berdasarkan teknologi machine vision dan kecerdasan buatan, strategi berikut diadopsi untuk mengatasi tantangan deteksi penyakit pada sayuran yang dilindungi:
- Untuk masalah hubungan ketergantungan fitur jarak jauh pada penyakit sayuran, mekanisme Deformable Attention (Vision Transformer with Deformable Attention, DAT) diperkenalkan ke jaringan tulang punggung. Modul DAT mencakup empat tahap utama: pertama, penyematan dilakukan melalui konvolusi 4 × 4 yang tidak tumpang tindih dengan langkah 4; pada tahap 1 dan 2, mekanisme perhatian lokal jendela digunakan untuk mengekstraksi fitur lokal, memanfaatkan mekanisme perhatian jendela yang bergeser dari Swin Transformer untuk memindahkan dan mengintegrasikan hasil perhitungan perhatian lokal di dalam jendela; pada tahap 3 dan 4, peta fitur terus diproses melalui mekanisme perhatian lokal jendela untuk memusatkan informasi lokal, sambil menggunakan mekanisme perhatian yang dapat dideformasi untuk mensimulasikan hubungan global antara informasi lokal, menyesuaikan rentang dan bentuk perhatian secara fleksibel, mencapai pergantian yang efektif antara bidang reseptif lokal dan global, memungkinkan model untuk fokus pada hubungan fitur jarak jauh sambil meningkatkan efisiensi komputasi.
- Untuk mengatasi keragaman dan kompleksitas manifestasi penyakit, mekanisme perhatian adaptif ringan (CSAAM) diperkenalkan ke jaringan leher, yang dapat secara adaptif menyesuaikan bobot dalam dimensi saluran dan spasial, menyoroti fitur penyakit utama, menekan gangguan latar belakang, dan meningkatkan keragaman dan kemampuan diskriminatif ekspresi fitur. Modul CSAAM menggabungkan perhatian saluran dan perhatian spasial, menangkap informasi “apa yang penting” dan “di mana penting”, menyediakan kemampuan representasi yang fleksibel dan kuat untuk memproses penyakit dengan berbagai ukuran dan morfologi.
- Untuk mengatasi perbedaan yang signifikan antara domain sumber (himpunan data COCO) dan domain target (himpunan data citra penyakit sayuran), diusulkan strategi pembelajaran transfer progresif hierarkis. Strategi ini pertama-tama melatih model pada himpunan data penyakit tomat, yang memungkinkannya memperoleh pengetahuan dasar tentang penyakit sayuran; selanjutnya, parameter yang telah dilatih sebelumnya ditransfer ke tugas target dan selanjutnya disempurnakan pada himpunan data penyakit sayuran yang komprehensif, sehingga tercapai transfer pengetahuan yang efektif. Metode pembelajaran transfer hierarkis ini sepenuhnya memanfaatkan kemampuan representasi fitur dari model yang telah dilatih sebelumnya, yang mempercepat konvergensi model dan meningkatkan akurasi deteksi.
- Untuk mengatasi kesulitan pengumpulan data dan ketidakseimbangan sampel, proporsi teknik penambahan data yang tepat diterapkan pada kategori sampel yang berbeda, menyeimbangkan distribusi data di seluruh kategori dan meningkatkan kemampuan pembelajaran model. Secara bersamaan, teknik penambahan data Mosaic digunakan selama proses pelatihan, menciptakan gambar baru dengan menyambung empat gambar yang berbeda bersama-sama, yang selanjutnya meningkatkan keragaman dan kompleksitas sampel pelatihan untuk meningkatkan kinerja generalisasi model.
Hasil eksperimen menunjukkan bahwa pada basis data penyakit sayuran terlindungi yang dibangun sendiri, model yang diusulkan mencapai akurasi lebih dari 90% untuk 30 penyakit di 5 sayuran, dengan presisi rata-rata (mAP) sebesar 94,31%. Dibandingkan dengan algoritme lain, model tersebut secara signifikan meningkatkan kinerja deteksi, dengan mAP meningkat sebesar 7,78% menjadi 11,90%, dan waktu inferensi hanya 23 ms. Bahkan dalam kondisi yang menantang seperti variasi pencahayaan, oklusi kompleks, dan gangguan latar belakang, model tersebut mempertahankan kinerja deteksi yang stabil, menunjukkan kemampuan adaptasi lingkungan yang kuat dan kemampuan pemrosesan waktu nyata, memberikan dukungan teknis yang efektif untuk pemantauan cerdas dan pencegahan serta pengendalian yang tepat terhadap penyakit sayuran terlindungi.
2 Bahan
2.1 Pengumpulan Data Eksperimen
Dalam lingkungan budidaya sayuran yang dilindungi, latar belakang kompleks dari gambar penyakit menghadirkan tantangan untuk tugas deteksi objek. Saat ini, kumpulan data yang ada hanya berisi gambar untuk tugas klasifikasi gambar penyakit tanpa anotasi objek, atau hanya menyertakan gambar penyakit dengan anotasi objek yang diambil dalam latar belakang sederhana. Tidak ada kumpulan data deteksi objek efektif yang tersedia untuk umum yang secara khusus menargetkan skenario budidaya sayuran yang dilindungi yang sebenarnya. Berdasarkan hal ini, penelitian ini menggabungkan pengalaman para ahli sayuran dan menggunakan peralatan pemantauan IoT pertanian untuk mengumpulkan gambar penyakit di bawah latar belakang yang berbeda (oklusi tanaman, tumpang tindih daun, dan gangguan tanah) dan kondisi pencahayaan (berawan, cerah, senja, malam) dari 42 terowongan rumah kaca di 3 pangkalan sayuran yang dibangun sendiri (mencakup 164 mu) dari Universitas Sains dan Teknologi Weifang. Kondisi pengumpulan yang berbeda memastikan keragaman kumpulan data. Diagram skematis dari situs pengumpulan data ditunjukkan pada Gambar 2. Sebanyak 35.986 sampel penyakit sayuran yang dilindungi dikumpulkan, termasuk gambar yang sehat dan yang berpotensi terinfeksi.

2.2 Praproses Data
Semua gambar percobaan dikumpulkan di lingkungan budidaya sayuran yang terlindungi. Karena kompleksitas dan ketidakpastian lingkungan lapangan, gambar yang dikumpulkan mungkin memiliki masalah seperti penyumbatan objek, pencahayaan berlebih, fokus yang buruk, dan deviasi target, yang memerlukan praproses dari kumpulan data gambar asli. Langkah pertama melibatkan penyaringan gambar yang dikumpulkan melalui pembersihan data untuk menghilangkan data gambar yang tidak efektif dengan kemiripan yang tinggi, resolusi rendah, atau kejelasan yang buruk, mempertahankan gambar dengan efek pencitraan yang lebih baik. Langkah kedua melibatkan pemotongan data gambar yang diperoleh untuk menghilangkan beberapa informasi yang berlebihan dalam gambar sambil mempertahankan wilayah yang diinginkan dengan bintik-bintik penyakit untuk meningkatkan kualitas informasi gambar. Kemungkinan beberapa bintik penyakit muncul dalam gambar yang sama relatif tinggi.
Untuk keperluan penelitian, 27.000 gambar dipilih dari 30.000 gambar untuk digunakan sebagai set pelatihan dan validasi deteksi, dengan 24.000 gambar digunakan untuk set pelatihan, 3.000 gambar untuk set validasi, dan 3.000 gambar sisanya sebagai set pengujian. Setelah konfirmasi manual, set data yang dibangun terdiri dari 30 jenis penyakit dan sampel sehat dari 5 sayuran, seperti yang ditunjukkan pada Tabel 1 .
TIDAK | Jenis penyakit | Jumlah gambar | ||
---|---|---|---|---|
Set pelatihan | Set validasi | Set pengujian | ||
A1 | Kesehatan tomat | tahun 1344 | 168 | 168 |
A2 | Jamur abu-abu tomat | 656 | 82 | 82 |
Ukuran A3 | Bercak daun abu-abu tomat | tahun 904 | 113 | 113 |
Ukuran A4 | Bercak hitam tomat | 520 | 65 | 65 |
Ukuran A5 | Penyakit busuk daun tomat | 952 | 119 | 119 |
A6 | Busuk coklat tomat | tahun 1016 | 127 | 127 |
A7 | Kanker bakteri pada tomat | 784 | 98 | 98 |
A8 | Penyakit busuk daun tomat | 992 | 124 | 124 |
A9 | Bercak bakteri pada tomat | 680 | 85 | 85 |
A10 | Cetakan daun tomat | 768 | 96 | 96 |
B1 | Kesehatan mentimun | tahun 1304 | 163 | 163 |
B2 | Titik target mentimun | 704 | 88 | 88 |
B3 | Jamur tepung mentimun | 632 | 79 | 79 |
B4 | Bercak sudut mentimun | 600 | 75 | 75 |
B5 | Penyakit bulai mentimun | 552 | 69 | 69 |
C1 | Kesehatan lada | tahun 1328 | 166 | 166 |
C2 | Bercak daun cabai | 664 | 83 | 83 |
C3 | Jamur tepung lada | 680 | 85 | 85 |
Bahasa Indonesia: C4 | Bercak hitam pada lada | 424 | 53 | 53 |
C5 | Penyakit busuk daun lada | 768 | 96 | 96 |
D1 | Kesehatan terong | tahun 1336 | 167 | 167 |
D2 | Layu kuning pada terong | 448 | 56 | 56 |
Bahasa Inggris D3 | Bercak coklat pada terong | 648 | 81 | 81 |
D4 | Bercak sudut mentimun | 744 | 93 | 93 |
D5 | Busuk coklat terong | 768 | 96 | 96 |
E1 | Kesehatan squash | tahun 1224 | 153 | 153 |
E2 | Penyakit virus squash | 760 | 95 | 95 |
Bahasa Inggris E3 | Daun labu perak | 512 | 64 | 64 |
E4 | Penyakit bulai labu | 600 | 75 | 75 |
E5 | Busuk coklat terong | 688 | 86 | 86 |
Total | 24.000 | 3000 | 3000 |
2.3 Anotasi Data
Berdasarkan situasi produksi sayuran yang dilindungi yang sebenarnya, dikombinasikan dengan bahan-bahan yang relevan dari situs web dan buku-buku profesional, kami menggunakan alat anotasi deteksi objek gambar LabelImg untuk membuat anotasi penyakit dalam gambar (Gambar 3 ) sesuai dengan area minimum di sekitar penyakit, menghasilkan label deteksi objek sebagai persiapan untuk melatih tugas-tugas deteksi penyakit sayuran yang dilindungi. Beberapa jenis penyakit dapat hidup berdampingan dalam gambar penyakit yang sama. Sampel dengan area piksel yang tidak mencukupi atau fitur yang tidak jelas tidak diberi label untuk mencegah overfitting jaringan saraf. Dalam kasus oklusi objek asing, target dengan area oklusi lebih besar dari 85% dan target dengan area kurang dari 15% di tepi gambar tidak diberi label.

2.4 Penambahan Data
Dalam tugas deteksi objek, ketidakseimbangan data merupakan tantangan umum. Kumpulan data asli menunjukkan ketidakseimbangan kelas yang signifikan, dengan perbedaan substansial dalam kuantitas sampel antara berbagai kategori penyakit sayuran, khususnya dengan sampel sehat yang jumlahnya jauh lebih banyak daripada sampel penyakit. Hal ini akan menyebabkan overfitting model pada sampel sehat dan underfitting pada sampel kategori lain selama pelatihan, sehingga mengurangi kemampuan generalisasi model. Untuk mengatasi masalah ini, teknik augmentasi data diterapkan pada set pelatihan dan validasi, dengan rasio augmentasi yang sesuai ditetapkan menurut kuantitas sampel dari berbagai kategori. Gambar yang ditambah kemudian dicampur dengan gambar asli, sehingga meningkatkan kuantitas dan keragaman sampel.
Augmentasi data dapat dikategorikan menjadi augmentasi data offline dan augmentasi data online berdasarkan metode penyimpanan. Augmentasi data offline memperluas kumpulan data dan menyimpannya di disk, dengan ekspansi data skala besar meningkatkan biaya penyimpanan; augmentasi data online mengacu pada pelaksanaan augmentasi data secara otomatis melalui pemrograman kode selama pelatihan model, yang memerlukan keterampilan pemrograman yang lebih tinggi tetapi dijalankan dengan sangat efisien. Selama proses pelatihan, faktor acak dapat diatur untuk mengontrol metode augmentasi data, memastikan bahwa data yang digunakan dalam setiap putaran pelatihan berbeda, sehingga meningkatkan fleksibilitas dan meningkatkan kualitas set sampel. Augmentasi data offline cocok untuk kumpulan data yang lebih kecil, sedangkan augmentasi online cocok untuk kumpulan data yang lebih besar karena tidak melibatkan ekspansi data aktual. Oleh karena itu, penelitian ini pertama-tama menggunakan augmentasi data offline untuk benar-benar memperluas sampel data berdasarkan kumpulan data asli. Secara bersamaan, augmentasi data online digunakan selama pelatihan model untuk lebih memperluas jumlah sampel pelatihan, sehingga mencapai tujuan untuk meningkatkan kuantitas sampel pelatihan sambil mengurangi konsumsi sumber daya komputer.
2.4.1 Peningkatan Data Offline
Pertama, jumlah total sampel penyakit dan sampel sehat untuk setiap kategori dihitung, dan kategori dengan sampel paling sedikit diidentifikasi. Kemudian, berdasarkan jumlah sampel kategori ini sebagai tolok ukur, rasio augmentasi untuk kategori lainnya dihitung. Untuk kategori dengan lebih banyak sampel, rasio augmentasi yang lebih kecil dipilih untuk mempertahankan stabilitas fitur aslinya. Untuk kategori dengan lebih sedikit sampel, rasio augmentasi yang lebih besar diadopsi untuk menghasilkan sampel yang lebih beragam.
Selanjutnya, augmentasi data dilakukan pada sampel masing-masing kategori sesuai dengan rasio augmentasi yang ditetapkan. Berdasarkan berbagai situasi yang terjadi dalam skenario nyata, 7 jenis augmentasi data diterapkan: distorsi geometrik dicapai melalui strategi seperti random flipping, random rotation, dan border expansion; distorsi fotometrik diterapkan melalui koreksi gamma, peregangan kontras, peningkatan kecerahan, dan teknik augmentasi data Gaussian blur untuk mensimulasikan kondisi pencitraan yang dipengaruhi oleh faktor-faktor seperti cuaca, lingkungan pencahayaan, sudut pengambilan gambar, atau bahkan lensa yang tidak jelas. Efek visualisasi dari metode augmentasi data ditunjukkan pada Gambar 4 .

Setelah penambahan data, untuk memastikan bahwa jumlah gambar yang diperoleh dari berbagai jenis sampel penyakit sayuran kira-kira sama, beberapa gambar tambahan perlu dihapus dengan tepat. Strategi penghapusan dapat didasarkan pada pemilihan acak atau aturan tertentu untuk memastikan bahwa setiap kategori memiliki jumlah sampel penyakit dan sampel sehat yang sama.
Melalui metode ini, masalah ketidakseimbangan data dapat diatasi, meningkatkan kemampuan pengenalan model untuk kelas minoritas, dan menghindari fenomena overfitting dan underfitting, sehingga meningkatkan kinerja model secara keseluruhan.
2.4.2 Penambahan Data Online
Augmentasi data daring terus memperluas kumpulan data yang dikirim ke model untuk pelatihan melalui teknik augmentasi data selama pelatihan model. Bila penyesuaian diperlukan, hanya modifikasi kode minor yang diperlukan untuk mengimplementasikan operasi baru, yang menawarkan fleksibilitas lebih besar dan menghemat ruang memori server. Untuk memastikan kinerja model deteksi objek, penelitian ini tidak hanya menggunakan metode augmentasi data luring yang umum untuk memperluas kumpulan data tetapi juga secara opsional menggunakan augmentasi data Mosaic selama pelatihan, seperti yang ditunjukkan pada Gambar 5 .

Seperti yang diilustrasikan pada Gambar 5 , augmentasi data Mosaic secara acak memotong dan menskalakan empat gambar, mengatur dan menggabungkannya secara acak, dan menghubungkannya untuk membentuk satu gambar. Tujuannya adalah untuk meningkatkan jumlah objek target dalam sampel penyakit sayuran yang dilindungi, mencapai efek pengayaan kumpulan data dan secara efektif meningkatkan kecepatan pelatihan model. Selama operasi normalisasi, data penyakit dari keempat gambar dihitung secara bersamaan, sehingga mengurangi memori yang dibutuhkan oleh model. Dengan menerapkan peningkatan Mosaic, latar belakang objek yang dideteksi dapat sangat diperkaya; oleh karena itu, penelitian ini menerapkannya selama pelatihan model.
2.5 Konstruksi Dataset
Berdasarkan Gambar 6 , kumpulan data citra penyakit sayuran terlindungi sampel besar (PVDD, Protected Vegetable Disease Dataset) telah dibangun.

Diagram alir yang diusulkan untuk deteksi penyakit sayuran yang dilindungi di lingkungan yang kompleks ditunjukkan pada Gambar 6 , yang terdiri dari tiga bagian: persiapan data, konstruksi model VegetableDet untuk deteksi penyakit sayuran yang dilindungi, dan deteksi penyakit sayuran.
- Setelah memperoleh citra penyakit sayuran yang dilindungi, penyaringan awal dilakukan untuk menghilangkan citra penyakit yang kualitasnya relatif rendah dan menyusun set citra penyakit awal. Prapemrosesan data dilakukan, dan set data dipartisi untuk anotasi data. Karena pelatihan model pembelajaran mendalam memerlukan sejumlah besar data pelatihan, untuk lebih meningkatkan akurasi pengenalan penyakit dan menghindari overfitting, set pelatihan penyakit diperluas melalui metode penambahan data.
- Setelah menetapkan kumpulan data, model dasar dipilih, dan modul untuk meningkatkan model diusulkan berdasarkan persyaratan deteksi penyakit sayuran, membangun model VegetableDet, yang kemudian dilatih dan divalidasi.
- Setelah Pelatihan Model Selesai, Dataset Uji Digunakan untuk Menguji Model, Mengenali Gambar Penyakit Input dan Mengeluarkan Kategori Penyakit dan Informasi Lokasi
3 Metode
Penelitian ini mengusulkan jaringan deteksi objek yang ringan dan efisien bernama VegetableDet, yang secara khusus dirancang untuk karakteristik deteksi penyakit sayuran yang dilindungi. Struktur jaringan VegetableDet mengintegrasikan mekanisme perhatian yang dapat diubah bentuk DAT dengan Modul Perhatian Adaptif Saluran-Spasial (CSAAM) untuk mengatasi tantangan dalam deteksi penyakit sayuran di lingkungan yang kompleks, seperti variasi pencahayaan, oklusi, pengenalan objek kecil, dan perubahan skala fitur. Gambar 7 menyajikan keseluruhan arsitektur jaringan VegetableDet.

3.1 Jaringan Tulang Punggung DAT
Penyakit sayuran bermanifestasi sebagai fitur target multiskala yang didistribusikan di berbagai posisi dalam gambar, yang membutuhkan kernel konvolusi yang lebih besar untuk ekstraksi fitur guna memperoleh medan reseptif yang memadai. Meskipun jaringan YOLOv8 secara bertahap memperluas medan reseptifnya melalui operasi konvolusi bertumpuk, ukuran kernel konvolusi yang relatif kecil di setiap lapisan dengan mudah menyebabkan hilangnya hubungan ketergantungan fitur jarak jauh selama ekstraksi fitur lapis demi lapis.
Untuk mengatasi masalah ini, penelitian ini menggabungkan Vision Transformer dengan Deformable Attention (DAT) (Xia et al. 2022 ) ke dalam arsitektur jaringan backbone YOLOv8n. Mekanisme ini dapat secara adaptif memilih posisi relatif kunci dan nilai dalam mekanisme perhatian dengan cara yang digerakkan oleh data, sehingga secara fleksibel berfokus pada wilayah yang relevan dan menangkap informasi fitur yang lebih berguna. Seperti yang ditunjukkan pada Gambar 8 , mekanisme perhatian DAT terdiri dari empat tahap. Gambar input pertama-tama menjalani penyisipan fitur melalui konvolusi 4 × 4 yang tidak tumpang tindih dengan langkah 4. Selanjutnya, pada tahap 1 dan 2, mekanisme perhatian lokal jendela digunakan untuk mengekstraksi fitur lokal, dikombinasikan dengan strategi perhatian jendela yang digeser dari Swin Transformer (Liu, Lin, et al. 2021 ) untuk menggeser dan menggabungkan hasil perhitungan perhatian lokal dalam jendela, sehingga meningkatkan efisiensi ekstraksi fitur. Pada tahap 3 dan 4, peta fitur menjalani pemrosesan lebih lanjut melalui mekanisme perhatian lokal jendela untuk menggabungkan informasi lokal, sambil memanfaatkan mekanisme perhatian yang dapat dideformasi (Zhu, Su, Lu, dkk. 2020 ) untuk memodelkan hubungan global antara informasi lokal, menyesuaikan jangkauan dan bentuk perhatian secara dinamis, mencapai komplementaritas yang efektif antara bidang reseptif lokal dan global, yang memungkinkan model untuk menangkap hubungan ketergantungan fitur jarak jauh sambil meningkatkan efisiensi komputasi.

3.2 Peningkatan Jaringan Leher dengan Mekanisme Perhatian CSAAM Terintegrasi
Jaringan Neck dari YOLOv8 bertanggung jawab atas fusi fitur dan konstruksi piramida fitur, memproses peta fitur dari berbagai skala untuk beradaptasi dengan persyaratan deteksi target dengan berbagai ukuran. Namun, jaringan Neck tradisional sering kali mengalami pengaruh gangguan latar belakang yang kompleks dan keragaman manifestasi penyakit saat memproses citra penyakit sayuran yang dilindungi, sehingga sulit untuk mengekstrak dan menggabungkan fitur-fitur utama secara efektif. Untuk mengatasi masalah ini, penelitian ini mengusulkan struktur jaringan Neck yang ditingkatkan yang menggabungkan Mekanisme Perhatian Adaptif Kanal-Spasial (CSAAM), yang meningkatkan kemampuan persepsi model untuk fitur-fitur penyakit utama.
Mekanisme Perhatian Adaptif Kanal-Spasial (CSAAM) mencapai fokus simultan pada “apa yang penting” (dimensi kanal) dan “di mana penting” (dimensi spasial) dengan menggabungkan perhatian kanal dan perhatian spasial, sehingga meningkatkan keragaman dan kemampuan diskriminatif ekspresi fitur. Struktur keseluruhan CSAAM ditunjukkan pada Gambar 9 .

Mekanisme perhatian saluran bertujuan untuk mempelajari bobot kepentingan berbagai saluran dalam peta fitur, yang memungkinkan model untuk fokus pada fitur saluran yang relevan dengan pengenalan penyakit. Penelitian ini mengadopsi mekanisme perhatian saluran adaptif, yang strukturnya ditunjukkan pada Gambar 10 .

Menurut Gambar 10 , peta fitur antara masukan menjalani penggabungan maks dan penggabungan rata-rata paralel, yang menangkap nilai fitur maksimum dan nilai fitur rata-rata dalam saluran, sehingga menghasilkan dua vektor C11 yang mencerminkan informasi saluran global. Selanjutnya, nilai fitur antara yang diekstraksi dimasukkan ke dalam multilayer perceptron, tempat nilai fitur diubah menjadi bobot perhatian untuk setiap saluran dalam Shared MLP, yang memungkinkan model untuk secara adaptif menentukan informasi saluran mana yang lebih penting untuk tugas deteksi objek selama proses pelatihan. Akhirnya, fitur yang dikeluarkan oleh MLP dikalikan elemen-bijaksana dan diberi bobot ke fitur asli, kemudian diproses melalui fungsi aktivasi sigmoid untuk memperoleh perhatian saluran MC(F).
Dalam modul perhatian spasial, kami mengusulkan penggunaan kernel konvolusi 3 × 3 untuk 3 operasi konvolusi untuk menggantikan konvolusi standar 7 × 7, yang meningkatkan efisiensi komputasi dan meningkatkan kemampuan jaringan untuk mengekspresikan fitur non-linier, seperti yang ditunjukkan pada Gambar 11 .

Pengenalan modul CSAAM menyediakan solusi yang fleksibel dan kuat untuk peningkatan fitur, yang secara efektif meningkatkan kemampuan pengenalan model untuk penyakit sayuran yang dilindungi melalui perhatian simultan terhadap pentingnya dimensi saluran dan spasial. Mekanisme perhatian saluran membantu model menyaring saluran fitur yang paling relevan untuk diskriminasi jenis penyakit, sementara mekanisme perhatian spasial memandu model untuk fokus pada area yang paling mungkin menunjukkan gejala penyakit. Efek sinergisnya memungkinkan model untuk mempertahankan kinerja deteksi yang stabil dan akurat bahkan di lingkungan yang kompleks.
3.3 Strategi Pelatihan Model Pembelajaran Transfer Progresif Hirarkis
Proses pelatihan model deteksi objek biasanya menghadapi tantangan ganda dari perbedaan distribusi data dan kelangkaan sampel, yang khususnya menonjol dalam domain tertentu seperti deteksi penyakit sayuran yang dilindungi. Terdapat kesenjangan distribusi yang signifikan antara kumpulan data visi umum (seperti COCO) dan kumpulan data domain tertentu (seperti gambar penyakit sayuran), di mana penerapan langsung model yang telah dilatih sebelumnya sering kali menghasilkan kinerja yang buruk. Untuk mengatasi masalah ini, penelitian ini mengusulkan strategi pembelajaran transfer progresif hierarkis yang secara efektif mempersempit kesenjangan pengetahuan antara domain sumber dan target melalui pendekatan adaptasi bertahap, meningkatkan efisiensi pembelajaran model dan kinerja deteksi dalam kondisi keterbatasan sumber daya. Seperti yang ditunjukkan pada Gambar 12 , strategi ini mencakup dua tahap pembelajaran transfer yang berurutan tetapi berbeda.

Seperti yang ditunjukkan pada Gambar 12 , tujuan inti dari tahap inisialisasi domain adalah untuk secara bertahap memandu kognisi model dari domain penglihatan umum ke domain khusus deteksi penyakit sayuran, membangun kemampuan representasi fitur penyakit awal. Tahap ini menggunakan strategi transfer parameter dan penyempurnaan yang dirancang dengan cermat, yang secara khusus diimplementasikan sebagai berikut: Pertama, dimulai dari reservoir pengetahuan tugas deteksi objek umum, model YOLOv8 yang dilatih pada set data COCO dipilih sebagai sumber pengetahuan, yang telah mempelajari representasi fitur visual umum pada data beragam skala besar. Kedua, transfer parameter selektif diimplementasikan, mentransfer parameter dari jaringan backbone yang terintegrasi dengan mekanisme DAT dan jaringan leher asli dalam model sumber ke arsitektur VegetableDet target, sementara kepala deteksi mengadopsi parameter inisialisasi acak. Strategi ini mempertahankan kemampuan ekstraksi fitur dasar sambil tetap menyediakan fleksibilitas yang cukup untuk pembelajaran tugas tertentu. Selanjutnya, set data penyakit sayuran (tomat) kategori tunggal digunakan untuk pelatihan, pilihan berdasarkan sifat sampel penyakit tomat yang relatif melimpah dan representatif, yang dapat membantu model dengan cepat membangun pemahaman awal tentang fitur visual penyakit tanaman. Selama proses pelatihan, tingkat pembelajaran yang dibedakan diterapkan pada berbagai komponen jaringan—jaringan tulang punggung menggunakan tingkat pembelajaran yang lebih kecil (0,0003) untuk mempertahankan stabilitas kemampuan ekstraksi fitur dasar, sementara jaringan leher dan kepala menggunakan tingkat pembelajaran yang lebih besar (0,001) untuk mempercepat adaptasi terhadap tugas-tugas tertentu. Strategi transfer yang dirancang dengan cermat ini memungkinkan model untuk dengan cepat menguasai kemampuan dasar deteksi penyakit sayuran dalam kondisi sampel yang terbatas, secara efektif memecahkan kesulitan konvergensi dan masalah overfitting yang disebabkan oleh pelatihan langsung dalam domain tertentu. Setelah tahap inisialisasi domain, model telah menetapkan kemampuan representasi fitur dasar untuk penyakit sayuran tetapi masih terbatas untuk mengenali penyakit dari satu jenis sayuran, yang memerlukan perluasan lebih lanjut dari batas-batas pengetahuannya.
Tahap adaptasi keanekaragaman bertujuan untuk memperluas kognisi model dari satu jenis penyakit sayuran ke kemampuan pengenalan komprehensif untuk berbagai jenis sayuran dan berbagai jenis penyakit, sehingga mencapai keluasan dan kedalaman dalam perluasan pengetahuan. Tahap ini menggunakan mekanisme transfer dan strategi pelatihan yang lebih baik, yang secara khusus diterapkan sebagai berikut: Pertama, parameter model lengkap yang diperoleh dari pelatihan tahap inisialisasi domain dipertahankan, termasuk semua bobot dari jaringan tulang punggung, jaringan leher, dan jaringan kepala, yang memastikan bahwa pengetahuan fitur penyakit sayuran yang diperoleh tidak hilang. Kedua, kumpulan data komprehensif (PVDD) yang berisi kelima sayuran dan tiga puluh jenis penyakit digunakan untuk pelatihan, yang mencakup presentasi visual dan fitur patologis berbagai penyakit sayuran, yang secara komprehensif memperluas cakupan pengetahuan model. Dalam hal strategi pelatihan, mekanisme tingkat pembelajaran tiga tingkat yang lebih kompleks diterapkan—jaringan tulang punggung menggunakan tingkat pembelajaran terkecil (0,0001) untuk menjaga stabilitas fitur dasar, jaringan leher menggunakan tingkat pembelajaran sedang (0,0005) untuk memungkinkan penyesuaian sedang, sementara jaringan kepala menggunakan tingkat pembelajaran terbesar (0,001) untuk sepenuhnya beradaptasi dengan tugas pengenalan multikategori. Selain itu, strategi pengambilan sampel seimbang dan kerugian tertimbang diterapkan pada berbagai kategori penyakit, memastikan bahwa model memiliki peluang pembelajaran yang seimbang untuk semua kategori, menghindari bias kinerja yang disebabkan oleh ketidakseimbangan kelas. Strategi adaptasi keragaman yang disempurnakan ini memungkinkan model untuk berkembang pesat ke kemampuan pengenalan yang komprehensif untuk berbagai penyakit sayuran sambil menjaga stabilitas representasi fitur dasar. Model tidak hanya belajar membedakan antara jenis penyakit dari berbagai sayuran tetapi juga mengenali manifestasi yang dibedakan dari jenis penyakit yang sama pada berbagai sayuran, mencapai keluasan dan kedalaman dalam perluasan pengetahuan.
Strategi pembelajaran transfer progresif hierarkis yang diusulkan menawarkan keuntungan teoritis dan praktis yang signifikan atas metode tradisional, terutama tercermin dalam aspek-aspek berikut: Dalam hal efisiensi transfer pengetahuan, melalui jalur ekspansi kognitif progresif “visi umum → penyakit sayuran tunggal → beberapa penyakit sayuran”, secara efektif mengurangi rentang transfer pengetahuan, sangat meningkatkan efisiensi transfer dan tingkat keberhasilan pembelajaran. Dalam hal efisiensi pemanfaatan sampel, strategi ini sepenuhnya memanfaatkan kumpulan data dari berbagai skala dan cakupan, menggunakan data penyakit sayuran tunggal untuk membangun kognisi dasar pada tahap pertama dan data yang beragam untuk memperluas batasan pengetahuan pada tahap kedua, secara efektif mengurangi masalah kelangkaan sampel. Dalam hal optimasi sumber daya komputasi, proses pembelajaran progresif menghindari pelatihan jangka panjang secara langsung pada tugas-tugas kompleks, mencapai kinerja yang sama atau bahkan lebih baik melalui dua tahap pelatihan yang relatif singkat, secara signifikan mengurangi biaya komputasi. Dalam hal kemampuan generalisasi model, proses pembelajaran progresif berlapis memungkinkan model untuk membangun representasi fitur yang lebih kuat dari yang khusus ke umum, meningkatkan kemampuan generalisasi untuk sampel yang tidak terlihat.
4 Hasil dan Pembahasan
4.1 Lingkungan Eksperimen
Prosesor perangkat keras yang digunakan adalah komputer Intel(R) Xeon(R) Gold 6152 dengan CPU 2,10GHZ, dikonfigurasi dengan server sistem Ubuntu dengan memori berjalan 256GB. Model GPU adalah NVIDIA Quadro RTX 8000 dengan memori video 48GB. Lingkungan konfigurasi untuk pelatihan dan penerapan model VegetableDet adalah Python 3.8.3, menggunakan kerangka pengembangan PyTorch, dengan versi torch-1.7.1 dan torchvision 0.8.2. Semua eksperimen diselesaikan pada perangkat keras dan kerangka perangkat lunak yang sama.
4.2 Pelatihan Hiperparameter
Hiperparameter merujuk pada parameter yang ditentukan sebelum pelatihan model deep learning, biasanya ditetapkan secara manual berdasarkan karakteristik model dan dataset. Hiperparameter model deep biasanya mencakup laju pembelajaran, ukuran batch, periode pelatihan, jenis pengoptimal, dan parameter dropout. Laju pembelajaran memengaruhi kecepatan proses pelatihan model; laju pembelajaran yang terlalu besar menyebabkan osilasi atau bahkan non-konvergensi selama pelatihan model, sementara laju pembelajaran yang terlalu kecil menyebabkan pelatihan model lambat dan terperangkap dalam optima lokal. Penelitian ini mengadopsi metode pembelajaran transfer progresif hierarkis, yang tidak memerlukan pelatihan model dari awal. Laju pembelajaran awal ditetapkan ke 0,001 ~ 0,003, dengan laju pembelajaran dikalikan 0,8 setiap 30 periode pelatihan. Mempertimbangkan ukuran memori GPU di platform eksperimental dan jumlah sampel pelatihan, ukuran batch ditetapkan ke 32. Jumlah Periode pelatihan ditetapkan ke 200. Algoritma pengoptimal Adam dipilih. Tabel 2 merangkum pengaturan hiperparameter model VegetableDet.
TIDAK. | Parameter pelatihan | Nilai |
---|---|---|
1 | Ukuran Batch | 32 |
2 | Jumlah Periode Pelatihan | 200 |
3 | Laju Pembelajaran Awal (IrO) | 0,001 ~ 0,003 |
4 | Koefisien Peluruhan Laju Pembelajaran (Irc) | 0.2 |
5 | Pengoptimal | Adam |
6 | Kecepatan Pembelajaran Momentum | 0,937 tahun |
7 | Koefisien Peluruhan Berat | 0,0005 |
8 | Pembelajaran Pemanasan | 3 |
9 | Pemanasan Momentum Pembelajaran | 0.8 |
10 | Pemanasan Tingkat Pembelajaran Awal | 0.1 |
11 | Pelatihan Multi-thread | 12 |
12 | Ukuran Gambar Input | 640 |
13 | loU Kerugian Keuntungan | 0,05 |
14 | Klasifikasi Cls Kerugian Keuntungan | 0.5 |
15 | Cls BCELoss Berat Sampel Positif | 1 |
16 | Obj Target Kerugian Keuntungan | 1 |
17 | Obj BCELoss Berat Sampel Positif | 1 |
18 | Ambang Batas loU selama Pelatihan | 0.2 |
4.3 Metrik Evaluasi
Untuk memverifikasi efektivitas model VegetableDet, penelitian ini menggunakan Presisi, Ingat, presisi rata-rata (AP), skor F1, mAP50, jumlah parameter (Param), operasi titik-mengambang per detik (FLOP), waktu deteksi per gambar (Kecepatan), dan memori yang diperlukan untuk inferensi (Memori) sebagai metrik pelatihan untuk mengevaluasi kinerja model VegetableDet.
4.4 Pelatihan Model dan Analisis Hasil Uji
4.4.1 Pelatihan Model Transfer Learning Tahap Pertama
Dengan menganalisis kurva proses pelatihan model VegetableDet pada tahap pertama pembelajaran transfer, kami memverifikasi efek aplikasi transfer fitur gambar dari model sumber terbuka dalam pelatihan model VegetableDet pertama. Kurva proses ditunjukkan pada Gambar 13 .

Dari kurva proses pelatihan pada Gambar 13 , dapat diamati bahwa parameter fitur gambar dari model sumber terbuka secara signifikan meningkatkan kemampuan ekstraksi fitur dari model VegetableDet, yang memungkinkan model untuk mencapai status konvergensi dengan cepat. Model VegetableDet pada tahap pertama pembelajaran transfer cenderung ke status stabil setelah sekitar 10 periode pelatihan, dengan nilai kerugian pelatihan model mendekati 0 dan akurasi validasi model mendekati 100%. Hasil konvergensi menunjukkan bahwa pengetahuan fitur gambar dari model sumber terbuka yang ditransfer ke model VegetableDet juga memiliki kemampuan representasi fitur yang baik, membantu VegetableDet mengekstrak fitur gambar yang efisien dari sejumlah sampel yang terbatas, sehingga dengan cepat mencapai status konvergensi, membuktikan rasionalitas dan efektivitas tahap pertama pembelajaran transfer.
4.4.2 Pelatihan Model Transfer Learning Tahap Kedua
Dengan menganalisis kurva proses pelatihan model VegetableDet pada tahap kedua pembelajaran transfer, kami memverifikasi efek aplikasi transfer fitur gambar dari model VegetableDet pertama dalam pelatihan model VegetableDet kedua. Kurva proses pelatihan model VegetableDet kedua ditunjukkan pada Gambar 14 .

Dari tren kurva konvergensi model pada Gambar 14 , dapat dilihat bahwa fitur dari model VegetableDet pertama dapat membantu model dalam tahap ini mengekstrak fitur gambar sampel sayuran sehat dan sampel penyakit, sehingga menghasilkan kinerja generalisasi yang baik. Proses konvergensi model pada tahap kedua pembelajaran transfer selaras dengan harapan teoritis, yang mengonfirmasi efektivitas strategi pelatihan pembelajaran transfer progresif hierarkis yang diusulkan.
4.4.3 Analisis Hasil Deteksi Penyakit Sayuran
Untuk memverifikasi kinerja model yang telah dilatih, perlu dilakukan eksperimen menggunakan data uji penyakit sayuran. Melalui analisis hasil deteksi penyakit sayuran, situasi deteksi yang terlewat dan deteksi yang salah dari berbagai jenis penyakit dapat dievaluasi. Dengan menggunakan model VegetableDet yang diusulkan untuk deteksi terpisah berbagai jenis penyakit sayuran, dari perspektif keseluruhan, model VegetableDet yang diusulkan mencapai P, R, dan AP yang melebihi 90% untuk 30 penyakit dan sampel sehat di 5 sayuran, dengan tingkat presisi dan perolehan kembali yang tinggi untuk mendeteksi berbagai jenis penyakit. mAP adalah 94,31%, yang menunjukkan bahwa model VegetableDet yang diusulkan memiliki kemampuan deteksi yang baik untuk penyakit sayuran.
Untuk mengevaluasi kinerja model VegetableDet secara menyeluruh di bawah definisi tugas yang berbeda, kami melakukan eksperimen dengan ambang batas IOU yang ditetapkan ke 0. Ini setara dengan melihat masalah deteksi objek sebagai masalah klasifikasi. Tabel 3 menunjukkan kinerja model VegetableDet di bawah ambang batas IOU yang berbeda.
Ambang batas IoU | peta (%) | Presisi (%) | Mengingat (%) |
---|---|---|---|
angka 0 | 96.38 | 97.42 | 95.17 |
0.5 | 94.31 | 95.89 | 93.21 |
0,75 | 91.24 | 92.36 | 90.05 |
Ketika ambang batas IOU ditetapkan ke 0, model VegetableDet mencapai mAP sebesar 96,38%, yang menunjukkan bahwa bahkan ketika tugas tersebut dipandang sebagai masalah klasifikasi murni, model kami dapat mencapai kinerja yang sangat tinggi. Hal ini menegaskan keunggulan model kami dalam tugas deteksi penyakit sayuran yang dilindungi, baik yang diperlakukan sebagai tugas deteksi objek maupun tugas klasifikasi.
Untuk lebih memverifikasi kemampuan generalisasi model VegetableDet dan mengurangi risiko overfitting, kami menerapkan eksperimen validasi silang sebanyak 5 kali. Kami membagi seluruh dataset secara acak menjadi 5 subset yang sama, menggunakan 4 subset sebagai data pelatihan setiap kali dan subset yang tersisa sebagai data uji. Tabel 4 menunjukkan hasil validasi silang sebanyak 5 kali.
Melipat | peta (%) | Presisi (%) | Mengingat (%) |
---|---|---|---|
1 | 94.35 | 95.62 | Nomor 93.11 |
2 | 93.89 | 95.27 | 92.84 |
3 | 94.71 | 96.03 | 93.53 |
4 | 94.18 | 95.49 | 92.95 |
5 | 94.58 | 95.83 | 93.41 |
Berarti | 94.34 | 95.65 | 93.17 |
Hasil validasi silang 5 kali lipat menunjukkan bahwa model VegetableDet bekerja secara stabil di bawah partisi data yang berbeda, dengan nilai mAP berkisar antara 93,89% hingga 94,71%, dan deviasi standar hanya 0,32%. Hal ini menunjukkan bahwa model kami memiliki kemampuan generalisasi yang kuat dan dapat beradaptasi secara efektif dengan distribusi data yang berbeda, sehingga menghindari masalah overfitting. Hasil ini semakin menegaskan keandalan dan ketahanan model VegetableDet dalam aplikasi praktis.
Untuk mengevaluasi kinerja model VegetableDet dalam berbagai kondisi pencahayaan, terutama kemampuannya mendeteksi penyakit pada daun dengan permukaan lilin di bawah pantulan cahaya yang kuat, kami membuat perangkat uji khusus. Perangkat uji ini berisi 500 gambar yang dibagi menjadi empat kondisi pencahayaan: pencahayaan normal, kondisi cahaya redup, cahaya langsung yang kuat, dan pantulan cahaya yang kuat. Tabel 5 menunjukkan kinerja model VegetableDet dalam berbagai kondisi pencahayaan.
Kondisi pencahayaan | peta (%) | Presisi (%) | Mengingat (%) |
---|---|---|---|
Cahaya Normal | 95.27 | 96.38 | 94.21 |
Kondisi Cahaya Rendah | 92.15 | 93.42 | 91.08 |
Cahaya Langsung Kuat | 90.83 | 92.17 | 89.57 |
Pantulan Cahaya Kuat | 87.42 | 89.24 | 86.13 |
Rata-rata | 91.42 | 92.80 | 90.25 |
Hasilnya menunjukkan bahwa kondisi pantulan cahaya yang kuat memang memiliki dampak yang signifikan terhadap kinerja model. Dalam kondisi pantulan cahaya yang kuat, nilai mAP turun menjadi 87,42%, penurunan sebesar 7,85 poin persentase dibandingkan dengan kondisi pencahayaan normal. Hal ini terutama karena pantulan cahaya yang kuat mengubah karakteristik warna permukaan daun, sehingga melemahkan visibilitas gejala penyakit.
4.5 Perbandingan Kinerja Antara Model VegetableDet dan Model Deteksi Objek Ringan yang Ada
Untuk menunjukkan sifat canggih dari model VegetableDet, kami membandingkannya dengan model deteksi objek ringan yang terkenal. Kumpulan data deteksi penyakit sayuran digunakan untuk pelatihan, dan hasil pengujian yang diperoleh dibandingkan dengan hasil pengujian model yang diusulkan. Model yang ada yang dipilih adalah YOLOv8n, YOLOv7-Tiny, YOLOv6-N, YOLOv6-T, YOLOX-Darknet53, YOLOX-S, YOLOX-Tiny, YOLOv5-S, YOLOv5-M, YOLOv5-L, YOLOv4, YOLOv3, dan YOLOv3-SPP, dengan total 13 model pembelajaran mendalam. Hasil pengujian ditunjukkan pada Tabel 6 .
Model | peta (%) | Parameter (Jutaan) | Gagal (G) | Memori (MB) |
---|---|---|---|---|
VegetableDet (Milik Kami) | 94.31 | 2.83 | 5.9 | 5.68 |
YOLOv8n | 86.84 | 36.9 | 104.5 | 71.19 |
YOLOv7-Kecil | 85.68 | 5.98 | 13.7 | Tanggal 11.18 |
YOLOv6-N | 85.91 | 3.51 | 10.4 | 8.46 |
YOLOv6-T | 86.07 | 14.7 | 36.1 | 32.2 |
YOLOX-Darknet53 | 83.85 | 63 | 157 | 485.46 |
YOLOX-S | 84.95 | 8.98 | 26.1 | 67.71 |
YOLOX-Kecil | 84.73 | 4.56 | 5.6 | 37.97 |
YOLOv5-S | 83.91 | 6.92 | 15.6 | tanggal 15.01 |
YOLOv5— | 84.77 | Tanggal 20.27 | 48 | 42.4 |
YOLOv5-L | Rp 85.000 | 46.33 | 108.5 | 93.4 |
YOLOv4 | 82.72 | 52.12 | 120.9 | 245.1 |
YOLOv3 | 83.16 | 61.85 | 156.3 | 236.1 |
YOLOv3-SPP | 82.98 | 62.49 | 157.3 | 73.89 |
Untuk memastikan perbandingan yang adil, semua algoritme perbandingan menjalani penyempurnaan yang ketat dan menyeluruh. Langkah-langkah penyempurnaan meliputi: (1) Optimalisasi laju pembelajaran: mengadopsi strategi laju pembelajaran siklik, dengan laju pembelajaran awal ditetapkan pada 0,001–0,005, dan disesuaikan secara dinamis berdasarkan kinerja set validasi; (2) Penyesuaian struktur jaringan: mengoptimalkan parameter jaringan backbone, jaringan neck, dan jaringan head untuk setiap jaringan perbandingan guna memastikan kinerja terbaik; (3) Strategi augmentasi data: menerapkan teknik augmentasi data yang sama pada setiap model, termasuk metode augmentasi offline dan online. Khususnya, untuk model YOLOX-Darknet53, kami melakukan penyesuaian optimasi yang lebih terperinci. Dalam percobaan awal, model ini mencapai mAP sebesar 83,85%. Melalui penyesuaian parameter jaringan backbone, penambahan modul mekanisme perhatian, pengoptimalan bobot fungsi kerugian, dan perluasan siklus pelatihan, kami meningkatkan kinerjanya hingga 91,23%. Meskipun demikian, kinerja ini masih lebih rendah dari 94,31% yang dicapai oleh model VegetableDet. Meskipun telah dioptimalkan, YOLOX-Darknet53 menunjukkan peningkatan kinerja, tetapi VegetableDet masih mempertahankan keunggulan yang jelas dalam akurasi deteksi, jumlah parameter, dan efisiensi komputasi. Hasil ini menyoroti keunggulan dan efisiensi model VegetableDet yang diusulkan dalam tugas deteksi penyakit sayuran yang dilindungi.
5 Kesimpulan
Deteksi cerdas penyakit sayuran yang dilindungi, sebagai mata rantai utama dalam pertanian presisi modern, memiliki signifikansi penting untuk memastikan stabilitas produksi pertanian dan meningkatkan manfaat ekonomi. Penelitian ini mengusulkan kerangka kerja deteksi yang inovatif, ringan, dan efisien, VegetableDet, yang secara sistematis mengatasi tantangan inti dalam deteksi penyakit sayuran, termasuk ekstraksi fitur yang tidak memadai, gangguan lingkungan yang kuat, dan kemampuan adaptasi model yang terbatas. Melalui validasi eksperimental dan analisis teoritis yang komprehensif, penelitian ini menarik kesimpulan penting berikut:
Dalam hal desain arsitektur jaringan, penelitian ini secara inovatif mengintegrasikan mekanisme Deformable Attention (DAT) dengan jaringan backbone YOLOv8n, yang memungkinkan sistem deteksi untuk secara efektif menetapkan dependensi fitur jarak jauh, meningkatkan kemampuan persepsi global untuk fitur penyakit yang tersebar. Secara bersamaan, dengan memperkenalkan Mekanisme Channel-Spatial Adaptive Attention (CSAAM) untuk meningkatkan jaringan piramida fitur, penilaian ganda terhadap pentingnya fitur tercapai, yang mengidentifikasi tidak hanya “fitur mana yang paling kritis” tetapi juga secara tepat menemukan “area mana yang paling layak untuk difokuskan”. Strategi peningkatan fitur multidimensi ini secara signifikan meningkatkan kemampuan diskriminasi fitur model dalam latar belakang yang kompleks, yang meletakkan dasar yang kokoh untuk pengenalan penyakit yang akurat.
Dalam hal pengoptimalan strategi pembelajaran, metode pembelajaran transfer yang diusulkan dalam penelitian ini memecahkan masalah praktis dari akuisisi data penyakit sayuran yang sulit dan ketidakseimbangan sampel. Melalui tahap “inisialisasi domain” dan “adaptasi keanekaragaman” dengan karakteristik yang khas, model tersebut mencapai transisi yang lancar dari pengetahuan penglihatan umum ke pengenalan penyakit tertentu, yang secara signifikan meningkatkan efisiensi transfer dan tingkat keberhasilan pembelajaran. Sementara itu, strategi penambahan data yang dibedakan memberikan peluang pembelajaran yang seimbang untuk berbagai kategori penyakit, yang selanjutnya meningkatkan kemampuan generalisasi model dan kemampuan beradaptasi lingkungan. Hasil eksperimen sepenuhnya memverifikasi keunggulan metode yang diusulkan, yang memberikan solusi yang layak untuk sistem pemantauan waktu nyata di lingkungan produksi pertanian yang sebenarnya.
Penelitian menemukan bahwa dalam kondisi pencahayaan ekstrem, terutama pantulan cahaya yang kuat pada daun dengan permukaan lilin, deteksi penyakit masih menghadapi tantangan. Penelitian mendatang akan mengeksplorasi teknologi pencitraan multispektral dan hiperspektral untuk menangkap fitur penyakit yang tidak terlihat oleh mata telanjang; mengembangkan algoritma pemrosesan gambar adaptif untuk secara otomatis menyesuaikan parameter gambar dalam kondisi pencahayaan yang berbeda; memperkenalkan metode analisis temporal untuk meningkatkan akurasi deteksi melalui pengamatan titik waktu ganda yang berkelanjutan. Selain itu, teknik pemulihan gambar berbasis fisika akan dipelajari untuk mengurangi gangguan pantulan cahaya yang kuat pada fitur penyakit, yang selanjutnya meningkatkan ketahanan dan akurasi model dalam berbagai kondisi lingkungan yang kompleks.