Упс! Не вдала спроба:(
Будь ласка, спробуйте ще раз.

Рівняння з багатьма невідомими: як Data Science допомагає Kernel планувати агротехнічні роботи

Олександр Тартачний
Олександр Тартачний журналіст
21 серпня 2023 11 хвилин читання

SPEKA разом із компанією Kernel публікує цикл матеріалів, присвячених ІТ-технологіям в агросекторі. У цій публікації розповідаємо, чому планування агротехнічних робіт та прогнозування врожаю — це завдання із сотень чинників, як нейромережі допомагають агровиробникам, які виклики та перспективи Big Data у цьому бізнесі та чому роботи ще неефективні у полі, але IT-рішення вже так.

Як Kernel використовує Data Science Як Kernel використовує Data Science

Як виростити соняшник і чому планування — це 80% успіху 

У людей, недотичних до індустрії, досі існує уявлення, що агровиробництво — це далека від цифрових технологій сфера. Натомість ця галузь вже давно глибоко технологічна. Наприклад, щоб визначити, які культури необхідно сіяти, та щоб спрогнозувати врожай на наступний сезон, потрібно пройти складний системний процес із залученням великої кількості даних. Його результатом є технологічна карта з повним переліком агрооперацій, продуктів і норм внесення. 

Тільки на вибір культури впливають безліч чинників, серед них: 

  • економічні — чи релевантно вирощувати культуру;
  • обмеження у сівозміні — не можна після соняшнику знову сіяти соняшник, бо він там не виросте тощо;
  • історія поля (попередня культура, історія врожайностей поля, використані технології дати посіву та збору); 
  • погодні умови (багаторічні показники опадів, кількості сонця, рельєф тощо);
  • обмеження щодо технології (якщо торік на цьому полі вносили засоби для захисту рослин, які мають діяти на наступну культуру, то її там сіяти не можна);
  • агрохімічні показники (зразки ґрунту відбирають у лабораторії, аналізують 17 показників та коригують рішення щодо добрив).

Але й це ще не все. Навіть коли визначилися з культурою, наприклад соняшник, вибирають гібрид — на основі його рейтингу в цьому регіоні та зважаючи на продуктивність цього поля. Надзвичайно важливим є не лише вибір власне гібриду, а й те, скільки рослин має бути на 1 га, щоб вони не конкурували між собою за вологу. 

Ще один етап планування — технологія живлення. Це технічно дуже складний процес, у якому необхідно враховувати багато складових: вид добрив, мікроелементи, спосіб їх внесення тощо. Визначити завдання для роботи техніки на кожному конкретному полі й навіть його фрагментів потрібно на основі технологічної карти, результатів обстеження грунту тощо. Це лише деякі основні етапи, і кожен із них супроводжують цифрові технології.

Агровиробництво вже давно глибоко технологічне Агровиробництво вже давно глибоко технологічне

Як вирощувати рослини під наглядом комп’ютерного зору

На величезній карті багато позначок різних кольорів — це інформаційна екосистема Kernel DigitalAgriBusiness. У компанії Kernel понад 5 тис. полів загальною площею понад 360 тис. га, усі з яких відображені у системі. 

Як виглядають сучасні карти полів / Kernel Як виглядають сучасні карти полів / Kernel

Кожне поле можна «відкрити» і побачити, що на ньому відбувається та які агрозаходи проводилися. Система фіксує агреговані показники, середні дані по полю, погоду, індекс вегетації, які добрива чи засоби для захисту від бур’янів вносились тощо. 

Обстеження поля — обов’язковий елемент у плануванні. Після посіву чекають декілька тижнів та оцінюють щільність рослин за допомогою фото з дронів та алгоритмів машинного навчання. 

Оцінка густоти стояння та якості посіву / Kernel Оцінка густоти стояння та якості посіву / Kernel

Модель комп’ютерного зору за знімками з дрона оцінює щільність культур на полі. Інша модель на основі даних про погодні умови, зокрема накопичених показників температур, та оглядів цього року моделює фазу розвитку ВВСН, яка показує відповідну стадію розвитку рослини на полі. 

Але покладаються не лише на алгоритми: у критичні фази розвитку рослин агрономи повинні оглянути поле (це відбувається щонайменше шість разів на рік), зробити фото та виявити можливі проблеми. Для цього у компанії є застосунок Scouting, у який можна повідомити про проблеми або зміни із геотегом поля.

Як працює Data Science в аграрній сфері

Далі модель машинного навчання на основі погодних, історичних умов та даних із супутника прогнозує врожайність, причому прогноз коригується щотижня через нові дані. 

Оцінка біологічної врожайності соняшника / Kernel Оцінка біологічної врожайності соняшника / Kernel

Щоб оцінити біологічну врожайність соняшнику, агрономи враховують оцінену щільність поля раніше, масу 1000 насінин та їхню середню кількість у кошику. Для визначення останнього є модель комп’ютерного зору, яка за фото підраховує кількість виповнених та наповнених насінин. Зважаючи на те, що на полі може не бути якісного інтернету, ця модель працює прямо у застосунку. 

Данило Поляков
Данило Поляков
Керівник відділу DataScience Kernel

Данило Поляков, керівник відділу DataScience Kernel, розповідає, що його завданням у компанії є створення моделей комп’ютерного зору, які рахують кількість рослин на полі. Також до його кола завдань входить оцінювання потенціалу поля, аналітика та кластеризація погоди, полів, рельєфу. Адже межа поля — це історично сформований поділ, він нічого спільного з природними передумовами не має. На одному полі можуть бути п’ять типів ґрунту, а отже, урожайність відрізнятиметься в рази. 

Завдання DataScience — поділити поле на такі елементарні частинки, які не мають відмінностей, і на кожні з цих елементарних частинок запланувати максимально відповідну їй технологію.

Як побудувати нейромережу для аграрного бізнесу 

Щоб побудувати моделі комп’ютерного зору, агрономи з моніторингу дронами робили декілька фотографій поля у різних точках. Далі відзняті фото маркують за допомогою інструменту CVAT (Computer Vision Annotation Tool). У середньому процес розмітки одного фото триває 15 хвилин. При цьому фахівцям потрібно було поставити мітку на кожному сході потрібної культури без відмітки бур’янів, а це від 250 до 800 міток.

Нейронна мережа будує теплову карту знімка, яка відображає вірогідність перебування рослини. Наступний алгоритм шукає точки, де саме на фото є центри рослин. Ще один алгоритм об’єднує рослини у ряди, далі за допомогою простого правила відсікають рослини у міжрядді. 

Це дозволяє оцінити кількість сходів на гектар, середню відстань між рослинами, відсоток двійників, відсоток пропусків, якість посіву. Фінальні значення обираються як медіанне значення серед усіх фото, зроблених на цьому полі. Результати зберігають та прикріплюють до паспорта земельної ділянки. Це готовий фундамент для оцінювання біологічної врожайності, а також автоматизоване оцінювання якості та посіву.

Кореляційний аналіз та інші методи відбору параметрів допомагають визначити чинники, що найбільше впливають на врожайність. Потім на цих даних тренують модель регресії. Для цього застосовують вибірку від 2014 року.

Робота на полях Kernel Робота на полях Kernel

Про дані з «полів» та як вони допомагають заощаджувати 

В агросфері є дрони, роботи та сільськогосподарська техніка зі штучним інтелектом, але майбутнє за фармменеджмент-системами на кшталт Kernel DigitalAgriBusiness та IT-рішеннями. Адже можливість планувати та керувати агровиробництвом за допомогою цифрових технологій дає величезний приріст до продуктивності сільського господарства. Зважаючи на об’єм земельного фонду компанії, заощадження навіть 1-2 доларів на гектарі — це вже економія у пів мільйона. Тому детальне планування надзвичайно важливе для великого агробізнесу.

Інформація відображається на моніторах агротехніки / Kernel Інформація відображається на моніторах агротехніки / Kernel

Але, щоб отримати хороші алгоритми, потрібні хороші дані.

«Є два підходи для покращення точності. Model-driven працює за рахунок експериментів із різними архітектурами моделей або гіперпараметрів навчання. Data-driven робить датасет більш чистим, якісним та різноманітним. Перший метод дає невеликий приріст, але це просто перебір параметрів, тому час тут більше витрачається на навчання, — пояснює Данило Поляков. — Другий підхід зазвичай дає більший приріст як модель, але для цього потрібно ретельно розібратися із датасетом: які в ньому дані, яких не вистачає, а також де модель помиляється найбільше та чому».

Щоб зрозуміти, чому в одній частині поля урожай 5 тонн на гектар, а на іншій 3, потрібні додаткові датчики та системи. Зараз агрокомпанії рідко їх використовують, але їх буде дедалі більше. 

Іноді проблема не у кількості даних, а у їхній якості. Наприклад, зараз агровиробники користуються картами ґрунтів, які зробили під час дослідження 1961 року. Але нічого точнішого наразі немає. Також історичні дані, наприклад, про погоду 20 років тому, малоінформативні — з глобальним потеплінням придатні для вирощування широти піднімаються. 

Чому роботи та ШІ поки що не замінили людей у роботі в полі  

Попри бум на мовні моделі та штучний інтелект, Данило Поляков зауважує, що у agritech особливих змін поки що не принесло, але час покаже. 

«Не можу сказати, що це прорив. Звісно, щороку щось нове додається й ми плануємо впроваджувати чатботи на основі ChatGPT і для служби підтримки, і для агрономів. Але коли була революція в алгоритмах комп’ютерного зору, років п’ять тому, це було помітніше», — наголошує експерт. 

Причину Поляков бачить у тому, що у бізнесу вищі вимоги. 

«У Data Science-ком’юніті вважають, що приблизно 80% проєктів не потрапляють на  продакшн. Звісно, що у медицині помилка може коштувати дуже дорого, Наприклад, у завданні детекції раку модель не повинна пропустити жодного кейсу, але якщо вона буде показувати зайві кейси, то лікар однаково перевірить, і це вже не так критично. В інших галузях, наприклад, під час аналізу тексту, оцінювання коментарів для визначення їх позитивного чи негативного відтінку, через те що потік даних дуже великий і текст може бути інтрепретований по-різному, модель із якістю 50% вже зможе допомагати бізнесу, — розповідає Поляков. — В агросфері поріг використання алгоритму дуже високий. Бізнес уже має 10-річні напрацювання, яким  довіряють і які були перевірені часом, тому, щоб переконати використовувати новий підхід, як-от машинне навчання, алгоритм повинен працювати набагато краще, а потім ще й бути перевірений декількома сезонами, а це означає роками».

Поля соняшника / Kernel Поля соняшника / Kernel

У компанії розповіли, що випробовували робота-оприскувача, який за допомогою камер із штучним інтелектом ідентифікує бур’ян та знешкоджує його. Але він виявився недостатньо ефективним, оскільки не відрізняє бур’яни на етапі росту, коли вони менші ніж 1 см. Звісно, щоб такі технології працювали, потрібен час та вдосконалення підходів. Це доводить, що для глобального прогресу в агросфері потрібні не стільки роботи, скільки методологія. Щоб отримати найкращий результат, потрібно знайти найліпшу практику на кожному полі. А більша кількість даних допомагає нам наблизитись до оптимального рішення.

0
Прокоментувати
Інші матеріали

Відпочинок за містом: досвід SPEKA

Анна Сергієнко 6 червня 2024 14:54

Data Scientist та Data Analyst: що вони роблять та у чому різниця між ними

Владислав Миронович 29 травня 2024 10:00

NASA Harvest допомагає моніторити вплив війни на сільське господарство

Олеся Дерзська 9 травня 2024 13:57

Кіберспортивна незалежність: як український кіберспорт позбувся зв’язків із російським та білоруським

Владислав Миронович 28 березня 2024 10:00

Як стати Machine Learning Engineer: власний досвід

Олександр Тартачний 27 березня 2024 09:00