Розпізнавання акустичних образів риб при моніторингу прісноводних екосистем

Автор(и)

  • Таtiana М. Tkachenko Київський національний університет будівництва і архітектури, Київ, Ukraine https://orcid.org/0000-0003-2105-5951
  • Yulia H. Pilkevich Київський національний університет будівництва і архітектури, Київ, Ukraine https://orcid.org/0000-0002-7618-0250
  • Heorhii M. Rozorinov Національний технічний університет України "Київський політехнічний інститут імені Ігоря Сікорського", Київ, Ukraine https://orcid.org/0000-0002-6095-7539

DOI:

https://doi.org/10.32347/2411-4049.2021.1.20-34

Ключові слова:

акустичний образ, екосистема, еталон сигналу, основна гармоніка, період, розпізнавання, фрейм

Анотація

Основними джерелами забруднення і засмічення водойм є недостатньо очищені стічні води промислових і комунальних підприємств, крупних тваринницьких комплексів, відходи виробництва; скидання водного і залізничного транспорту; відходи первинної обробки льону, пестициди та ін. Забруднюючі речовини, потрапляючи в природні водойми, призводять до якісних змін води, які, в основному, виявляються в зміні фізичних властивостей води, у зміні хімічного складу води, в наявності плаваючих речовин на поверхні води і відкладанні їх на дні водойм. Зростання населення, розширення старих і виникнення нових міст значно збільшили надходження побутових стоків у внутрішні водойми. Ще більшою мірою забруднюють водойми миючі синтетичні засоби, що широко використовуються в побуті. У результаті знижується здатність вод до насичення киснем, паралізується діяльність бактерій, що мінералізують органічні речовини. Несприятливий екологічний стан багатьох прісноводних екосистем завдає суттєвої шкоди рибним ресурсам водойм і ставить під загрозу можливість не тільки розвивати рибну галузь, розводячи рибу штучно, але і просто її виловлювати. Все це змушує вживати заходів щодо поліпшення екологічного стану прісних водойм. Звукові коливання є важливою складовою екологічного моніторингу стану біоти прісних водойм. Інформація про звукоутворення у водоймі, частиною якої є діяльність риб, отримується за допомогою акустичних датчиків і далі піддається комп’ютерній обробці. Сучасні методи розпізнавання акустичних образів риб базуються або на еталонах сигналів, з властивостями середньостатистичних оцінок, або на зіставленнях акустичних сигналів з еталоном. Показано, що для створення еталонів, як правило, виконується: попередня обробка сигналу, виділення ознак акустичного сигналу. Акустичні сигнали, що надходять від рухливих об'єктів – риб, можуть змінюватися залежно від об'єктивних зовнішніх умов і фізичного стану водойм. Жорсткі алгоритми розпізнавання акустичних образів характеризуються високою вірогідністю помилки. У зв'язку з цим кращими є адаптивні алгоритми розпізнавання акустичних образів. В процесі формування еталонів здійснюється уточнення програмного забезпечення згідно з особливостями акустичного сигналу. Реалізація процесу створення еталонів дозволяє визначати міру функціональної готовності параметрів і бази знань для вирішення завдань розпізнавання акустичних сигналів. В процесі розпізнавання задаються умови вірогідності правильного порівняння з еталоном, при невиконанні яких алгоритм перестає виконуватися і потребує додаткового навчання. Це вимагає створення еталонів, що відображають характерні особливості сигналів риб. Нині для ідентифікації найчастіше вибирають таку ознаку акустичних сигналів, як довжина періоду основної гармоніки сигналу. Її можна визначати або шляхом пошуку максимального значення в автокореляційній функції, або шляхом пошуку мінімального значення у функції середнього значення різниці амплітуд сигналу, або шляхом пошуку різниці двох максимальних значень в послідовності деталізуючих вейвлет-коефіцієнтів. Показано, що для завдань розпізнавання акустичних образів риб найбільш точним і вимагаючим найменшого навчання є представлення акустичного сигналу у вигляді набору векторів ознак фреймів. Детально було проаналізовано методики виділення періоду основної гармоніки акустичного сигналу: SIFT, ВОТ-А і ВОТ-ВП. Методика ВОТ-ВП характеризується відсутністю заздалегідь заданих порогів; швидким пошуком періоду основної гармоніки; відсутністю залежності від рівня шуму, оскільки досліджується конкретний діапазон частот. В той же час обчислювальна складність вейвлет-перетворення відносно висока, у зв'язку з чим потрібна оптимізація алгоритму обчислень.

Біографії авторів

Таtiana М. Tkachenko, Київський національний університет будівництва і архітектури, Київ

Доктор технічних наук, професор, професор кафедри охорони праці та навколишнього середовища

Yulia H. Pilkevich, Київський національний університет будівництва і архітектури, Київ

Начальник відділу МТЗ

Heorhii M. Rozorinov, Національний технічний університет України "Київський політехнічний інститут імені Ігоря Сікорського", Київ

Доктор технічних наук, професор, професор кафедри акустичних мультимедійних електронних систем

Посилання

Оrlov, D.S., Sadovnikova, L.K., & Lozanovskaya, I.N. (2012). Ekologiya I ohrana hidrosfery pri khimicheskom zagryaznenii [Ecology and protection of the hydrosphere with chemical pollution]. Moscow: Vysshaya shkola (in Russian).

Oppengeym, A.V., & Shafer, R.V. (1979). Tsyfrovaya obrabotka signalov [Digital signal processing]. Moscow: Svyaz (in Russian).

Rabiner, L.R., & Shafer, R.V. (1981). Tsyfrovaya obrabotka rechevykh signalov [Digital processing of speech signals]. Moscow: Radio i Svyaz' (in Russian).

Rabiner, L.R., & Jang, B.H. (1993). Fundamentals of speech recognition. New Jersey: Prentice Hall PTR, Englewood Cliffs.

Solonina, A.I., Ulakhovich, D.A., & Yakovlev, L.A. (2001). Algoritmy i protsessory tsyfrovoy obrabotki signalov [Algorithms and processors for digital signal processing]. Sankt Peterburg: BKHV-Peterburg (in Russian).

Sekunov, N.Yu. (2001). Obrabotka zvuka na РС [Sound processing on PC]. Sankt Peterburg: BKHV-Peterburg (in Russian).

Fyedorov, Ye.Ye. (2006). Modeli i metody preobrazovaniya rechevykh signalov [Models and methods of converting speech signals]. Donetsk: Nord-Press (in Russian).

Yefimov, Ye.P., Nikonov, A.V., Sapozhkov, M.A., & Shorov, V.I. (1989). Akustika: Spravochnik [Acoustics: Handbook]. (M.A. Sapozhkov, Ed.). Moscow: Radio i Svyaz' (in Russian).

Fyedorov, Ye.Ye., & Shelepov, V.Yu. (2002). Automatic detection of the beginning and end of speech recording. Iskusstvennyi intellect, 4, 295-298 (in Russian).

Freeman, D., Sonthcott, С., & Boyd, I.A. (1988). Voice activity detector for the Pan-European digital cellular mobile telephone service. In IEE Colloquium Digitized Speech Communication via Mobile Radio (pp. 61-65). London.

Karpov, A.A. (2004). Robust method for determining the boundaries of speech based on spectral entropy. Iskusstvennyi intellekt, 4, 606-612 (in Russian).

Fyedorov, Ye.Ye. (2008). Metodika formirovaniya akusticheskikh kharakteristik etalonov rechi [Methodology for the formation of acoustic characteristics of speech standards]. Donetsk: Veber (in Russian).

Markel, D.D., & Grey, A.Kh. (1980). Lineynoe predskazaniye rechi [Linear speech prediction]. Moscow: Svyaz' (in Russian).

Vintsyuk, Т.K. (1987). Analiz, raspoznavaniye i interpretatsiya rechevykh signalov [Analysis, recognition and interpretation of speech signals]. Kyiv: Naukova dumka (in Russian).

Shannon, B.J., & Paliwal, K.K. (2003). A comparative study of filter bank spacing for speech recognition. In Proc. of Microelectronics engineering research conference (pp. 310-312). Brisbane.

Kocharov, D.A. (2006). Sonority Measure for Automatic Speech Recognition. In Trudy mezhd. konf. SPECOM’2006 (pp. 245-250). Sankt Peterburg.

Atal, B.S. (1976). Avtomaticheskoye opoznavaniye diktorov po golosam [Automatic recognition of speakers by voices]. In Proceedings of IEEE, 64(4), 48-66 (in Russian).

Davis, S.B., & Mermelstein, P. (1980). Comparison of Parametric Representations for Monosyllabic Word Recognition in Continuously Spoken Sentences. In IEEE Trans. on Acoustic, Speech and Signal Processing, 28(4), 357-366.

Dorokhin, O.А., Zasypkin, А.V., Chervin, N.А., & Shyelyepov, V.Yu. (1997). O nekotorykh podkhodakh k probleme komp'yuternogo raspoznavaniya ustnoy ryechi [Some approaches to the problem of computer speech recognition]. In Trudy Myezhdunarodnoy konferentsiyi "Znaniye – Dialog – Ryeshyeniye" (KDS 97) (Vol. 1. 234-240). Yalta (in Russian).

Moldokulova, N.V., & Trunin-Donskoy, V.N. (1989). Lingvo-akusticheskiye problemy sozdaniya sistemy raspoznavaniya slitnoy ryechi na EVM [Linguo-acoustic problems of creating a continuous speech recognition system on a computer]. Frunzye: Ilim (in Russian).

Dobyeshi, I. (2004). Dyesyat' lektsiy po veyvletam [Ten lectures on wavelets]. Moscow: RKhD (in Russian).

Chui, К. (2001). Vvedenie v veyvlety [Introduction to wavelets]. Moscow: Mir (in Russian).

Malla, S. (2005). Veyvlety v obrabotkye signalov [Wavelets in signal processing]. Moscow: Mir (in Russian).

Bourlard, H., & Morgan, N. (1994). Connectionist Speech Recognition: A Hybrid Approach. Boston: Kluwer Academic Publishers.

##submission.downloads##

Опубліковано

2021-04-02

Як цитувати

Tkachenko Т. М., Pilkevich, Y. H., & Rozorinov, H. M. (2021). Розпізнавання акустичних образів риб при моніторингу прісноводних екосистем. Екологічна безпека та природокористування, 37(1), 20–34. https://doi.org/10.32347/2411-4049.2021.1.20-34