Сенсація

Вчені навчили комп’ютер визначати стать людини за написаним текстом

Колектив вчених Національного дослідницького ядерного університету «МІФІ», Національного дослідницького центру «Курчатовський Інститут» і Воронезького державного університету розробили метод, який навчає комп’ютер розпізнавати стать людини за написаним ним текстом з точністю до 80%. Наукова розробка відноситься до області комп’ютерної лінгвістики.

Результати дослідження опубліковані в журналі Procedia Computer Science.

Численні наукові дослідження показують, що в написаному тексті неминуче відбиваються характеристики його автора – стать, психологічні особливості, рівень освіти.

На основі аналізу мови можна діагностувати наявність у людини деяких захворювань (деменції, депресії) і схильність до суїцидальної поведінки. Потреба у встановленні характеристик автора тексту також зростає з розвитком інтернет-комунікацій: компаніям важливо знати, яким групам осіб подобаються їхні товари і послуги.

Вчені, що працюють в даному напрямку (лінгвісти, психологи, фахівці з інформаційних технологій), на основі чисельних значень різних параметрів тексту будують математичні моделі для діагностування тих чи інших параметрів особистості.

Колектив фахівців проаналізував ефективність різних технологій машинного навчання з використанням нейронних мереж для аналізу текстів.

В ході дослідження вони порівняли точність рішення задачі гендерної ідентифікації текстів на основі двох підходів до моделювання на основі даних: з одного боку, алгоритми машинного навчання, з іншого боку – нейронні мережі глибокого навчання.

«Ми досягли високих результатів у визначенні статі автора тексту завдяки просунутим моделям нейромережі, в умовах, коли автор не приховує свою стать. На черзі завдання визначення статі в умовах його навмисного приховування», – говорить доцент НІЯУ МІФІ Олександр Збоїв.

Так, в наступних текстах, розміщених спочатку на сайті знайомств, нейросітка без зусиль знаходить підступ в десяти випадках з десяти, притому, що автор навмисно пише від протилежної статі.

Результати цього дослідження показав, що підхід, заснований на використанні надточної нейронної мережі і методів глибокого навчання для розпізнавання статі людини за текстом є найбільш оптимальним.

Зараз група дослідників працює над завданням з розпізнавання віку.

Підпишіться на групу «СВІДОК» у Facebook

Loading...
Загрузка...